用戶畫(huà)像ID體系建設(shè):以阿里、網(wǎng)易、美團(tuán)、58為例
編輯導(dǎo)語(yǔ):在上篇文章《一文從0到1掌握用戶畫(huà)像知識(shí)體系》中,本文作者為我們分析了用戶畫(huà)像知識(shí)體系。在上篇文章的基礎(chǔ)上,今天,作者又以阿里、網(wǎng)易、美團(tuán)、58為例,分析總結(jié)了用戶畫(huà)像ID體系建設(shè),幫你理清楚各ID之間的關(guān)系圖,方便做映射。
前言:梳理完標(biāo)簽畫(huà)像體系的業(yè)務(wù)需求后,作為數(shù)據(jù)產(chǎn)品經(jīng)理,就要開(kāi)始了對(duì)畫(huà)像體系的整體設(shè)計(jì),其中首要遇到的就是用戶ID體系的打通相關(guān)的問(wèn)題。
公司各業(yè)務(wù)線ID繁多,數(shù)據(jù)割裂,如何才能盡可能關(guān)聯(lián)更多的數(shù)據(jù),以準(zhǔn)確的描繪出一個(gè)用戶的畫(huà)像呢?
接下來(lái)我們來(lái)看看索隆通過(guò)對(duì)界內(nèi)科技巨頭:阿里、網(wǎng)易、美團(tuán)、58的調(diào)研分析,來(lái)一步步建立自己公司的ID-Mapping體系的過(guò)程。
一、阿里OneID
阿里巴巴作為一家包含多條業(yè)務(wù)線的公司,如:
電商、金融、廣告、文化、教育、娛樂(lè)、設(shè)備和社交等領(lǐng)域,數(shù)據(jù)區(qū)域包含國(guó)內(nèi)、國(guó)外;數(shù)據(jù)場(chǎng)景包含線上的人貨場(chǎng)錢(qián)、線下的人貨場(chǎng)錢(qián)位置等數(shù)據(jù),以及物流、用餐、咨詢、影視、出行、閱讀、音樂(lè)和健康等相關(guān)數(shù)據(jù)。
ID類型包含phone、PC cookie、IMEI與IDFA、淘寶賬戶、支付寶賬戶、郵箱等。
而對(duì)于每個(gè)BU來(lái)說(shuō),他們知道的只是這個(gè)客戶的片面屬性,在開(kāi)展?fàn)I銷活動(dòng)時(shí),只是針對(duì)一個(gè)手機(jī)號(hào)或一個(gè)郵箱做營(yíng)銷,但背后不能識(shí)別出來(lái)一個(gè)自然人、一個(gè)公司。
為打破數(shù)據(jù)孤島,創(chuàng)造更大的數(shù)據(jù)價(jià)值,阿里使用OneData作為核心方法論。
OneData體系包含:
- OneModel:數(shù)據(jù)資產(chǎn)構(gòu)建與管理
- OneID:實(shí)體打通和畫(huà)像
- OneService:邏輯化服務(wù)
OneID基于超強(qiáng)ID識(shí)別技術(shù)鏈接數(shù)據(jù),高效生產(chǎn)標(biāo)簽;業(yè)務(wù)驅(qū)動(dòng)技術(shù)價(jià)值化,消除數(shù)據(jù)孤島,提升數(shù)據(jù)質(zhì)量,提升數(shù)據(jù)價(jià)值。
而ID的打通,必須有ID-ID之間的兩兩映射打通關(guān)系,通過(guò)ID映射關(guān)系表,才能將多種ID之間的關(guān)聯(lián)打通,完全孤立的兩種ID是無(wú)法打通的。
打通整個(gè)ID體系,看似簡(jiǎn)單,實(shí)則計(jì)算復(fù)雜,計(jì)算量非常大。
假如某種對(duì)象有數(shù)億個(gè)個(gè)體,每個(gè)個(gè)體又有數(shù)十種不同的ID標(biāo)識(shí),任意兩種ID之間都有可能打通關(guān)系,想要完成這類對(duì)象的所有個(gè)體ID打通需要數(shù)億次計(jì)算,一般的機(jī)器甚至大數(shù)據(jù)集群都無(wú)法完成。
大數(shù)據(jù)領(lǐng)域中的ID-Mapping技術(shù)就是用機(jī)器學(xué)習(xí)算法類來(lái)取代野蠻計(jì)算,解決對(duì)象數(shù)據(jù)打通的問(wèn)題。
基于輸入的ID關(guān)系對(duì),利用機(jī)器學(xué)習(xí)算法做穩(wěn)定性和收斂性計(jì)算,輸出關(guān)系穩(wěn)定的ID關(guān)系對(duì),并生成一個(gè)UID作為唯一識(shí)別該對(duì)象的標(biāo)識(shí)碼。
二、網(wǎng)易ID-Mapping
網(wǎng)易產(chǎn)品線有網(wǎng)易云音樂(lè)、網(wǎng)易郵箱、網(wǎng)易新聞、網(wǎng)易嚴(yán)選等,不同應(yīng)用上有不同的ID,如yanxuanid、oaid、musicid、phone、email、idfa、imei等。
要想標(biāo)識(shí)唯一ID,網(wǎng)易采用的思路及方案為:
結(jié)合各種賬戶、各種設(shè)備型號(hào)之間的關(guān)系對(duì),以及設(shè)備使用規(guī)律等用戶數(shù)據(jù),采用規(guī)則規(guī)律、數(shù)據(jù)挖掘算法(連通圖劃分+社區(qū)發(fā)現(xiàn))的方法,判別賬戶是否屬于同一個(gè)人。
ID-Mapping過(guò)程中,常遇到的問(wèn)題及對(duì)應(yīng)方案如下:
1. 問(wèn)題一:用戶有多個(gè)設(shè)備信息
解決方案:定義相關(guān)的閾值進(jìn)行關(guān)聯(lián)。社區(qū)發(fā)現(xiàn)當(dāng)前應(yīng)用于營(yíng)銷場(chǎng)景,暫未用于風(fēng)控或用戶運(yùn)營(yíng)場(chǎng)景,因?yàn)檫@種方式會(huì)把一些異常的賬號(hào)關(guān)聯(lián)在一起,且會(huì)存在僅登錄使用過(guò)一次的設(shè)備信息。
2. 問(wèn)題二:設(shè)備過(guò)期,一般是2年半左右時(shí)間
解決方案:設(shè)定衰減系數(shù),對(duì)單用戶多設(shè)備加大衰減力度。
備注:通常一人多設(shè)備對(duì)應(yīng)的場(chǎng)景有,借用朋友設(shè)備、設(shè)備臟數(shù)據(jù)、刷號(hào)等。
三、58 ID-Mapping
58業(yè)務(wù)場(chǎng)景豐富,其產(chǎn)品線包含58同城、趕集、安居客、中華英才網(wǎng)、轉(zhuǎn)轉(zhuǎn)、58到家等。
在這種多用戶、多業(yè)務(wù)線、多子公司的情況下,用戶數(shù)據(jù)種類繁雜,構(gòu)建畫(huà)像的數(shù)據(jù)來(lái)自于日志、簡(jiǎn)歷庫(kù)、帖子庫(kù)、用戶信息庫(kù)、商家?guī)?、認(rèn)證信息庫(kù)等數(shù)據(jù)源,其中僅日志就涉及到58、趕集、安居客等各個(gè)子產(chǎn)品的PC/M/APP日志。
如何將眾多數(shù)據(jù)源串聯(lián)起來(lái)是構(gòu)建用戶畫(huà)像面臨的第一個(gè)問(wèn)題,如下是58構(gòu)建的ID-Mapping模型圖。
從圖中可以看出,不同業(yè)務(wù)線所擁有的ID標(biāo)識(shí)不一:
- 58同城:wuser、wbdid、wimei
- 58趕集:guser、gbdid、gapud、gimei
- 安居客:kimei
其中可以通過(guò)telep、bidua、appua、imei、idfa關(guān)聯(lián)起來(lái),由此建立不同ID之間的關(guān)聯(lián)映射關(guān)系,就是ID-Mapping的過(guò)程。
四、美團(tuán)ID-Mapping
美團(tuán)與大眾點(diǎn)評(píng)進(jìn)行了合并,那同一個(gè)用戶在兩個(gè)APP上有不同的身份標(biāo)識(shí),美團(tuán)要怎樣進(jìn)行唯一標(biāo)識(shí)呢?
我們來(lái)看看美團(tuán)和大眾點(diǎn)評(píng)的賬號(hào)體系。美團(tuán)采用手機(jī)號(hào)、微信、微博、美團(tuán)賬號(hào)的登錄方式;大眾點(diǎn)評(píng)采用的手機(jī)號(hào)、微信、QQ、微博的登錄方式;其交集為手機(jī)號(hào)、微信、微博。
最終,對(duì)于注冊(cè)用戶賬戶體系,美團(tuán)采用了手機(jī)號(hào)作為用戶的唯一標(biāo)識(shí)。
五、總結(jié)
從上述案例可看出,ID-Mapping有三種常見(jiàn)方法:
- 基于賬號(hào)體系企業(yè)中最常用的是基于賬號(hào)體系來(lái)做ID的打通,用戶注冊(cè)時(shí),給到用戶一個(gè)uid,以u(píng)id來(lái)強(qiáng)關(guān)聯(lián)所有注冊(cè)用戶的信息。
- 基于設(shè)備:那對(duì)于未注冊(cè)用戶可以通過(guò)終端設(shè)備ID精準(zhǔn)識(shí)別,包含Android/iOS兩類主流終端的識(shí)別。通過(guò)SDK將各種ID采集上報(bào),后臺(tái)利用的ID關(guān)系庫(kù)和校準(zhǔn)算法,實(shí)時(shí)生成/找回終端唯一ID并下發(fā)。
- 基于賬號(hào)&設(shè)備:結(jié)合各種賬戶、各種設(shè)備型號(hào)之間的關(guān)系對(duì),以及設(shè)備使用規(guī)律等用戶數(shù)據(jù),采用規(guī)則規(guī)律、數(shù)據(jù)挖掘算法的方法,輸出關(guān)系穩(wěn)定的ID關(guān)系對(duì),并生成一個(gè)UID作為唯一識(shí)別該對(duì)象的標(biāo)識(shí)碼。
六、實(shí)踐
1. 梳理業(yè)務(wù)及數(shù)據(jù)現(xiàn)狀由于公司包含租住、生活服務(wù)等多條業(yè)務(wù)線
不同業(yè)務(wù)的用戶標(biāo)識(shí)不一;數(shù)據(jù)來(lái)源各不相同,數(shù)據(jù)散落在各業(yè)務(wù)表中,ID標(biāo)識(shí)包含phone、郵箱、神策ID、cuid、IMEI、idfa等。
2. 明確建設(shè)目標(biāo)
ID-Mapping體系的建立,旨在打破數(shù)據(jù)孤島,將更多用戶的數(shù)據(jù)關(guān)聯(lián)起來(lái),形成全域用戶畫(huà)像,幫助營(yíng)銷人員進(jìn)行精細(xì)化營(yíng)銷。
3. 制定項(xiàng)目計(jì)劃
第一階段:基于用戶賬號(hào)體系,用phone關(guān)聯(lián)注冊(cè)用戶的ID,維護(hù)一個(gè)ID映射庫(kù),統(tǒng)計(jì)注冊(cè)用戶線上線下行為數(shù)據(jù)。
第二階段:基于設(shè)備,用device ID關(guān)聯(lián)未注冊(cè)用戶的ID,統(tǒng)計(jì)未注冊(cè)用戶的行為數(shù)據(jù)。
第三階段:基于賬號(hào)&設(shè)備,采用數(shù)據(jù)挖掘算法做ID映射。
4. 按計(jì)劃進(jìn)行
接下來(lái)要做的就是按計(jì)劃開(kāi)展項(xiàng)目。這個(gè)過(guò)程中,注意要點(diǎn)在于,基于公司的數(shù)據(jù)現(xiàn)狀出發(fā),一步步實(shí)施;梳理清楚底層數(shù)據(jù)表中的ID標(biāo)識(shí);理清楚各ID之間的關(guān)系圖,便于做映射。
#專欄作家#
大鵬,公眾號(hào):一個(gè)數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家,《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊(cè)》作者。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議。
老師您好,我是類類有話說(shuō)的網(wǎng)站編輯,想申請(qǐng)權(quán)限轉(zhuǎn)載這篇文章到我們網(wǎng)站上,麻煩您添加下我的微信呀,KL15968397937