數(shù)據(jù)產(chǎn)品經(jīng)理之標(biāo)簽體系建設(shè)思路
在企業(yè)的許多業(yè)務(wù)上,標(biāo)簽都有著廣泛的應(yīng)用,那么,怎么做好標(biāo)簽體系的設(shè)計(jì)搭建?這篇文章里,作者復(fù)盤了公司標(biāo)簽體系應(yīng)用中常出現(xiàn)的問題與原因,并梳理了標(biāo)簽體系設(shè)計(jì)搭建的相關(guān)內(nèi)容,一起來看一下。
一、標(biāo)簽(tag)是什么
我們通常說打標(biāo)簽的時(shí)候,多少帶有一點(diǎn)貶義的色彩。打標(biāo)簽一般與刻板印象相連,僅憑某些行為/動(dòng)作/狀態(tài)對(duì)人或事物下判斷,給人或事物增加了某種屬性。
在大數(shù)據(jù)的世界中,標(biāo)簽應(yīng)用非常廣泛。標(biāo)簽是用戶畫像的基礎(chǔ),可以通過標(biāo)簽刻畫用戶特征??梢酝ㄟ^標(biāo)簽進(jìn)行客戶分群,實(shí)現(xiàn)精準(zhǔn)化營銷和個(gè)性化投放。
按用途分類,一般常見的分類是基礎(chǔ)信息標(biāo)簽、用戶行為標(biāo)簽、業(yè)務(wù)偏好標(biāo)簽。
- 基礎(chǔ)信息標(biāo)簽指的是如年齡、性別等社會(huì)學(xué)信息;
- 用戶行為標(biāo)簽指的是對(duì)用戶行為的描述,如近7天用戶購買、近30天用戶提款等;
- 業(yè)務(wù)偏好標(biāo)簽指的是用戶對(duì)業(yè)務(wù)內(nèi)容的偏好,如對(duì)某垂類視頻內(nèi)容偏好等。
按時(shí)效分類,分為T+1標(biāo)簽和準(zhǔn)實(shí)時(shí)標(biāo)簽。
按主體分類,標(biāo)簽主體可以是人(用戶),也可以是企業(yè)(客戶)或其他主體,需要看不同公司的業(yè)務(wù)情況而定。
這里涉及到打標(biāo)主體ID的識(shí)別,人和企業(yè)可能有多種ID,比如同樣是個(gè)體用戶,ID類型有phone手機(jī)號(hào)、openid、unionid、設(shè)備號(hào)、公司業(yè)務(wù)ID等。同樣是企業(yè)客戶,ID類型有統(tǒng)一社會(huì)信用代碼、企業(yè)名稱、納稅號(hào)、公司業(yè)務(wù)ID等。
在某些場景下,數(shù)據(jù)情況僅支持某一類型的ID打標(biāo),但使用場景可能會(huì)用到其他類型的ID。是否可以把不同類型的ID打通,實(shí)現(xiàn)全維度的打標(biāo)?這就會(huì)用到ID-Mapping技術(shù),有些公司也稱為One Entity。
二、標(biāo)簽的用途
標(biāo)簽在公司業(yè)務(wù)上有著非常廣泛的應(yīng)用。
- 客戶畫像:作為打在用戶上的屬性,各種基礎(chǔ)信息標(biāo)簽、用戶行為標(biāo)簽、業(yè)務(wù)偏好標(biāo)簽可以對(duì)客戶進(jìn)行刻畫,幫助業(yè)務(wù)了解客戶情況,進(jìn)行價(jià)值判斷和業(yè)務(wù)決策。
- 客戶分群:通過單標(biāo)簽或多標(biāo)簽的組合,進(jìn)行客群的圈選。選中的客群滿足特定標(biāo)簽的條件。常用作廣告投放、精準(zhǔn)營銷的場景。
三、公司標(biāo)簽應(yīng)用中常出現(xiàn)的問題
在聊標(biāo)簽體系設(shè)計(jì)搭建之前,我們先復(fù)盤看看公司標(biāo)簽體系應(yīng)用中常出現(xiàn)的一些問題和原因,思考下在后續(xù)標(biāo)簽體系設(shè)計(jì)的過程中可以怎么避免。
a.標(biāo)簽元數(shù)據(jù)維護(hù)不夠細(xì)致,業(yè)務(wù)通過標(biāo)簽元數(shù)據(jù)文檔查找可用標(biāo)簽時(shí),無法確定是否滿足使用場景。【標(biāo)簽是什么、怎么用】
原因是標(biāo)簽元數(shù)據(jù)維護(hù)顆粒度較粗,即使標(biāo)簽命名相同,不同業(yè)務(wù)對(duì)標(biāo)簽口徑的理解也可能不一樣,此時(shí)如果業(yè)務(wù)口徑只有簡單一兩句話,業(yè)務(wù)無法判斷此標(biāo)簽是否能用于其業(yè)務(wù)場景。沒有技術(shù)口徑,需要開發(fā)查看代碼確定業(yè)務(wù)的問題。這里的溝通成本很高,需要花費(fèi)很多時(shí)間進(jìn)行標(biāo)簽邏輯的回看和確認(rèn)。
在標(biāo)簽體系設(shè)計(jì)過程中,元數(shù)據(jù)維護(hù)上應(yīng)該有詳細(xì)的業(yè)務(wù)口徑和技術(shù)口徑,且統(tǒng)一標(biāo)簽的命名規(guī)范。
b.標(biāo)簽分類復(fù)雜且有近義,業(yè)務(wù)無法通過標(biāo)簽?zāi)夸浾业较胗玫臉?biāo)簽/找不到已存在的可用標(biāo)簽,重復(fù)提已有標(biāo)簽的加工需求?!緲?biāo)簽在哪里】
原因一是標(biāo)簽?zāi)夸浽O(shè)計(jì)沒做好,在標(biāo)簽體系設(shè)計(jì)之初,就應(yīng)該規(guī)劃好標(biāo)簽的分級(jí)分類。二是在標(biāo)簽需求實(shí)現(xiàn)過程中復(fù)核缺位,導(dǎo)致近義分類膨脹。
在標(biāo)簽體系設(shè)計(jì)過程中,應(yīng)該提供標(biāo)簽?zāi)夸洏涞墓δ?,能查看目前?biāo)簽的分級(jí)分類并進(jìn)行調(diào)整。由于標(biāo)簽投產(chǎn)后,元數(shù)據(jù)也會(huì)被下游業(yè)務(wù)系統(tǒng)應(yīng)用。調(diào)整標(biāo)簽元數(shù)據(jù)需要考慮對(duì)下游的影響,標(biāo)簽和分類需要解耦,標(biāo)簽分類的調(diào)整不能影響標(biāo)簽的正常使用。
另外是標(biāo)簽管理辦法的細(xì)化和標(biāo)簽管理員的職責(zé)。建設(shè)標(biāo)簽全生命周期管理體系,按照需求評(píng)審——開發(fā)投產(chǎn)——標(biāo)簽核驗(yàn)——生產(chǎn)啟用——變更——下線的不同階段進(jìn)行管理,在評(píng)審和核驗(yàn)階段需要進(jìn)行標(biāo)簽需求方和管理員進(jìn)行復(fù)核。定期review最新的標(biāo)簽分類并進(jìn)行梳理,對(duì)相近分類進(jìn)行合并調(diào)整。
c.標(biāo)簽加工后客群試算數(shù)量和業(yè)務(wù)手工跑的/預(yù)期不一致。【標(biāo)簽數(shù)據(jù)不對(duì)】
原因是標(biāo)簽數(shù)據(jù)質(zhì)量問題,在標(biāo)簽投產(chǎn)后沒有進(jìn)行核驗(yàn)。需要查看標(biāo)簽加工取數(shù)表的數(shù)據(jù)是否出現(xiàn)異常,比如沒有正常推送。需要復(fù)核標(biāo)簽技術(shù)口徑是否和需求業(yè)務(wù)口徑一致。
d.標(biāo)簽投產(chǎn)后業(yè)務(wù)沒有使用過,很多僵尸標(biāo)簽?!緲?biāo)簽沒人用】
需要進(jìn)行標(biāo)簽生命周期管理,一定時(shí)間段內(nèi)沒有業(yè)務(wù)使用過的標(biāo)簽,進(jìn)行標(biāo)簽下線處理,減少計(jì)算和存儲(chǔ)資源的浪費(fèi)。
除了以上列的常見問題,還有一些其他的情況。下面標(biāo)簽體系設(shè)計(jì)搭建,嘗試回答上面的常見問題。
四、標(biāo)簽體系設(shè)計(jì)搭建
這里把標(biāo)簽體系設(shè)計(jì)分為:數(shù)據(jù)源層、元數(shù)據(jù)層、標(biāo)簽加工層、標(biāo)簽服務(wù)層、標(biāo)簽全生命周期管理。
1. 數(shù)據(jù)源層
標(biāo)簽加工的數(shù)據(jù)源包括業(yè)務(wù)數(shù)據(jù)、埋點(diǎn)數(shù)據(jù)、日志數(shù)據(jù)和第三方數(shù)據(jù)。
2. 元數(shù)據(jù)層
元數(shù)據(jù)是對(duì)標(biāo)簽信息的刻畫,是對(duì)標(biāo)簽對(duì)象的屬性描述,對(duì)業(yè)務(wù)是否能理解標(biāo)簽口徑、正確使用和發(fā)揮標(biāo)簽商業(yè)價(jià)值,具有重要作用。業(yè)務(wù)在提標(biāo)簽需求的時(shí)候,最重要的就是明確標(biāo)簽的元數(shù)據(jù)信息,這也是開發(fā)加工標(biāo)簽的基礎(chǔ)。
標(biāo)簽元數(shù)據(jù)需要涵蓋的字段包括:
- 標(biāo)簽名稱:注意標(biāo)簽的命名規(guī)范。
- 標(biāo)簽一級(jí)/二級(jí)分類:分級(jí)分類的深度取決于公司規(guī)劃擴(kuò)展的標(biāo)簽范圍,如果只有一百以內(nèi)的標(biāo)簽,二級(jí)標(biāo)簽分類能做到比較好的覆蓋,如果標(biāo)簽數(shù)量成百上千,需要更深的分級(jí)分類進(jìn)行管理。
- 標(biāo)簽業(yè)務(wù)口徑:盡量完整且明確、無歧義,對(duì)后續(xù)其他業(yè)務(wù)使用此標(biāo)簽有很大的幫助。
- 標(biāo)簽技術(shù)口徑:有需要,盡可能詳細(xì)至取數(shù)的源表名和字段名。
- 標(biāo)簽枚舉值
- 標(biāo)簽更新周期:T+1/7/15/30,準(zhǔn)實(shí)時(shí)
- 標(biāo)簽數(shù)據(jù)類型:數(shù)值型:標(biāo)簽取值為數(shù)字,細(xì)分為:整數(shù)型、比率型、金額型、浮點(diǎn)型;文本型:標(biāo)簽取值為文本,如字符串型;日期型:標(biāo)簽取值為時(shí)間,如datetime日期;枚舉型:enum
- 標(biāo)簽創(chuàng)建時(shí)間、標(biāo)簽更新時(shí)間
- 標(biāo)簽需求提出人
3. 標(biāo)簽加工層
開發(fā)按照業(yè)務(wù)需求上的標(biāo)簽元數(shù)據(jù)信息進(jìn)行標(biāo)簽的加工處理。完成標(biāo)簽加工作業(yè)后,會(huì)落到中間結(jié)果表,通過id-mapping進(jìn)行融合,最終落到標(biāo)簽結(jié)果查詢表中。
這里回到前文第一點(diǎn)標(biāo)簽是什么,我們提到不同打標(biāo)主體有不同的ID類型。用戶的ID類型就有phone手機(jī)號(hào)、openid、unionid、公司業(yè)務(wù)ID、設(shè)備號(hào)(設(shè)備號(hào)又分為IDFA、IMEI)等。企業(yè)(客戶)的ID類型有統(tǒng)一社會(huì)信用代碼、企業(yè)名稱、納稅號(hào)、公司業(yè)務(wù)ID等。
不同類型主體ID的數(shù)據(jù)如果無法識(shí)別為同一個(gè)對(duì)象/主體,就無法把不同ID的數(shù)據(jù)進(jìn)行打通。如果沒有一個(gè)統(tǒng)一的ID進(jìn)行關(guān)聯(lián),不同類型孤立的ID之間的數(shù)據(jù)無法打通。需要建立一個(gè)公司內(nèi)部的全局id。
以企業(yè)標(biāo)簽舉例,標(biāo)簽需求中取數(shù)源表是企業(yè)名稱,但打標(biāo)主體需要為統(tǒng)一社會(huì)信用代碼,這時(shí)候需要通過id-mapping的技術(shù)把同一主體下的不同id進(jìn)行串聯(lián)。需要一個(gè)公司內(nèi)部的全局id,將完成業(yè)務(wù)認(rèn)證的不同類型的id數(shù)據(jù)源進(jìn)行收攏。
如通過不同的號(hào)碼底表獲取了全局id A 對(duì)應(yīng)的phone數(shù)據(jù),通過企業(yè)微信的底表獲取了全局id A對(duì)應(yīng)的unionid數(shù)據(jù),此時(shí)就可以通過全局id 進(jìn)行關(guān)聯(lián),觸達(dá)客戶A的方式有識(shí)別到的手機(jī)號(hào)和微信客戶信息,對(duì)于同一個(gè)客戶不同渠道的精準(zhǔn)觸達(dá)很有幫助。獲得客戶一個(gè)渠道的ID,可以識(shí)別出其他渠道的ID進(jìn)行觸客。
這里特別提一下設(shè)備號(hào),設(shè)備號(hào)指的是智能設(shè)備如手機(jī)、平板電腦等的唯一標(biāo)識(shí)符。一般廣告精準(zhǔn)投放用的就是設(shè)備號(hào)包。一個(gè)客戶可能擁有多臺(tái)手機(jī)或者平板電腦,現(xiàn)在市面上沒有廠商會(huì)提供手機(jī)號(hào)和設(shè)備號(hào)之間的精準(zhǔn)匹配,只會(huì)通過包對(duì)包的服務(wù)提供。也要關(guān)注設(shè)備號(hào)過期的問題,按照現(xiàn)在用戶手機(jī)和平板替換的速度,考慮以半年/年的頻率更新設(shè)備號(hào)信息的獲取。
4. 標(biāo)簽服務(wù)層
這里回到前文第二點(diǎn)標(biāo)簽用途,我們了解標(biāo)簽有客戶畫像、客群管理、客群試算等不同的使用場景,在金融、零售等不同行業(yè)都有非常廣泛的應(yīng)用。標(biāo)簽需要配合服務(wù)組件才能大規(guī)模應(yīng)用在業(yè)務(wù)場景中,通過標(biāo)準(zhǔn)的服務(wù)提供,降低重復(fù)開發(fā)的成本,最大程度復(fù)用現(xiàn)有組件,更好地發(fā)揮數(shù)據(jù)價(jià)值和保障服務(wù)穩(wěn)定。
1)用戶畫像
用戶畫像是用戶標(biāo)簽的聚合,單個(gè)標(biāo)簽反映的是用戶部分的信息,多個(gè)標(biāo)簽反映用戶整體全貌。用途是支持業(yè)務(wù)和運(yùn)營人員進(jìn)行用戶分析、價(jià)值判斷、策略制定。畫像服務(wù)可以支持下游業(yè)務(wù)應(yīng)用系統(tǒng)送入單個(gè)/批量的客戶主體ID和需要查詢的標(biāo)簽ID,返回對(duì)應(yīng)客戶的具體畫像信息。
2)客群管理
一群客戶ID稱為客群。客群可以通過單個(gè)標(biāo)簽或者多個(gè)標(biāo)簽組合篩選得出。常與用戶畫像結(jié)合,用途是根據(jù)業(yè)務(wù)需求,篩選出滿足業(yè)務(wù)條件的客戶,用于廣告投放精準(zhǔn)營銷、個(gè)性化推薦、線上運(yùn)營等場景。
在通過標(biāo)簽篩選客群的服務(wù)上,需要考慮是否支持不同主體類型標(biāo)簽的交并,是否支持不同時(shí)效標(biāo)簽的交并。如需支持業(yè)務(wù)在篩選客群后計(jì)算客群數(shù)量,需要支持客群試算的能力。如需支持業(yè)務(wù)判斷某個(gè)/批量的客戶是否屬于特定客群,需要支持判斷客戶是否屬于分群的能力。
3)標(biāo)簽管理
標(biāo)簽服務(wù)提供給下游業(yè)務(wù)系統(tǒng)使用時(shí),需要提供標(biāo)簽元數(shù)據(jù)查詢服務(wù),包括標(biāo)簽元數(shù)據(jù)列表,標(biāo)簽?zāi)夸浀取?/p>
五、標(biāo)簽全生命周期管理
標(biāo)簽生命周期管理也是標(biāo)簽體系的一部分,更多是管理辦法和責(zé)任分工的內(nèi)容。
標(biāo)簽的全生命周期可以劃分為標(biāo)簽需求提出及評(píng)審——標(biāo)簽開發(fā)測試投產(chǎn)——標(biāo)簽核驗(yàn)——標(biāo)簽啟用——標(biāo)簽變更——標(biāo)簽下線。
標(biāo)簽作為一種數(shù)據(jù)資產(chǎn),全生命周期的管理是數(shù)據(jù)資產(chǎn)的管理。需要關(guān)注的是全生命周期不同階段對(duì)應(yīng)的標(biāo)簽狀態(tài)、不同階段關(guān)聯(lián)方需要進(jìn)行什么操作、從什么節(jié)點(diǎn)開始標(biāo)簽正式啟用、往后節(jié)點(diǎn)狀態(tài)變更對(duì)業(yè)務(wù)使用的影響和處理方案、狀態(tài)之間的遞進(jìn)和回退場景等。更多在之后數(shù)據(jù)資產(chǎn)管理的文章中進(jìn)行展開。這里簡單提兩點(diǎn)。
標(biāo)簽需求提出及評(píng)審:
a.提標(biāo)簽需求之前,需要先查看標(biāo)簽元數(shù)據(jù),是否有同樣業(yè)務(wù)含義的標(biāo)簽已經(jīng)上線,當(dāng)標(biāo)簽數(shù)量達(dá)到一定程度的時(shí)候,尋找標(biāo)簽就會(huì)出現(xiàn)困難。避免因?yàn)榉诸?、叫法不一致,而讓業(yè)務(wù)發(fā)起重復(fù)的標(biāo)簽需求。
b.明確標(biāo)簽使用場景,用于客戶畫像點(diǎn)查,還是標(biāo)簽客群篩選,還是其他用途。
c.標(biāo)簽需求模板,制定工作的SOP,在標(biāo)簽需求提出階段提供需求模板,關(guān)鍵字段包括標(biāo)簽分類、標(biāo)簽名稱、標(biāo)簽業(yè)務(wù)含義、標(biāo)簽更新頻率、枚舉值、數(shù)據(jù)類型等上述4.2元數(shù)據(jù)層提及的字段。
標(biāo)簽下線:
標(biāo)簽下線的情景分為兩種,一種是在標(biāo)簽啟用一段時(shí)間后,發(fā)現(xiàn)數(shù)據(jù)質(zhì)量有問題/口徑需要調(diào)整,進(jìn)行臨時(shí)下線操作;二是標(biāo)簽超過一段時(shí)間沒有任何使用,成為僵尸標(biāo)簽,為了避免計(jì)算和存儲(chǔ)資源浪費(fèi)進(jìn)行永久標(biāo)簽下線。第一種情景需要注意對(duì)標(biāo)簽下游應(yīng)用的影響,在畫像查詢返回和客群篩選管理中應(yīng)該如何處理。
本文由 @RfSr 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
Mark一下