【標簽畫像系列】標簽評分,大量標簽如何進行系統(tǒng)治理

1 評論 13207 瀏覽 107 收藏 12 分鐘

標簽評分是標簽治理的一個重要措施,通過打分可從各個維度評估標簽,掌握標簽真實使用情況,進行標簽持續(xù)優(yōu)化,助力業(yè)務(wù)運營。那么,要如何進行標簽評分呢?一起來看一下吧。

本篇是「標簽畫像系列」的第四篇,此前我們已經(jīng)介紹過了標簽畫像體系建設(shè)方法論、標簽體系設(shè)計與加工、標簽加工與落庫,這次我們來介紹一下「標簽評分」。

標簽評分是標簽治理的一個重要措施,通過給標簽打分,可清晰直觀地從各個維度評估標簽,掌握標簽真實使用情況,進行標簽持續(xù)優(yōu)化,助力業(yè)務(wù)運營。同時,也能幫助數(shù)據(jù)團隊判斷哪些標簽更應(yīng)該投入計算與存儲資源,合理規(guī)劃集群資源。

一、為何要進行標簽評分

經(jīng)過前期標簽體系設(shè)計、標簽加工,標簽終于可以上線,讓業(yè)務(wù)人員使用,發(fā)揮價值了!

隨著標簽上線一段時間后,我們開始關(guān)心每天占用計算資源與存儲空間,跑出來的上百個標簽,業(yè)務(wù)同學真的用到了多少,業(yè)務(wù)收益是否能覆蓋數(shù)據(jù)成本呢?標簽上線后,其質(zhì)量怎么樣,是否存在老規(guī)則不適用、需要持續(xù)優(yōu)化的情況?

帶著這一問題,我們需要用一種方法來評估標簽上線后的使用情況,標識各個標簽的價值。參考電影評分、花唄評分等形式,我們決定也給標簽打個分、排個序,簡單明了。

二、標簽評分模型

標簽評分模型,經(jīng)過考慮我們選取了5個維度作為評分入?yún)ⅲ?/p>

標簽總評分= a* 標簽使用度評分 + b * 標簽關(guān)注度評分 + c * 標簽質(zhì)量評分 + d * 標簽持續(xù)優(yōu)化讀評分 + e * 標簽安全度評分

其中標簽使用度、標簽關(guān)注度、標簽質(zhì)量、標簽持續(xù)優(yōu)化度作為核心維度,標簽安全度可根據(jù)實際情況考慮是否納入。a、b、c、d、e是權(quán)重,總和為100%。

1. 標簽使用度評分

標簽使用度,用以評估標簽被分析、外部系統(tǒng)的使用情況。

在袋鼠云標簽產(chǎn)品中,標簽有這幾種使用場景:

  • 標簽引用:如原子標簽被衍生標簽應(yīng)用、衍生標簽被組合標簽引用等,基于該場景,計算“標簽引用次數(shù)”指標。
  • 標簽分析:標簽在標簽圈群、群組畫像、群組對比、顯著性分析等畫像分析功能中被分析的情況,計算“標簽分析次數(shù)”指標。
  • 標簽調(diào)用:標簽通過數(shù)據(jù)API被外部應(yīng)用查詢的次數(shù),計算“標簽調(diào)用次數(shù)”指標。

基于以上3個指標,我們首先采用Sigmoid函數(shù)將指標轉(zhuǎn)化為評分,再將各個指標的評分加權(quán)匯總成標簽使用度評分。

2. 標簽關(guān)注度評分

標簽關(guān)注度,用以評估被搜索、查看、收藏的情況。

袋鼠云標簽產(chǎn)品中,標簽關(guān)注度與以下場景有關(guān):

  • 標簽搜索:標簽在標簽市場被用戶搜索的情況,計算“標簽搜素次數(shù)”指標。
  • 標簽查看:標簽被點擊查看基礎(chǔ)信息、分析頁面等的次數(shù),計算“標簽查看次數(shù)”指標。
  • 標簽收藏:收藏該標簽的用戶數(shù),計算“收藏用戶數(shù)”指標。

以上3個指標可反映標簽的關(guān)注熱度,我們依然采用Sigmoid函數(shù)將指標轉(zhuǎn)化為評分,再將各個指標的評分加權(quán)匯總成標簽關(guān)注度評分。

3. 標簽質(zhì)量評分

標簽質(zhì)量,用以評估用戶被打標情況,反映標簽規(guī)則的合理性。

當我們定義了標簽和標簽值,經(jīng)過計算之后,標簽值打在用戶身上的很少,那說明我們的規(guī)則執(zhí)行不合理。比如我們定義了“活躍度”這個標簽,分為“高活躍、中活躍、低活躍度”等,但真實被打上的這個標簽的用戶,低于70%,還有很大一部分比例是空值,未打上該標簽,說明我們制定的標簽值規(guī)則有漏洞,需要完善。

系統(tǒng)將計算每個標簽的“標簽覆蓋度”,將覆蓋度歸一化為分數(shù),轉(zhuǎn)化成評分。

4. 持續(xù)優(yōu)化度評分

持續(xù)優(yōu)化度,用以評估標簽上線后,是否后續(xù)再去優(yōu)化該標簽。

在客戶的生命周期中,不斷有新用戶流入、沉默用戶流失。公司戰(zhàn)略調(diào)整、產(chǎn)品發(fā)布等都會影響客戶行為,這些變化我們需要以數(shù)據(jù)的方式呈現(xiàn),所以我們需要不斷根據(jù)業(yè)務(wù)調(diào)整、客戶變化調(diào)整我們的標簽策略,以追求可通過標簽直接地、迅速地反映客戶情況,指導業(yè)務(wù)運營。

持續(xù)優(yōu)化度,我們通過“標簽優(yōu)化次數(shù)”指標來評估,指標簽上線后標簽被編輯再次發(fā)布的的次數(shù)。我們同樣采用Sigmoid函數(shù)將指標轉(zhuǎn)化為評分。

5. 安全度評分

標簽安全度,不能反映標簽的熱度,但也將其作為了標簽評分的一個維度,可根據(jù)企業(yè)情況考慮是否納入。

在袋鼠云標簽產(chǎn)品中,標簽安全相關(guān)的策略有:

  • 標簽的可見度:標簽可編輯、可查看的用戶范圍
  • 標簽使用是否需要申請授權(quán):標簽發(fā)布后,其他人使用該標簽,是否需要申請審批
  • 標簽是否進行行級權(quán)限控制:上面我們控制了標簽的列權(quán)限,行級權(quán)限反映該標簽是否設(shè)置了行級權(quán)限
  • 標簽是否脫敏:標簽是否進行脫敏

根據(jù)標簽的安全度策略配置情況,我們也采用評分的方式來評估。

基于以上5個維度的評分,我們根據(jù)前面提的公式加權(quán)匯總,得到總評分。

三、標簽評分的應(yīng)用

基于標簽評分,為了更加直觀的讓標簽管理員、業(yè)務(wù)人員查看熱門標簽、沉默標簽等,通過排行榜的方式呈現(xiàn):

1)熱門標簽排行榜

基于標簽的使用度、關(guān)注度、持續(xù)優(yōu)化度3個角度來計算標簽的熱門評分,展示TOP N的熱門標簽。

熱門標簽說明這些標簽被經(jīng)常使用,我們需要持續(xù)關(guān)注這些標簽的正常運行、質(zhì)量,保障業(yè)務(wù)使用。

2)沉默標簽排行榜

熱門的標簽的反向排序便是沉默標簽,沉默標簽說明這些標簽使用率很低,可考慮定期下線,節(jié)省集群資源。

3)綜合排行榜

綜合排行榜便根據(jù)標簽的綜合評分進行排序,從標簽使用度、關(guān)注度、持續(xù)優(yōu)化度、質(zhì)量、安全等幾個維度評估,全面評估標簽。

4. 標簽使用度、關(guān)注度、持續(xù)有優(yōu)化度、質(zhì)量、安全分榜單排行

用戶可根據(jù)自己更加關(guān)注的維度,查看標簽使用度、關(guān)注度、持續(xù)優(yōu)化度、質(zhì)量、安全各個子維度的排行榜。同時,可查看各個標簽的具體指標,如使用度維度,可查看各個標簽的當前引用次數(shù)、分析次數(shù)、調(diào)用次數(shù),針對具體指標具體分析,滿足不同的標簽分析場景。

標簽評分模型上線后,我們需要根據(jù)實際情況調(diào)整不同維度的權(quán)重,符合自身實際情況。當經(jīng)過一段時間的應(yīng)用,大家認可這套評估邏輯之后,便可以將靜態(tài)化的評分展示轉(zhuǎn)化為動態(tài)化的告警、自動化治理等,可設(shè)置標簽質(zhì)量告警、評分告警,自動通知標簽管理員、責任人等。

以上便是在產(chǎn)品中應(yīng)用的評分邏輯,希望對大家有所幫助,也可提出不同思路優(yōu)化評分模型,達到更好的標簽治理效果。

本文由 @木研 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 標簽評分模型上線后,我們需要根據(jù)實際情況調(diào)整不同維度的權(quán)重,符合自身實際情況。

    來自廣東 回復