搭建標(biāo)簽體系,學(xué)會(huì)讓用戶(hù)為你干活

0 評(píng)論 16016 瀏覽 94 收藏 12 分鐘

編輯導(dǎo)讀:用戶(hù)標(biāo)簽是精細(xì)化運(yùn)營(yíng)的基礎(chǔ),能有效提高流量的分發(fā)效率和轉(zhuǎn)化效率。用戶(hù)由標(biāo)簽組成,但是這些標(biāo)簽打那些緯度標(biāo)簽?由誰(shuí)來(lái)打?怎么打標(biāo)簽?本文作者對(duì)此展開(kāi)了分析探討,一起來(lái)看看~

標(biāo)簽,主要的作用就是用于商品識(shí)別,用來(lái)標(biāo)志產(chǎn)品目標(biāo)、分類(lèi)、內(nèi)容等。標(biāo)簽按照存在形式分,可分實(shí)物標(biāo)簽、網(wǎng)絡(luò)標(biāo)簽(tag)等。

(1)實(shí)物標(biāo)簽

主要用于標(biāo)明物品的品名、重量、體積、用途等信息的簡(jiǎn)要標(biāo)牌。有傳統(tǒng)的印刷標(biāo)簽和現(xiàn)代條碼打印標(biāo)簽。

適用范圍:包裝:嘜頭標(biāo)簽、郵政包裹;商品:價(jià)格標(biāo)簽、產(chǎn)品說(shuō)明標(biāo)簽;

(2)網(wǎng)絡(luò)標(biāo)簽(tag)

它是一種互聯(lián)網(wǎng)內(nèi)容組織方式,是相關(guān)性很強(qiáng)的關(guān)鍵字,幫助人們輕松的描述和分類(lèi)內(nèi)容,以便于檢索和分享,Tag已經(jīng)成為自web 2.0以來(lái)的重要元素。

今天我們就來(lái)聊聊網(wǎng)絡(luò)標(biāo)簽,let’s go

背景

假設(shè)一個(gè)場(chǎng)景:老板把你叫到辦公室,讓你做一套標(biāo)簽體系,你會(huì)怎樣推進(jìn)?

常規(guī)思路:調(diào)研市場(chǎng)上同類(lèi)型產(chǎn)品做法→通過(guò)各種渠道,拿到標(biāo)簽體系結(jié)構(gòu)(或者利用爬蟲(chóng)爬取標(biāo)簽體系數(shù)據(jù))→直接套用過(guò)來(lái)→人工達(dá)標(biāo)、模型訓(xùn)練→形成自有標(biāo)簽體系

這是一種快速便捷的方案,但是埋了很多隱性的“坑”,稍不留神就會(huì)被坑。

  1. 不同平臺(tái)內(nèi)容體量有差異,內(nèi)容調(diào)性與用戶(hù)調(diào)性亦有差異,完全照搬內(nèi)容標(biāo)簽體系,弊大于利。
  2. 標(biāo)簽體系不完善,不適合自有內(nèi)容生態(tài),就花費(fèi)大量人力、物力來(lái)做,勞民傷財(cái)。

怎樣躲“坑”?那得學(xué)會(huì)靈活運(yùn)用他人的體系

當(dāng)拿到搭建標(biāo)簽體系的任務(wù),首先想到有兩個(gè)方案

方案一:調(diào)研同類(lèi)型產(chǎn)品做法,直接套用其分類(lèi)標(biāo)簽體系

優(yōu)點(diǎn):簡(jiǎn)單、高效

缺點(diǎn):不完全適合自有內(nèi)容生態(tài)

方案二:爬取同類(lèi)產(chǎn)品內(nèi)容數(shù)據(jù),進(jìn)行無(wú)監(jiān)督訓(xùn)練,輸出分類(lèi)標(biāo)簽結(jié)果。

優(yōu)點(diǎn):可以更好的了解內(nèi)容生態(tài)中內(nèi)容分布情況,制定合理的分類(lèi)標(biāo)簽體系。

缺點(diǎn):時(shí)間周期長(zhǎng),成本高

不管方案一還是方案二,得到的都只是初版標(biāo)簽體系標(biāo)準(zhǔn)(比如一二級(jí)分類(lèi)體系標(biāo)準(zhǔn)),只能用做建立底層分類(lèi)標(biāo)簽,離標(biāo)簽體系建立還有一段露要走。

當(dāng)有了底層分類(lèi)標(biāo)簽,可以在此基礎(chǔ)上進(jìn)行多維度標(biāo)簽建構(gòu):

  1. 情感化標(biāo)簽
  2. 風(fēng)格標(biāo)簽
  3. 實(shí)體標(biāo)簽
  4. 概念標(biāo)簽

……

多維度標(biāo)簽有了,怎樣讓內(nèi)容打上這些標(biāo)簽?

1. 充分調(diào)用用戶(hù)生產(chǎn)力,讓作者打標(biāo)

我們都知道,豆瓣將打標(biāo)的權(quán)利下放給用戶(hù),在上傳文章、寫(xiě)電影評(píng)論都可選擇或手填標(biāo)簽,對(duì)于內(nèi)容平臺(tái)來(lái)說(shuō),這是一筆巨型財(cái)富。但是由于用戶(hù)能力水平有高有低,打出的標(biāo)簽需要進(jìn)行清洗、消歧等操作后才能使用。

一些資訊平臺(tái)、視頻平臺(tái),作者發(fā)布文章時(shí),也會(huì)讓作者選擇、填寫(xiě)內(nèi)容標(biāo)簽,比如趣頭條、B站等。

B站發(fā)文頁(yè)面

問(wèn)題點(diǎn):用戶(hù)手動(dòng)填寫(xiě)的標(biāo)簽沒(méi)有統(tǒng)一標(biāo)準(zhǔn),標(biāo)簽名稱(chēng)不規(guī)范,無(wú)法直接使用。筆者拉出所在公司作者手填tag,利用率也就50%-60%左右,需要人工進(jìn)行標(biāo)簽分類(lèi),比如篩選出實(shí)體標(biāo)簽、概念標(biāo)簽、風(fēng)格標(biāo)簽等。

2. 人工打標(biāo)

作者手動(dòng)填寫(xiě)tag,只能作為tag體系補(bǔ)充的一環(huán),且利用率有限。因此,專(zhuān)門(mén)的標(biāo)注同學(xué)、真實(shí)用戶(hù)打標(biāo),是必不可少的一環(huán),更好的保證標(biāo)簽可用率與準(zhǔn)確率。

調(diào)動(dòng)用戶(hù)生產(chǎn)力,讓真實(shí)用戶(hù)打標(biāo)簽,不知大家有沒(méi)有用過(guò)。把打標(biāo)偽裝成用戶(hù)活動(dòng),既是用戶(hù)運(yùn)營(yíng)的手段,也是標(biāo)簽生產(chǎn)的手段,利用用戶(hù)運(yùn)營(yíng)的思路來(lái)生產(chǎn)標(biāo)簽,好處多多。

我們來(lái)算筆賬——

假設(shè)日活用戶(hù)1000萬(wàn),圈出100萬(wàn)用戶(hù)做活動(dòng),預(yù)計(jì)每日參與活動(dòng)用戶(hù)20w,真正完成答題用戶(hù)7w-8w,剔除無(wú)效數(shù)據(jù),最終可用數(shù)據(jù)可以有10w左右,平均成本可靈活調(diào)控。

如果找專(zhuān)人一天標(biāo)注10w數(shù)據(jù),按照人效1500來(lái)算(上限值),那么就需要66個(gè)人,人力成本一天也得大幾萬(wàn)。

對(duì)比來(lái)看,調(diào)動(dòng)用戶(hù)生產(chǎn)力,優(yōu)勢(shì)不言而喻。

第一步:洞察用戶(hù)

  • 人口學(xué)特征:性別、年齡、職業(yè)等
  • 地理位置特征:所在城市,城市等級(jí)
  • 活躍行為特征:最近60天、30天、14天、7天等活躍天數(shù)
  • 閱讀行為特征:最近60天、30天安、14天、7天等閱讀視頻、圖文次數(shù)、時(shí)長(zhǎng)。

通過(guò)這些不同維度的用戶(hù)數(shù)據(jù),讓你對(duì)用戶(hù)做個(gè)深度剖析,找到你需要的那部分用戶(hù)。

第二步:吸引用戶(hù)

將打標(biāo)簽的項(xiàng)目偽裝成用戶(hù)活動(dòng),比如要進(jìn)行影視劇劇名打標(biāo),可以開(kāi)展一個(gè)“看視頻猜劇名”的活動(dòng)。比如要進(jìn)行相似圖片標(biāo)注 ,可以開(kāi)展一個(gè)“看圖片找不同”的活動(dòng)。

怎樣做好偽裝,吸引用戶(hù)參與?

  1. 活動(dòng)名稱(chēng)接地氣,要點(diǎn)突出,直接要害
  2. 設(shè)計(jì)有看點(diǎn)的活動(dòng)banner
  3. 做好答題頁(yè)面交互體驗(yàn)設(shè)計(jì)
  4. 充分利用金幣、獎(jiǎng)金競(jìng)品激勵(lì)

第三步:服務(wù)用戶(hù)

當(dāng)把用戶(hù)吸引進(jìn)來(lái)之后,需要為它們做好服務(wù),提升活躍留存。

  1. 定期監(jiān)測(cè)參與活動(dòng)用戶(hù)質(zhì)量,剔除羊毛黨、質(zhì)量低用戶(hù)。
  2. 制定獎(jiǎng)懲機(jī)制
  3. 收集用戶(hù)反饋,對(duì)于有用建議及時(shí)響應(yīng)。
  4. 由于項(xiàng)目具有周期性,做好用戶(hù)召回(利用psuh、站內(nèi)信等手段觸達(dá)召回)

再多說(shuō)一句,當(dāng)把這套流程機(jī)制中臺(tái)化,可以滿(mǎn)足不同業(yè)務(wù)場(chǎng)景需求,對(duì)于用戶(hù)促活、標(biāo)簽打標(biāo)等具有很強(qiáng)的實(shí)操價(jià)值。

3. 模型訓(xùn)練

常規(guī)的模型訓(xùn)練流程很簡(jiǎn)單,大致分為五個(gè)環(huán)節(jié):

標(biāo)準(zhǔn)制定→樣本標(biāo)注→模型訓(xùn)練→數(shù)據(jù)評(píng)測(cè)→上線

隨著業(yè)務(wù)需求增加,對(duì)于模型迭代效率要求越來(lái)越高,普通的模型訓(xùn)練流程太繁瑣,需要跨部門(mén)溝通,費(fèi)時(shí)費(fèi)力,因此,搭建一套模型訓(xùn)練自動(dòng)化平臺(tái)顯得尤為重要,對(duì)于簡(jiǎn)單的模型,可以由運(yùn)營(yíng)或者產(chǎn)品協(xié)調(diào)標(biāo)注,快速訓(xùn)練、迭代模型,提升效率。

這里簡(jiǎn)單聊聊模型自動(dòng)化訓(xùn)練平臺(tái)的搭建,或有不足之處,大家一起交流學(xué)習(xí)。

平臺(tái)工具可分四大模塊:數(shù)據(jù)處理、模型訓(xùn)練、數(shù)據(jù)集打分、模型對(duì)比

模塊一:數(shù)據(jù)處理(整合數(shù)據(jù)獲取、數(shù)據(jù)處理兩個(gè)小模塊)

(1)數(shù)據(jù)獲取

1)內(nèi)部獲取

  1. 來(lái)自?xún)?nèi)部,整合已有工具,平臺(tái)加上工具跳轉(zhuǎn)入口;利用sql自行獲取想要樣本標(biāo)注數(shù)據(jù)。
  2. 來(lái)自?xún)?nèi)部,算法側(cè)提供相應(yīng)樣本標(biāo)注數(shù)據(jù)

2)外部獲取

根據(jù)具體需求,制定內(nèi)容爬取方案,瞭望爬取相應(yīng)內(nèi)容(圖文、視頻、小視頻等全體裁),需要入庫(kù),支持輸入標(biāo)注平臺(tái)、眾包進(jìn)行數(shù)據(jù)標(biāo)注。

(2)數(shù)據(jù)處理

  1. 針對(duì)內(nèi)外部獲取的數(shù)據(jù)集,支持輸入標(biāo)注平臺(tái)、眾包進(jìn)行標(biāo)注,輸出有效標(biāo)注樣本數(shù)據(jù)集
  2. 針對(duì)眾包、標(biāo)注平臺(tái)輸出的有效標(biāo)注樣本數(shù)據(jù)集,需要有個(gè)樣本管理配置平臺(tái),進(jìn)行數(shù)據(jù)處理,然后將數(shù)據(jù)直接推送至對(duì)應(yīng)模型進(jìn)行訓(xùn)練。

模塊二:模型訓(xùn)練

  1. 算法提供每個(gè)需求所需模型
  2. 選定所需模型,輸入有效標(biāo)注數(shù)據(jù)集進(jìn)行訓(xùn)練
  3. 支持配置選擇模型參數(shù),比如,基于神經(jīng)網(wǎng)絡(luò)模型,一般可以迭代訓(xùn)練輪數(shù)、學(xué)習(xí)率、網(wǎng)絡(luò)層數(shù)、向量寬度、選擇的優(yōu)化器等。
  4. 支持增量與全量任務(wù)訓(xùn)練,訓(xùn)練狀態(tài)可視化,便于及時(shí)掌握訓(xùn)練情況
  5. 建立監(jiān)控報(bào)警機(jī)制,訓(xùn)練狀態(tài)異常時(shí)觸發(fā),保證訓(xùn)練狀態(tài)正常。

模塊三:數(shù)據(jù)集打分

  1. 已經(jīng)訓(xùn)練完畢的模型,輸入測(cè)試集、驗(yàn)證集數(shù)據(jù),輸出P\R\F1值
  2. 輸出P\R\F1值后,再次輸入人工評(píng)測(cè)數(shù)據(jù)集,輸出評(píng)測(cè)數(shù)據(jù)結(jié)果,人工離線評(píng)測(cè),輸出準(zhǔn)召率。

模塊四:模型對(duì)比

對(duì)于準(zhǔn)召率達(dá)標(biāo)不同版本模型進(jìn)行留檔記錄,便于對(duì)比迭代前后模型效果

  • 對(duì)比維度:模型版本號(hào)、訓(xùn)練完成時(shí)間、P\R\F1值、人工評(píng)測(cè)準(zhǔn)召率等

通過(guò)作者打標(biāo)、用戶(hù)打標(biāo)、模型訓(xùn)練等方式,輸出了各個(gè)維度內(nèi)容標(biāo)簽,存儲(chǔ)于標(biāo)簽庫(kù)中,為各業(yè)務(wù)場(chǎng)景提供底層數(shù)據(jù)支持。

 

本文由 @珂然 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!