個(gè)性化算法要合規(guī)整改,“個(gè)推”政策限制下如何做好算法推薦?(上)

0 評(píng)論 5141 瀏覽 8 收藏 15 分鐘

編輯導(dǎo)語:個(gè)性化推薦可以讓用戶更加快速地獲取自己想要的信息,幫助用戶在海量信息中進(jìn)行篩選,減少用戶的時(shí)間成本,但這存在著數(shù)據(jù)泄露的隱患,且后續(xù)若形成信息繭房,也會(huì)限制用戶的思維邊界。那么,未來個(gè)性化推薦應(yīng)該怎么走,還存在著什么發(fā)展空間?本文作者就個(gè)性化推薦的定義、利弊以及發(fā)揮空間等問題做了探討,一起來看一下。

8月27日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定(征求意見稿)》(以下簡(jiǎn)稱《意見稿》)并公開征求意見。

《意見稿》對(duì)具有輿論屬性或社會(huì)動(dòng)員能力的算法推薦服務(wù)提供者進(jìn)行重點(diǎn)規(guī)則,從內(nèi)容推薦要求堅(jiān)持主流價(jià)值導(dǎo)向,到不得實(shí)施流量造假、控制熱搜等影響網(wǎng)絡(luò)輿論,劍指微博、今日頭條、百度、快手、抖音等資訊信息及短視頻平臺(tái)。

《意見稿》對(duì)個(gè)性化推薦開關(guān)、個(gè)性化推薦等做出明確規(guī)定,APP要在規(guī)定時(shí)間內(nèi)整改合規(guī)。以下是關(guān)于《意見稿》的部分截圖:

【上篇】個(gè)性化算法要合規(guī)整改,“個(gè)推”政策限制下如何做好算法推薦?

大數(shù)據(jù)算法為王時(shí)代,個(gè)性化算法是潮流(但算法背后衍生出不少個(gè)人隱私問題),《意見稿》基于人權(quán)益本身出臺(tái)。平臺(tái)如何在個(gè)性化推薦合規(guī)情況下,進(jìn)一步做好人工推薦或精準(zhǔn)推薦,達(dá)到雙管齊下效果?本篇淺談個(gè)人對(duì)算法推薦的看法。

一、什么是個(gè)性化推薦?

個(gè)性化推薦為什么受到平臺(tái)“吹捧(喜歡)”?算法主要解決了什么問題?什么是個(gè)性化推薦?

個(gè)性化推薦就是在特定場(chǎng)景下,人和信息之間更有效率的一種連接。各平臺(tái)熱衷于做算法推薦的目的是要把內(nèi)容/物品變成價(jià)值的效率系統(tǒng),提升產(chǎn)品整體的使用轉(zhuǎn)化。

二、個(gè)性化推薦的利與弊

個(gè)性化推薦可謂互聯(lián)網(wǎng)經(jīng)濟(jì)最核心的取勝武器。《意見稿》的出臺(tái)是要逆時(shí)代洪流發(fā)展?當(dāng)然不是!

任何事物都有兩面性,個(gè)性化推薦算法也一樣,利弊結(jié)合。

1)好處

  1. 用戶打開產(chǎn)品能快速找到自己想要的物品,提升整體查找效率;
  2. 方便用戶快速了解自己感興趣的內(nèi)容;
  3. 方便用戶專注于了解自己喜歡的領(lǐng)域,形成自身優(yōu)勢(shì)。

2)壞處

  1. 所有便利都是通過出讓更多個(gè)人隱私換來的。一旦平臺(tái)存儲(chǔ)的數(shù)據(jù)泄露,將是人類史上一場(chǎng)無法預(yù)估的信息災(zāi)難。
  2. 大數(shù)據(jù)比你自己更懂自己,但長(zhǎng)期下去容易形成信息繭房,不利于個(gè)人認(rèn)知成長(zhǎng)。
  3. 個(gè)性化相似內(nèi)容推薦頻次過高,重復(fù)看到相似推薦等于浪費(fèi)個(gè)人時(shí)間。

《意見稿》基于個(gè)性化算法所暴露出的弊端,進(jìn)行了強(qiáng)制約束和整改。

三、推薦的進(jìn)化史

近10年算法推薦發(fā)展迅速,但不少平臺(tái)仍然保留著“個(gè)人推薦+算法推薦+個(gè)性化推薦”幾種不同的推薦策略,三者之間有何區(qū)別?

1. 人工推薦

個(gè)人推薦是推薦的1.0版本,由平臺(tái)運(yùn)營(yíng)/編輯根據(jù)自己對(duì)內(nèi)容或物品的品質(zhì)、熱度等做出評(píng)分,最后將評(píng)分高的內(nèi)容推薦給用戶。個(gè)人推薦的內(nèi)容通常是千人一面,平臺(tái)需要花費(fèi)較長(zhǎng)時(shí)間去驗(yàn)證人工挑選的內(nèi)容是否符合市場(chǎng)/用戶的需求,整體推薦效率滯后。

人工推薦目前仍廣泛應(yīng)用于傳統(tǒng)行業(yè),如報(bào)紙、媒體、出版等。

2. 算法推薦

算法推薦是推薦的2.0版本,即平臺(tái)根據(jù)推薦訴求(如提升內(nèi)容的CTR、CVR等指標(biāo)),形成簡(jiǎn)單的算法邏輯,讓內(nèi)容滿足平臺(tái)大多數(shù)用戶的需求。

比如常見的排行榜、新品榜、人氣榜、飆升榜等,但算法推薦仍然是千人一面的推薦效果。

【上篇】個(gè)性化算法要合規(guī)整改,“個(gè)推”政策限制下如何做好算法推薦?

3. 精準(zhǔn)推薦

精準(zhǔn)推薦是推薦的3.0版本,它是前兩種算法推薦的綜合產(chǎn)物。主要通過給用戶、內(nèi)容、物品打上各類專屬標(biāo)簽,再給貼有不同標(biāo)簽的用戶推薦他們可能喜歡的內(nèi)容,在某種程度上精準(zhǔn)推薦“簡(jiǎn)單”的實(shí)現(xiàn)了千人千面的推薦需求。

精準(zhǔn)推薦目前廣泛應(yīng)用于APP推送、廣告投放等。

【上篇】個(gè)性化算法要合規(guī)整改,“個(gè)推”政策限制下如何做好算法推薦?

4. 個(gè)性化推薦

個(gè)性化推薦是推薦的4.0版本。它跟人工推薦最根本的區(qū)別在于,人工推薦是對(duì)用戶“被動(dòng)的投喂”,而個(gè)性化推薦則是用戶“主動(dòng)的選擇”。

個(gè)性化推薦的核心在于推薦模型的訓(xùn)練,主要包括召回和排序兩種主模型,且個(gè)性化推薦進(jìn)一步細(xì)分為搜索推薦和個(gè)性化推薦。

搜索推薦是將海量?jī)?nèi)容與用戶表意明確的查詢意圖的相關(guān)聯(lián),通過分詞、變換、擴(kuò)充、糾錯(cuò)等過程,更好地了解用戶的搜索意圖,實(shí)現(xiàn)精準(zhǔn)推薦。而個(gè)性化推薦則是將海量?jī)?nèi)容與用戶表意不明確的偏好相關(guān)聯(lián),最后輸出用戶可能偏好的推薦物。

因此個(gè)性化推薦的邏輯是——APP通過大數(shù)據(jù)收集,記錄下用戶每一個(gè)行為動(dòng)作、行為路徑、停留時(shí)長(zhǎng)等,實(shí)時(shí)分析用戶的主要意圖,再通過以物推物、以人推物、協(xié)同過濾等規(guī)則,將用戶偏好內(nèi)容先召回,最后按排序規(guī)則計(jì)算出要給用戶推薦的內(nèi)容。

個(gè)性化推薦解決用戶千人千面的需求,目前廣泛應(yīng)用于各大頭部APP,其中以BATJ四大巨頭為主。

四、個(gè)性化推薦存在的問題

個(gè)性化推薦發(fā)展迅猛,但仍然存在不少問題,其中最常見的4個(gè)問題便是:

1. 重復(fù)推薦問題

當(dāng)機(jī)器算法足夠了解你之后,算法能快速計(jì)算出用戶偏好的內(nèi)容,但同品類、同熱點(diǎn)甚至是相似度極高的內(nèi)容,無法避免內(nèi)容重復(fù)出現(xiàn)在一屏或多個(gè)推薦位的問題。

將APP頁面拆分成不同板塊分析下,以淘寶APP為例,頁面可分為搜索區(qū)、輪播banner區(qū)、分類icon區(qū)、特價(jià)劃算區(qū)、直播區(qū)等不同榜單模塊。淘寶的算法推薦業(yè)內(nèi)數(shù)一數(shù)二,所以從物品推薦來看推薦的內(nèi)容重復(fù)度低,但目前推薦能做到四大巨頭這程度的企業(yè)較少。

【上篇】個(gè)性化算法要合規(guī)整改,“個(gè)推”政策限制下如何做好算法推薦?

因?yàn)榘駟沃g的推薦系統(tǒng)其實(shí)比較復(fù)雜。舉個(gè)簡(jiǎn)單的例子,APP一共有10個(gè)榜單欄目,其中2個(gè)榜單是純?nèi)斯じ深A(yù),剩余8個(gè)榜單純算法推薦。這種推薦邏輯至少會(huì)出現(xiàn)3種重復(fù)推薦的問題——人工推薦的榜單之間存在重復(fù)推薦、純算法榜單之間存在重復(fù)推薦、人工榜單和算法榜單之間存在重復(fù)推薦。

如果榜單跟榜單之間制定去重規(guī)則,能降低重復(fù)推薦的概率。然而去重限制并不能100%保證頁面不再出現(xiàn)重復(fù)內(nèi)容。因?yàn)榘駟卧蕉嘁馕吨ブ匾?guī)則越復(fù)雜,越靠后的榜單可能會(huì)出現(xiàn)去重后無內(nèi)容召回的情況,無內(nèi)容召回時(shí)系統(tǒng)會(huì)自動(dòng)啟用兜底推薦,這便衍生出其他2種重復(fù)推薦問題——人工榜單跟兜底榜單存在重復(fù)推薦、純算法榜單跟兜底榜單存在重復(fù)推薦。

2. 推薦不準(zhǔn)問題

負(fù)責(zé)算法推薦時(shí),不少同事曾給我反饋算法推薦不準(zhǔn)的問題。比如他不是老師身份,平臺(tái)總喜歡給他推薦老師偏好的內(nèi)容;他不是高管,總給他推薦高管的資訊;他對(duì)美妝不感興趣,總給他推薦美妝信息等等。

好幾次一查對(duì)方日志發(fā)現(xiàn),用戶早上7點(diǎn)04分瀏覽了美妝頻道、中午11點(diǎn)30分點(diǎn)進(jìn)去了某化妝品詳情頁、中午12點(diǎn)45分在看某美妝博主的直播……這些行為日志都明確表明用戶對(duì)美妝品類有強(qiáng)烈需求,而用戶本身卻不承認(rèn)自己有過這些點(diǎn)擊行為。為什么?

除了“超我”不承認(rèn)“本我”的行為以外,還因?yàn)闀?huì)存在一個(gè)賬號(hào)在多臺(tái)設(shè)備上使用過,或多個(gè)不同用戶使用同一個(gè)賬號(hào)下單等情況。

這時(shí)候一個(gè)賬號(hào)對(duì)應(yīng)的實(shí)際用戶身份非常復(fù)雜。雖然算法可以通過增加設(shè)備ID加大匹配門檻,但系統(tǒng)仍不能100%準(zhǔn)確判斷好每次瀏覽的是用戶A還是用戶B,這就是為什么在個(gè)性化算法推薦成熟的時(shí)候,仍然有很多用戶吐槽大數(shù)據(jù)推薦不準(zhǔn)。

實(shí)際上,你喜不喜歡某品類,有沒有點(diǎn)過哪些資源,大數(shù)據(jù)給你記錄得清清楚楚,大數(shù)據(jù)不會(huì)騙人,有時(shí)候騙人的反而是我們自己。

3. 推薦過于密集

相似內(nèi)容推薦過于密集的問題十分普遍,最常見于抖音。

我自身是個(gè)影視劇迷,非常愛刷影視劇視頻。抖音算法計(jì)算出我的偏好后,精準(zhǔn)的拿捏住我對(duì)哪些劇感興趣。比如我最近在追《周生如故》,抖音里10條內(nèi)容就給我推了6條關(guān)于該劇的內(nèi)容。

站在用戶角度,我非常高興算法給我精準(zhǔn)推薦偏好的視頻,但同一個(gè)片段上一個(gè)視頻剛刷完,沒刷幾個(gè)視頻同樣的內(nèi)容又出現(xiàn),推薦頻次過于密集最后導(dǎo)致用戶在茫茫視頻推薦中,人工過濾未看過的視頻,心累。

4. 熱點(diǎn)時(shí)效性問題

算法推薦遇到的最大挑戰(zhàn)點(diǎn)在于對(duì)熱點(diǎn)內(nèi)容和時(shí)效性強(qiáng)的內(nèi)容推薦,比如馬上中秋國(guó)慶到來,強(qiáng)時(shí)效性的內(nèi)容在推薦時(shí)需要加入時(shí)間衰減的推薦機(jī)制,不然就會(huì)給用戶推薦不合時(shí)宜或已經(jīng)過時(shí)的內(nèi)容。

五、算法成熟時(shí)代,如何應(yīng)對(duì)“個(gè)推”政策危機(jī)?

個(gè)性化推薦算法暴露不少隱私問題,《意見稿》整改是維護(hù)社會(huì)主義價(jià)值觀的正向措施。在算法成熟的時(shí)代,企業(yè)該如何應(yīng)對(duì)《意見稿》中提到的合規(guī)處理?

——答案只有一個(gè),按照政策執(zhí)行,該關(guān)閉的開關(guān)關(guān)閉,該下線的算法下線,該修改的引導(dǎo)文案修改,算法推薦要堅(jiān)持弘揚(yáng)社會(huì)主義正能量。

六、精準(zhǔn)推薦發(fā)揮空間還有多大?

個(gè)性化算法被“整改”,算法“回滾”到3.0版本,還有多大發(fā)揮空間?

其實(shí)這算不上什么算法回滾。即使眾多企業(yè)都在談?wù)搨€(gè)性化推薦,但個(gè)性化算法只有少部分頭部玩家在應(yīng)用,不少企業(yè)目前也只處于3.0推薦階段。標(biāo)簽體系雖然成熟,但我認(rèn)為標(biāo)簽還有進(jìn)一步的挖掘空間。

標(biāo)簽收集可分成3種類型,一是內(nèi)容本身的標(biāo)簽、二是使用內(nèi)容的人的標(biāo)簽、三是場(chǎng)景標(biāo)簽。簡(jiǎn)單概括為冷標(biāo)簽、溫標(biāo)簽、熱標(biāo)簽,而熱標(biāo)簽便是其中可挖掘的爆發(fā)點(diǎn)。

至于什么是冷標(biāo)簽、溫標(biāo)簽、熱標(biāo)簽,標(biāo)簽爆發(fā)點(diǎn)在哪兒?我們下一篇推文再詳細(xì)分享,敬請(qǐng)期待。

#專欄作家#

卡卡,微信公眾號(hào):卡卡的產(chǎn)品札記,人人都是產(chǎn)品經(jīng)理專欄作家。8年大型互聯(lián)網(wǎng)產(chǎn)品運(yùn)營(yíng)經(jīng)驗(yàn)。曾負(fù)責(zé)過稻殼兒、手機(jī)主題等產(chǎn)品,對(duì)IP字體的打造引領(lǐng)了行業(yè)風(fēng)向標(biāo)。既當(dāng)過業(yè)務(wù)操盤手,也當(dāng)過自媒體創(chuàng)作者,對(duì)產(chǎn)品運(yùn)營(yíng)、內(nèi)容運(yùn)營(yíng)有自己的見解。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!