策略產(chǎn)品經(jīng)理面試題:“怎么應(yīng)對推薦系統(tǒng)的冷啟動?”

4 評論 10596 瀏覽 123 收藏 8 分鐘

筆者結(jié)合這道面試題,進(jìn)行了一系列的思考與總結(jié),希望對你有所啟發(fā)。

怎么應(yīng)對推薦系統(tǒng)的冷啟動?

這是一道很常見的推薦策略產(chǎn)品經(jīng)理面試題。

這個問題無論是從技術(shù)層面、商業(yè)層面、還是業(yè)務(wù)層面,都會有不同的解決方法。

最近,在做一個APP頻道內(nèi)的內(nèi)容feed流,也遇到了冷啟動問題,下面是最近思考得出的一些可行的思路。

推薦系統(tǒng)冷啟動階段其實也可以不那么的“冷”。

先了解一下什么是冷啟動?

沒有官方的定義。對于推薦系統(tǒng)來講,因為需要用到用戶,物品和事件三種數(shù)據(jù),其中任何一種數(shù)據(jù)的缺失都會導(dǎo)致推薦系統(tǒng)的冷啟動。當(dāng)然一般都是缺用戶數(shù)據(jù)。

所以冷啟動最直接的原因就是缺少可用的數(shù)據(jù)。那么,解決問題的辦法也是對癥下藥。

01

排行榜、熱榜等熱門效應(yīng)應(yīng)對冷啟動。

這個是最常見的一種應(yīng)對冷啟思路。推薦系統(tǒng)的本質(zhì)目的是高效連接用戶和平臺上的物品,就其能夠達(dá)成的目標(biāo)來講可以分為兩種:

  1. 為用戶發(fā)現(xiàn)“好”的東西
  2. 為用戶發(fā)現(xiàn)“喜歡”的東西

那么在不知道用戶喜歡什么的時候,最好的辦法就是把平臺上的“好”東西推給用戶。

如何衡量,量化一個東西的好壞。常見的做法就是依據(jù)物品的一些單品特征來計算它的熱度得分,然后按照這個得分進(jìn)行排序。

比如對于視頻,可以采用視頻的完播量/率、轉(zhuǎn)發(fā)量/率、點贊量/率、評論量/率等維度的特征進(jìn)行計算;對于商品,可以采用商品的銷量、關(guān)注量、收藏量、加購量等維度的特征進(jìn)行計算。

熱門推薦適合大多數(shù)的冷啟動場景,但是需要注意品類的多樣性和差異性。常見的加入隨機(jī)性、干預(yù)穿插、品類配比等等方式來保證最后給用戶呈現(xiàn)結(jié)果的豐富度。

02

有一些平時看似沒有用的數(shù)據(jù),實則蘊(yùn)含很豐富的信息,上下文信息就是這其中的一類。

無論你是否注冊、是否登錄,在你打開瀏覽器,或者打開APP的時候,包括你的設(shè)備信息、瀏覽器信息、環(huán)境信息、語言信息等等都已經(jīng)自動上傳到應(yīng)用的數(shù)據(jù)后臺了。

不同的領(lǐng)域?qū)ι舷挛男畔⒌亩x不同,但大意都是指和用戶當(dāng)前所處環(huán)境,場景相關(guān)的數(shù)據(jù)。

一個人在固定的設(shè)備、瀏覽器、環(huán)境、語言信息下的行為可能不能說明什么問題,但是當(dāng)有幾萬、幾十萬甚至上百萬的這樣的數(shù)據(jù)的時候,那么它顯現(xiàn)出來的一些規(guī)律性就有很大的價值了。

比如:有相關(guān)數(shù)據(jù)表明,一般在下午早上8點和下午4點上傳的抖音視頻會更容易獲得傳播。

另外,之前國外一家公司做的一個音樂推薦系統(tǒng)就是基于用戶的國家信息來推薦不同風(fēng)格的歌曲,這其實也是一種上下文信息的應(yīng)用。

這可能就是統(tǒng)計學(xué)意義所在。

03

拿來主義在推薦系統(tǒng)的冷啟動階段同樣適用,分為對內(nèi)和對外兩種:

對內(nèi)

一般稍微大點企業(yè)都不會只有一條業(yè)務(wù)線,所以當(dāng)面臨冷啟動問題的時候,不妨把眼界拓寬,看看其他業(yè)務(wù)是否有現(xiàn)成的數(shù)據(jù)可供對接,尤其是成熟的業(yè)務(wù)線。

在奉行拿來主義的適合,特別需要注意下面幾點:

  1. 業(yè)務(wù)形態(tài)是否一致。比如同屬電商業(yè)務(wù),同屬內(nèi)容社區(qū)業(yè)務(wù)。
  2. 用戶重合度是否足夠高,這樣才能保證你拿來的標(biāo)簽是可靠,可用的。尤其是在一個核心業(yè)務(wù)下面的垂直業(yè)務(wù),一般用戶重合度都很高。

拿來主義其實就是一種標(biāo)簽對接的思路,用相似的成熟業(yè)務(wù)標(biāo)簽來支持新業(yè)務(wù)的冷啟動,這在背靠大樹的企業(yè)是一種很常見的思路。比如淘寶APP、京東APP下的部分垂直頻道。

對外

對外的話一般是指標(biāo)簽采買。需要關(guān)注兩點:

  1. 采買標(biāo)簽的渠道需要足夠垂直,盡量保證業(yè)務(wù)范疇一致;
  2. 需要驗證標(biāo)簽的的準(zhǔn)確性。比如之前我們給租房業(yè)務(wù)搭建房源推薦系統(tǒng),需要用戶的地理位置和購買力標(biāo)簽,對接了一家專門做租房線上交易企業(yè)的標(biāo)簽。在標(biāo)簽驗證環(huán)節(jié),把地理位置標(biāo)簽與用戶常用的收貨地址標(biāo)簽進(jìn)行比對,購買力標(biāo)簽與用戶經(jīng)常購買的品類的價格進(jìn)行比對,在一定程度上可以剔除臟數(shù)據(jù)。

04

提升推薦系統(tǒng)的時效性。

這種嚴(yán)格來說不屬于解決冷啟的一種思路,但是,一定程度上能夠縮短冷啟的周期。

不知道大家有沒有注意到當(dāng)你從淘寶APP首頁猜你喜歡區(qū)域點擊一個商品,進(jìn)入該商品的詳情頁,并且瀏覽時間比較長的時候,再返回的時候,會有一個與你剛剛瀏覽商品相似的商品移動上來。

我第一次發(fā)現(xiàn)的時候,著實被驚艷到了。

如果能提升推薦系統(tǒng)的時效性,甚至做到實時,那么在用戶打開應(yīng)用,第一次與平臺的物品進(jìn)行有效交互的時候,就已經(jīng)能夠產(chǎn)生新的推薦列表了。

這個策略的背后需要考慮的因素很多,比如有效交互的定義、接口的性能、計算的能力。

05

歷史數(shù)據(jù)的復(fù)用。

成熟的業(yè)務(wù)推薦系統(tǒng)一般都會有一個冷啟動數(shù)據(jù)池,會選擇過往冷啟效果比較好的物品加入到數(shù)據(jù)池以備下次冷啟。

歷史數(shù)據(jù)不能簡單的全盤復(fù)用,需要考慮一定的過濾策略。比如當(dāng)下的環(huán)境政策、業(yè)務(wù)規(guī)劃、平臺計劃等等,盡量能夠保證各方權(quán)益的平衡。

以上大概就是最近思考所得一些冷啟策略,隨便聊聊,希望你能有所獲,也歡迎大家補(bǔ)充交流。

#專欄作家#

夏唬人,公眾號:夏唬人,人人都是產(chǎn)品經(jīng)理專欄作家。某廠策略產(chǎn)品經(jīng)理,關(guān)注推薦,搜索,AI策略方向,用數(shù)據(jù)來賦能業(yè)務(wù)。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 言簡意賅,關(guān)注了

    來自廣東 回復(fù)
  2. 怎樣應(yīng)對

    回復(fù)
  3. 沒干貨啊

    來自四川 回復(fù)
    1. 到我的公眾號看干貨

      回復(fù)