如何解決熱門推薦的3大難題?
個(gè)性化推薦強(qiáng)調(diào)于精準(zhǔn)性,要求在這個(gè)信息過載的互聯(lián)網(wǎng)世界中能夠精準(zhǔn)推薦出符合用戶感興趣的產(chǎn)品。那么如何將熱門有效的融入到推薦系統(tǒng)呢?
自豆瓣在個(gè)性化推薦的嘗試,到現(xiàn)在新起之秀的今日頭條、電商巨頭的亞馬遜利用個(gè)性化推薦成為行業(yè)中的佼佼者。很多互聯(lián)網(wǎng)企業(yè)開始將目光開始聚焦在個(gè)性化推薦,希望通過個(gè)性化推薦贏得市場。
熱門是互聯(lián)網(wǎng)產(chǎn)品中最常見的功能之一,如“大家都在看”,“今日爆款”等字眼隨處可見。熱門結(jié)合了眾多渠道,發(fā)揮著提供最熱優(yōu)質(zhì)的內(nèi)容服務(wù)的作用。
個(gè)性化推薦強(qiáng)調(diào)于精準(zhǔn)性,要求在這個(gè)信息過載的互聯(lián)網(wǎng)世界中能夠精準(zhǔn)推薦出符合用戶感興趣的產(chǎn)品。而熱門具有統(tǒng)一性,不管個(gè)體用戶的行為,熱門的數(shù)據(jù)都是統(tǒng)一的。
這兩者看似相悖,但試想一下,若周圍的朋友都在討論熱點(diǎn)事件時(shí),你卻一無所知,是否感覺與整個(gè)社會脫節(jié)了呢?因此,在追求精準(zhǔn)性和個(gè)性化的同時(shí),也需要考慮社會統(tǒng)一性。
那么如何將熱門有效的融入到推薦系統(tǒng)呢?
接下來,帶您開啟個(gè)性化推薦的宇宙飛行之旅,該班次出發(fā)于分析熱門的優(yōu)劣;小憩于如何解決熱門劣勢;中轉(zhuǎn)至個(gè)性化推薦與熱門的結(jié)合;到站于精準(zhǔn)性與統(tǒng)一性共存的“推薦星球”。
熱門的闡述
每個(gè)人對熱門都會聯(lián)想到很多詞語,如熱銷榜、暢銷書籍、網(wǎng)紅等等,熱門在日常生活中扮演著越來越重要的角色。同樣,在互聯(lián)網(wǎng)中,熱門也占據(jù)著重要的地位。熱門的應(yīng)用場景十分廣泛,下圖展示了部分領(lǐng)域中的熱門應(yīng)用:淘寶(電商)、愛奇藝(視頻)、微博(社交)、酷狗(音樂)。
接下來從三個(gè)方面深入了解熱門:熱門的影響因素、熱門的優(yōu)勢以及熱門的弊端。
圖熱門的應(yīng)用場景
1. 熱門的影響因素
結(jié)合現(xiàn)實(shí)來說,熱門主要受三個(gè)部分的影響:物品自身的屬性、用戶的反饋以及時(shí)間。
物品自身的屬性:
若兩部電影同時(shí)首映:《少年的你》和《半個(gè)喜劇》,相信絕大部分觀眾都會選擇《少年的你》。因?yàn)椤渡倌甑哪恪肥怯闪髁啃〉ㄒ嘴惹Лt)和實(shí)力演員(周冬雨)飾演,且經(jīng)過了前期大量的宣傳。因此,從物品自身屬性來看,兩部電影是無法相提并論的。
用戶的反饋:
物品自身的屬性雖然看上去屬于天然優(yōu)勢,但是在實(shí)際的算法中也不會占據(jù)主要的地位。內(nèi)容是否真的好,還需要真實(shí)用戶的檢驗(yàn)。在推薦星球中,用戶的行為(瀏覽、點(diǎn)贊、分享、評論、轉(zhuǎn)發(fā)等等)也是重要的考慮因素。
時(shí)間因素:
很多物品屬于一次性消費(fèi),用戶看過也就是看過了,很少進(jìn)行二次消費(fèi)。若熱門的數(shù)據(jù)是一成不變的,或者更換周期不合理的話,用戶會感受到乏味無趣,從而造成了用戶的流失。所以,不管何種平臺都希望熱門能夠按照合理的周期進(jìn)行更新,時(shí)間成為不可缺少的考慮因素。
2. 熱門的優(yōu)勢
熱門在互聯(lián)網(wǎng)市場上扮演著重要的角色,其主要原因如下:
新用戶冷啟動問題:
當(dāng)用戶行為數(shù)據(jù)量少且用戶信息獲取不準(zhǔn)確(用戶冷啟動問題)等現(xiàn)狀下,熱門反而比個(gè)性化推薦更加適用。舉個(gè)列子,若某一個(gè)用戶剛剛注冊某知名APP時(shí),試問一下有多少人會尋著耐心注冊性別、年齡、職業(yè)等信息呢?又有多少人會注冊其真實(shí)的信息呢?
所以,在絕大多數(shù)用戶冷啟動情況下,選擇熱門進(jìn)行推薦比根據(jù)用戶社會信息進(jìn)行推薦更加具有保障。
對物品要求?。?/strong>
當(dāng)物品數(shù)量級小或者物品的差異性小的情況下,熱門推薦比個(gè)性化推薦更加合適。當(dāng)物品少或者類目聚集時(shí),個(gè)性化推薦總是推薦同一類的物品,那么個(gè)性化推薦也失去了個(gè)性化的特性了,且個(gè)性化的計(jì)算成本遠(yuǎn)大于熱門計(jì)算。
3. 熱門的劣勢
不可否認(rèn),熱門也具有很大的弊端,其主要有如下三點(diǎn):
無法滿足個(gè)性化需求:
當(dāng)用戶存在行為數(shù)據(jù)時(shí),若一味推薦熱門數(shù)據(jù),那么個(gè)性化變得黯然失色,千人千面的推薦最終演變?yōu)榍艘幻娴耐扑],個(gè)性化也從推薦星球的舞臺上褪去。
長尾效應(yīng):
長尾(The Long Tail)效應(yīng),是指那些原來不受到重視的銷量小但種類多的產(chǎn)品或服務(wù)由于總量巨大,累積起來的總收益超過主流產(chǎn)品的現(xiàn)象。
如下展示的是熱門的長尾效應(yīng)趨勢圖,圖中表示20%的商品占據(jù)的市場份額超過了80%的商品占據(jù)的市場份額。顯然易見,熱門越流行,長尾效應(yīng)越明顯。
圖:長尾效應(yīng)趨勢圖(來自百度百科)
更新周期慢:
熱門的生產(chǎn)邏輯如下圖所示:根據(jù)用戶行為數(shù)據(jù)和物品自身的內(nèi)容,結(jié)合某種計(jì)算公式(點(diǎn)擊率、購買轉(zhuǎn)化率等)計(jì)算出每個(gè)物品的數(shù)值、排序,從而得到熱門數(shù)據(jù)。
從上面的熱門邏輯來看,其更新速度主要與用戶行為以及物品的數(shù)據(jù)量有關(guān)。在目前數(shù)據(jù)量如此劇增的互聯(lián)網(wǎng)環(huán)境中,熱門的更新速度不得不慢下來了。
圖-熱門的生產(chǎn)邏輯
如何用好熱門推薦
如何用好熱門推薦呢?主要從兩個(gè)部分出發(fā):首先從熱門自身的短板出發(fā),著手于解決熱門的弊端;其次,具體闡述個(gè)性化推薦中其他武器與熱門的結(jié)合,從而達(dá)到推薦星球的運(yùn)行理念——統(tǒng)一與個(gè)性共存。
1. 解決熱門弊端的方法
結(jié)合上文提出的熱門弊端,此處針對性的提出相應(yīng)的解決辦法。
用戶的個(gè)性化需求:
如何滿足用戶的個(gè)性化需求呢?相信標(biāo)題和市場已經(jīng)告訴你答案了,即引入個(gè)性化推薦,具體的做法參考下文提到的內(nèi)容與熱門的結(jié)合。
巧妙利用長尾效應(yīng):
如何解決長尾效應(yīng)呢?解決這個(gè)問題的關(guān)鍵是如何將冷門物品曝光,其中常見的做法是通過熱門的熱度帶動冷門物品,電商巨頭亞馬遜成功運(yùn)用了該方法。
熱門產(chǎn)品為《進(jìn)入空氣稀薄地帶》,向購買過該書的用戶推薦了冷門書籍《觸摸巔峰》,通過內(nèi)容將兩個(gè)物品關(guān)聯(lián)起來,當(dāng)其中一個(gè)物品進(jìn)入熱門后,帶動了另一個(gè)冷門物品的暢銷,最終創(chuàng)造了《觸摸巔峰》的榜單逆行現(xiàn)象。
加快更新周期:
如何加快熱門更新周期呢?其關(guān)鍵在于縮小計(jì)算的數(shù)量級。俗話說:一口吃不掉一個(gè)饅頭,那一般怎么做呢?我們把饅頭切成幾塊,問題迎刃而解。因此面對如此龐大的數(shù)據(jù)量級,通過對物品和用戶人群的劃分,從而加快熱門的更新周期。
2. 和其他武器的結(jié)合
目前市場上賦予智能推薦系統(tǒng)的武器有協(xié)同過濾、用戶畫像、社交關(guān)系、物品畫像、熱門數(shù)據(jù)以及召回排序模型。面對日益豐富的武器庫,很多人感到迷茫,該選擇何種武器贏得推薦市場?
圖 推薦星球的武器庫
- 協(xié)同過濾:無論是基于用戶還是基于物品的協(xié)同過濾,其根本思想需要找到人或者物關(guān)聯(lián)性較大的對象,然后基于此作出推薦。若需提高協(xié)同過濾的方法的精準(zhǔn)性,特殊處理熱門物品/人的數(shù)據(jù),從而才能保證協(xié)同過濾中計(jì)算的物品/人是真正意義上的相似。
- 用戶畫像:提到個(gè)性化推薦,用戶畫像自動躍入腦海中。很多人對推薦的認(rèn)知是用戶畫像越精準(zhǔn),則推薦越精準(zhǔn)。對于這點(diǎn),我們并不否認(rèn),但是用戶畫像提煉出的是什么呢?是該用戶側(cè)重于哪一方面,或是類目、或是地域、或是話題等等。根據(jù)用戶畫像提煉出的信息,從熱門中取出相匹配的數(shù)據(jù),自動化的生成高質(zhì)量的推薦結(jié)果。所以,結(jié)合用戶畫像和熱門,使推薦星球能夠召回更加有效的推薦結(jié)果。
- 召回排序模型:該武器在市場上扮演著神秘的角色,其殺傷力以及射程范圍無法預(yù)估。該武器依賴于用戶的行為數(shù)據(jù),通過一種或幾種模型的混合,從而預(yù)測用戶對物品的評分。
圖-熱門與其他武器的關(guān)聯(lián)性
社交關(guān)系:基于社交關(guān)系的推薦是給用戶賦予其社會屬性,若某用戶是另一用戶的閨蜜或家庭成員,針對某用戶的推薦會考慮另一用戶的行為數(shù)據(jù)。看到這里大家不禁疑惑?是不是和基于用戶的協(xié)同過濾有異曲同工之妙呢?答案確實(shí)如此,只不過基于社交關(guān)系的用戶關(guān)系屬于強(qiáng)關(guān)聯(lián),而基于用戶的協(xié)同過濾中得到的相似用戶屬于弱關(guān)聯(lián)。因此,社交關(guān)系比基于用戶協(xié)同更直接。
物品畫像:物品畫像在解決長尾現(xiàn)象以及物品冷啟動問題中不可或缺。通過文本處理、內(nèi)容關(guān)聯(lián)、模型等方式計(jì)算兩兩物品之間的相關(guān)性,通過熱門巧妙帶動冷門物品/冷啟動物品,緩解長尾以及物品冷啟動問題。
熱門數(shù)據(jù):熱門數(shù)據(jù)必不可少,熱門賦予了推薦星球的共性。熱門與推薦星球相結(jié)合,具備了熱門的時(shí)效性、統(tǒng)一性,又具備了推薦的個(gè)性化,同時(shí)緩解了物品冷啟動、長尾效應(yīng)、新用戶冷啟動等問題,提高推薦精準(zhǔn),推動了推薦星球的發(fā)展。
推薦案例
在不同的場景下,選擇其中幾種武器進(jìn)行合理組裝,最大化的推薦出符合用戶興趣偏好的物品。接下來我們通過案例中詳細(xì)闡述在具體的場景下,當(dāng)面臨實(shí)際問題時(shí),我們該如何選擇武器并使用該武器。
1. 資訊推薦行業(yè)
眾所周知,資訊行業(yè)中最考究的是時(shí)效性。我們選擇綜合熱點(diǎn)、高時(shí)效性召回、物品畫像、用戶畫像、排序策略(時(shí)間倒排)、后處理策略(時(shí)效性限制)這幾種方式。
Step1:根據(jù)用戶畫像、高時(shí)效性、物品畫像,分別召回符合用戶興趣偏好的高時(shí)效性物品、符合用戶歷史行為的相關(guān)物品;為保證推薦的多樣性,選擇綜合熱點(diǎn)召回當(dāng)下熱點(diǎn)
Step2:對上述召回結(jié)果進(jìn)行后處理—如不符合時(shí)效的item進(jìn)行過濾處理
Step3:對處理后的召回結(jié)果按照某種方式(如時(shí)間倒排)排序,生成推薦結(jié)果。
2. 電商推薦行業(yè)
電商推薦的時(shí)效性不是很強(qiáng),但其在物品的使用周期需要進(jìn)行特殊處理。在電商推薦中常常遇到的且令人頭大的是:若用戶短期內(nèi)購買了洗發(fā)水,若和其他場景邏輯相似,推薦系統(tǒng)向該用戶推薦不同品牌同功效的洗發(fā)水,但是這種推薦令絕大部分客戶感到反感。
我們選擇高關(guān)注量物品召回、關(guān)聯(lián)規(guī)則訓(xùn)練出的物品相關(guān)、用戶畫像、后處理(同物品限制)、排序策略這幾種武器。具體使用說明如下:
Step1:根據(jù)用戶有行為的物品和關(guān)聯(lián)規(guī)則得到的物品相關(guān)召回相關(guān)武物品;根據(jù)用戶畫像和高關(guān)注量物品召回召回符合用戶興趣偏好的物品
Step2:對上述召回結(jié)果進(jìn)行后處理(同細(xì)分類目下一定周期限制),也許類目無法做到如此精確的細(xì)分處理,那可以通過文本分析,過濾產(chǎn)品相似性過大的物品
Step3:對處理后的召回結(jié)果按照某種召回方式(購買率、關(guān)注度等復(fù)雜排序),從而生成推薦結(jié)果。
3. 總結(jié)
在競爭日益激烈的互聯(lián)網(wǎng)時(shí)代,誰更能抓住用戶的興趣,推薦出符合用戶興趣的物品,誰更容易贏得市場。僅僅只依賴熱門,將無法滿足用戶個(gè)性化需求;若僅僅依賴個(gè)性化(不考慮熱門),又可能面臨與時(shí)代脫節(jié)的風(fēng)險(xiǎn)。
因此,只有將熱門巧妙的融入到推薦星球中,結(jié)合用戶畫像、物品畫像等方法召回推薦侯選集;通過后處理方式對侯選集進(jìn)行過濾處理;通過模型、評估指標(biāo)等生成有序物品結(jié)合,即個(gè)性化與共性共存、時(shí)效性與場景特殊性共存的推薦結(jié)果。
本文由 @達(dá)觀數(shù)據(jù) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!