AI必備知識:推薦系統(tǒng)
本文作者詳細(xì)介紹了AI推薦系統(tǒng),并提出了自己的想法。跟著作者思路一起來了解一下吧!
一、好的推薦系統(tǒng)
1. 什么是好的推薦系統(tǒng)——用戶視角
什么是推薦系統(tǒng)?
當(dāng)你心理產(chǎn)生一個(gè)需求的時(shí)候,能通過這個(gè)工具順利實(shí)現(xiàn)對這個(gè)需求的搜索,并獲得符合心理預(yù)期的產(chǎn)品列表,這個(gè)工具我們就稱之為——推薦系統(tǒng)。
例如在現(xiàn)實(shí)生活中我們經(jīng)常會用淘寶、京東、百度等產(chǎn)品,人們通常會基于目的(例如買洗面奶、洗發(fā)水、圖書)的情況下去搜索想要的產(chǎn)品;或是在需求不明確的情況下,期望外部能傳達(dá)符合自身內(nèi)心需求的信息。
那么,什么樣的推薦系統(tǒng)是好的推薦系統(tǒng)呢?
1.1 用戶層面:對用戶真正有價(jià)值的推薦
1.1.1 符合用戶的預(yù)期
推薦結(jié)果精準(zhǔn),能較大概率的覆蓋用戶的需求;用戶搜索詞與推薦物品有較高的匹配度,這里通常用召回率和準(zhǔn)確率來衡量上述指標(biāo)。
- 召回率:正例在實(shí)際總的正例中被預(yù)測正確的概率
- 準(zhǔn)確率:正例被預(yù)測正確的概率
1.1.2 讓用戶產(chǎn)生驚喜
在滿足精準(zhǔn)性的情況下,推薦系統(tǒng)能挖掘人性需求,幫用戶拓展眼界探索未知,產(chǎn)生驚喜。
其體現(xiàn)在推薦結(jié)果的多樣性,物品間知識關(guān)聯(lián)性等。比如用戶搜索古典音樂類書籍,可以在列表中增加與此類型音樂相配的古典舞蹈、茶藝等書籍.
另外,推薦物品不能和用戶所購買物品物理綁定。比如用戶購買紅樓夢上,系統(tǒng)推薦紅樓夢下,這個(gè)推薦對用戶來說并不存在真正心理需求
1.2 系統(tǒng)層面:技術(shù)
對用戶而言,對推薦結(jié)果的預(yù)期、反饋的時(shí)間、推薦物品更新的頻率、系統(tǒng)容錯(cuò)機(jī)制等,都會直接影響用戶體驗(yàn)。因此在系統(tǒng)層面,一個(gè)優(yōu)秀的推薦系統(tǒng)需具備但不限于:
- 強(qiáng)大抵御并處理噪聲數(shù)據(jù)(例如刷單產(chǎn)生的無效數(shù)據(jù))的能力
- 高效數(shù)據(jù)計(jì)算及傳輸能力
- 穩(wěn)定的存儲機(jī)制
- 算法的精準(zhǔn)性
1.3 不斷完善與優(yōu)化
就像人一樣,只有不斷的學(xué)習(xí),才能完善自身的知識體系以及對世界的認(rèn)知,系統(tǒng)亦然。
好的推薦系統(tǒng)一定具備自我學(xué)習(xí)的能力,通過建立反饋機(jī)制和用戶進(jìn)行交互,從而不斷優(yōu)化對用戶群體的認(rèn)知,最終能實(shí)現(xiàn)對用戶群體的精準(zhǔn)聚類,為每類群體建立模型,物品精準(zhǔn)投放。
1.4 讓用戶信服的推薦理由
好的推薦系統(tǒng)勢必會讓用戶產(chǎn)生強(qiáng)烈的信任與依賴感,給用戶提供物品推薦的依據(jù)——推薦理由。
推薦理由可以體現(xiàn)出系統(tǒng)是如何判斷物品進(jìn)入用戶的興趣范圍的。常用的推薦理由大概分為以下四類:
- 熱門商品;推薦系統(tǒng)通常都會賦予部分熱門商品一定的權(quán)重,由于感興趣的人基數(shù)非常大,所以系統(tǒng)判斷目標(biāo)用戶感興趣的概率也較大
- 目標(biāo)用戶的好友同時(shí)也喜歡此類物品
- 喜歡某類物品的用戶同時(shí)也喜歡這類物品
- 與某類物品內(nèi)容有極大的關(guān)聯(lián)性;這里關(guān)聯(lián)性可以逐步細(xì)化,比如基于知識體系的推薦,即不同領(lǐng)域的匹配,或同一領(lǐng)域的梯度匹配等
1.5 實(shí)現(xiàn)雙贏
好的推薦系統(tǒng)不僅能讓用戶找到目標(biāo)物品,也能讓商家發(fā)現(xiàn)目標(biāo)/潛在的用戶群體,實(shí)現(xiàn)共贏。
2.什么是好的推薦系統(tǒng)——產(chǎn)品視角
推薦系統(tǒng)都會有一個(gè)明確的目的,無論是為了突破技術(shù)壁壘還是基于商業(yè)目的,最終都會根據(jù)目標(biāo),通過特定的用戶行為數(shù)據(jù)來判斷成功與否。
比如對于電商平臺,用戶關(guān)注、點(diǎn)贊、收藏、加入購物車等操作,都可以在一定程度上衡量推薦結(jié)果的精準(zhǔn)性,但并未達(dá)到此系統(tǒng)的最終目標(biāo)——支付。
因此我們可以選與系統(tǒng)最終目標(biāo)最匹配的用戶行為,也就是在這個(gè)過程中用戶付出代價(jià)最大的行為作為主要的判斷依據(jù),比如購買成功,對此行為賦予相對較大的權(quán)重。
二、推薦系統(tǒng)架構(gòu)
通過上面的介紹,大家應(yīng)該對推薦系統(tǒng)有一個(gè)初步的認(rèn)識了,那么推薦系統(tǒng)是由哪幾部分構(gòu)成呢,在這一部分,我將逐一解答。
大部分推薦系統(tǒng)都是由前臺展示頁面、后臺日志系統(tǒng)和推薦算法系統(tǒng)三部分構(gòu)成。
1. 前臺展示頁面
前臺展示頁面是直觀展示給用戶的界面,通過UI與用戶交互,交互產(chǎn)生的用戶行為數(shù)據(jù)將存儲在后臺日志系統(tǒng)中,開發(fā)者根據(jù)推薦算法對日志系統(tǒng)中的數(shù)據(jù)進(jìn)行處理及分析,最終生成推薦結(jié)果。
那么,交互產(chǎn)生的用戶行為數(shù)據(jù)包括哪些呢?
- 用戶自身基礎(chǔ)屬性;即性別、年齡、學(xué)歷、職業(yè)、所在地等,通常來源于用戶注冊信息或是其他平臺數(shù)據(jù)。
- 用戶行為:瀏覽網(wǎng)頁、點(diǎn)擊、收藏、購買、點(diǎn)贊、關(guān)注等行為。
- 用戶行為結(jié)果:產(chǎn)生的話題、搜索關(guān)鍵詞及反饋(評論/打分)等。
每種類型的數(shù)據(jù)可以抽象為一種特征,獲取方式可來源于目標(biāo)網(wǎng)站或社交網(wǎng)絡(luò)。
2. 后臺日志系統(tǒng)
日志系統(tǒng)主要是用來記錄系統(tǒng)運(yùn)行的軌跡,在記錄的同時(shí),跟蹤分析錯(cuò)誤,審計(jì)系統(tǒng)運(yùn)行的流程。
日志記錄的內(nèi)容通常分為兩大類,一是面向用戶,二是面向開發(fā)者,這里我們更多關(guān)注第一類。
用戶行為都會存儲在日志數(shù)據(jù)庫中,由于用戶產(chǎn)生的數(shù)據(jù)量巨大且速度快,為了保證數(shù)據(jù)傳輸?shù)姆€(wěn)定性,可以嵌入高吞吐量分布式消息系統(tǒng)——Kafka。
同時(shí)為了提高數(shù)據(jù)處理效率,通常會設(shè)定日志內(nèi)容邊界對檢測出的無效數(shù)據(jù)源(例如刷單數(shù)據(jù))先做過濾。當(dāng)然經(jīng)過篩選后的數(shù)據(jù)也并非規(guī)整,這就需要對數(shù)據(jù)進(jìn)行一定層級的分級分類和格式規(guī)范了。
比如用戶點(diǎn)擊行為,會生成相應(yīng)的點(diǎn)擊日志,用戶的每次查詢會生成一個(gè)展示日志,與此同時(shí)會有一個(gè)并行的程序?qū)w并點(diǎn)擊日志與展示日志。
3. 推薦系統(tǒng)算法
有了前端展示后和后端數(shù)據(jù)之后,那么如何實(shí)現(xiàn)他倆的交互呢,這中間需要一個(gè)連接的橋梁——推薦系統(tǒng)算法。
推薦系統(tǒng)算法可以抽象為一個(gè)規(guī)則,只有把這個(gè)規(guī)則定義好,前端才知道哪些數(shù)據(jù)該展示并如何展示,后端數(shù)據(jù)庫也知道哪些數(shù)據(jù)有價(jià)值。否則,如果將所有日志內(nèi)容輸出,不僅會增大用戶信息檢索的困難,系統(tǒng)也就失去了自身意義。
總的來說,推薦系統(tǒng)的實(shí)質(zhì)就是一個(gè)用戶行為特征與物品特征匹配的過程。
用戶端特征包含用戶自身、用戶行為和用戶行為結(jié)果三部分;物品特征包含標(biāo)簽、內(nèi)容(關(guān)鍵詞)等。
推薦結(jié)果均是基于用戶特征及物品特征原始數(shù)據(jù),在不同維度(時(shí)間、多樣性、流行度等)上,根據(jù)用戶需求賦予權(quán)重并進(jìn)行處理(篩選、排序等)后的結(jié)果。即遵循用戶—特征—物品過程。當(dāng)推薦系統(tǒng)生成初始結(jié)果后,在通過過濾、排名算法生成最終推薦結(jié)果和推薦理由。
推薦引擎可抽象成一種特征,每種特征對應(yīng)成一種推薦策略,結(jié)合不同用戶需求,調(diào)整每個(gè)具體特征上所賦予的權(quán)重,最終生成特征物品-特征映射{item:Userfeature},Userfeature為多個(gè)特征權(quán)重相加后的最終值。
三、常用推薦系統(tǒng)算法
1. 常用系統(tǒng)原理介紹
我們從推薦系統(tǒng)具體要解決什么問題以及如何解決問題來剖析原理。
首先,推薦系統(tǒng)要解決的最核心的兩個(gè)關(guān)鍵點(diǎn)是:如何發(fā)現(xiàn)用戶感興趣的物品和如何確定物品之間的關(guān)系。其次,每個(gè)問題分別如何解決呢?
1.1 如何發(fā)現(xiàn)用戶感興趣的物品
1.1.1 用戶主動(dòng)告訴系統(tǒng)對哪些類型感興趣
用戶自行選定感興趣的關(guān)鍵詞標(biāo)簽,系統(tǒng)將找到與此標(biāo)簽匹配的物品。
1.1.2 通過分析用戶行為數(shù)據(jù)
利用用戶在平臺的歷史瀏覽記錄獲取能代表用戶的關(guān)鍵詞,或?qū)?strong>社交數(shù)據(jù),獲取用戶好友列表,從而基于用戶好友喜愛物品生成推薦列表。
1.2 如何確定物品與物品間的關(guān)系——相似度
相似度計(jì)算原理:所有相似度的計(jì)算都是基于矩陣的運(yùn)算。
1.2.1 基于內(nèi)容(關(guān)鍵詞/標(biāo)簽)
大部分物品都會多維度特征,通過特征從而實(shí)現(xiàn)與用戶的期望得以匹配,常用的是通過物品內(nèi)容關(guān)鍵詞或是給物品打標(biāo)簽的形式來匹配。
1.2.2 協(xié)同過濾
協(xié)同過濾也是推薦系統(tǒng)中常用的算法,其分為兩種,基于用戶和基于物品。
那什么是基于用戶呢?
就是找到和你相似的一個(gè)小群體,小群體里面喜歡的東西都是你喜歡的,你獲得的推薦結(jié)果就是這個(gè)小群體喜愛的物品集合。
那什么基于物品呢?
基于用戶興趣交集計(jì)算物品間的相似度,即喜歡物品i的用戶有多少也喜歡物品j,通常用來表示物品間的相似度,同時(shí)結(jié)合用戶歷史行為生成推薦列表;用戶的歷史行為對物品間的相似性也具有一定的貢獻(xiàn)度。
這樣看來,基于物品的推薦系統(tǒng),更加個(gè)性化同時(shí)也一定程度上反映了用戶的興趣傳承。
2. 如何實(shí)現(xiàn)更加精準(zhǔn)的分類
僅僅通過用戶間興趣交集生成推列表往往是不夠的,在內(nèi)容、標(biāo)簽的分類以及人群之間的關(guān)系上,如何進(jìn)行深度挖掘?下面幾種方法提供了一些優(yōu)化思路。
2.1 混合推薦
在實(shí)際的案例中,單個(gè)的推薦模型大多都無法滿足預(yù)期,所以通常從系統(tǒng)、算法、結(jié)果、處理流程上采用不同的混合策略。
例如基于內(nèi)容增強(qiáng)協(xié)同過濾(The content-boosted?collaborative filtering recommender),此算法融合了協(xié)同過濾和基于內(nèi)容的算法思想,和基于內(nèi)容或協(xié)同過濾的單個(gè)模型相比,它預(yù)測能達(dá)到比較高的精度,同時(shí)它也能解決了數(shù)據(jù)稀疏和冷啟動(dòng)問題。
2.2?隱語義模型
2.2.1 隱語義概念
類似于協(xié)同過濾中基于物品的方法;在每個(gè)具體分類中,以用戶行為(興趣)作為物品權(quán)重的分配依據(jù)。
2.2.2 與協(xié)同過濾不同之處(優(yōu)化點(diǎn)):
- 物品可以有多個(gè)分類維度;基于用戶行為決定每個(gè)類中物品的權(quán)重(eg:如果某類用戶群體都對某一物品特別感興趣,在這類中這個(gè)物品的權(quán)重就非常大)
- 分類粒度更加細(xì)化;比如關(guān)于《深入理解OpenCV》這本書原來被劃分為【計(jì)算機(jī)】類,細(xì)化之后可以分為【圖像處理】類;
2.3?文本精準(zhǔn)匹配
為量化文本間的關(guān)聯(lián)度,引入一個(gè)概念——TF-idf,通過比對搜索關(guān)鍵詞與物品庫單個(gè)物品的關(guān)鍵詞或標(biāo)簽的相似性,從而生成推薦列表。
TF-idf值越大,說明相關(guān)性越大,反之;這里對TF-idf公式原理做簡要說明加強(qiáng)理解:
計(jì)算公式:TF-idf = ?f(t,d) x idf(t,D)
TF:頻率;搜索詞在特定文檔中出現(xiàn)的頻率:
Idf:搜索詞在其他文檔中出現(xiàn)的次數(shù):
在文檔搜索中,不僅要考慮搜索關(guān)鍵詞在目標(biāo)文檔出現(xiàn)的頻率,也要考慮關(guān)鍵詞在其他文檔出現(xiàn)的頻率。
如果搜索詞是大眾詞語,那么搜索的結(jié)果完全不具備參考價(jià)值,比如搜索詞為the;在idf公式中,分子為所有文檔的個(gè)數(shù),分母為包含這個(gè)關(guān)鍵詞的文檔個(gè)數(shù),如果是大眾詞語,則:idf=0,TF-idf=0,物品(關(guān)鍵詞)間沒有相關(guān)性。
2.4?利用社交網(wǎng)絡(luò)數(shù)據(jù)
社交網(wǎng)絡(luò)中包含大量的用戶數(shù)據(jù),能更好的反映用戶間的關(guān)系,用戶關(guān)系通常有三種:
- 互為好友(Facebook)
- 單向關(guān)注(Twitter)
- 興趣小組模式(豆瓣小組)
利用社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行推薦通常都將用戶間的熟悉程度和興趣相似度作為最主要的兩個(gè)判別指標(biāo)。
用戶間熟悉程度,即通過用戶共同好友數(shù)量計(jì)算;興趣相似度,即通過兩個(gè)用戶喜愛物品的重合度進(jìn)行衡量。
弊端:用戶數(shù)據(jù)量巨大,數(shù)據(jù)庫讀取消耗時(shí)間太長。
優(yōu)化方法:
- 減少數(shù)據(jù)量;
- 重構(gòu)數(shù)據(jù)庫;
2.5?時(shí)間特征
在日常生活中,物品迭代速度非常快,人們的近期行為通常比遠(yuǎn)期行為更加符合目前自身興趣需求,因此在系統(tǒng)滿足精準(zhǔn)性的情況下,需要考慮推薦系統(tǒng)的時(shí)效性,根據(jù)不同推薦內(nèi)容賦予時(shí)間權(quán)重。
例如新聞與經(jīng)典書籍,新聞更新頻繁具有較高的時(shí)效性,而經(jīng)典書籍例如紅樓夢,社會對它的需求已經(jīng)處于平穩(wěn),因此時(shí)效性不高。
如何將時(shí)間權(quán)重賦予物品:
- 物品的生命周期:物品生命周期的長短決定了物品的時(shí)效性。一個(gè)物品隨著流行度的增長,在線時(shí)長(一個(gè)物品在某天被用戶產(chǎn)生過行為)也隨之增加,斜率越大說明具有較低的時(shí)效性生命周期較長(如wikipedia),斜率越小說明具有較高的時(shí)效性生命周期較短(如nytimes)。所以物品生命周期越長,與時(shí)間相關(guān)性越低。
- 人的興趣愛好會隨著時(shí)間而改變,不同階段所感興趣的物品差異較大,時(shí)間相隔越久,用戶對物品產(chǎn)生的行為權(quán)重越低,近期行為賦予較高權(quán)重。
除此之外,不同物品推薦的時(shí)間點(diǎn)也是需要考慮因素之一,比如用戶在工作時(shí)間,盡可能推送與工作相關(guān)的資訊或資料,與工作內(nèi)容不相關(guān)的信息做降權(quán),下班時(shí)間再適當(dāng)調(diào)整權(quán)重。
但是同時(shí)也要考慮不同崗位工作狀態(tài)存在不一致的情況,具體推送情況可以通過每個(gè)用戶大量的行為數(shù)據(jù)來判斷。
2.6?環(huán)境特征
環(huán)境特征通??梢耘c時(shí)間特征配合。用戶在不同的時(shí)間與地點(diǎn)的需求差異可能會很大甚至完全不同,或是在特定的時(shí)間與地點(diǎn),對某種信息的需求會急速上升。
例如用戶在紐約旅游,關(guān)注點(diǎn)會大量集中在紐約的衣食住行,但如果這個(gè)時(shí)候推薦系統(tǒng)推薦的信息都是倫敦的,那么結(jié)果可想而知。
四、?實(shí)戰(zhàn)篇——如何維護(hù)用戶數(shù)據(jù)
當(dāng)用戶數(shù)據(jù)量太大,例如引入社交網(wǎng)絡(luò)或是新聞實(shí)施推薦,此時(shí)如果每次更新都讀取一次數(shù)據(jù)庫,那么效率會大幅下降導(dǎo)致用戶體驗(yàn)不佳。
目前常用的有兩種方案:
1. 消息隊(duì)列
為每個(gè)用戶維護(hù)一個(gè)消息隊(duì)列,里面包含用戶的基本屬性(如年齡、性別、職業(yè)等)、喜愛的物品、朋友圈等。每當(dāng)這個(gè)用戶產(chǎn)生新的動(dòng)作(搜索),系統(tǒng)將根據(jù)特定的規(guī)則,賦予消息隊(duì)列中每部分?jǐn)?shù)據(jù)的權(quán)重。最終獲得推薦列表。
這里科普一下什么是消息隊(duì)列。顧名思義,就是把傳輸?shù)南⒎旁陉?duì)列里,隊(duì)列,可以抽象為一個(gè)容器,所以消息隊(duì)列,就是一個(gè)用作保存?zhèn)鬏斨械南⑷萜鳌?/p>
在這個(gè)基礎(chǔ)上,這個(gè)容器可以跨平臺、語言提供可靠的、持久的異步通訊機(jī)制。
- 可靠是指:有且只有一次;有序。
- 異步是指:發(fā)送方和接收方可以不同時(shí)在線。
另外,通過消息隊(duì)列還能實(shí)現(xiàn)系統(tǒng)解耦,這使得各個(gè)系統(tǒng)間可以相對獨(dú)立運(yùn)行。
2. 建立喜好詞關(guān)鍵表
在數(shù)據(jù)庫中,我們?yōu)槊總€(gè)用戶維護(hù)一個(gè)map,也就是建立“key-value”鍵值對,key對應(yīng)用戶喜好詞,value對應(yīng)喜好程度。
每個(gè)新聞會有對應(yīng)的關(guān)鍵詞和Tf-idf值。當(dāng)用戶瀏覽一篇新聞時(shí),系統(tǒng)會將這篇新聞的關(guān)鍵詞和Tf-idf值插入到用戶喜好此列表里。如果用戶瀏覽了包含與原有相同關(guān)鍵詞的新聞,Tf-idf值會自動(dòng)相加并更新原有值。同時(shí)考慮數(shù)據(jù)庫存儲問題,根據(jù)具體需求為關(guān)鍵詞量設(shè)定一個(gè)上限。
當(dāng)然,除了存儲問題,這里還有一個(gè)新問題:用戶興趣是否會變化呢?
比如在某某手機(jī)的發(fā)布會前或是世界杯,用戶只在這段時(shí)間集中關(guān)注某一話題,但之后可能完全不在意了,那么在喜好詞列表里,如何體現(xiàn)用戶興趣遷移呢?
這里引入一個(gè)新概念——衰減機(jī)制。每一個(gè)Tf-idf值乘上一個(gè)衰減因子, 同時(shí)在喜好列表中設(shè)定一個(gè)閾值L,當(dāng)Tf-idf減少到小于L的時(shí)候,關(guān)鍵詞直接刪除。
五、未來思考
一個(gè)人在群體中的重要性和影響力以及人與人之間一直是難以通過幾個(gè)參數(shù)或幾個(gè)模型就能判別的,它們均是一個(gè)不規(guī)則的非線性模型。
平臺數(shù)據(jù)對于深度挖掘人與人之間的關(guān)系來說其實(shí)是微不足道的,在現(xiàn)實(shí)生活中,人與人之間的關(guān)系本來就難以定論,存在著表層關(guān)系與深層關(guān)系。
表層關(guān)系具體是指社會賦予你們的關(guān)系,比如同事、上下屬、同學(xué)等,深層關(guān)系則是指你們除了是同事以外,可能私下里是有著相同的興趣愛好的朋友。
表層關(guān)系通??梢杂脭?shù)據(jù)挖掘定義,比如兩個(gè)人的通話記錄(這里不是指通話內(nèi)容,而是打電話的時(shí)間、時(shí)長等)、位置信息等,但是外部信息數(shù)據(jù)通常會根據(jù)個(gè)人習(xí)慣而產(chǎn)生誤差。
其實(shí),對推薦系統(tǒng)的理解等價(jià)于對人性的理解;挖掘人與人的關(guān)系、人與物的關(guān)系、物與物的關(guān)系。
除了人們主動(dòng)表達(dá)的需求,我認(rèn)為最重要的,其實(shí)是人性的欲望。所謂道生一,一生二,三生萬物,萬物由道生出,而欲望乃道的其中一個(gè)產(chǎn)物。所以欲望通常不會平白無故的產(chǎn)生,欲望與欲望之間也不會毫無關(guān)聯(lián),個(gè)人的成長經(jīng)歷及生活環(huán)境造就了一個(gè)人的性格,讓他養(yǎng)成了一些習(xí)慣。
習(xí)慣通常是有形無意識表達(dá),而欲望通常是無意識無形表達(dá)。我在想,是否把習(xí)慣與欲望結(jié)合起來,是否就是對人性的建模。大數(shù)據(jù)時(shí)代,通過大量的用戶成長數(shù)據(jù)與環(huán)境數(shù)據(jù)或許可以適當(dāng)挖掘其中規(guī)則,但更加深入的,其實(shí)是要推導(dǎo)因果的關(guān)系。
參考文獻(xiàn):
[1] 新聞推薦系統(tǒng):基于內(nèi)容的推薦算法——TFIDF、衰減機(jī)制
[2]《推薦系統(tǒng)實(shí)戰(zhàn)》;
[3]《日志系統(tǒng)設(shè)計(jì)》
[4]《消息隊(duì)列應(yīng)用場景》
[5] 推薦系統(tǒng)的混合加權(quán)技術(shù)研究
[6] Xiaoyuan Su and Taghi M. Khoshgoftaar, “A Survey of Collaborative Filtering Techniques”,Advances in Artificial Intelligence,2009.
本文由 @ShallyFeng 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash ,基于 CC0 協(xié)議
算法這塊還有一個(gè)多路召回,一般單個(gè)算法模型不能滿足推薦的精準(zhǔn)度。
贊贊
棒棒的