商品推薦系統(tǒng)的類型與原理
電商系統(tǒng)中,它的推薦系統(tǒng)與實現(xiàn)邏輯是怎么樣的呢?不同推薦方式背后的運行邏輯是什么呢?本文將為我們揭曉以上問題的答案。
很多事物沒有接觸其背后真相的時候都覺得它十分神秘,生活中的魔術(shù)就是這樣的事物。
而我們在沒有接觸推薦系統(tǒng)的時候,同樣覺得它十分神秘、不可思議。比如用戶在搜索引擎上搜索一些商品的資料后,去淘寶或者京東時竟然突然發(fā)現(xiàn)在推薦的地方出現(xiàn)了用戶想要去搜索的商品。
慢慢去了解推薦系統(tǒng),并思考推薦系統(tǒng)的實現(xiàn)時,我發(fā)現(xiàn)它們背后基本邏輯還是十分簡單的。
一、推薦系統(tǒng)是什么呢?
今晚有英超的球賽,啤酒和球賽才是最配,怎么能沒有啤酒呢,這時你有幾個選擇?
第一種選擇:你可以去你家樓下7-11,然后你走進店鋪轉(zhuǎn)了一圈很快找到了啤酒,然后你對比一下幾個品牌和價格,然后拿起你喜歡的品牌在前臺進行付款。
第二種選擇:你看離球賽開始時間還有段時間,你可以去家附近的家樂福順帶買點零食,你到了家樂福按照指示牌找到賣酒水的貨架,然后不斷對比啤酒的品牌和價格,選定之后,你又按照指示牌找到賣零食的貨架,然后選擇了幾袋薯片,然后進行結(jié)算。
第三種選擇:你很懶,只想在沙發(fā)上面躺尸,這時你可以打開外賣APP在叫做搜索框的物件上面 搜索啤酒,然后你在商品里面挑選各種啤酒,完了之后你根據(jù)和你距離的遠近進行下單,等待送貨上門。
以上描述了用戶在不同場景選購啤酒的方式,也是面對商品過載情況下用戶怎么對商品進行挑選的場景。
- 在7-11店鋪由于店鋪不大,店鋪成列的SKU大致上千種,用戶很容易憑借自己的瀏覽習(xí)慣找到啤酒這個商品。
- 到了家樂福,如果你不是經(jīng)常去逛超市很難通過瀏覽方式在數(shù)萬的SKU種找到啤酒,但是用戶可以通過商品類目來找到啤酒。
- 而進入電商類網(wǎng)站,里面的SKU都是千萬級別的,用戶只能通過搜索來獲取到啤酒。
上述例子是針對目的明確的用戶的。但是生活中很多用戶是目的不明確的,所以才有逛街這個詞,逛街和逛超市可能就是因為無聊,為了打發(fā)時間才有的行為。
那超市如何使這些人消費呢?
既然你不知道買什么,我就告訴你需要買什么?用各種促銷、各種打折、各種堆頭推薦商品,同時在你購買商品附近放和這個商品相關(guān)的商品。
再比如,以前聽音樂是用Walkman,用的是卡帶和CD,現(xiàn)在一個手機音樂就涵蓋了很多音樂,但問題來了——這么多音樂你要聽哪些啊?
如果身邊有朋友你可以問你朋友,但是有時候朋友推薦的并不是你喜歡的,而且你不可能時時刻刻都去問朋友吧?
在信息泛化和過載的時代,你需要這樣一款懂你的工具,比如你在想聽歌的時候,提供你喜歡的音樂,當(dāng)你想去一個陌生地方的時候為規(guī)劃好路線,這個工具就叫推薦系統(tǒng)。
推薦系統(tǒng)是信息過濾系統(tǒng)的一個子類,它根據(jù)用戶的偏好和行為,來向用戶呈現(xiàn)他(或她)可能感興趣的物品。推薦系統(tǒng)會嘗試去預(yù)測你對一個物品的喜好,以此向你推薦一個你很有可能會喜歡的物品。
推薦系統(tǒng)滿足的需求就是在海量信息中幫你過濾你不感興趣噪聲,為你精確鎖定你希望得到的有價值的信息。為用戶過濾噪聲搜索引擎也能提供,幫助用戶精確鎖定信息。
而搜索引擎于推薦系統(tǒng)的區(qū)別在于,搜索引擎是用戶主動獲取,用戶有明確關(guān)鍵詞來描述自己想要的。
推薦系統(tǒng)不需要用戶有明確需求,而會根據(jù)用戶標(biāo)簽,歷史行為為用戶主動推薦內(nèi)容。
小結(jié)一下,推薦系統(tǒng)是一套信息過濾系統(tǒng),通過推薦算法將用戶和物品聯(lián)系起來,它能夠在信息過載的環(huán)境中幫助用戶找到感興趣的信息,也能夠推送信息給感興趣的用戶。
二、商品推薦目的
1. 想讓用戶買什么
正如上面過所說, 很多用戶過來就是無聊打發(fā)時間,也不知道想要買什么,就是上來看看。這個場景主要表現(xiàn)在新平臺的用戶只是過來看看上面的商品是否和自己的預(yù)期匹配,這個預(yù)期首先拋開產(chǎn)品功能上體驗,從商品角度來說包括商品的豐富程度,商品價格優(yōu)惠程度;老平臺的用戶過來只是為了打發(fā)時間,看看平臺有沒有推薦自己感興趣的商品。比如各種秒殺活動、團購活動、搜熱、分類上熱門搜索、猜你喜歡等等。電商常用這些做法來表達自己平臺的主張,平臺想要用戶買什么。
2. 用戶可能想買什么
給用戶推薦用戶真正感興趣的商品,個性化進行推薦。用戶使用的時間越長,推薦的越精準(zhǔn)。偏好的推薦本質(zhì)上是一種排除系統(tǒng),主要流程包括收集-分析-匹配-推薦。
為什么說用戶使用時間越長推薦越精準(zhǔn),通過用戶的使用,系統(tǒng)在不斷收集用戶的行為信息(瀏覽記錄、搜索記錄、購買記錄、收藏記錄、評價記錄及用戶基本信息),再通過收集到用戶行為記錄分析用戶購買偏好,建立用戶畫像;匹配相同偏好的用戶發(fā)現(xiàn)其偏好的商品,匹配相似度高的商品;推薦通過算法將匹配相似度高的商品在前臺進行呈現(xiàn)。個性化推薦通過計算商品和用戶特征,最終實現(xiàn)“千人千面”的商品推薦方式。
3. 更好的挖掘長尾商品
80/20法則無處不在,尤其是傳統(tǒng)零售企業(yè)需要考慮商品的流轉(zhuǎn)率,都希望每個商品都被銷售一空,因為如果滯銷貨架的成本會壓死零售商。但是互聯(lián)網(wǎng)的出現(xiàn)在試圖打破這個法則,這些長尾商品的總銷售額是個不可小覷的數(shù)字,甚至超過主流商品。主流商品代表大多數(shù)用戶的需求,而長尾商品則代表小眾用戶個性化需求。通過推薦系統(tǒng)發(fā)掘用戶興趣,發(fā)掘長尾商品創(chuàng)造更高的銷售額。
為什么今日頭條,抖音都說有毒,不知不覺一刷就是好幾個小時,背后的始作俑者就是推薦算法,而這種推薦算法就是更懂你。今日頭條和抖音這類平臺的崛起讓人意識到推薦算法的強大,而最先運營推薦算法的是在電商領(lǐng)域,如果說新聞類推薦不精準(zhǔn)用戶最多看其他新聞,電商變現(xiàn)鏈條路徑比較短,如果推薦算法不完善流失的可是真金白銀。
三、推薦算法數(shù)據(jù)獲取
個性化推薦算法不是憑空產(chǎn)生的需要基于用戶的行為進行數(shù)據(jù)分析設(shè)計的,用戶行為在個性化統(tǒng)計中有兩種方式顯性和隱形。
顯性反饋行為就是讓用戶明確表達對物品的觀點,比如對音樂的喜歡和不喜歡,對電影的評分,對小視頻的點贊等,這些都是設(shè)計人員特意讓用戶表達自己的觀點。
與顯性相對的就是隱性反饋方式,這種方式不需要用戶特地的反饋自己的偏好,而是通過用戶行為模型進行采集和分析,比如用戶對商品的瀏覽行為。隱性反饋和顯性反饋需要的數(shù)據(jù)量更好,存儲方式分布式存儲,對算法模型要求更高。
通過兩種反饋方式后,我們可以得出用戶給出的反饋結(jié)果,而結(jié)果分為正向的結(jié)果和負向的結(jié)果,兩個結(jié)果就不做詳細解釋,從字面意思就可以看出來。需要說明的一下隱性反饋一般沒有負反饋,隱性反饋都是從日志數(shù)據(jù)中得到用戶行為的結(jié)果。
下面我們來對電商推薦系統(tǒng)做一下簡單的介紹。
四、常規(guī)推薦法
這種方法和線下商超的手法如出一轍,比如banner廣告、熱銷排行榜、商家促銷、秒殺、精品推薦等等,都是給予平臺運營人員或者買手主觀進行推薦,并不會因為用戶不同而產(chǎn)生差異,而推薦的條件取決于運營人員經(jīng)驗、商家的贊助(花錢)、銷售數(shù)據(jù)、評價數(shù)據(jù)、瀏覽數(shù)據(jù)、收藏數(shù)據(jù)等這些因子的影響。
目前電商紛紛轉(zhuǎn)型內(nèi)容電商和社交電商,通過PGC或者UGC生成內(nèi)容來吸引消費者的眼球,留住用戶時間從達到促銷的目的。
內(nèi)容形式有長圖文、視頻推薦、直播推薦等多種形式,在內(nèi)容中嵌入商品購買入口,在瀏覽時可以直達商品,增加購買轉(zhuǎn)化率。
而社交電商主要是分銷形式,一說分銷大家都懂,他那是沖著消費去的嗎?
常規(guī)推薦的問題也很明顯,爆款數(shù)量畢竟是少數(shù),運營人員推薦的商品用戶不一定會買賬,這樣用戶流失率會比較高。這就催生出了第二種推薦方式:個性化推薦法。
五、個性化推薦法
個性化推薦通過采集用戶信息,商品信息以及用戶行為數(shù)據(jù),通過分析和整理后過濾掉的商品數(shù)據(jù),利用推薦算法的規(guī)則和排序方式給用戶進行推薦商品的呈現(xiàn),從而達到個性化的推薦。而用戶對呈現(xiàn)結(jié)果的反饋比如點擊,瀏覽時間,收藏,購買,作為依據(jù)來不斷優(yōu)化推薦系統(tǒng)。
常見的個性推薦算法主要包括:基于內(nèi)容個性推薦、利用用戶行為的協(xié)同過濾、基于人口建模的推薦。在現(xiàn)實情況下,推薦算法不會單一的存在,而是多種推薦方式進行融合,實現(xiàn)個性化推薦的目的-用戶可能想買什么。
1. 基于內(nèi)容的推薦(CB,Content-Based Recommendation)
CB基于內(nèi)容相關(guān)性構(gòu)建商品模型推薦,利用內(nèi)容本身的特征進行推薦。將商品相關(guān)的類目、品牌、商品屬性、商品標(biāo)題、商品標(biāo)簽等相似內(nèi)容推薦給用戶。內(nèi)容的推薦是非?;A(chǔ)的推薦方法,計算的是內(nèi)容本身的相關(guān)程度。
比如用戶在淘寶上瀏覽過男士襯衫,在淘寶的發(fā)現(xiàn)好貨就會給你推薦各種各樣的男士襯衣、男士T恤、男士西裝等,在通過你繼續(xù)訪問男士七分袖襯衣,系統(tǒng)又獲取到這個產(chǎn)品屬性,會繼續(xù)給你推薦七分袖的亞麻襯衣、七分袖麻料襯衣、五分袖襯衣、男士七分袖T恤等等。這就相當(dāng)于在商場身邊有個貼身的導(dǎo)購,你每試穿一次衣服又為你推薦一系列相關(guān)的衣服一樣。
CB的基本實現(xiàn)原理
(1)提取商品特征
這個可以根據(jù)商品的一些特征比如類目,屬性,品牌,標(biāo)題,標(biāo)簽,商品組合,評分等因子進行提取。
(2)計算用戶喜歡的特征
根據(jù)用戶以前的喜歡的和不喜歡的商品的特征進行計算,得出用戶喜歡的特征。用戶的特征由相關(guān)關(guān)鍵字組成,可以通過TF-IDF模型計算用戶行為的關(guān)鍵字,從而得出用戶的特征。
(3)相關(guān)商品推薦給用戶
根據(jù)用戶喜歡的特征,去商品庫進行選擇,找出相關(guān)性最大的多個商品進行推薦。因為提取出了商品的特征,通過計算得出了用戶喜歡的特征,可以通過余弦相似度計算出商品間的相識性給用戶進行推薦。簡單介紹一下余弦相似度,通過計算兩個向量的夾角余弦值來評估他們的相似度。如圖所示,夾角越小,兩個向量越類似;夾角越大,兩個向量越不同。
(4)最后根據(jù)用戶反饋的結(jié)果更新用戶喜歡的特征
用戶的喜好是不斷變化的,今天可能我關(guān)注襯衣,明天我又想看手機,所以系統(tǒng)需要根據(jù)用戶喜歡的變化更新用戶的特征。
CB算法的優(yōu)點:
- (1)實現(xiàn)起來比較簡單,不需要復(fù)雜的算法和計算,很快可以實現(xiàn)商品的相關(guān)性。
- (2)推薦結(jié)果容易被用戶感知,用戶行為很快被計算出來,從而實現(xiàn)推薦
- (3)結(jié)果可解釋,很容易找到可解釋的相關(guān)特征。
- (4)新的商品也可以馬上被推薦
CB算法的缺點:
- (1)無個性化,無法挖掘用戶的潛在興趣
- (2)分析特征有限,很難充分提取商品相關(guān)性
- (3)無法為新用戶產(chǎn)生推薦,在用戶行為較少時推薦不精準(zhǔn)。
2. 基于協(xié)同過濾的推薦
通過基于內(nèi)容的推薦算法只能基本滿足用戶的推薦需求,但是要做到平臺千人千面還是要有一定的距離。所以我們需要通過算法自動發(fā)掘用戶行為數(shù)據(jù),從用戶的行為中推測出用戶的興趣,從而給用戶推薦滿足他們興趣的物品。
而基于用戶行為分析的推薦算法是個性化推薦系統(tǒng)的重要算法,從而學(xué)術(shù)界一般將這類算法叫做“協(xié)同過濾算法”。協(xié)同過濾算法是指通過用戶行為分析,不斷獲取用戶互動信息,是用戶的推薦列表不斷過濾掉自己不感興趣或者不匹配的商品,讓結(jié)果不斷提升用戶的滿意度。
簡單來說,這種方法不單單只是根據(jù)自己的喜愛,而且還引入了“鄰居”的喜好來進行推薦。這樣推薦更加充分,而且可以深入挖掘用戶的潛在的興趣。
上面說過協(xié)同過濾是基于用戶行為分析,就需要引入一下參數(shù)進行計算:
- 用戶標(biāo)識
- 商品/物品標(biāo)識
- 用戶行為的種類(包括瀏覽,點贊,收藏,加入購物車,下單等)
- 用戶行為的上下文(包括時間、地點等)
- 用戶行為的權(quán)重(包括瀏覽時長,購買頻次等)
- 用戶行為的內(nèi)容(比如點評的分值,評論的文本內(nèi)容等)
基于協(xié)同推薦業(yè)界得到最廣泛的算法是基于領(lǐng)域的方法,然而其又細分為了兩塊——基于用戶的協(xié)同過濾稱為User-based CF 和基于商品的協(xié)同過濾稱為Item-based CF。下面我們別對這兩者進行說明。
(1)基于用戶的協(xié)同過濾User-based CF
系統(tǒng)通過分析用戶和其他用戶的特征值,找出相近的特征用戶,然后根據(jù)特征用戶的喜好商品,從中找到一些商品推薦給該用戶。
以閱讀為例,比如用戶A一直看產(chǎn)品經(jīng)理方面的書籍,這樣系統(tǒng)可以找到和他有類似興趣的用戶,然后把這些用戶喜歡看的書(同時這些書用戶A沒有看過的)推薦給用戶A。簡言之就是計算出兩個用戶的相似度,然后給A推薦用戶B喜歡的東西。
User-based CF基本實現(xiàn)原理
1)找到和目標(biāo)用戶興趣相似的用戶
先將用戶行為進行定義分值,比如從瀏覽,收藏,加入購物車,購買,評分等幾個行為進行定義分值,然后根據(jù)用戶對商品的行為進行打分,通過余弦相似度方法進行計算興趣相似的用戶。
在這里舉個栗子吧:
我們先定義一下用戶1001-1006個用戶,用戶對于商品行為類型為下表幾種瀏覽,收藏,下單等,同時我們需要對用戶行為賦予不同的權(quán)重分,比如收藏為0.5分,整體的行為分值表如下:
然后我們假設(shè)用戶在不同商品下的用戶行為進行統(tǒng)計,得出以下用戶對于商品的偏好程度的得分表,其中表格中的數(shù)值為用戶對商品的感興趣程度。
我們根據(jù)用戶余弦相似度進行計算相似的用戶。具體公式如下:
我們假設(shè)計算 1001和1002 兩個用戶的相似程度,并將數(shù)據(jù)帶入公式中:
cos(1001,1002)= 2*3+4*5+5*5+5*1 / √22+42+52+52 * √32+52+52+12 = 0.863
通過計算我們得出1001和1002用戶余弦相似度約等于 0.863,相似值得范圍從-1到1,1表示用戶之間完全相似,0表示用戶之間是獨立得,-1表示兩個用戶之間相似度正好相反,在-1到1之間得值表示其相似和相異。而我們剛才得出得指是0.863表示用戶之間得相似性非常高。 同理我們可以計算出1001用戶和其他用戶得相似值。
2)將集合中用戶喜歡的且目標(biāo)用戶沒有聽說過的商品進行推薦
計算出來用戶相似度后,在相似度高的用戶集合中選擇相關(guān)商品,將目標(biāo)用戶沒有瀏覽過的商品進行推薦。
還是延續(xù)之前那個栗子,我們需要給1001用戶推薦沒有瀏覽過的商品,我們將和1001相似值較高的用戶進行選擇,假設(shè)我們設(shè)定一個閾值比如0.85,相似度0.85以上用戶的喜好商品進行推薦,但是同時涉及到推薦的排序的問題。我們根據(jù)以下公式進行計算推薦:
(其中S(u,k)包含和用戶u興趣最接近的k個用戶,N(i)對物品i有過行為的用戶集合,通過W是用戶U和用戶V的相似度,R表示用戶V對物品興趣)
我們需要先計算出與1001相似得用戶,通過計算得出1002-1006用戶的相似值分別是0.863,0.875,0.779,0.812,0.916。這樣系統(tǒng)可以將“鼠標(biāo)”推薦給用戶1001.我們需要去閾值在0.85以上的用戶,分別是1002,1003,1006,所以可以給用戶1001推薦自拍桿和白酒兩種商品,我們可以通過上面的公式計算用戶對這兩者感興趣程度然后進行排序。
- 自怕桿=0.863*1+0.916*8=8.191
- 白 酒 =0.863*3=2.589
這樣我們可以將自拍桿和白酒的排序,將自拍桿排列在白酒的前面。
(2)基于商品的協(xié)同過濾Item-based CF
這種算法是亞馬遜最先提出來的,系統(tǒng)通過分析用戶標(biāo)簽數(shù)據(jù)和行為數(shù)據(jù),判斷出用戶喜好商品的類型,然后從這類喜歡共同類型商品的用戶中挑選一些類似的商品推薦給該用戶。
比如,該算法會因為你購買過“佛珠手串”而給你推薦“茶具”和“檀香”。該算法目前在電商領(lǐng)域使用最多的算法。很多朋友會覺得item CF算法和基于內(nèi)容的推薦算法很類似,CF算法并不基于商品的屬性和類目進行計算相似度,他主要通過分析用戶行為來記錄內(nèi)容之間相關(guān)性。所以算法不會計算 佛珠手串和茶具,檀香的相似度,而是喜歡佛珠手串的用戶也喜歡茶具和檀香,系統(tǒng)就判斷手串和茶具、檀香之間有相關(guān)性。
Item-based CF基本實現(xiàn)原理
1)計算內(nèi)容之間的相似度
計算商品間的相似度同樣用到的是余弦相似度的計算方法,兩個商品產(chǎn)生相似度是因為他們共同被很多用戶喜歡,商品相似度越高,說明這兩個商品被很多共同喜好的用戶所喜歡。
這里同樣用到了余弦相似性來求物品的相似度,但是公式略有不同,其中,|N(i)|是喜歡物品i的用戶數(shù),|N(j)|是喜歡物品j的用戶數(shù),|N(i)&N(j)|是同時喜歡物品i和物品j的用戶數(shù)。
舉例說明,首先我們假定有3個用戶,分別為A、B、C,用戶A購買A,B兩個商品,用戶B購買了ABC三個商品,用戶C只買了商品A。
- 物品A:用戶A 用戶B 用戶C
- 物品B:用戶B
- 物品C:用戶A 用戶B
根據(jù)上面公式進行計算,我們先進行物品A、物品B、物品C之間的形似度計算
- 物品A/物品B = 1 / √3*1 = 0.578
- 物品B/物品C = 1 / √2*1 = 0.702
- 物品A/物品C = 2 / √3*2 = 0.816
從以上的結(jié)果可以看出來,物品A和物品C之間相似度最高,我們需要推薦商品給用戶C時,我們首選將物品C推薦給用戶。
2)根據(jù)用戶的偏好,給用戶生成推薦列表。
計算完商品相似度,我們需要把商品推薦給用戶。如果用戶近期有多個行為記錄,我們先計算每條行為記錄的相似值,然后可以得出多個推薦列表,我們需要將這些列表做相似值的去重和排序,需要注意的是如果重復(fù)記錄在單個推薦列表相似值不高,但是多條推薦列表都有涉及我們需要提升其權(quán)重。然后根據(jù)相似值進行排序展示。
UserCF與ItemCF算法的比較
UseCF:
適合于用戶量較小或者小于商品量的場景,如果用戶量過大在計算用戶間相似度上代價很大。時效性比較強,用戶個性化不太明顯的領(lǐng)域,當(dāng)用戶新行為產(chǎn)生后不一定導(dǎo)致結(jié)果的立刻變化。新用戶入駐后產(chǎn)生少量行為后,不能立刻對他進行推薦。UserCF相似表一般都是每隔一段時間進行離線計算的。新商品上線后,有用戶對它產(chǎn)生行為將立刻推薦給其他相似度高的用戶。缺點是很難解釋用戶推薦的理由。
ItemCF:
適用于物品數(shù)量少于用戶量的場景,物品數(shù)量很多則計算相似度上運力要求很高。同時適用用戶個性化需求比較強、物品豐富的場景。用戶一旦有了新的行為一定會導(dǎo)致推薦結(jié)果的變化,新用戶行為發(fā)生變化將立刻向其推薦該物品相似的其他物品。但如果有新商品上線需要離線更新商品的相似度表后,才能進行推薦。
3. 基于人口建模的推薦
基于人口統(tǒng)計學(xué)的推薦是比較容易實現(xiàn)的推薦算法。該算法僅使用用戶的基本信息,比如年齡、性別等,衡量用戶的相似性,將與當(dāng)前用戶相似的其他用戶所偏好的物品推薦給當(dāng)前用戶。
- 用戶A是名女性,年齡介于20~25歲,偏好物品A;
- 用戶B是名男性,年齡介于40~45歲,偏好物品B、物品C;
- 用戶C是名女性,年齡介于 20~25歲;
我們已為每位用戶建立了profile(用戶畫像),現(xiàn)在我們要給用戶C進行推薦。
基于profile和合適的距離度量計算用戶的相似度, 我們發(fā)現(xiàn)用戶A與用戶C最相似,可將用戶A偏好的物品A推薦給用戶C。
基于人口統(tǒng)計學(xué)的推薦特點:
(1)只需要用戶基本數(shù)據(jù)信息就可以進行推薦,不涉及商品的歷史偏好數(shù)據(jù),沒有冷啟動的問題。但同時用戶某些信息不好獲取比如年齡這類隱私的數(shù)據(jù)。
(2)不依賴商品本身的數(shù)據(jù),適合任何領(lǐng)域。因為如此對于用戶分類比較粗糙,不適合精度要求高的領(lǐng)域,比如圖書,電影和音樂,在初期的電商類平臺可以做簡單的推薦。
六、基于知識的推薦系統(tǒng)
協(xié)同過濾系統(tǒng)需要用戶的行為數(shù)據(jù)作為信息源,向用戶推薦商品,而不需要輸入其他的附加信息?;趦?nèi)容的推薦系統(tǒng)主要應(yīng)用的數(shù)據(jù)源包括類別和屬性信息,還有從商品標(biāo)題中獲取的關(guān)鍵詞。
這兩種方法的優(yōu)勢在于能以相對較小的代價獲取這些數(shù)據(jù)。但是有些產(chǎn)品領(lǐng)域,用戶希望能明確定義他們的需求,而這些明確化的需求的處理并不是協(xié)同過濾和基于內(nèi)容的推薦的系統(tǒng)所擅長的。
基于知識的推薦系統(tǒng)可以幫我們解決上面的問題。它不需要評分?jǐn)?shù)據(jù)就可以進行推薦,也不存在冷啟動的問題。
基于知識的推薦系統(tǒng)在物品購買頻率很低的情況下特別適用。例如房屋、汽車、金融服務(wù)甚至是昂貴的奢侈品。在這種情況下,推薦的過程中常常缺乏商品的評價。推薦過程是基于顧客的需求和商品描述之間的相似度,或是對特定用戶的需求使用約束來進行的。它允許顧客明確地說出來他們想要什么。好像身邊有個專屬的顧問,對于買車、買房、金融理財產(chǎn)品他們能夠根據(jù)用戶的需求推薦合適的產(chǎn)品。
基于知識的推薦系統(tǒng),一般以會話方式進行交互,一般的交互過程如下:
- a.??用戶需要按要求一次性或者逐步鍵入自己的需求
- b.??系統(tǒng)收集到足夠多有關(guān)用戶需求和偏好的信息后,系統(tǒng)匹配推薦一部分產(chǎn)品
- c.??用戶可以根據(jù)自己的要求修正這些需求
這種方式類似搜索,只是和搜索不同的是不需要鍵入自己需求,而是系統(tǒng)會提供相應(yīng)的選項給用戶進行選擇。這種方式看似比價簡單,但是實際上需要考驗更加精密的交互模式和專家提供的選項支持,同時也是考驗從業(yè)在某個領(lǐng)域的深度。
如果產(chǎn)品庫里面沒有滿足用戶需求的產(chǎn)品,系統(tǒng)需要智能的給定解決方案,比如主動提供某些的候選結(jié)果。
七、寫在最后的冷啟動
通過上面的介紹相信大家對推薦系統(tǒng)有一定的了解,推薦系統(tǒng)需要有用戶的歷史行為和興趣預(yù)測用戶的行為和行為,因此需要借助大量用戶的行為數(shù)據(jù)來鑄件推薦系統(tǒng)。但是很多時候電商系統(tǒng)剛上線沒有大量的用戶行為數(shù)據(jù)作為支撐,在這樣的情況下怎么樣設(shè)計個性化推薦系統(tǒng)同時讓用戶對推薦的結(jié)果滿意,這就是冷啟動的問題。
1. 冷啟動主要涉及到3類問題
用戶冷啟動
當(dāng)新用戶來到電商系統(tǒng)時,因為系統(tǒng)沒有他的行為數(shù)據(jù),所以無法給他進行個性化推薦。用戶冷啟動主要解決如何給新用戶做個性化推薦的問題。
物品冷啟動
當(dāng)新品上架時,如果更好將商品推薦給它感興趣的用戶。物品冷啟動主要解決新品上架推薦的問題。
系統(tǒng)冷啟動
系統(tǒng)冷啟動主要解決一個新的電商網(wǎng)站設(shè)計了個性化推薦系統(tǒng),讓系統(tǒng)上的商品匹配相應(yīng)的用戶,讓系統(tǒng)用戶體驗到個性化的推薦服務(wù)。
2. 解決方案
針對上面3個問題,有不同的解決辦法,一般來說可以參考一下解決方案:
1)提供非個性化的推薦服務(wù),比如熱門推薦,熱銷排行等,用戶根據(jù)系統(tǒng)推薦的商品,進行用戶的行為,收集到用戶行為數(shù)據(jù)后,切換為個性化推薦。
2)利用基于人口建模的推薦,盡可能多的獲取用戶的個人信息,根據(jù)用戶的個人信息,分組進行推薦。比如獲取用戶的性別,年齡信息后,給用戶推薦相應(yīng)的的商品,當(dāng)然這個商品的顆粒度很粗,但是從過程中可以獲取到用戶的行為信息。
3)需要用戶的社交網(wǎng)絡(luò)賬號登錄,導(dǎo)入用戶在社交媒體的喜好,然后根據(jù)用戶喜歡進行推薦商品。
4)在用戶登錄時需要用戶對一些物品進行反饋,收集用戶對這些物品的反饋,推薦與這些物品相似的商品。比如閱讀APP常用的了解用戶對那些類別的書籍剛興趣,微博上面注冊需要關(guān)注某些用戶等。
5)對于新新上架的商品,明確商品的類目和屬性,根據(jù)商品的這些信息匹配找到相類似的物品或者對應(yīng)有這類喜好的用戶。
6)在系統(tǒng)冷啟動是,可以引用專家的知識進行標(biāo)注,從而建立物品的相關(guān)度表。
以上和大家簡單的聊了聊關(guān)于常用的推薦算法,目前推薦算法也在與時俱進,可能我說的都是錯的,以后會有更好的推薦方法。作為產(chǎn)品經(jīng)理對于技術(shù)這塊個人覺得了解其實現(xiàn)的原理即可。希望本文對大家有所幫助。
本文由 @產(chǎn)品_空 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理 ,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 unsplash,基于 CC0 協(xié)議
有個問題想請教以下:如何組合使用這幾種推薦方式。假如每種推薦方式得到的結(jié)果都很多,如何對這些結(jié)果進行排序?
非常系統(tǒng)性的講解了個性化推薦的背景、主要問題、技術(shù)方案
請教一下,有相關(guān)的課程或者是書籍可以推薦一下嗎
請教下,請問可以轉(zhuǎn)載到學(xué)生產(chǎn)品學(xué)習(xí)社群么
解決了困惑,衷心感謝
想請教一下 為什么基于用戶的和基于商品的 求余弦相似度的公式不同呢?
學(xué)到了很多 非常感謝
贊一個,同類文章里寫的比較通俗易懂了
給你點贊