搜廣推策略產品必知系列:新用戶user冷啟動策略
在推薦系統(tǒng)里,如果想解決有關“新用戶冷啟動”的問題,策略產品可以如何搭建策略解法?首要的,策略產品需要明確新用戶的定義,接著,產品才可以更恰當?shù)卮罱ㄕ倩睾团判虿呗?。本篇文章里,作者便針對新用戶冷啟動策略做了解讀,一起來看。
今天順著介紹冷啟動另一個話題即——「用戶冷啟動」問題。
用戶User冷啟動與物品item在推薦系統(tǒng)中面臨其實問題根源其實相同,都是因為物品item/用戶user因為積累的樣本數(shù)據(jù)量過少,模型無法準確學習進行準確的人貨匹配,用戶冷啟動更直接的表現(xiàn)就是我不知道如何準確給對應的用戶進行準確的推薦,用戶訪問推薦位就更加活躍,更有利于形成用戶訪問的留存。
在問題解決思路上,兩種冷啟動還是存在解決問題的思路差異,因此我們先來快速入門介紹一下關于用戶冷啟動背后的問題根源,以及目前對于新用戶冷啟動的解法。
一、用戶USER冷啟動問題背景
1. 新用戶冷啟動定義
用戶冷啟動主要解決如何給「新用戶」推薦給他可能感興趣的物料item的問題;但是電商場景的新用戶不僅指純激活的新客,而是指少行為、低活躍度的用戶群體,這類用戶在站內的行為少,因而深度模型在學習用戶興趣表達時,由于行為序特征稀疏,很難獲得較好的效果。
2. 新用戶所謂“新”的分類
根據(jù)定義的說明,新用戶根據(jù)行為模式會劃分成為以下兩種類型,都屬于用戶行為樣本在一定的時間戳范圍內遠遠少于APP內用戶的均值樣本量,所以會在承接的策略上略微有差異;
- 純新的激活、注冊類型的用戶;
- 長時間未登錄APP的低活躍用戶,包括對于老客促活、活動拉動回歸的用戶。
二、推薦系統(tǒng)如何解決新品冷啟動問題的策略
策略解法核心思想:所有冷啟動的核心思想都是為了試探性的讓User用戶產生更多的「行為樣本」(點擊、加購以及成交等興趣行為)、「標簽數(shù)據(jù)」(用戶給自己打上運動戶外、),核心目的就是讓用戶的畫像、樣本逐漸的完整。
1.?新用戶注冊信息輸入方案
1)興趣標簽填寫
為了幫助APP做快速用戶冷啟(非強制),會在用戶剛注冊時候提供填寫「興趣偏好」、「年齡」、「性別」等粗顆粒度用戶注冊的冷啟動信息,這種偏向用戶冷啟動的手段而非策略。
這種方式對于用戶User冷啟動前期屬于事半功倍的一種手段,對于微博、小紅書以及豆瓣等圖文推薦流媒體,以及網易云音樂這種主打歌單推薦平臺有著非常大的必要性與幫助。
2)賬戶共享登陸
同公司畫像、樣本共享,或者是利用用戶的社交網絡賬號登錄(需要用戶授權),導入用戶在社交網站上的好友信息,然后給用戶推薦其好友喜歡的物品Item,利用社交網絡關系進行推薦的原因是自在于,在計算用戶余弦相似度默認社交關系網朋友會相似度較高(類似你可能會喜歡)。
2. 規(guī)則化召回&相似老客個性化召回策略
規(guī)則化召回的方式更多的就是通過特定的召回規(guī)則方等等規(guī)則來實現(xiàn),簡單規(guī)則配置是默認這是絕大多數(shù)User用戶都感興趣的內容(例如最新的iPhone 14pro max,年初的冬奧會谷愛凌新聞,沒有人不會對這個不感興趣對吧),絕大多數(shù)的用戶都會愿意去點擊、收藏等行為。
1)熱門規(guī)則物料召回
比方說「銷量Top Sale近30天倒序排序」、「近30天點擊率 Top CTR最高」,這種簡單統(tǒng)計規(guī)則來進行商品的召回,個性化程度不足,但是前期對于用戶產生行為行之有效。
2)基于bias特征的物料召回(前提是可以通過客戶輸入獲取到可信特征)
通過用戶特征將用戶分群,比如地區(qū)、性別、年齡、渠道等bias特征,通過分析不同特征下的用戶群體物料偏好差異來做細分的物料召回策略。實驗數(shù)據(jù)來看,區(qū)分省份的熱門物料召回策略收益較高。
3)個性化召回
這里大家看到不要奇怪,雖然新用戶樣本少,但是在完成對于新用戶和老用戶相似特診KNN聚類之后,會把Jaccard距離相近的老用戶個性化推薦內容給到冷啟新用戶進行推薦,因此這里再用DSSM或者attention特征時序的召回方式就和前面文章一樣了。
但是需要核心注意的點就在于模型容易被老用戶帶偏,需要人為剔除一些強bias的樣本特征(特征工程的一些核心工作,雖然瑣碎但是對于結果又明顯提升),可以考慮通過關注實驗的效果來進行剔除。
3. 非個性化排序與個性化排序
用戶冷啟動如果光在召回方面有策略而不在排序增加策略,最終也是白搭,排序是最終前端展示的號碼牌,因此會有很多排序的模塊也要為新用戶準備相應的策略:
1)熱門排序
例如按照商品銷量、點擊率商品特征進行排序,這一類排序對于新用戶還是比較行之有效的方法,原理如同上述熱門物料召回類似。
2)Bandit模型排序
EE(探索與開發(fā)興趣)下的經典冷啟動模型,平衡準確性和多樣性。多臂老虎機問題,我們用用戶對不同item的興趣來分別計算興趣值,并且假設item的興趣是符合Beta分布。
- 每個item都會對應一套(a,b)參數(shù),通過上述公式來生成beta隨機數(shù);
- 將產生的隨機數(shù)最大的臂作為結果,并且根據(jù)用戶反饋,點擊就a+1,否則就b+1,當所有的(a,b)都很大的時候,這個時候每一個beta分布都會接近中心的位置,選擇所有臂中產生隨機數(shù)最大的去搖。
3)行為序Attention特征強化
用戶在APP的行為最直接的表達了用戶的興趣偏好。在行為序稀疏的情況下,盡可能地人工構造更豐富的行為序Session。例如用戶對商品/類目/主播的點擊、收藏、分享、加購、成交等一手行為序;此外也可以通過經驗構造,例如用戶觀看時長達到一定閾值的商品、類目;還可以將行為序特征與用戶的bias特征交叉等等方式獲得的二手行為序。
三、總結與思考
新客冷啟動策略整體的思考路徑其實和新品item冷啟動有點類似,讓系統(tǒng)幫助用戶快速積累行為樣本,達到穩(wěn)定性、多樣性的投放狀態(tài);但是在解法策略上還是有比較多的差異,最核心的步驟需要先定義清楚你的新用戶user的定義,再針對不同的user來做相應的召回、排序策略。
本文由 @策略產品Arthur 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!