大數(shù)據(jù)驅(qū)動(dòng)下的微博社會(huì)化推薦

2 評(píng)論 14119 瀏覽 98 收藏 24 分鐘

不同于搜索,“推薦”通常不是獨(dú)立的互聯(lián)網(wǎng)產(chǎn)品,而是互聯(lián)網(wǎng)產(chǎn)品的核心組件,為該產(chǎn)品的核心目標(biāo)服務(wù),比如電商網(wǎng)站的推薦是為了達(dá)成更多商品交易。微博推薦同樣如此,其存在價(jià)值就是通過(guò)梳理和優(yōu)化用戶關(guān)系網(wǎng)絡(luò)、打通內(nèi)容傳播鏈條、引爆信息定向傳播,從而實(shí)現(xiàn)加速高價(jià)值用戶關(guān)系構(gòu)建、優(yōu)質(zhì)內(nèi)容傳播和商業(yè)化營(yíng)收等微博核心目標(biāo)。

明確了推薦的角色和定位后,設(shè)計(jì)一個(gè)合適的推薦系統(tǒng)還需要系統(tǒng)了解微博的數(shù)據(jù)特點(diǎn)。因?yàn)橹挥星宄?shù)據(jù)的特點(diǎn),才能更有針對(duì)性地設(shè)計(jì)推薦系統(tǒng)產(chǎn)品、架構(gòu)和算法。

微博用戶

微博數(shù)據(jù)

微博的數(shù)據(jù)特點(diǎn)

微博是一個(gè)以內(nèi)容消費(fèi)為核心的偏弱關(guān)系社交網(wǎng)絡(luò),關(guān)系的構(gòu)建多是依托于興趣。它是半開(kāi)放的,用戶看到的大部分內(nèi)容,來(lái)自于2層關(guān)注構(gòu)建的網(wǎng)絡(luò)。而對(duì)社交網(wǎng)絡(luò)而言,用戶關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)、內(nèi)容信息、用戶是其數(shù)據(jù)三要素,因此下文也主要會(huì)圍繞這3個(gè)要素對(duì)微博數(shù)據(jù)特點(diǎn)進(jìn)行闡述。

用戶關(guān)系網(wǎng)絡(luò)結(jié)構(gòu):呈現(xiàn)海量、社會(huì)化、興趣弱關(guān)系、半開(kāi)放等4個(gè)方面的特點(diǎn)。微博關(guān)系網(wǎng)絡(luò)擁有超過(guò)6億個(gè)節(jié)點(diǎn)、1000多億條邊,每天有海量信息通過(guò)這張網(wǎng)絡(luò)傳輸。它就像一個(gè)虛擬社會(huì),帶著社會(huì)化分工、去中心化、非對(duì)等性的屬性;每個(gè)用戶都有自己的真實(shí)身份和角色,比如橙V、藍(lán)V、普通用戶,承擔(dān)不同的職責(zé)并具備不同的話語(yǔ)權(quán),在內(nèi)容的生產(chǎn)、傳播、消費(fèi)的過(guò)程中,扮演著不同角色。

內(nèi)容信息:微博的信息是簡(jiǎn)短、豐富而碎片化的,同時(shí)存在著UGC和媒體內(nèi)容,具備極快的傳播速度。微博由點(diǎn)及面和Timeline的Feed流設(shè)計(jì),使其具備極好的信息傳播能力,這是微博的優(yōu)勢(shì),但同樣也會(huì)引發(fā)問(wèn)題——飛速的傳播讓舊信息很快被淹沒(méi)掉,不管其價(jià)值多寡。因此對(duì)于推薦系統(tǒng)來(lái)說(shuō),其主要目標(biāo)就是讓優(yōu)質(zhì)信息沉淀下來(lái)并獲得更多的曝光機(jī)會(huì),這也是之所以要做“錯(cuò)過(guò)的微博”的原因。

用戶:微博用戶具備個(gè)性化的行為和偏好,承擔(dān)著良好的社會(huì)化分工角色。同時(shí),微博通過(guò)基于UID的賬號(hào)體系來(lái)識(shí)別用戶,記錄歷史數(shù)據(jù)并存儲(chǔ)關(guān)系數(shù)據(jù),從而精確地了解每一個(gè)用戶,也為后面?zhèn)€性化推薦打下良好的基礎(chǔ)。

微博推薦系統(tǒng)設(shè)計(jì)

微博推薦的設(shè)計(jì)主要包括產(chǎn)品、架構(gòu)、算法3個(gè)方面,下面首先了解產(chǎn)品的設(shè)計(jì)思路。

產(chǎn)品設(shè)計(jì)

微博自然推薦分為用戶和內(nèi)容推薦兩個(gè)部分。

用戶推薦

用戶平臺(tái)推薦

用戶推薦

用戶推薦的產(chǎn)品目標(biāo)是優(yōu)化用戶關(guān)系網(wǎng)絡(luò)結(jié)構(gòu),在用戶推薦產(chǎn)品設(shè)計(jì)實(shí)踐中主要有兩點(diǎn)經(jīng)驗(yàn)值得和大家分享。

效果衡量指標(biāo)。效果衡量指標(biāo)是連接產(chǎn)品定位和算法優(yōu)化方向的橋梁,而這也是產(chǎn)品設(shè)計(jì)中不斷思考和摸索的方向。初始時(shí)我們直觀地認(rèn)為,如果用戶喜歡推薦結(jié)果就會(huì)產(chǎn)生較高的點(diǎn)擊率,從而將CTR作為衡量指標(biāo),但隨后這個(gè)思路就被否定。用戶推薦的初衷是關(guān)系達(dá)成而不是即時(shí)愉悅用戶,于是衡量指標(biāo)被調(diào)整為RPM(Relation per Thousand Impression,即千次曝光的用戶關(guān)系達(dá)成量)。在一段時(shí)間后我們開(kāi)始反思一個(gè)問(wèn)題:用戶關(guān)系達(dá)成的意義是什么,用戶關(guān)系量是否是越多越好呢?答案顯然是否定的,受限于精力,推薦必須幫助用戶梳理關(guān)系網(wǎng)絡(luò)結(jié)構(gòu),讓用戶可以簡(jiǎn)單地構(gòu)建高價(jià)值的用戶關(guān)系,從而讓用戶可以更好地消費(fèi)內(nèi)容以及更容易地進(jìn)行社交互動(dòng),因此衡量指標(biāo)衍生為關(guān)系達(dá)成后的互動(dòng)率和用戶行為量。

產(chǎn)品設(shè)計(jì)原則。推薦是用戶預(yù)期之外的非自然流量,應(yīng)該順應(yīng)用戶的行為,以自然流暢的方式展現(xiàn)給用戶。因此,推薦必須從最有效的主動(dòng)場(chǎng)景入手,比如微博找人頁(yè)用戶帶有明顯關(guān)注新用戶的意圖,而這里展示用戶推薦正好滿足需求;而Feed流的瀏覽目的是內(nèi)容消費(fèi),推薦新用戶會(huì)打斷內(nèi)容消費(fèi)的流暢性,效果很差。

內(nèi)容推薦

內(nèi)容推薦的產(chǎn)品目標(biāo)是加速優(yōu)質(zhì)信息傳播以滿足內(nèi)容消費(fèi)需求,“錯(cuò)過(guò)的微博、贊過(guò)的微博、正文頁(yè)相關(guān)推薦、熱點(diǎn)話題”則是其中具有代表性的內(nèi)容推薦產(chǎn)品,這里會(huì)重點(diǎn)介紹下“錯(cuò)過(guò)的微博”的設(shè)計(jì)思路。

“錯(cuò)過(guò)的微博”前身是一個(gè)叫做“智能排序“的推薦產(chǎn)品,主要用于解決信息過(guò)載情況下的排序問(wèn)題。正常情況下,微博用戶平均每天會(huì)接收到2000+條Feed,而真正閱讀的內(nèi)容不超過(guò)200條,那么怎樣才能讓用戶看到更多高價(jià)值信息,減少低質(zhì)內(nèi)容曝光,從而提升內(nèi)容消費(fèi)體驗(yàn),這正是產(chǎn)品的設(shè)計(jì)目的。“智能排序”采用了簡(jiǎn)單直接的設(shè)計(jì)思路:Feed流按價(jià)值高低整體排序,這樣做存在兩個(gè)問(wèn)題:

定義及量化信息對(duì)用戶的價(jià)值。因?yàn)橛脩魧?duì)信息價(jià)值的理解方式千奇百怪,因此不論如何調(diào)整算法總會(huì)讓部分用戶不滿意。

信息價(jià)值和時(shí)間順序的平衡。整體重排序會(huì)讓微博丟失Timeline的排列屬性,從而新的信息有可能排在舊的后面,而時(shí)間序是保證微博傳播能力和信息新鮮度的關(guān)鍵。

所以“智能排序”不是一個(gè)優(yōu)雅的解決方案,而后通過(guò)數(shù)據(jù)分析發(fā)現(xiàn):用戶錯(cuò)過(guò)的90+%信息中,只有部分內(nèi)容是對(duì)用戶具有極高價(jià)值且不容錯(cuò)過(guò)的,所以這里無(wú)需對(duì)未讀Feed全排序,只需要將最高價(jià)值的信息找出來(lái)并推薦給用戶,其它的Feed仍按正常時(shí)間序排列。這樣做一方面可以讓Feed流整體上符合Timeline的排序,用戶感覺(jué)自然流暢;另一方面,與用戶對(duì)最高價(jià)值的信息認(rèn)知上比較接近,算法效果比較理想。產(chǎn)品推出后,用戶認(rèn)可度很高,互動(dòng)率遠(yuǎn)遠(yuǎn)高于普通Feed。

架構(gòu)設(shè)計(jì)

推薦系統(tǒng)的架構(gòu)設(shè)計(jì),包含在線服務(wù),以及數(shù)據(jù)存儲(chǔ)、傳輸、計(jì)算兩個(gè)部分。

首先看數(shù)據(jù)部分,整體架構(gòu)分為Online和Offline兩個(gè)部分,其中Online部分通過(guò)Kafka/Scribe把用戶的即時(shí)行為和發(fā)布內(nèi)容傳輸?shù)搅魇接?jì)算系統(tǒng)Storm中做即時(shí)處理,處理的結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到Redis中。而Offline的數(shù)據(jù),主要通過(guò)Hadoop平臺(tái)做基礎(chǔ)的存儲(chǔ),然后通過(guò)Spark/MapReduce等分布式計(jì)算后,將直接應(yīng)用到在線服務(wù)的數(shù)據(jù)存儲(chǔ)到HBase/Lushan/Redis等數(shù)據(jù)庫(kù)中,亦或是存放到在線服務(wù)的本地文件。

UAE

接下來(lái)看在線服務(wù)的架構(gòu)設(shè)計(jì),如圖所示,這里通過(guò)UVE(Uniform Value Estimate)來(lái)分發(fā)非自然流量——廣告、運(yùn)營(yíng)、推薦。推薦經(jīng)過(guò)應(yīng)用層接入后,會(huì)進(jìn)入在線服務(wù)的核心處理模塊lab_common_so,這個(gè)模塊主要實(shí)現(xiàn)了3項(xiàng)功能。

  • 流量切分:即按滿足同樣數(shù)據(jù)分布的方式切分流量,用于算法策略的灰度實(shí)驗(yàn)。
  • 排序:通過(guò)LR模型(ctr or RPM or ctr*click_value)實(shí)現(xiàn)推薦結(jié)果的精選排序。
  • 算法策略選擇:動(dòng)態(tài)加載更新算法策略庫(kù).so文件。

微博推薦候選集非常龐大,架構(gòu)設(shè)計(jì)中分為初選與精選兩個(gè)模塊,精選模塊位于lab_common_so中,而初選由獨(dú)立的功能模塊來(lái)承擔(dān),來(lái)源于3個(gè)維度:

  1. 離線計(jì)算:如用戶推薦95%的結(jié)果來(lái)自離線計(jì)算。
  2. Storm流式計(jì)算:實(shí)時(shí)計(jì)算用戶行為觸發(fā)的推薦結(jié)果,并即時(shí)推薦給用戶。
  3. 離線計(jì)算(生成半加工品的推薦資源數(shù)據(jù))+在線計(jì)算(通過(guò)索引IDX連接)。

用于精選排序的ctr預(yù)估模型,基于Hadoop平臺(tái)數(shù)據(jù),通過(guò)Spark來(lái)分布式訓(xùn)練。

預(yù)估模型

算法設(shè)計(jì)

微博推薦的算法體系如圖所示,包含4層:數(shù)據(jù)挖掘、基礎(chǔ)算法、核心算法、混合算法技術(shù)。

算法體系

先看數(shù)據(jù)挖掘部分,這里基于微博社交數(shù)據(jù)建模來(lái)完成用戶親密度、用戶影響力、領(lǐng)域關(guān)鍵節(jié)點(diǎn)、粉絲相似度、關(guān)注相似度、興趣協(xié)同的量化計(jì)算,從而數(shù)據(jù)化地描述微博社交網(wǎng)絡(luò)、用戶關(guān)系、用戶興趣和能力,并將其作為在線推薦計(jì)算的中間結(jié)果數(shù)據(jù)。

基礎(chǔ)算法中,都是大家比較熟知的NLP、用戶分析、傳播模型等算法,不做過(guò)多介紹。算法設(shè)計(jì)和實(shí)踐的重點(diǎn)是核心算法和混合技術(shù),接下來(lái)會(huì)逐個(gè)介紹:

協(xié)同過(guò)濾

協(xié)同過(guò)濾是經(jīng)典的推薦算法,在微博中廣泛應(yīng)用,共使用過(guò)如下4種:

協(xié)同過(guò)濾

其中,user-based協(xié)同的應(yīng)用最為廣泛。微博借助UID賬號(hào)體系,經(jīng)過(guò)多年積累,存儲(chǔ)了充足的用戶數(shù)據(jù),user-based CF結(jié)果精確,且有良好的推薦理由;相對(duì)而言,微博信息的時(shí)效性很強(qiáng),item-based協(xié)同效果不太理想。此外,微博具有良好的社會(huì)化屬性,擁有大量各個(gè)領(lǐng)域的專家和關(guān)鍵節(jié)點(diǎn),從而在一些對(duì)專業(yè)知識(shí)要求較高的場(chǎng)景,基于keyUser-based的協(xié)同具有良好的效果。在智能排序研發(fā)時(shí)曾借鑒Facebook的經(jīng)驗(yàn),實(shí)踐過(guò)Edgerank算法(加一些公式描述),是相對(duì)經(jīng)典的協(xié)同過(guò)濾,引入了時(shí)間衰減因素,來(lái)提升推薦結(jié)果的時(shí)效性。

相關(guān)性推薦content-based

Content-based算法廣泛應(yīng)用在內(nèi)容推薦中,這里將以微博正文頁(yè)相關(guān)推薦為例進(jìn)行介紹,如圖所示分為在線和離線兩個(gè)部分。

相關(guān)性推薦content-based

離線部分,多種候選物料(如微博、電影)經(jīng)過(guò)NLP結(jié)構(gòu)化處理后選取優(yōu)質(zhì)候選,以關(guān)鍵詞、分類為key構(gòu)建索引。其中微博、話題、長(zhǎng)微博的候選集索引通過(guò)流式計(jì)算產(chǎn)生,可以做到分鐘級(jí)的實(shí)時(shí)更新。此外,由于微博內(nèi)容簡(jiǎn)短,可提取的有效關(guān)鍵詞數(shù)量有限,為了提升推薦的覆蓋率和準(zhǔn)確度會(huì)以優(yōu)質(zhì)微博、長(zhǎng)微博、話題為訓(xùn)練語(yǔ)料,離線開(kāi)展詞擴(kuò)展、詞聚類計(jì)算(基于word2vec)則用于在線相關(guān)性計(jì)算的輔助。

在線計(jì)算,用戶訪問(wèn)正文頁(yè)后,推薦服務(wù)會(huì)基于Storm流式計(jì)算的分類、關(guān)鍵詞向量結(jié)果查詢索引獲取推薦候選集,并計(jì)算微博正文同各個(gè)推薦候選集的相關(guān)度,選擇相關(guān)而不相似的候選集開(kāi)展ctr/RPM計(jì)算,并由此排序得到推薦推薦結(jié)果呈現(xiàn)給用戶。

排序模型

基于機(jī)器學(xué)習(xí)的Learning to ranking是推薦中常用解決排序問(wèn)題的算法技術(shù),微博推薦的排序模型采用經(jīng)典的LR模型。

排序模型

在線計(jì)算時(shí)的feature向量會(huì)隨著推薦服務(wù)日志記錄下來(lái),尤其是場(chǎng)景相關(guān)的feature,并通過(guò)特征工程的ETL框架將各類產(chǎn)品匯集和處理以生成訓(xùn)練樣本,開(kāi)展模型訓(xùn)練。基礎(chǔ)feature分為用戶、item、場(chǎng)景3個(gè)維度,而實(shí)際應(yīng)用的feature多為交叉特征。

另外,對(duì)于多種推薦候選集共存的場(chǎng)景,這里通過(guò)ctr*click_value的方式來(lái)解決綜合排序問(wèn)題,click_value的計(jì)算主要考慮候選集結(jié)果對(duì)用戶產(chǎn)生的長(zhǎng)遠(yuǎn)影響,如用戶閱讀一篇長(zhǎng)文章、關(guān)注一個(gè)新用戶的click_value要遠(yuǎn)高于點(diǎn)擊一個(gè)相關(guān)微博。

時(shí)序混合

微博推薦會(huì)隨著用戶行為而實(shí)時(shí)調(diào)整推薦結(jié)果,這里通過(guò)時(shí)序混合算法策略來(lái)達(dá)成這一目的,在不同的階段采用不同的算法。如圖是一個(gè)正文頁(yè)的例子。

時(shí)序混合

在實(shí)際場(chǎng)景中,很多用戶會(huì)先后訪問(wèn)同一個(gè)正文頁(yè),在初始曝光階段,系統(tǒng)會(huì)采用content-based 算法給出推薦結(jié)果,而正文頁(yè)得到了充分曝光和足夠多可信用戶的互動(dòng)行為后,會(huì)采用協(xié)同過(guò)濾的算法計(jì)算推薦結(jié)果,并呈現(xiàn)給后續(xù)訪問(wèn)的用戶。這個(gè)算法思路基于一個(gè)樸素的假設(shè):訪問(wèn)同一個(gè)正文頁(yè)的用戶存在相似的即時(shí)興趣,從而這里可以采用user-based CF并結(jié)合貝葉斯平滑來(lái)選擇點(diǎn)擊率最好的item做好推薦結(jié)果,計(jì)算方式如下。

計(jì)算方式

其中為用戶i的歷史點(diǎn)擊率,用以消除不同用戶的點(diǎn)擊率偏差。

模型融合

單一的算法模型都存在局限性,為了解決復(fù)雜的社會(huì)化推薦問(wèn)題,通常會(huì)采用模型融合的方法來(lái)實(shí)現(xiàn)模型間的優(yōu)勢(shì)互補(bǔ),提供最佳的推薦結(jié)果。分層模型融合和分片線性模型是微博推薦中應(yīng)用較多的。

分層模型融合,即上一層模型的輸出作為下一層模型的feature輸入,通常采用多層LR或LR+GBDT的方式,如圖所示。

模型融合

分片線性模型:由于線性模型的局限性,很多時(shí)候無(wú)法學(xué)到泛化效果好的非線性關(guān)系,為了應(yīng)對(duì)各類跨平臺(tái)、分場(chǎng)景的推薦問(wèn)題,我們引入了分片擬合、分而治之的分片線性模型,即多個(gè)模型解決同一個(gè)問(wèn)題,每個(gè)模型應(yīng)用于其效果最好的條件流量。以微博用戶推薦為例,我們從用戶類型維度將空間/流量劃分為3個(gè)局部區(qū)域——藍(lán)V、橙V和普通用戶,它們各有一個(gè)線性預(yù)測(cè)模型來(lái)分片融合給出推薦結(jié)果,取得了很好的效果。另外在微博廣告實(shí)踐中也從平臺(tái)維度劃分流量空間并采用了分片線性模型,從而大幅提升了CTR預(yù)估的精準(zhǔn)性。

分片模型

商業(yè)化設(shè)計(jì)—商業(yè)推薦

經(jīng)過(guò)多年的發(fā)展,微博積累了大量高價(jià)值用戶,如明星、領(lǐng)域?qū)<遥麄兌挤e累了豐富的社交資產(chǎn),具有一呼百應(yīng)的社交影響力。同時(shí),微博上又有大量的企業(yè)用戶,希望通過(guò)微博平臺(tái)推廣和營(yíng)銷,但自身用戶關(guān)系網(wǎng)絡(luò)狹小,從而內(nèi)容缺乏自我傳播能力,希望能快速構(gòu)建粉絲關(guān)系網(wǎng)絡(luò),借助高價(jià)值用戶的關(guān)系網(wǎng)絡(luò)來(lái)推廣自己的產(chǎn)品。另外,很多用戶都存在偶發(fā)的自我推廣訴求,希望自己的信息被所有的粉絲看到,甚至能曝光給潛在粉絲,但微博信息更新速度快,信息又很容易被淹沒(méi)掉。

推薦可以很好地解決上述問(wèn)題,滿足企業(yè)和個(gè)人的推廣需求,來(lái)通過(guò)“連接”實(shí)現(xiàn)商業(yè)化變現(xiàn)。粉絲頭條和漲粉助手是兩個(gè)最有代表性的微博商業(yè)推薦產(chǎn)品。

商業(yè)推薦

商業(yè)化推薦

漲粉助手重點(diǎn)解決高價(jià)值粉絲關(guān)系網(wǎng)絡(luò)的快速構(gòu)建問(wèn)題,而粉絲頭條專注于企業(yè)推廣信息的精準(zhǔn)觸達(dá)和有效曝光,并通過(guò)將名人、關(guān)鍵節(jié)點(diǎn)轉(zhuǎn)化為企業(yè)的產(chǎn)品代言人,來(lái)達(dá)成高影響力用戶的社交資產(chǎn)變現(xiàn)和企業(yè)用戶的營(yíng)銷需求,進(jìn)而將名人的影響力引渡到品牌上,拉近明星、品牌、用戶的距離。在社交網(wǎng)絡(luò)中,廣告的效果與信息發(fā)布者有著重要的關(guān)系,因?yàn)橛脩粲绊懥Σ煌瑤?lái)的信任度也就不同。

社交平臺(tái)

通過(guò)系統(tǒng)性的產(chǎn)品設(shè)計(jì)來(lái)實(shí)現(xiàn)特定微博信息的爆炸性定向傳播,其實(shí)現(xiàn)機(jī)制如圖所示。

機(jī)制

引爆過(guò)程包含兩次粉絲頭條投放:第一次將推廣內(nèi)容投放給關(guān)鍵節(jié)點(diǎn)與核心粉絲,等他們產(chǎn)生轉(zhuǎn)、評(píng)、贊等行為后,再代投這些互動(dòng)內(nèi)容,借助關(guān)鍵節(jié)點(diǎn)的粉絲資產(chǎn)來(lái)定向推廣自己的產(chǎn)品以實(shí)現(xiàn)二級(jí)粉絲關(guān)系網(wǎng)絡(luò)中的擴(kuò)散傳播,星火燎原。

在算法實(shí)現(xiàn)維度會(huì)重點(diǎn)介紹最關(guān)鍵的算法模塊:個(gè)性化定價(jià)與分包。這里主要為客戶提供了4個(gè)檔位的粉絲頭條投放包,而算法需要解決的是提升用戶的購(gòu)買(mǎi)率和總體收入,并保障平臺(tái)流量變現(xiàn)效率和客戶ROI之間的均衡。

粉絲

算法設(shè)計(jì)的關(guān)鍵是先定價(jià)、后分包,首先通過(guò)客戶心理價(jià)格和購(gòu)買(mǎi)力建模,計(jì)算不同用戶在面對(duì)不同價(jià)格時(shí)的購(gòu)買(mǎi)概率,進(jìn)而計(jì)算最佳的呈現(xiàn)價(jià)格:

  1. 第一檔:購(gòu)買(mǎi)率>min_threshold條件下,max{price}
  2. 第二檔:max{P(購(gòu)買(mǎi)率|用戶類型,price1)*price2}
  3. 第三擋:max{P(購(gòu)買(mǎi)率|用戶類型,price1,pric2)*price3)
  4. 最大包:price4 = 受眾包用戶量*1000/eCPM。

而分包是在特定價(jià)格下需要推廣給多少潛在粉絲,即綜合考慮訂單復(fù)購(gòu)率、客戶ROI的最優(yōu)eCPM計(jì)算:max{eCPM*(1+P(復(fù)購(gòu)率|eCPM,ROI))。

寫(xiě)在最后

推薦技術(shù)誕生于上世紀(jì)80年代,而真正的繁榮卻源自于大數(shù)據(jù)的推動(dòng)。本文從推薦的定位、微博的數(shù)據(jù)特點(diǎn)、數(shù)據(jù)驅(qū)動(dòng)的系統(tǒng)(產(chǎn)品/架構(gòu)/算法)設(shè)計(jì)、推薦的商業(yè)化等4個(gè)方面全面闡述微博的社會(huì)化推薦實(shí)踐。在這個(gè)過(guò)程中,架構(gòu)設(shè)計(jì)和數(shù)據(jù)存儲(chǔ)建立在成熟的大數(shù)據(jù)工具和解決方案上,產(chǎn)品和算法設(shè)計(jì)則大量應(yīng)用了大數(shù)據(jù)的思路和技術(shù)。通過(guò)挖掘社會(huì)化數(shù)據(jù)寶藏,量化“連接”價(jià)值,尋找高價(jià)值“連接”,為用戶呈現(xiàn)優(yōu)質(zhì)的個(gè)性化推薦結(jié)果。最后詳細(xì)描述了微博推薦商業(yè)化變現(xiàn)的構(gòu)想和實(shí)踐,證明推薦在社交網(wǎng)絡(luò)中依然具備良好的商業(yè)價(jià)值,而不僅僅是電商網(wǎng)站。微博是社會(huì)化資產(chǎn)變現(xiàn)的開(kāi)拓者,希望我們的經(jīng)驗(yàn)?zāi)軌驅(qū)ψx者有所啟發(fā)和幫助,并歡迎大家為我們提出寶貴的建議。

 

來(lái)源@36大數(shù)據(jù)

作者@姜貴彬

文章鏈接:http://www.36dsj.com/archives/45725

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 懂技術(shù), 會(huì)運(yùn)營(yíng), 還搞產(chǎn)品的全棧, 可怕~

    來(lái)自上海 回復(fù)
  2. 沙發(fā)

    來(lái)自上海 回復(fù)