自4月29日阿里入股新浪以來(lái),外界開(kāi)始揣摩馬云花5.86億美元要去干什么,一邊倒的觀點(diǎn)認(rèn)為,馬云是看中了新浪微博的數(shù)據(jù)。
但最關(guān)鍵的問(wèn)題是,馬云要用這些數(shù)據(jù)去干什么。是大多數(shù)人猜測(cè)的用來(lái)做簡(jiǎn)單的營(yíng)銷+導(dǎo)流嗎?NO!阿里浪聯(lián)姻最大的價(jià)值在于,需求預(yù)測(cè)模型的構(gòu)建。
阿里需要預(yù)測(cè)型數(shù)據(jù)
微博與淘寶兩個(gè)平臺(tái)的用戶數(shù)據(jù)全部打通后,阿里能通過(guò)數(shù)據(jù)挖掘進(jìn)行精準(zhǔn)營(yíng)銷+導(dǎo)流。但這就完了嗎?這只是基礎(chǔ)而已。
與新浪微博數(shù)據(jù)相比,阿里的數(shù)據(jù)庫(kù)最大的缺陷在于滯后性。《大數(shù)據(jù)時(shí)代》中曾有一個(gè)例子,一位可能患有禽流感的用戶,首先會(huì)去谷歌上搜尋“流感的癥狀”,等病情嚴(yán)重后才會(huì)去醫(yī)院就診。所以相對(duì)來(lái)說(shuō),谷歌的數(shù)據(jù)具有前瞻性,而醫(yī)院發(fā)布的患病率等數(shù)據(jù),通常會(huì)滯后于實(shí)際發(fā)病率。
類似地,一位用戶有消費(fèi)需求,首先可能會(huì)在微博行為中體現(xiàn),等需求到達(dá)一定程度,才會(huì)去天貓、淘寶網(wǎng)上去購(gòu)買。新浪微博數(shù)據(jù)更原始,更前瞻,能直接獲知用戶的消費(fèi)需求。
以阿里旗下的淘寶數(shù)據(jù)魔方為例,主要功能為品牌、產(chǎn)品熱銷分析,淘寶熱詞分析(產(chǎn)品熱詞),消費(fèi)流量來(lái)源分析,屬于總結(jié)性數(shù)據(jù),缺乏對(duì)趨勢(shì)的預(yù)測(cè)性。
有了新浪微博的數(shù)據(jù)之后,阿里可以怎么做?
兩個(gè)平臺(tái)的數(shù)據(jù)庫(kù)全面打通后,新浪微博的海量數(shù)據(jù)可進(jìn)行對(duì)消費(fèi)需求的預(yù)測(cè),如哪些用戶可能產(chǎn)生消費(fèi)需求?而阿里數(shù)據(jù)庫(kù)則可用來(lái)驗(yàn)證,有需求的哪些用戶會(huì)把需求轉(zhuǎn)化為實(shí)際購(gòu)買行為?
具體的做法是,利用新浪微博的詞條挖掘,建立一批詞條與消費(fèi)需求聯(lián)系的數(shù)學(xué)模型,然后逐一進(jìn)行測(cè)試。再將得出的測(cè)試結(jié)果與用戶在淘寶、天貓上消費(fèi)的實(shí)際數(shù)據(jù)進(jìn)行對(duì)比,重新篩選出與實(shí)際消費(fèi)數(shù)據(jù)吻合的特定數(shù)學(xué)模型。
模型建立后,阿里就能精準(zhǔn)預(yù)測(cè)哪些用戶會(huì)發(fā)生購(gòu)買行為,哪些商品會(huì)熱賣?有了這些數(shù)據(jù)后,天貓的50000賣家、淘寶網(wǎng)的800萬(wàn)賣家才能有效安排商品的采銷、庫(kù)存等環(huán)節(jié)。
阿里的消費(fèi)數(shù)據(jù)與新浪微博的用戶原始數(shù)據(jù),會(huì)組合成一個(gè)巨大的競(jìng)爭(zhēng)門(mén)檻,可能把國(guó)內(nèi)數(shù)據(jù)指導(dǎo)銷售做到一個(gè)新的水平。當(dāng)然,這件事還有一個(gè)企業(yè)能做,那就是騰訊。
它旗下有騰訊微博、QQ空間、微信等社交媒體,再加上易迅、QQ網(wǎng)購(gòu)等電商網(wǎng)站。但遺憾的是,其中多屬于“千年老二”,要干過(guò)“阿里浪組合”,還得看自身造化。
為何是新浪微博的數(shù)據(jù)?
國(guó)內(nèi)數(shù)據(jù)挖掘企業(yè)中,百度有百度指數(shù),數(shù)據(jù)來(lái)源是海量的網(wǎng)頁(yè)、新聞搜索;新浪微博有微指數(shù),抓取的是微博用戶的行為、博文數(shù)據(jù);阿里有淘寶指數(shù)、數(shù)據(jù)魔方,數(shù)據(jù)來(lái)源旗下電商店鋪、商品瀏覽記錄、商品品類、成交收藏評(píng)價(jià)數(shù)據(jù)。
撇開(kāi)資本層面的可操作性不談,單從技術(shù)上看,阿里為何不去與百度結(jié)合,繼而生成一個(gè)更為巨大的怪獸?
一、單從數(shù)據(jù)層面來(lái)看,百度數(shù)據(jù)來(lái)源、用戶成分很復(fù)雜,與淘寶、天貓等電商數(shù)據(jù)整合難度大,建立能準(zhǔn)確反映消費(fèi)需求的數(shù)據(jù)模型更困難。谷歌具備這個(gè)實(shí)力,百度難說(shuō)。
二、相比之下,新浪微博的數(shù)據(jù)來(lái)源更單一,全部來(lái)自旗下5億多用戶的社交數(shù)據(jù),而最核心的因素是,新浪微博與天貓、淘寶網(wǎng)的用戶重合度高達(dá)40%(新浪負(fù)責(zé)人透露)。目前,天貓、淘寶網(wǎng)的用戶數(shù)量約為5億。這意味著有2億用戶既是新浪微博的用戶,又是天貓、淘寶網(wǎng)的會(huì)員。
通過(guò)新浪微博后臺(tái)的數(shù)據(jù)分析,天貓、淘寶網(wǎng)能夠獲知該用戶的消費(fèi)需求。比如,一微博用戶發(fā)了許多關(guān)于健身的狀態(tài),系統(tǒng)在分析后就會(huì)猜測(cè):該用戶可能有健身喜好,天貓、淘寶網(wǎng)就能向其推送健身產(chǎn)品的促銷信息了。
阿里入股新浪微博后,二者用戶賬戶、數(shù)據(jù)交換、在線支付、網(wǎng)絡(luò)營(yíng)銷展開(kāi)合作。筆者認(rèn)為,只有打通用戶數(shù)據(jù)、網(wǎng)絡(luò)營(yíng)銷兩項(xiàng)可行性強(qiáng)點(diǎn),其余都是浮云。
三、新浪微博數(shù)據(jù)挖掘技術(shù)積累不足,而阿里無(wú)線團(tuán)隊(duì)的強(qiáng)大。筆者曾采訪過(guò)微軟MVP付海軍,他的觀點(diǎn)是新浪微博雖有海量數(shù)據(jù),但目前連垃圾粉篩選過(guò)濾都很糟糕,更別談深層面的數(shù)據(jù)挖掘,而阿里的淘寶、支付寶團(tuán)隊(duì)數(shù)據(jù)挖掘?qū)嵙?qiáng)大,從發(fā)布的淘寶交易趨勢(shì)可以看出。
VIA:虎嗅