基于大數(shù)據(jù)的用戶畫像構(gòu)建(理論篇)
![](http://image.woshipm.com/wp-files/img/44.jpg)
什么是用戶畫像?
簡(jiǎn)而言之,用戶畫像是根據(jù)用戶社會(huì)屬性、生活習(xí)慣和消費(fèi)行為等信息而抽象出的一個(gè)標(biāo)簽化的用戶模型。構(gòu)建用戶畫像的核心工作即是給用戶貼“標(biāo)簽”,而標(biāo)簽是通過對(duì)用戶信息分析而來的高度精煉的特征標(biāo)識(shí)。
舉例來說,如果你經(jīng)常購買一些玩偶玩具,那么電商網(wǎng)站即可根據(jù)玩具購買的情況替你打上標(biāo)簽“有孩子”,甚至還可以判斷出你孩子大概的年齡,貼上“有5-10歲的孩子”這樣更為具體的標(biāo)簽,而這些所有給你貼的標(biāo)簽統(tǒng)在一次,就成了你的用戶畫像,因此,也可以說用戶畫像就是判斷一個(gè)人是什么樣的人。
除去“標(biāo)簽化”,用戶畫像還具有的特點(diǎn)是“低交叉率”,當(dāng)兩組畫像除了權(quán)重較小的標(biāo)簽外其余標(biāo)簽幾乎一致,那就可以將二者合并,弱化低權(quán)重標(biāo)簽的差異。
用戶畫像的作用
羅振宇在《時(shí)間的朋友》跨年演講上舉了這樣一個(gè)例子:當(dāng)一個(gè)壞商家掌握了你的購買數(shù)據(jù),他就可以根據(jù)你平常購買商品的偏好來決定是給你發(fā)正品還是假貨以提高利潤(rùn)。且不說是否存在這情況,但這也說明了利用用戶畫像可以做到“精準(zhǔn)銷售”,當(dāng)然了,這是極其錯(cuò)誤的用法。
其作用大體不離以下幾個(gè)方面:
- 精準(zhǔn)營銷,分析產(chǎn)品潛在用戶,針對(duì)特定群體利用短信郵件等方式進(jìn)行營銷;
- 用戶統(tǒng)計(jì),比如中國大學(xué)購買書籍人數(shù) TOP10,全國分城市奶爸指數(shù);
- 數(shù)據(jù)挖掘,構(gòu)建智能推薦系統(tǒng),利用關(guān)聯(lián)規(guī)則計(jì)算,喜歡紅酒的人通常喜歡什么運(yùn)動(dòng)品牌,利用聚類算法分析,喜歡紅酒的人年齡段分布情況;
- 進(jìn)行效果評(píng)估,完善產(chǎn)品運(yùn)營,提升服務(wù)質(zhì)量,其實(shí)這也就相當(dāng)于市場(chǎng)調(diào)研、用戶調(diào)研,迅速下定位服務(wù)群體,提供高水平的服務(wù);
- 對(duì)服務(wù)或產(chǎn)品進(jìn)行私人定制,即個(gè)性化的服務(wù)某類群體甚至每一位用戶(個(gè)人認(rèn)為這是目前的發(fā)展趨勢(shì),未來的消費(fèi)主流)。比如,某公司想推出一款面向5-10歲兒童的玩具,通過用戶畫像進(jìn)行分析,發(fā)現(xiàn)形象=“喜羊羊”、價(jià)格區(qū)間=“中等”的偏好比重最大,那么就給新產(chǎn)品提供類非??陀^有效的決策依據(jù)。
- 業(yè)務(wù)經(jīng)營分析以及競(jìng)爭(zhēng)分析,影響企業(yè)發(fā)展戰(zhàn)略
構(gòu)建流程
數(shù)據(jù)收集
數(shù)據(jù)收集大致分為網(wǎng)絡(luò)行為數(shù)據(jù)、服務(wù)內(nèi)行為數(shù)據(jù)、用戶內(nèi)容偏好數(shù)據(jù)、用戶交易數(shù)據(jù)這四類。
- 網(wǎng)絡(luò)行為數(shù)據(jù):活躍人數(shù)、頁面瀏覽量、訪問時(shí)長(zhǎng)、激活率、外部觸點(diǎn)、社交數(shù)據(jù)等
- 服務(wù)內(nèi)行為數(shù)據(jù):瀏覽路徑、頁面停留時(shí)間、訪問深度、唯一頁面瀏覽次數(shù)等
- 用戶內(nèi)容便好數(shù)據(jù):瀏覽/收藏內(nèi)容、評(píng)論內(nèi)容、互動(dòng)內(nèi)容、生活形態(tài)偏好、品牌偏好等
- 用戶交易數(shù)據(jù)(交易類服務(wù)):貢獻(xiàn)率、客單價(jià)、連帶率、回頭率、流失率等
當(dāng)然,收集到的數(shù)據(jù)不會(huì)是100%準(zhǔn)確的,都具有不確定性,這就需要在后面的階段中建模來再判斷,比如某用戶在性別一欄填的男,但通過其行為偏好可判斷其性別為“女”的概率為80%。
還得一提的是,儲(chǔ)存用戶行為數(shù)據(jù)時(shí)最好同時(shí)儲(chǔ)存下發(fā)生該行為的場(chǎng)景,以便更好地進(jìn)行數(shù)據(jù)分析。
行為建模
該階段是對(duì)上階段收集到數(shù)據(jù)的處理,進(jìn)行行為建模,以抽象出用戶的標(biāo)簽,這個(gè)階段注重的應(yīng)是大概率事件,通過數(shù)學(xué)算法模型盡可能地排除用戶的偶然行為。
這時(shí)也要用到機(jī)器學(xué)習(xí),對(duì)用戶的行為、偏好進(jìn)行猜測(cè),好比一個(gè) y=kx+b 的算法,X 代表已知信息,Y 是用戶偏好,通過不斷的精確k和b來精確Y。
在這個(gè)階段,需要用到很多模型來給用戶貼標(biāo)簽。
用戶汽車模型
根據(jù)用戶對(duì)“汽車”話題的關(guān)注或購買相關(guān)產(chǎn)品的情況來判斷用戶是否有車、是否準(zhǔn)備買車
用戶忠誠度模型
通過判斷+聚類算法判斷用戶的忠誠度
身高體型模型
根據(jù)用戶購買服裝鞋帽等用品判斷
文藝青年模型
根據(jù)用戶發(fā)言、評(píng)論等行為判斷用戶是否為文藝青年
用戶價(jià)值模型
判斷用戶對(duì)于網(wǎng)站的價(jià)值,對(duì)于提高用戶留存率非常有用(電商網(wǎng)站一般使用RFM 實(shí)現(xiàn))
還有消費(fèi)能力、違約概率、流失概率等等諸多模型。
用戶畫像基本成型
該階段可以說是二階段的一個(gè)深入,要把用戶的基本屬性(年齡、性別、地域)、購買能力、行為特征、興趣愛好、心理特征、社交網(wǎng)絡(luò)大致地標(biāo)簽化。
為什么說是基本成型?因?yàn)橛脩舢嬒裼肋h(yuǎn)也無法100%地描述一個(gè)人,只能做到不斷地去逼近一個(gè)人,因此,用戶畫像既應(yīng)根據(jù)變化的基礎(chǔ)數(shù)據(jù)不斷修正,又要根據(jù)已知數(shù)據(jù)來抽象出新的標(biāo)簽使用戶畫像越來越立體。
關(guān)于“標(biāo)簽化”,一般采用多級(jí)標(biāo)簽、多級(jí)分類,比如第一級(jí)標(biāo)簽是基本信息(姓名、性別),第二級(jí)是消費(fèi)習(xí)慣、用戶行為;第一級(jí)分類有人口屬性,人口屬性又有基本信息、地理位置等二級(jí)分類,地理位置又分工作地址和家庭地址的三級(jí)分類。
數(shù)據(jù)可視化分析
這是把用戶畫像真正利用起來的一步,在此步驟中一般是針對(duì)群體的分析,比如可以根據(jù)用戶價(jià)值來細(xì)分出核心用戶、評(píng)估某一群體的潛在價(jià)值空間,以作出針對(duì)性的運(yùn)營。
如圖:
后記
這里只寫了用戶畫像的構(gòu)建流程和一些原理,下次有時(shí)間我會(huì)寫篇關(guān)于大數(shù)據(jù)平臺(tái)的實(shí)踐文章,并說一下一些行為模型的算法原理,有興趣的朋友可以關(guān)注下。
本文由 @我勒個(gè)矗 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理?,未經(jīng)許可,禁止轉(zhuǎn)載。
模型的算法和原理的文有出來嗎,求分享
模型的算法和原理的文有出來嗎,求分享
模型的算法和原理的文有出來嗎,求分享