盡可能地做到:全面無死角的會(huì)員畫像
因數(shù)據(jù)分析統(tǒng)計(jì)分析有其局限性,基于此的會(huì)員畫像也不可能做到真正意義上的全面完整。因此,我們只能做到盡可能的全面無死角的會(huì)員畫像。
最近有不少朋友留言,讓對(duì)會(huì)員畫像做個(gè)全面的點(diǎn)的講解下。就此,我對(duì)《三生三世話CRM》系列課程的第四課“會(huì)員分析”中的會(huì)員畫像內(nèi)容進(jìn)行個(gè)展開講解。
首先,基于我自己對(duì)會(huì)員畫像的認(rèn)知對(duì)其做個(gè)定義。會(huì)員畫像可以認(rèn)為是基于會(huì)員分析的聚類分組后的定性描述的標(biāo)簽化呈現(xiàn),是對(duì)會(huì)員多維度屬性展開的更加立體全面的描述歸納。
會(huì)員畫像本質(zhì)也是會(huì)員分析的一種分析呈現(xiàn)方法。會(huì)員分析的目的就是為了清楚的描述展現(xiàn)會(huì)員的特征屬性,更好地理解把握會(huì)員是我們做分析的終極目標(biāo)?!皹?biāo)簽”可以認(rèn)為是自然語言的一部分,是一個(gè)簡單精煉的歸納表現(xiàn)形式。在實(shí)際業(yè)務(wù)中,大家都在廣泛的應(yīng)用這一類基于標(biāo)簽的畫像方法,即會(huì)員畫像?;跁?huì)員畫像的標(biāo)簽方法歸納起來,就是給用戶貼一系列的標(biāo)簽,而“標(biāo)簽”是能表示用戶某一特征屬性的標(biāo)識(shí)。
會(huì)員畫像是建立在一系列屬性數(shù)據(jù)之上的目標(biāo)用戶模型。會(huì)員畫像的基礎(chǔ)信息應(yīng)該是對(duì)會(huì)員描述的全量信息,通??梢苑譃闄C(jī)器很容易解析的結(jié)構(gòu)化信息和機(jī)器很難理解需要結(jié)合知識(shí)庫才能夠理解的非結(jié)構(gòu)化信息,這些信息最后以飽含深意的標(biāo)簽的形式表現(xiàn)出來。
會(huì)員畫像邏輯
先來說說結(jié)構(gòu)化信息,可以理解成在數(shù)據(jù)庫中結(jié)構(gòu)化存放的信息,歸結(jié)起來包括會(huì)員的基礎(chǔ)信息,行為信息,已經(jīng)分析總結(jié)后的特征信息。會(huì)員的這些信息要基于時(shí)間和空間維度來談才有意義,脫離了時(shí)間,空間的數(shù)據(jù)是無意義的。
比如“有錢人”這個(gè)標(biāo)簽,100年前的有錢人和現(xiàn)在的有錢人絕不是一個(gè)概念,至少有錢程度差異很大了;即使同一時(shí)間的當(dāng)下的1萬/月的高薪,在一線城市和三四線城市,在不同的國家,肯定都意味不同的。因此用戶畫像應(yīng)該是多維度的立體的描述體系。
非結(jié)構(gòu)化信息,就是一些零碎的,人類自然語言描述等,目前機(jī)器還不能有效的準(zhǔn)確的理解人類的自然語言,因?yàn)槲覀兊淖匀徽Z言很多時(shí)候是有歧義的,需要通過上下文才能理解的,而機(jī)器需要結(jié)合龐大知識(shí)庫的轉(zhuǎn)譯才能夠理解的非結(jié)化信息。
比如一些人類生活總結(jié)出來的概念、行為、習(xí)慣等知識(shí)的結(jié)合就能解讀出額外的信息。比會(huì)員信息中缺失的性別,會(huì)員信息中沒有性別,但我們可以結(jié)合一些業(yè)務(wù)描述語境來判斷,通常姓名中帶有女字旁,與花名相關(guān)的會(huì)員,我們可以認(rèn)為其為女性。又比如用戶訪問過的網(wǎng)站,經(jīng)常訪問一些美妝或女性服飾類網(wǎng)站,是女性的可能性就高;訪問體育軍事類網(wǎng)站,是男性的可能性就高。還有用戶上網(wǎng)的時(shí)間段,經(jīng)常深夜上網(wǎng)的用戶男性的可能性就高。把這些特征加入到知識(shí)分類器進(jìn)行訓(xùn)練,也能提高一定的數(shù)據(jù)覆蓋率。當(dāng)然這些知識(shí)也要限定在一定的時(shí)間空間下,不同的時(shí)間空間的知識(shí)解讀出來的信息完全是不一樣的。
要想讓機(jī)器能夠理解這些知識(shí):
- 第一個(gè)是要有足夠大的規(guī)模,必須覆蓋足夠多的樣本,足夠多的概念;
- 第二個(gè)是語義要足夠豐富,當(dāng)說到各種各樣的關(guān)系的時(shí)候,機(jī)器必須都能夠理解;
- 第三個(gè)就是數(shù)據(jù)質(zhì)量要足夠精良,能夠按照一定的規(guī)則被聚類被歸納;
- 第四個(gè)就是結(jié)構(gòu)必須足夠友好需要借鑒語義和背景知識(shí)來給我們力量。
會(huì)員畫像歸根結(jié)底就是對(duì)會(huì)員屬性分析結(jié)果的描述呈現(xiàn),終究只是概括性的歸納描述。因此,我們不可能通過會(huì)員畫像對(duì)會(huì)員做到全方位全面的描述,這里的全面只能是相對(duì)的。細(xì)細(xì)糾結(jié)下,會(huì)員畫像本身也是有其自身缺陷的。
首先,會(huì)員畫像從某種程度講上還是不完整的。
導(dǎo)致這個(gè)問題可能有兩個(gè)原因,第一個(gè)原因就是任何畫像的來源數(shù)據(jù)都是有一定偏差的,一般描述的都是用戶畫像的某一方面,很難有一個(gè)非常完整的畫像。還有一個(gè)非常重要的原因就是隱私,大家都是有選擇性的提供個(gè)人信息,會(huì)回避不愿談及自己的,但是很多時(shí)候可能了解用戶不愿談及的這個(gè)方面的內(nèi)容對(duì)于我們做產(chǎn)品,做服務(wù)又是非常重要的?;谶@兩個(gè)原因,我們對(duì)用戶的理解就是一個(gè)碎片式的,很難召回完整的目標(biāo)客戶。
其次,會(huì)員畫像還有一個(gè)問題就是不正確性。
也就是說,我們對(duì)用戶畫像的理解很多時(shí)候是錯(cuò)誤的,這導(dǎo)致會(huì)出現(xiàn)錯(cuò)誤的服務(wù)應(yīng)用。導(dǎo)致不正確性的原因有很多,人類社會(huì)是在向前發(fā)展,知識(shí)也在不斷的演變。因此,供機(jī)器學(xué)習(xí)的知識(shí)庫永遠(yuǎn)也不會(huì)有完整全面的時(shí)候,總有機(jī)器還無法理解知識(shí),就會(huì)做出不夠精準(zhǔn)正確的描述。
綜上, 我們理解的會(huì)員畫像,通常只是基于存量的歷史數(shù)據(jù),通過數(shù)據(jù)分析模型,對(duì)會(huì)員數(shù)據(jù)從屬性特征在時(shí)間、空間內(nèi)盡可能地描述歸納。因數(shù)據(jù)分析統(tǒng)計(jì)分析有其局限性,基于此的會(huì)員畫像也不可能做到真正意義上的全面完整。因此,我們只能做到盡可能的全面無死角的會(huì)員畫像。
PS:本人最近因公司(萬達(dá)網(wǎng)科)出現(xiàn)眾所周知的原因,剛剛失業(yè),求合適的坑
#專欄作家#
Reuter,知乎專欄:電商CRM規(guī)劃,人人都是產(chǎn)品經(jīng)理專欄作家,自詡數(shù)據(jù)分析思維做產(chǎn)品的PM。善以數(shù)據(jù)分析思維做解析產(chǎn)品業(yè)務(wù)需求,完成產(chǎn)品實(shí)現(xiàn)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
沙發(fā)2
沙發(fā)