如何挖掘用戶評(píng)論,聽到真實(shí)聲音?

2 評(píng)論 11132 瀏覽 37 收藏 10 分鐘

評(píng)論區(qū)研究雖然是一個(gè)以文本內(nèi)容分析為主的研究,但是在數(shù)據(jù)量龐大的情況下,我們不能忽略掉量化處理和反饋結(jié)果的客觀性與準(zhǔn)確性。

網(wǎng)上購物時(shí),我們一般只能看到商品的圖文詳情,但是光憑圖片與文字,往往無法對(duì)商品的優(yōu)劣做出準(zhǔn)確判斷,這個(gè)時(shí)候,已購者的評(píng)論對(duì)我們是否會(huì)購買該商品起著很大的作用。在閱讀網(wǎng)站或者APP上選擇一本書進(jìn)行閱讀或購買也是同樣的道理。因?yàn)殄e(cuò)誤的選擇意味著我們要為這本書付出時(shí)間甚至金錢。因此,除了了解出版社、內(nèi)容簡介等書籍相關(guān)信息之外,我們還需要參考其他讀者的意見,來判斷這本書的質(zhì)量到底好不好,合不合我們的口味。

另一方面,隨著IP的概念席卷整個(gè)文娛產(chǎn)業(yè) (如閱讀、影視、游戲、動(dòng)漫、音樂等等) ,版權(quán)費(fèi)也隨之一漲再漲,有的甚至高達(dá)幾千萬元?;ヂ?lián)網(wǎng)免費(fèi)時(shí)代終結(jié),付費(fèi)模式隨之襲來。面對(duì)高昂的運(yùn)營成本,營收逐漸成為內(nèi)容型產(chǎn)品策劃與運(yùn)營主要關(guān)注的指標(biāo)。從這個(gè)角度來說,關(guān)注閱讀產(chǎn)品的評(píng)論區(qū)與關(guān)注電商產(chǎn)品的評(píng)論區(qū)對(duì)策劃和運(yùn)營同樣重要。因此,作為用戶研究人員,有時(shí)也需要協(xié)助產(chǎn)品去了解產(chǎn)品內(nèi)甚至是各個(gè)渠道上的用戶反饋情況。

下面,以《網(wǎng)易云閱讀評(píng)論區(qū)分析項(xiàng)目》為例進(jìn)行介紹。

1項(xiàng)目前期的分析與思考

項(xiàng)目的總體目標(biāo)是了解目前平臺(tái)評(píng)論區(qū)的用戶反饋與質(zhì)量,同時(shí)關(guān)注用戶的潛在需求與問題點(diǎn),為后續(xù)產(chǎn)品與運(yùn)營提供可行性方向指導(dǎo)。在項(xiàng)目開始前,我們主要關(guān)注了以下幾點(diǎn):

  • 展現(xiàn)用戶的評(píng)論反饋似乎不是難事,難點(diǎn)在于數(shù)百萬的評(píng)論怎么展示??????如何提取“合適的、有代表性的”評(píng)論供產(chǎn)品方了解情況?
  • 評(píng)論的質(zhì)量是一個(gè)抽象名詞,我們?cè)撛鯓訉⑵淞炕??質(zhì)量的衡量標(biāo)準(zhǔn)是什么?
  • 書評(píng)文本不同于問卷開放題的文本,它沒有統(tǒng)一的主題與中心。如何從這些評(píng)論中區(qū)分出優(yōu)秀體驗(yàn)點(diǎn)和低劣體驗(yàn)點(diǎn),分辨出哪些是用戶的感情,哪些是需求?
  • 最后也是最重要的一點(diǎn),即落地性:如何輸出結(jié)論,才能指導(dǎo)產(chǎn)品運(yùn)營與設(shè)計(jì)?

2研究框架的搭建與指標(biāo)的提取

一般來說,當(dāng)看到輿情或者評(píng)論分析項(xiàng)目時(shí),我們的第一反應(yīng)會(huì)認(rèn)為這應(yīng)該是一個(gè)“文本分析”項(xiàng)目。其實(shí)不然,文字雖然是評(píng)論的主體,但是與一般的定性類項(xiàng)目不同。在面對(duì)龐大的數(shù)據(jù)量時(shí),需求方更希望能得到一個(gè)關(guān)乎量的反饋,一個(gè)客觀的、可以明確目前平臺(tái)書籍質(zhì)量在用戶心中到底是好是壞的反饋;當(dāng)然還有背后的原因,就是用戶到底有哪些滿意的或者不滿意的地方?用戶的需求是什么?哪些是我們可以滿足的?因此,我們確立了以客觀的數(shù)據(jù)為骨架,以文字內(nèi)容分析為血肉的大方向,將產(chǎn)品分為出版和原創(chuàng) (原創(chuàng)又分為男頻和女頻) 兩個(gè)大的模塊考量,同時(shí),考慮數(shù)據(jù)的可得性和不同分析維度,在按照書籍提取了評(píng)論文字內(nèi)容之后輔助分析了以下指標(biāo):

(1)每本書評(píng)論數(shù)量、是否是大師評(píng)論、評(píng)論的星級(jí)

這些指標(biāo)與評(píng)論密切相關(guān),通過評(píng)論的數(shù)量、質(zhì)量 (大師評(píng)論、星級(jí)) 等,可以在一定程度上反應(yīng)版塊的活躍度和受歡迎程度。當(dāng)然也可以滿足統(tǒng)計(jì)出一些基本的數(shù)據(jù),在整體上對(duì)于評(píng)論的情況有一個(gè)大致的了解,明晰后續(xù)改進(jìn)的方向。

(2)書籍名稱、書籍類型、PV/UV

但是,僅僅分析書評(píng)相關(guān)顯然是不夠的,因?yàn)闀u(píng)可以視為一個(gè)因變量,而這個(gè)因變量很大程度上受書籍內(nèi)容類型和質(zhì)量的影響,所以在信息挖掘的時(shí)候也要考慮書籍層面等背景信息相關(guān)維度的指標(biāo)。選擇PV/UV的主要原因是考慮到不同的書籍評(píng)論曝光程度不同,評(píng)論影響力也不同。

(3)用戶注冊(cè)時(shí)間、用戶等級(jí)

同時(shí),在定量研究中,我們往往很關(guān)注受訪者信息,也就是樣本的Profile,因?yàn)椴煌尘暗娜巳?,往往?huì)得出截然不同甚至相反的結(jié)論。因此,我們同時(shí)也會(huì)提取用戶的注冊(cè)時(shí)間與等級(jí)。這樣我們就可以知道平臺(tái)評(píng)論用戶的構(gòu)成是怎么樣的,他們的評(píng)論是不是會(huì)有所不同。

3統(tǒng)計(jì)方法的選擇與結(jié)論的輸出

因?yàn)槠脚_(tái)數(shù)據(jù)量較大,在拆分為出版、原創(chuàng)男頻、原創(chuàng)女頻之后,顆粒度依舊太粗,會(huì)導(dǎo)致結(jié)論不分明。因此我們考慮進(jìn)一步按照產(chǎn)品現(xiàn)有維度細(xì)分:

  1. 篩選每個(gè)版塊的大師評(píng)論,也就是精華評(píng)論,即點(diǎn)贊數(shù)最多、展示于評(píng)論區(qū)最前列的評(píng)論。它最能代表讀者心理認(rèn)同的內(nèi)容;同時(shí)大師評(píng)論越多,體現(xiàn)版塊越活躍,評(píng)論區(qū)質(zhì)量越高。
  2. 篩選每個(gè)版塊的五星級(jí)評(píng)論,集中體現(xiàn)讀者關(guān)于書籍好的反饋;篩選每個(gè)版塊中三星及以下評(píng)論,集中體現(xiàn)讀者關(guān)于書籍不太好的反饋。

在方法上,我們首先利用詞頻來展現(xiàn)每個(gè)版塊下不同維度評(píng)論里包含的詞語的出現(xiàn)次數(shù),在剔除無意義的高頻連接詞之后,對(duì)文本進(jìn)行了語義網(wǎng)絡(luò)分析。

(戳大圖閱讀更清晰)

在這個(gè)過程中,我們發(fā)現(xiàn)了一些有意思的結(jié)論。舉例來說,大師評(píng)論,除了包含對(duì)書的理解與本身故事情節(jié)、人物塑造的深度評(píng)價(jià)外,更多的是對(duì)人生與社會(huì)兩大主題的思考,比如生命、愛情、歲月、內(nèi)心,比如國家發(fā)展、經(jīng)濟(jì)、市場(chǎng)、企業(yè)發(fā)展等。這一方面體現(xiàn)了讀者內(nèi)心的訴求與關(guān)注點(diǎn),另一方面也向我們展示了受歡迎的書籍的題材內(nèi)容與標(biāo)準(zhǔn)。原創(chuàng)男頻和原創(chuàng)女頻也呈現(xiàn)出一些截然不同的特點(diǎn):女頻讀者更喜歡古裝、穿越、言情和校園的題材,也更關(guān)注電視劇、韓劇,因此評(píng)論中這些字眼出現(xiàn)在五星級(jí)評(píng)論中的概率也更高;而男頻讀者則非常反感出軌、離婚的題材與內(nèi)容,這些字眼是三星及以下的高頻閃現(xiàn)詞。此外,我們?cè)谌羌耙韵略u(píng)論中還發(fā)現(xiàn),讀者除了反饋內(nèi)容本身的問題,比如錯(cuò)別字、翻譯不好、文筆差、爛尾等,還會(huì)反饋平臺(tái)和功能上的一些問題,比如章節(jié)付費(fèi)、排版、圖片不清晰等。

最后,我們利用詞云對(duì)每個(gè)版塊和分析維度下出現(xiàn)的頻率較高的“關(guān)鍵詞”進(jìn)行視覺上的凸顯,突出了我們的主要結(jié)論。

針對(duì)詞頻統(tǒng)計(jì)以及語義網(wǎng)絡(luò)分析的結(jié)論,一方面,用戶的評(píng)論反饋驗(yàn)證了產(chǎn)品目前版本在一些功能模塊上存在的不足,為產(chǎn)品提出了改進(jìn)和優(yōu)化的方向;另一方面,從用戶的評(píng)論中也可以挖掘出讀者對(duì)作品最重視的幾個(gè)關(guān)鍵指標(biāo)維度,對(duì)產(chǎn)品重新設(shè)計(jì)評(píng)論區(qū)的標(biāo)簽與評(píng)分體系提出了建議;同時(shí)也為產(chǎn)品如何引導(dǎo)與改善用戶書評(píng),以營造更好的移動(dòng)閱讀社區(qū)氛圍提供了思路。

綜上所述,評(píng)論區(qū)研究雖然是一個(gè)以文本內(nèi)容分析為主的研究,但是在數(shù)據(jù)量龐大的情況下,我們不能忽略掉量化處理和反饋結(jié)果的客觀性與準(zhǔn)確性。這也正是詞頻、詞云、語義網(wǎng)絡(luò)相對(duì)人工/客服統(tǒng)計(jì)結(jié)果更加明晰,更能從整體上反映問題與主題聯(lián)系的優(yōu)勢(shì)所在。

 

作者:田敏,一枚對(duì)心理學(xué)有濃厚興趣的經(jīng)濟(jì)學(xué)人,熱愛思考,喜歡探究,目前主要跟進(jìn)網(wǎng)易閱讀和漫畫產(chǎn)品的用戶研究工作。

本文作者@田敏,由@用鹽有點(diǎn)咸(微信公眾號(hào):用鹽有點(diǎn)咸) 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 請(qǐng)問那個(gè)詞云的圖片是怎么做的呢?詞云上面沒有這種模板呀~感謝告知

    來自美國 回復(fù)
  2. 一看就是一個(gè)細(xì)膩的女孩紙寫的,很喜歡“用研有點(diǎn)咸”的文章,很細(xì)膩,很易懂,而且也有深度。

    來自浙江 回復(fù)