群體智慧前沿:大眾評(píng)分落伍了,情感評(píng)分更有用

0 評(píng)論 3842 瀏覽 8 收藏 13 分鐘

導(dǎo)語:在線網(wǎng)絡(luò)評(píng)價(jià)為人們提供了可以立即獲得群眾智慧的渠道。在亞馬遜和Yelp的所有在線評(píng)價(jià)中,積極正面的評(píng)價(jià)占據(jù)了絕大部分,但是人們對(duì)這些項(xiàng)目呈現(xiàn)出來的行為性質(zhì)卻存在著明顯的差異,那么如何才能從這些積極在線評(píng)價(jià)的“海洋“中辨別出真正具有價(jià)值、成功的項(xiàng)目?目前流行的“星級(jí)評(píng)價(jià)”是否可以作為預(yù)測其項(xiàng)目成功的可靠依據(jù)?最近Nature human behavior一文中對(duì)于這些問題給出了答案。本文是對(duì)這篇論文的概述。

論文題目:Mass-scale emotionality reveals human behaviour and marketplace success

論文網(wǎng)址:https://www.nature.com/articles/s41562-021-01098-5

群體智慧前沿:大眾評(píng)分落伍了,情感評(píng)分更有用

一、從在線平臺(tái)的“海量”評(píng)價(jià)中提取用戶情感

目前隨著互聯(lián)網(wǎng)在線眾包平臺(tái)的發(fā)展,商品或線下服務(wù)的售賣都會(huì)在其在線眾包平臺(tái)中附著其一定的評(píng)價(jià)信息,而其中最為普遍的就是星級(jí)評(píng)價(jià)方式;這就可以供其平臺(tái)的潛在消費(fèi)者在選擇商品或服務(wù)時(shí)可以通過成本最低的方式,獲得最為直接的參考。

但事實(shí)果真如此嗎?已有研究調(diào)查所證明,這些在線的評(píng)級(jí)系統(tǒng)存在一定的局限性:其在線評(píng)價(jià)絕大多數(shù)都是積極正面的[1]。例如,在亞馬遜網(wǎng)站上,平均星級(jí)評(píng)價(jià)約為4.2(滿分5分),其中遠(yuǎn)超過一半的評(píng)論是5星級(jí)評(píng)價(jià)[2]。近一半的Yelp評(píng)論是5星評(píng)價(jià)[3],而近90%的Uber評(píng)價(jià)可能是5星[4]。

以上這種情況會(huì)導(dǎo)致個(gè)人經(jīng)常面臨著在眾多星級(jí)相似的項(xiàng)目中進(jìn)行選擇,特別是考慮到人們甚至不會(huì)考慮獲得低于3星級(jí)的選項(xiàng);所以星級(jí)評(píng)價(jià)本身可能無法可靠地預(yù)測其項(xiàng)目成功與否,它也并不能作為對(duì)項(xiàng)目真實(shí)價(jià)值的有效性參考。

高度集中的積極性評(píng)價(jià)會(huì)使其成為無效的信號(hào), 那么究竟如何才能從這些海量的積極性評(píng)價(jià)中獲取有效的信息。

來自美國馬薩諸塞大學(xué)管理學(xué)院的教授 Matthew D. Rocklage 和其研究團(tuán)隊(duì)把這種在大量積極評(píng)價(jià)中辨別成功的挑戰(zhàn)稱為“海量”評(píng)價(jià)積極性問題。他們首先證明了這種“海量”積極性問題存在的普遍性,并且提出具有情感性 (emotionality) 的評(píng)述性語言可以向個(gè)人提供更有意義的參考。他們將這一研究成果以《Mass-scale emotionality reveals human behaviour and marketplace success》為題目發(fā)表在了Nature Human Behaviour上。

他們分別從電影票房收入、亞馬遜圖書出售量、超級(jí)碗廣告中新品牌的追隨者、Yelp上的餐廳預(yù)訂量四個(gè)大規(guī)模在線評(píng)價(jià)案例中研究了海量評(píng)價(jià)積極性的問題。

通過對(duì)于四個(gè)大規(guī)模在線信息評(píng)價(jià)平臺(tái)的研究,他們證明了80%到100%的在線星級(jí)評(píng)價(jià)都是積極的,并且發(fā)現(xiàn)在線星級(jí)評(píng)分對(duì)于預(yù)測一個(gè)項(xiàng)目的行為和其成功性是不可靠的,即越來越多的積極評(píng)價(jià)通常不能預(yù)示著其項(xiàng)目的成功。

但是評(píng)價(jià)文本的情緒化因素卻可以用來預(yù)測一個(gè)項(xiàng)目的行為和其成功的可能性;這是因?yàn)榍榫w化語言為個(gè)人本身提供了一種跡象,表明發(fā)生了特別有影響的事情[5,6],因此它們可以作為一個(gè)特別明確的信號(hào),讓個(gè)人了解自己的態(tài)度。這種強(qiáng)烈的信號(hào)反過來會(huì)導(dǎo)致態(tài)度在記憶中更加牢固[7],這是一個(gè)公認(rèn)的預(yù)測態(tài)度的影響和持久性的因素。

下面將展示出他們所研究的四個(gè)案例:

二、情緒因素預(yù)測電影票房

研究者們從Metacritic.com獲得了2005年到2018年這13年所有電影的在線評(píng)論,并使用為每部電影撰寫的前30條用戶評(píng)論來衡量電影的星級(jí)(0到10星)和在線評(píng)價(jià)文本的情緒化語言分析。

他們發(fā)現(xiàn)一部電影的平均星級(jí)將會(huì)顯著地減少其電影的票房收入。而當(dāng)所有的電影都被包括在內(nèi)時(shí)——即使是那些最初有負(fù)面評(píng)價(jià)的電影——星級(jí)評(píng)價(jià)對(duì)票房收入也沒有顯著的預(yù)測作用。

之后他們?cè)谕荒P椭屑尤肓嗽u(píng)論文本的平均情感性因素,以及平均文本效價(jià) (valence) 作為對(duì)照。星級(jí)評(píng)分仍然是電影票房收入的一個(gè)重要的負(fù)面預(yù)測因素(見圖1左)。

最重要的是,評(píng)價(jià)文本中的情緒化因素是未來票房收入的一個(gè)重要的正向預(yù)測因素(見圖1右)。

群體智慧前沿:大眾評(píng)分落伍了,情感評(píng)分更有用

圖1(左)預(yù)測電影票房收入與其電影星級(jí)評(píng)價(jià)的關(guān)系;(右)預(yù)測電影票房收入與其電影評(píng)價(jià)文本中的情緒化因素的關(guān)系

三、圖書銷量:文本情緒比評(píng)分更重要

在第二個(gè)研究案例中,研究者們預(yù)測了從1995年到2015年亞馬遜網(wǎng)站上所有書籍的成功性(20年的數(shù)據(jù));他們?cè)俅问褂妹勘緯那?0條評(píng)論來索引該書的星級(jí)(1-5星)、文本效價(jià)和文本中的情緒化因素。

其平均星級(jí)評(píng)價(jià)的回歸結(jié)果好壞參半。星級(jí)評(píng)價(jià)是預(yù)測購書數(shù)量的一個(gè)負(fù)面因素。當(dāng)被評(píng)為負(fù)面的書籍也被包括在內(nèi)時(shí),正面的星級(jí)評(píng)價(jià)對(duì)購買量有顯著的預(yù)測作用。然而,這里的總體證據(jù)好壞參半的,因?yàn)樵?/3的圖書類型中,星級(jí)評(píng)價(jià)是不顯著的或?yàn)樨?fù)面的預(yù)測因素。

在分析積極評(píng)價(jià)的書籍時(shí),他們根據(jù)該書的平均星級(jí)和文本的情感性來預(yù)測該書的購買量。其發(fā)現(xiàn)平均星級(jí)是購買的一個(gè)負(fù)面預(yù)測因素,而文本的情緒化是一個(gè)重要的正面預(yù)測因素。除了這些影響之外,前30條評(píng)論中更多正面的情感性語言預(yù)示著更多的購買量,并且這一結(jié)論在百分之93的圖書類型中都有展現(xiàn)。

四、廣告中新品牌追隨者:評(píng)價(jià)預(yù)測粉絲增長

在研究案例3中,研究者們考察了針對(duì)電視廣告的實(shí)時(shí)推文的情感性是否能預(yù)測成功和人類行為,即品牌的每日新粉絲數(shù)量的增加。對(duì)于2016年和2017年的超級(jí)碗,他們獲得了發(fā)生在該超級(jí)碗當(dāng)天的所有實(shí)時(shí)推文,其中提到了超級(jí)碗期間播放的廣告。共有84家企業(yè)的94個(gè)廣告,關(guān)于這些廣告的推文總數(shù)為187206條。然后,他們使用評(píng)價(jià)詞典來量化推文中對(duì)每個(gè)商業(yè)的平均效價(jià)和情緒化的表達(dá)。

他們發(fā)現(xiàn)公司在超級(jí)碗之前積累的粉絲數(shù)量可以預(yù)測他們?cè)诔?jí)碗之后積累的粉絲數(shù)量,但《今日美國》上對(duì)于公司的星級(jí)評(píng)分對(duì)粉絲沒有預(yù)測作用。

然后,他們?cè)黾恿嗣總€(gè)廣告的推文的文本情感性因素作為主要預(yù)測因素,并增加了文本的平均效價(jià)作為控制變量。其發(fā)現(xiàn)《今日美國》的星級(jí)評(píng)分和推文的效價(jià)對(duì)新粉絲的數(shù)量沒有預(yù)測作用。然而,關(guān)于商業(yè)推文的文本情感性語言的正面積極性程度越高, 公司在接下來的兩周內(nèi)積累的Facebook粉絲就越多。

五、餐廳預(yù)訂量:評(píng)分與情緒都有用

在研究案例4中,研究者們根據(jù)截至2017年伊利諾伊州芝加哥市存在的所有餐廳的前30條Yelp.com評(píng)論,研究了餐廳的成功和預(yù)定量問題。他們用這些評(píng)論來索引每家餐廳的平均星級(jí) (1到5星)、文本效價(jià)(valence)和文本情感性。

而這一次,他們的研究結(jié)果與先前的3個(gè)研究案例不同,在餐廳預(yù)定量的問題上,平均星級(jí)評(píng)價(jià)可以預(yù)測更多的餐桌預(yù)訂量。他們接著將餐廳前30條評(píng)論的文本情緒化因素以及其文本效價(jià)添加到回歸模型中去。

平均星級(jí)評(píng)價(jià)變得不顯著(見圖2左),并且文本的效價(jià)卻是一個(gè)積極的預(yù)測因素。除了這些影響之外,存在著更多積極情感性語言評(píng)價(jià)的餐廳將會(huì)得到更多的用餐預(yù)定(見圖2右)。

群體智慧前沿:大眾評(píng)分落伍了,情感評(píng)分更有用

圖2(左)預(yù)測餐桌預(yù)定量與其電影星級(jí)評(píng)價(jià)的關(guān)系;(右)預(yù)測餐桌預(yù)定量與其電影評(píng)價(jià)文本中的情緒化因素的關(guān)系

六、“海量”評(píng)價(jià)積極性問題的解決途徑

現(xiàn)如今,大規(guī)模在線評(píng)價(jià)信息中的“海量”評(píng)價(jià)積極性問題已經(jīng)越來越普遍化,并且有時(shí)會(huì)伴隨著商家自己為了使得自己的商品或者服務(wù)得到更好的銷售從而進(jìn)行刷好評(píng)的操作,這就會(huì)進(jìn)一步造成大眾消費(fèi)者從中識(shí)別有效信號(hào)的困難性。

而基于情緒化的語言評(píng)價(jià)可以成為解決這個(gè)問題的正確途徑,這就需要呼吁相關(guān)第三方平臺(tái)組織要更加關(guān)注個(gè)人態(tài)度的情感性。

平臺(tái)管理者可以考慮匯總評(píng)論者的語言,并提供一個(gè)“情感星級(jí)”,以向個(gè)人提供更有意義的評(píng)估參考;而具有有效預(yù)測性,并且可以取代星級(jí)評(píng)價(jià)的指標(biāo)的探索性研究將會(huì)留給對(duì)此研究問題感興趣的研究人員。

參考文獻(xiàn):

[1] Hu, N., Zhang, J. & Pavlou, P. A. Overcoming the J-shaped distribution of product reviews. Commun. ACM 52, 144–147 (2009).

[2] Woolf, M. Playing with 80 million Amazon product review ratings using Apache Spark. minimaxir http://minimaxir.com/2017/01/amazon-spark/ (2017).

[3] Yelp Factsheet (Yelp, 2017); https://www.yelp.com/factsheet

[4] Athey, S., Castillo, J. C. & Knoepfle, D. Service quality in the gig economy: empirical evidence about driving quality at Uber. White Paper. https://doi. org/10.2139/ssrn.3499781 (2019).

[5] Tooby, J. & Cosmides, L. The past explains the present. Ethol. Sociobiol. 11, 375–424 (1990).

[6] Ekman, P. E. & Davidson, R. J. The Nature of Emotion: Fundamental Questions (Oxford Univ. Press, 1994).

[7] Rocklage, M. D. & Fazio, R. H. Attitude accessibility as a function of emotionality. Pers. Soc. Psychol. Bull. 44, 508–520 (2018).

 

作者:熊宏晉;編輯:鄧一雪;公眾號(hào):集智俱樂部

原文鏈接:https://mp.weixin.qq.com/s/U7_GSusLyAns9wwaPkuoiw

本文由 @集智俱樂部 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!