【干貨】從社交媒體傳播和文本挖掘角度解讀《歡樂頌2》
![](http://image.woshipm.com/wp-files/img/86.jpg)
作為數(shù)據(jù)分析愛好者,本文作者將想從數(shù)據(jù)的角度去解讀《歡樂頌2》這部熱播劇的方方面面,包括輿情傳播、網(wǎng)絡(luò)口碑、人物社交網(wǎng)絡(luò)分析及,以及小說內(nèi)容的文本分析。
5月11日,讓眾多安迪粉期待已久的《歡樂頌》第二季終于播出。相比首季,《歡樂頌2》在造型和場景上顯得更為精致時(shí)尚,且其中每個(gè)角色的造型卻都是遵從的其身份和背景,并不突兀。
正所謂“外行看熱鬧,內(nèi)行看門道”,作為數(shù)據(jù)分析愛好者的筆者,自然想從數(shù)據(jù)的角度去解讀這部熱播劇的方方面面,包括輿情傳播、網(wǎng)絡(luò)口碑、人物社交網(wǎng)絡(luò)分析,以及小說內(nèi)容的文本分析。
以下是筆者在這篇文章想要著重分析的內(nèi)容:
- 這部分在互聯(lián)網(wǎng)上的輿情傳播如何?包括該劇的全網(wǎng)傳播趨勢、關(guān)注人群畫像,及網(wǎng)絡(luò)營銷手法。
- 和大獲成功的第一部相比,第二部的口碑如何?主要涉及本劇豆瓣影評(píng)的文本分析。
- 對(duì)第一、二季的小說文本分析。主要涉及關(guān)鍵詞提取、主要人物的社交網(wǎng)絡(luò)關(guān)系及關(guān)聯(lián)詞分析等。
在筆者進(jìn)行分析的過程中,會(huì)用到一些常用的(大)數(shù)據(jù)分析工具,以及環(huán)環(huán)相扣的數(shù)據(jù)分析討論,雖然對(duì)于常規(guī)的數(shù)據(jù)運(yùn)營并無直接的幫助,但“他山之石,可以攻玉”,分析的思路卻可以作為參考,以期應(yīng)用到其他實(shí)際的場景中。
1?《歡樂頌2》的大數(shù)據(jù)輿情分析
在第一部分中,筆者選取了2017.05.07~2017.05.29期間關(guān)于《歡樂頌2》的全網(wǎng)輿情數(shù)據(jù)作為數(shù)據(jù)分析對(duì)象,利用新浪微輿情的“信息監(jiān)測”和“全網(wǎng)事件分析”作為數(shù)據(jù)采集、數(shù)據(jù)分析和可視化的工具。
以下分別從《歡樂頌2》的全網(wǎng)傳播概況及傳播趨勢兩方面進(jìn)行分析。
1.1《歡樂頌2》的全網(wǎng)傳播概況
(1)全網(wǎng)傳播走勢
上圖是《歡樂頌2》在這段時(shí)間內(nèi)信息傳播走勢圖,自開播之日起,該劇的全網(wǎng)聲量出現(xiàn)了明顯的提升,而且里面出現(xiàn)了幾個(gè)信息傳播的“波峰”,說明當(dāng)日全網(wǎng)關(guān)于該劇的討論(包括媒體和網(wǎng)民個(gè)體)較多。尤其需要注意的是,本劇開播當(dāng)日(5-11)的波峰峰值是該時(shí)間段內(nèi)最大的一個(gè),這是不是一個(gè)巧合呢?不要急,筆者會(huì)在后面為各位小伙伴解開謎底。
(2)全網(wǎng)正負(fù)面信息占比
從上圖中可以看到,這段時(shí)間內(nèi),全網(wǎng)關(guān)于《歡樂頌2》的信息量有5,564,016條,其中負(fù)面信息的占比達(dá)到152,315條,占到總信息量的2.74%。
同時(shí),在總體上,負(fù)面信息隨著時(shí)間的推移又不斷增長的趨勢。
結(jié)合二者來看,如此這般的負(fù)面信息占比和發(fā)展情形對(duì)于該劇來說不太有利,說明全網(wǎng)關(guān)于該劇的負(fù)面口碑評(píng)價(jià)比較顯著,需要引起制片方的重視,筆者會(huì)在接下來的分析中,探明到底出現(xiàn)了哪些負(fù)面口碑,以及它們出現(xiàn)的原因。
(3)全網(wǎng)關(guān)注度來源
因?yàn)樵谟耙晞〉膫鞑ヂ暳恐?,微博這塊占據(jù)較大的比重,所以筆者在排除微博這一信息來源后,對(duì)余下的信息來源TOP10進(jìn)行了統(tǒng)計(jì),如下圖所示:
從上圖可以看出,除開微博外,微信、今日頭條這兩大社會(huì)化媒體平臺(tái)上關(guān)于本劇的信息量貢獻(xiàn)最多,尤其微信在近日推出了「微信實(shí)驗(yàn)室」,通過新增加的“搜一搜”和“看一看”這兩個(gè)入口,使用戶能夠主動(dòng)搜索關(guān)鍵詞,能夠?yàn)g覽熱點(diǎn)資訊、好友關(guān)注的資訊以及自己感興趣的文章,這樣的動(dòng)作加上數(shù)年的優(yōu)質(zhì)內(nèi)容沉淀,使得微信在社會(huì)化媒體內(nèi)容生產(chǎn)方面的重要性日漸突出。
(4)全網(wǎng)信息地域分布
有點(diǎn)意外,全網(wǎng)關(guān)注度(關(guān)于這部劇的全網(wǎng)信息量)排名榜首的是江蘇,竟然不是北京和上海這兩大年輕白領(lǐng)云集的現(xiàn)代化的都市,尤其是上海,關(guān)于本劇的信息量分布在TOP10中墊底,難道上海的網(wǎng)民和媒體絕大部分都棄劇了?或者說是本劇的口碑極差?
對(duì)于此種疑問,筆者將會(huì)在第二部分進(jìn)行分析。
1.2 人群畫像
因?yàn)殛P(guān)于本劇的探討,微博(主要是新浪微博)占據(jù)大頭,所以筆者選取該平臺(tái)上的人群作為分析對(duì)象。
(1)? 性別分布
毫無疑問,女生是該劇的忠實(shí)擁簇,他們對(duì)該劇的狂熱絕對(duì)超過男生。
(2)? 年齡分布
從下圖中可以看出,19-34這個(gè)年齡區(qū)間占據(jù)關(guān)注人群的70%左右,也就是說青年群體對(duì)該劇很感興趣。
(3)? 興趣圖譜
下圖給出了關(guān)注該劇的人群的興趣標(biāo)簽TOP5,可以看出,這部分人群比較追星,熱愛生活,都是一些極具年輕人特質(zhì)的興趣愛好。
(4)用戶情感狀態(tài)
根據(jù)關(guān)注《歡樂頌2》的微博用戶給自己打的情感類別標(biāo)簽,可以得知此類用戶的情感狀態(tài)分布情況:
由此可以看到,大部分用戶(80.75%)處于情感空白/開窗期(“單身”和“求交往”狀態(tài)),再次是“戀愛中”,結(jié)合前面的年齡分布,說明關(guān)注人群大都是未婚青年。
(5)用戶學(xué)歷分布
毫無疑問,這類都市情感劇的受眾以受過高等教育的人群為主,因?yàn)樵搫≈v述的是高學(xué)歷白領(lǐng)在大城市工作生活和戀愛的故事。
(6)用戶城市類型
有點(diǎn)出乎意料的是,4線及以下城市的關(guān)注人群所占比重最高,為30.26%,其次是2線和3線城市,而一線城市的關(guān)注人群則僅為14.41%,難道是一線城市的人群對(duì)本劇比較挑剔?
結(jié)合前面的信息地域分布,關(guān)注《歡樂頌2》的主體是一群熱愛生活、熱衷于追星的高學(xué)歷青年女性,她們生活在一線城市開外,情感狀態(tài)多為單身。
1.3 《歡樂頌2》開播當(dāng)日的營銷宣傳分析
在前面提及的全網(wǎng)傳播趨勢中,筆者提到了該劇在開播當(dāng)日就出現(xiàn)明顯的聲量高峰,很明顯,這絕非偶依然。
從前面的信息來源分布可以得知,該劇絕大部分的聲量都來源于微博,尤其是新浪微博。為此,筆者單獨(dú)調(diào)出5-11的微博信息趨勢數(shù)據(jù)。
從上圖可以看到,新浪微博上關(guān)于該劇的信息量大體上是呈現(xiàn)上升趨勢的。在當(dāng)日的23時(shí)左右達(dá)到高峰,而且這種增長趨勢很有節(jié)奏感—從工作時(shí)間段9:00開始,聲量隨時(shí)間的推移不斷上漲。
為了進(jìn)一步發(fā)現(xiàn)其中的傳播規(guī)律,筆者利用新浪微輿情的“信息監(jiān)測”模塊對(duì)其中有影響力的微博進(jìn)行了進(jìn)一步的搜尋和排查,也就是發(fā)現(xiàn)其中轉(zhuǎn)發(fā)次數(shù)較多的微博,以及順藤摸瓜,發(fā)現(xiàn)傳播源頭。
經(jīng)過逐步地抽絲剝繭,筆者發(fā)現(xiàn)了其中轉(zhuǎn)發(fā)量較多的幾條微博,也就是傳播源頭,主要是《歡樂頌2》的幾位主演的微博賬號(hào)和一些跟該劇有關(guān)的微博話題。從實(shí)際效果來看,《歡樂頌2》的幾位主演——?jiǎng)?、王凱、楊紫等人在新浪微博上的影響力較高,粉絲數(shù)量龐大,主動(dòng)轉(zhuǎn)發(fā)積極,使得對(duì)劇集宣傳的效果也相對(duì)較好。
除了主創(chuàng)人員的主動(dòng)推廣外,《歡樂頌2》的推廣營銷方式也是豐富多樣。在微博推廣上,《歡樂頌2》的宣傳物料準(zhǔn)備充足,預(yù)告片、小花絮、主題曲MV等一應(yīng)俱全;宣傳矩陣搭建完整,不僅注意與微博官方賬號(hào)“新浪娛樂”、“新浪電視”、“東方衛(wèi)視番茄臺(tái)”和”@微博電視劇“等)、廣告品牌等多方聯(lián)動(dòng),而且KOL輿論引導(dǎo)投入巨大,還邀請(qǐng)其他明星助力宣傳。
然而,從上面的傳播效果來看,媒體大號(hào)的傳播效果沒有明星個(gè)人的微博賬號(hào)傳播效力大,那么,其中的原因又是什么呢?我們接著往下看。
1.4?微博傳播效果分析
為了深入了解媒體大號(hào)和明星個(gè)人微博傳播特點(diǎn)和規(guī)律,筆者特地找了5-11當(dāng)天粉絲互動(dòng)量較大的2條微博—分別為@微博電視劇和劉濤的個(gè)人微博賬號(hào)@劉濤tamia,它們的轉(zhuǎn)發(fā)評(píng)論幾近一致,方便在同等條件下發(fā)現(xiàn)其中的傳播規(guī)律。
將這兩條微博的轉(zhuǎn)發(fā)傳播關(guān)系數(shù)據(jù)導(dǎo)出,制成能夠清晰反映傳播路徑的可視化“力導(dǎo)向傳播圖“:
上圖是@微博電視劇關(guān)于《歡樂頌2》的營銷微博的傳播路徑圖,其中紫色“簇群“的中心就是賬號(hào)@微博電視劇,除了它自己帶來的轉(zhuǎn)發(fā)傳播(也就是紫色簇群區(qū)域內(nèi)的小圓點(diǎn))之外,周圍還有一些次級(jí)傳播中心,比如“十三點(diǎn)半的kings”、“影視大米FAN”、“吳侃侃kkw”這樣營銷性質(zhì)很強(qiáng)的自媒體賬號(hào)進(jìn)行協(xié)助宣傳,顯然這是宣傳方砸錢買的流量,不是自帶的。
而下面劉濤的該條微博就呈現(xiàn)出明顯的“中心化”特點(diǎn),也就是除了劉濤個(gè)人微博賬號(hào)以外,就沒有特別明顯的次級(jí)傳播中心,絕大部分的傳播都來自于劉濤的賬號(hào)粉絲。
由此,結(jié)論不言自明:
明星個(gè)人微博的傳播較媒體大號(hào)而言更有效力,因?yàn)槊餍且蚱鋫€(gè)人魅力,吸聚的粉絲多,發(fā)的微博貼近生活,跟粉絲之間有較強(qiáng)的互動(dòng)關(guān)系,而且他們的粉絲團(tuán)體也會(huì)不遺余力的去散播此類消息,所以傳播效力更強(qiáng)一些。相比之下,微博大號(hào)因?yàn)樽陨淼臓I銷屬性,除非有利益驅(qū)動(dòng),粉絲才會(huì)主動(dòng)參與互動(dòng),一般而言不會(huì)太強(qiáng),更有甚者,會(huì)發(fā)動(dòng)水軍進(jìn)行操作,通過不正當(dāng)?shù)氖侄我灾\取利益。
好了,上面是關(guān)于《歡樂頌2》的大數(shù)據(jù)輿情傳播分析,下面會(huì)進(jìn)入到另一個(gè)板塊——對(duì)該劇的口碑(主要是豆瓣影評(píng))和小說文本進(jìn)行文本挖掘,期待發(fā)現(xiàn)一些更有趣的內(nèi)容。
2 《歡樂頌2》的豆瓣口碑分析和小說文本分析
一般來說,對(duì)于文本的深入挖掘往往能實(shí)現(xiàn)“知其然并知其所以然”的效力,因?yàn)槲谋静幌駭?shù)字那般空洞和抽象,內(nèi)容往往能直接揭示出原因。
這部分的數(shù)據(jù)主要有:
- 《歡樂頌》第一季和第二季的豆瓣影評(píng)
- 《歡樂頌》第一季和第二季對(duì)應(yīng)的原著小說,《歡樂頌2》的劇集將把后兩季的小說內(nèi)容進(jìn)行打包拍攝,所以第二、第三季的小說內(nèi)容都會(huì)出現(xiàn)在《歡樂頌2》的劇情里
豆瓣電影是中國最大與最權(quán)威的電影分享與評(píng)論社區(qū),收錄了百萬條影片和影人的資料,有2500多家電影院加盟,更匯聚了數(shù)千萬熱愛電影的人,因而這里關(guān)于影視劇的評(píng)論具有一定的代表性和公信力,可以在很大程度上反映一部影視劇作品的口碑狀況。所以,筆者抓取豆瓣上《歡樂頌》一二季的影評(píng)作為口碑分析的依據(jù)。
2.1《歡樂頌》一、二季的總體口碑對(duì)比分析
(1)評(píng)價(jià)星級(jí)
從總評(píng)分來看,《歡樂頌》第二季要明顯遜色于第一季,前者拿到了7.3的高分,而后者僅獲得了5.2的評(píng)分。
從第一季和第二季的評(píng)價(jià)星級(jí)占比可以看出,出現(xiàn)第二季總評(píng)分低于第一季的原因在于:第二季在中高分區(qū)間“4星”和“3星”中的占比要小于第一季,而在低分區(qū)間“2星”和“1星”中的比重要高于第一季。
(2)《歡樂頌2》的豆瓣影評(píng)情感傾向分析
由于第一季的口碑要好于第二季,所以筆者接下來著重分析一下第二季的豆瓣影評(píng)的“情感傾向”。
這里的“情感傾向”是以一個(gè)介于0~1之間的“情感極性值”來表征—如果某條評(píng)論的情感極性值越接近于0,說明它的負(fù)面情感傾向越明顯,越接近于1,說明它的正面情感傾向越明顯,而取值在0.5左右徘徊,這說明這種情感傾向不明顯,是為“中性”。筆者將情感傾向值的取值區(qū)間0~1細(xì)分為3個(gè)子區(qū)間,分別對(duì)應(yīng)不同的情感傾向:
豆瓣影評(píng)具有獨(dú)特的語言風(fēng)格—反諷,貶義褒用,不像商品評(píng)論那般直白外露,它的語義往往含蓄且幽默。所以在分析之前,筆者找到大量有標(biāo)注的豆瓣影評(píng)語料,利用機(jī)器學(xué)習(xí)進(jìn)行情感語義模型訓(xùn)練,以期達(dá)到良好的情感正負(fù)面判斷效果。初步結(jié)果如下:
經(jīng)情感傾向標(biāo)簽映射處理,得到如下結(jié)果:
從上圖可以看到,第一季和第二季的情感傾向的最大差異在于正負(fù)面情感的比重不同:第一季的評(píng)論正負(fù)面情感占比旗鼓相當(dāng),而第二季的負(fù)面情感明顯占據(jù)主導(dǎo)地位,正面占比大幅壓縮,這也是本劇豆瓣評(píng)分不高的原因之一。
再看一下情感傾向隨時(shí)間發(fā)展的走勢情況,筆者選取的分析時(shí)間段是3.31~5.22,也就是該劇播出前一個(gè)多月和播出后一段時(shí)間的情感傾向走勢。這里采用的是情感傾向值累加的數(shù)值,越高說明口碑評(píng)價(jià)越好,這也兼顧了評(píng)論數(shù)量上的增減情況(豆油愿意參與評(píng)分,哪怕是負(fù)面評(píng)分,也說明對(duì)本劇有一定的關(guān)注度)。由此得到下圖:
可以看出,在本劇播出次日,情感傾向值達(dá)到高峰,隨后一路下降,結(jié)合這段時(shí)間內(nèi)的總體情感傾向占比可知,豆油們對(duì)于該劇播出后的劇集的關(guān)注度和口碑評(píng)價(jià)都呈現(xiàn)出下降的趨勢。
那么,究竟是什么原因讓廣大豆油們對(duì)該劇如此嫌棄呢?請(qǐng)接著往下看。
(3)《歡樂頌》一、二季豆瓣評(píng)論內(nèi)容的關(guān)鍵詞對(duì)比分析
以下是關(guān)于《歡樂頌》一、二季豆瓣評(píng)論文本的關(guān)鍵詞對(duì)比分析,可以在這張直觀的可視化效果圖上看到“豆油”們對(duì)《歡樂頌》一二季方方面面的評(píng)價(jià)。
上圖中,對(duì)于一二季的評(píng)論文本分別按照“高提及率(Frequent)”和“低提及率(Infrequent)”進(jìn)行了劃分。上圖以橫縱軸的“Average”進(jìn)行切分,則可以分為4個(gè)象限,右上角的為2類文本提及率皆高的詞匯,左下角為二者提及率皆低的詞匯。左上和右下僅是二者之一高提及率的詞匯。
另外,藍(lán)色點(diǎn)陣代表的詞匯屬于對(duì)《歡樂頌》第一季的評(píng)價(jià),黃色點(diǎn)陣所代表的的詞匯屬于對(duì)《歡樂頌》第二季的評(píng)價(jià),右上角的象限二者的評(píng)語趨于重合。
在右邊的TOP Terms(重點(diǎn)關(guān)鍵詞匯)一欄中可以看到,對(duì)于第一季的評(píng)論,豆油們主要提到了該劇的cast/卡司(?演員陣容強(qiáng)大)、山影(山東影視制作有限公司,該劇的出品方)、(看該?。┩2幌聛?、(人物形象)豐滿,以及關(guān)于安迪和奇點(diǎn)(魏渭)的情感主線的探討,但沒有出現(xiàn)明顯的負(fù)面評(píng)價(jià),甚至以褒贊為主。
而第二季里,很多豆油拿第一季和第二季進(jìn)行對(duì)比,認(rèn)為本劇和第一季沒得比,還有就是本劇里的插曲太多,好似一個(gè)MV大集合(“MV”、“mv”、“歌曲”、“就唱”),正如某位豆油的評(píng)論所說“一開始就狂配bgm,而且感覺和劇情并不搭嘎,什么咖喱歌一股鄉(xiāng)村風(fēng)”。。。值得玩味的是,也有都有拿本劇和同一時(shí)間段的《白鹿原》做對(duì)比,兩部劇均包含對(duì)時(shí)代環(huán)境和個(gè)體發(fā)展的探討,但在格局、視野以及最終呈現(xiàn)方式上都有較大不同。
點(diǎn)擊其中的關(guān)鍵詞,看到關(guān)于這些關(guān)鍵詞的評(píng)論詳情(語句經(jīng)過分詞和去停用詞)。
總之,豆油們關(guān)于第二季的吐槽很多。
由此,筆者想進(jìn)一步看看豆油們到底還有哪些關(guān)于該劇的槽點(diǎn)。
(4)第二季的典型意見挖掘?qū)Ρ确治?/strong>
將經(jīng)預(yù)處理得到的5000條典型評(píng)論進(jìn)行文本聚類,每一個(gè)文本聚類“簇群”都會(huì)有一個(gè)中心語句,也就是該“簇群”的典型意見,所以這種文本處理也叫做“典型意見挖掘”,用來從海量的文本里發(fā)掘主要的觀點(diǎn)或意見。
經(jīng)筆者處理,5000條評(píng)論被劃分為300多個(gè)成分占比不一的“話題簇群”,筆者僅選取其中占比TOP10的典型意見進(jìn)行展示。
從上表可以看出,豆油們關(guān)于本劇的典型意見多為負(fù)面,集中在以下幾個(gè)方面:
- 比第一部差,主要詬病的地方在于本劇的劇情、編劇和演員演技,以及硬生生的人物專屬插曲/配樂亂入
- 三觀不正,被吐槽為“高配版小時(shí)代”,倡導(dǎo)“紙醉金迷”的富人價(jià)值觀
- 對(duì)本劇中的個(gè)別角色及其主演的喜好,如邱瑩瑩和趙啟平及其扮演者
除此之外,本劇廣告植入太多也是很多豆油吐槽的地方,本劇為了配合植入廣告,角色人物的吃穿用度多處設(shè)定明顯違和,甚至有豆油表示“《歡樂頌1》是在劇情里插播恰到好處的廣告,而《歡樂頌2》是在硬生生的廣告里插播劇情……”
(5)“五美”人物點(diǎn)評(píng)詞云
綜合豆油們關(guān)于《歡樂頌》第一季和第二季關(guān)于劇中“五美”的評(píng)論,筆者制作出安迪、曲筱綃、樊勝美、關(guān)雎爾和邱瑩瑩的個(gè)性化評(píng)論關(guān)鍵詞詞云。
不消筆者多說,小伙伴們就能看出這些人物關(guān)鍵詞詞云,主要反映了豆油們對(duì)于“五美”的人物印象及其主要的關(guān)聯(lián)人物。對(duì)于這五個(gè)人的性格特征,由上述關(guān)鍵詞詞云可以總結(jié)為:
- 外冷內(nèi)熱、氣場強(qiáng)大的冰山御姐——安迪
- 古靈精怪、魅力超群的小妖精——曲筱綃
- 虛榮拜金、獨(dú)立自強(qiáng)的驕傲女王——樊勝美
- 文靜內(nèi)斂、一團(tuán)和氣的優(yōu)質(zhì)女孩——關(guān)雎爾
- 單純可愛、精力充沛的元?dú)馍倥瘳摤?/li>
2.2 《歡樂頌》一、二季的小說文本分析
(1)一、二季的小說文本關(guān)鍵詞對(duì)比
此處,對(duì)于小說文本的關(guān)鍵詞提取,筆者沒采取一般文本分析時(shí)所采用的詞頻統(tǒng)計(jì),而采用的是TF-IDF(term frequency–inverse document frequency)關(guān)鍵詞統(tǒng)計(jì)方法,從而更有效的提取文本中的關(guān)鍵信息。詳情可以參閱《以<大秦帝國之崛起>為例,來談大數(shù)據(jù)輿情分析和文本挖掘》的第三部分。
以下是《歡樂頌》一二季原著小說的關(guān)鍵詞TOP20。
可以看出,一二季小說文本的關(guān)鍵詞絕大部分是其中的主要人物,而主要人物的總體順序(對(duì)于小說而言是人物的重要性)變動(dòng)不大,個(gè)別人物出現(xiàn)重要性的“位移”:
- 安迪、曲筱綃和樊勝美是一二季中妥妥的一號(hào)、二號(hào)和三號(hào)女主人公;
- 包奕凡在第二季的重要性有所提升,而魏渭的重要性則呈現(xiàn)下降的趨勢;
- 電視劇第二季中出現(xiàn)的謝濱(也就是電視劇中的音樂達(dá)人謝童)、舒展和陳家康也出現(xiàn)在小說二三季的關(guān)鍵詞TOP20中,不過排名較為靠后。
這也說明,小說和劇本在人設(shè)上保持有連貫性,沒有明顯大的變動(dòng)。
(2)一、二季劇中人物社交網(wǎng)絡(luò)分析
通過設(shè)置人物詞典,筆者從中提取出《歡樂頌》一二季對(duì)應(yīng)小說文本的人物社交關(guān)系圖譜,用來發(fā)現(xiàn)2部電視劇中人物關(guān)系的特征。
在人物社交網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)代表一個(gè)人物,線條代表人物之間的關(guān)系,線條顏色的人物節(jié)點(diǎn)代表他們之間有著較為頻繁的交往(或友或敵)。節(jié)點(diǎn)及其代表人物字體的大小表征的是“Betweenness Centrality (中介性核心性)”,該詞學(xué)術(shù)的說法是“兩個(gè)非鄰接的成員間的相互作用依賴于網(wǎng)絡(luò)中的其他成員,特別是位于兩成員之間路徑上的那些成員,他們對(duì)這兩個(gè)非鄰接成員的相互作用具有某種控制和制約作用“,說人話就是—字體大的人物具有更大的人際關(guān)系影響,能接觸和影響的人物較多,而在小說中出現(xiàn)次數(shù)多的未必就是這類人物,這里的存在感需要以人脈和人際影響力作為基石。詳情可參看《以<大秦帝國之崛起>為例,來談大數(shù)據(jù)輿情分析和文本挖掘》的第三部分。
從上圖可以看出,第一季中的安迪和幾個(gè)主要人物都有很強(qiáng)的人際聯(lián)系,他們之間的連線較粗,而譚宗明、曲筱綃、樊勝美等人的人脈資源豐富,或者是他們?nèi)穗H交往/應(yīng)酬較多。
在第二季的人物社交網(wǎng)絡(luò)中,則呈現(xiàn)出“去中心化”的趨勢,除了成為愛人的包奕凡外,第一主角安迪與其他人的交往沒之前那么密切了。按照劇情發(fā)展,他們之間迎來了情感的新可能,卻也面臨來自身世及包家內(nèi)部帶來的新困擾,加之后媽魏太太的不斷責(zé)難,這樣也不久難理解安迪和其他人的交往較第一季要少了,自身麻煩不斷,所以無暇顧及。
當(dāng)然,第二季的人物情感脈絡(luò)也很清晰了,即使有攪局者的出現(xiàn)(魏渭、舒展、陳家康等),固定的CP組合也沒有出現(xiàn)變化,如安迪-包奕凡、邱瑩瑩-應(yīng)勤,曲筱綃-趙啟平,樊勝美-王柏川,以及關(guān)雎爾-謝濱(謝童)。
(3)小說文本的人物關(guān)聯(lián)詞分析
在最后,筆者把《歡樂頌》小說1、2、3季合并,經(jīng)過文本預(yù)處理后,再進(jìn)行小說文本的詞向量訓(xùn)練,將這些詞匯映射到向量空間,變成一個(gè)個(gè)詞向量(Word Vector),以使這些詞匯在便于被計(jì)算機(jī)識(shí)別和分析的同時(shí),還具有語義上的相關(guān)性,而不僅僅是基于詞匯之間的共現(xiàn)關(guān)系。
由于篇幅原因,筆者僅涉及跟“五美”相關(guān)的關(guān)聯(lián)詞分析,各呈現(xiàn)TOP10的關(guān)聯(lián)詞,由此發(fā)現(xiàn)跟主設(shè)人物相關(guān)的詞匯,發(fā)掘人物深層次的特點(diǎn)。
從上面“五美”的TOP10關(guān)聯(lián)詞可以得到兩類關(guān)聯(lián)詞:
第一類詞是跟主設(shè)關(guān)系密切的人物,如魏渭、包奕凡之于安迪,趙啟平、劉歆華之于曲筱綃等,這些都符合大家對(duì)于電視劇的認(rèn)知。
另一類是反映人物行為的詞匯。如安迪和曲筱綃,二人常用的通信工具都有電話,其他三人只用手機(jī)進(jìn)行通訊。而電話一般指固定電話,設(shè)在辦公室,較為正式,領(lǐng)導(dǎo)或是管理層用的比較多;而手機(jī)具有便攜性,無論室內(nèi)和外出都用的多。
安迪、曲筱綃和樊勝美的關(guān)聯(lián)詞里有涉及“昨晚”,再對(duì)照小說原本,三人都有很多晚上交際應(yīng)酬的場景。
此外,在樊勝美、關(guān)雎爾和邱瑩瑩的關(guān)聯(lián)詞里,都出現(xiàn)了“連忙”一詞,有“立即”、“馬上”的意思,也就是經(jīng)常會(huì)出現(xiàn)倉促、手忙腳亂的情形。
字字珠璣間,折射出“五美”所處的社會(huì)階層和自身心態(tài)。
結(jié)語
雖然分析下來,《歡樂頌2》在劇情和各種細(xì)節(jié)上多有瑕疵,加之違和感很強(qiáng)的硬廣植入,所以它的口碑遠(yuǎn)不及第一季。然而,《歡樂頌2》還是較好的繼承了第一季典型的人物設(shè)定,很多觀眾能夠通過“五美”看到自己或者身邊人的影子,雖是小說,但也緊密觀照當(dāng)下現(xiàn)實(shí),擁有一種天然的熟悉感和代入感,更能引發(fā)劇集和觀眾之間的情感共鳴,甚至還被許多都市白領(lǐng)奉為生存指南和戀愛擇偶教科書。
或許,像很多毀譽(yù)參半的影視劇那樣,關(guān)于它們的評(píng)判本來就是模棱兩可的,不能立即蓋棺定論:
譽(yù)滿天下,未必不為爛片;謗滿天下,未必不為佳劇~
那么,看完本文或本劇的小伙伴,你覺得呢?
ps:筆者寫完這篇文章的時(shí)候,第二季還一集沒看哦,有對(duì)劇情誤讀的地方還請(qǐng)資深劇迷見諒哦,哈哈哈。
參考資料及工具:
- 新浪微輿情:“全網(wǎng)事件分析”、“信息監(jiān)測”及“微博傳播效果分析”模塊(數(shù)據(jù)采集、數(shù)據(jù)分析和數(shù)據(jù)可視化呈現(xiàn))
- 微指數(shù)、微博數(shù)據(jù)中心冰鑒用戶洞察平臺(tái)(人物畫像)
- 《歡樂頌》1、2、3季的小說原著(文本數(shù)據(jù))
- 《歡樂頌1》和《歡樂頌2》的豆瓣影評(píng)(評(píng)分?jǐn)?shù)據(jù)和文本數(shù)據(jù))
- Python,jieba分詞、snownlp、gensim、tagul(文本分詞、情感分析、詞向量和詞云制作)
#專欄作家#
蘇格蘭折耳喵,微信公眾號(hào):運(yùn)營喵是怎樣煉成的,人人都是產(chǎn)品經(jīng)理專欄作家。數(shù)據(jù)分析愛好者,擅長數(shù)據(jù)分析和可視化表達(dá),喜歡研究各種跟數(shù)據(jù)相關(guān)的東東。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
感謝大神分享!想要請(qǐng)問一下對(duì)文中提到的江蘇討論熱度居首位的原因怎么看呀?
可以隨意用新浪微輿情的人好幸福
真的好棒!
為什么文章點(diǎn)進(jìn)去,過幾秒就沒了啊
哪個(gè)文章???
好厲害,產(chǎn)品新人一枚,以后跟著你學(xué)習(xí) ??
哈哈,共勉 ??
太厲害了。可是找不到微博數(shù)據(jù)中心冰鑒用戶洞察平臺(tái)。。。
內(nèi)部數(shù)據(jù),目前不對(duì)外的
前輩,要做數(shù)據(jù)分析,從零開始該怎么做?
培養(yǎng)興趣和愛好,了解你想做數(shù)據(jù)分析的場景,以問題驅(qū)動(dòng)學(xué)習(xí)~
簡直666
剛想發(fā)言,又一想還是算了逼格太低。
說吧,說吧??????
還有一點(diǎn)穩(wěn)重提到受眾多半是本科以上,原因應(yīng)該是大學(xué)生空閑時(shí)間比較多,??苹蛘咂渌泄潭ǖ纳盍?xí)慣。
、
嗯,還有四線城市關(guān)注人群占據(jù)主流,原因在于他們時(shí)間多,不像一線城市的小年輕這么忙碌
文章很棒,學(xué)習(xí)了。大佬 ?? ??
請(qǐng)問用什么軟件做的文本分析呢?
Python,文章末尾有寫的,你再仔細(xì)看看 ??
啊不好意思,沒注意 ?? 趕快去研究下 哈哈
不明覺厲
目測樓主屬于年薪不下40w的,如果我說的不對(duì),請(qǐng)憑你的這篇文章找一個(gè)吧!超級(jí)贊! ??
恭喜你~你還真說錯(cuò)了,目前窮人一枚,沒有這么多。。。
哈哈,樓主謙虛!能加個(gè)維信好友嗎,我現(xiàn)在搜狗做產(chǎn)品,交流下,算是半個(gè)同行~
g18818233178,一起切磋
牛人,馬住,仔細(xì)學(xué)習(xí)~
很牛的分析文章。
??
厲害??
說實(shí)話微信新加的看一看功能內(nèi)容離優(yōu)質(zhì)二字還有很長的距離
是的,但某些干貨文章還是可以期待一下的
看不懂,不過先get一下,學(xué)習(xí)一下數(shù)據(jù)分析的思維
嗯,隔行不隔理
只能說太厲害了,馬住好文!![:mrgreen:](http://m.codemsi.com/wp-includes/images/smilies/mrgreen.png)
??
請(qǐng)問作者在哪找到那么多有標(biāo)注的情感標(biāo)簽
豆瓣上爬取的,采用眾包形式的人工標(biāo)注
數(shù)據(jù)分析的典范之作??!
閑來寫寫,謝謝夸贊~??
一集沒看。表示滋瓷
??
樓主厲害,一集沒看都感謝,佩服佩服
??
一線城市的年輕人上班都忙死了,哪里有這么多時(shí)間追劇…….
我就是”一線城市忙死了”的其中之一,一集沒看,雖然抽空寫了這篇文章。。。
同感,想著攢到周末和假期看,但依然沒時(shí)間。。。
你寫這篇文章,真心下了蠻多功夫??! 寫了多久???
梳理思路,收集數(shù)據(jù),可視化和成文,一周吧
數(shù)據(jù)分析,你果然是專家! 能否推薦一本數(shù)據(jù)分析入門的書啊?
我會(huì)的這些都不是書上學(xué)來的,野路子,多看博客多思考吧