網(wǎng)易云音樂(lè):如何通過(guò)數(shù)據(jù)發(fā)掘音樂(lè)品鑒家,進(jìn)而找到寶藏小眾音樂(lè)
編輯導(dǎo)語(yǔ):在網(wǎng)易云音樂(lè)平臺(tái),經(jīng)常能發(fā)現(xiàn)一些冷門但好聽(tīng)的寶藏歌曲,這是網(wǎng)易云音樂(lè)的差異化優(yōu)勢(shì)。網(wǎng)易數(shù)據(jù)產(chǎn)品團(tuán)隊(duì)是如何通過(guò)定義音樂(lè)鑒賞人,實(shí)現(xiàn)對(duì)小眾高品質(zhì)音樂(lè)的批量挖掘和冷啟動(dòng)呢?一起來(lái)看一下吧。
01 長(zhǎng)尾內(nèi)容信號(hào)缺失,如何發(fā)掘其中的優(yōu)質(zhì)內(nèi)容?
作為網(wǎng)易云的資深用戶,我在網(wǎng)易云上面發(fā)現(xiàn)了不少冷門但是真的很好聽(tīng)的寶藏歌曲。寶藏小眾歌曲推薦算網(wǎng)易云音樂(lè)的差異化優(yōu)勢(shì),在其他音樂(lè)平臺(tái)很少見(jiàn)到。
今天和大家分享冷門寶藏歌曲背后的故事,看看網(wǎng)易數(shù)據(jù)產(chǎn)品團(tuán)隊(duì)如何通過(guò)定義音樂(lè)鑒賞人,實(shí)現(xiàn)對(duì)小眾高品質(zhì)音樂(lè)批量挖掘和冷啟動(dòng)。
首先聊聊為什么大部分情況下我們聽(tīng)不到小眾歌曲。站在推薦算法的角度看,因?yàn)?strong>長(zhǎng)尾內(nèi)容用戶行為數(shù)據(jù)較為稀疏,算法誤判的概率很大,誤判后推薦一些人氣低而且不好聽(tīng)的內(nèi)容,是對(duì)用戶體驗(yàn)非常大的傷害。
所以一般情況下,算法會(huì)更偏好推薦熱門內(nèi)容,因?yàn)閿?shù)據(jù)量充足置信度高。這會(huì)讓整個(gè)平臺(tái)追求確定性的中低收益,但這樣會(huì)導(dǎo)致畸形的生態(tài)和音樂(lè)口味的趨同。
長(zhǎng)尾內(nèi)容:可以理解為小眾,冷門,對(duì)人群的滲透率低的內(nèi)容。長(zhǎng)尾是指在概率分布圖的尾巴位置。
而著重推薦成熟歌曲的算法對(duì)新晉創(chuàng)作者很不友好,這樣的機(jī)制會(huì)讓新作品和細(xì)分圈子的小眾作品得不到流量的青睞,沒(méi)有露臉的機(jī)會(huì),自然無(wú)法出頭。而站在平臺(tái)側(cè)的角度,如果新內(nèi)容無(wú)法很好冷啟動(dòng),流量總是集中在頭部熱度高的歌曲,對(duì)于長(zhǎng)期健康內(nèi)容生態(tài)是很不利。例如快手就因?yàn)閹讉€(gè)直播家族流量過(guò)于集中,平臺(tái)議價(jià)權(quán)被擠壓,以及頭部暴雷對(duì)生態(tài)打擊嚴(yán)重。
為了保持高質(zhì)量的音樂(lè)生態(tài),給寶藏小眾歌曲更多機(jī)會(huì),網(wǎng)易云團(tuán)隊(duì)一開(kāi)始的方法是人工撈取小眾歌曲聽(tīng),根據(jù)好聽(tīng)程度打分,把得分高的小眾歌曲交給算法去推薦。但是人工成本高,效果挺差,因?yàn)榇蚍秩撕苤饔^,他們的音樂(lè)喜好并不能代表聽(tīng)歌用戶,體現(xiàn)在數(shù)據(jù)指標(biāo)上是人工篩選的歌曲冷啟動(dòng)成功率(播放等級(jí)躍遷成功率)有3%。
所以網(wǎng)易團(tuán)隊(duì)開(kāi)始用數(shù)據(jù)產(chǎn)品的方式來(lái)解決這個(gè)問(wèn)題,問(wèn)題的成功指標(biāo)是:
- 短期:小眾高質(zhì)量歌曲的冷啟動(dòng)成功率
- 長(zhǎng)期:音樂(lè)流量分布健康,不過(guò)分集中于頭部
02 先(用數(shù)據(jù))找伯樂(lè),再找千里馬
小眾歌曲的投票權(quán),不應(yīng)該集中在審核人員,而是應(yīng)該下放到廣大聽(tīng)歌的人民群眾手中。用良好品味和代表性的聽(tīng)眾的投票行為,來(lái)作為高質(zhì)量音樂(lè)的信號(hào),傳遞給推薦系統(tǒng)。找到高質(zhì)量音樂(lè)鑒賞人十分關(guān)鍵。
音樂(lè)鑒賞人的典型畫像是這樣的,深夜emo的你,打開(kāi)網(wǎng)易云,恰好聽(tīng)到一首小眾冷門的歌,但是越聽(tīng)越好聽(tīng),你點(diǎn)亮了小紅心,一遍又一遍的循環(huán)播放,這點(diǎn)黑夜里的點(diǎn)贊小火星被推薦系統(tǒng)敏銳的捕捉到,讓枯竭的流量之水開(kāi)始流淌,最終讓這首埋藏已有的歌得見(jiàn)天日。
那如何用數(shù)據(jù)發(fā)掘音樂(lè)鑒賞人呢?
音樂(lè)鑒賞人是能在高質(zhì)量歌曲早期就點(diǎn)贊收藏這些音樂(lè)的人:
- 發(fā)現(xiàn)時(shí)間早:「發(fā)現(xiàn)歌曲時(shí)間權(quán)重分」,對(duì)用戶收藏某首歌曲的時(shí)間先后進(jìn)行加權(quán)處理。在某首歌曲播放到達(dá)最高等級(jí)的成長(zhǎng)周期中,對(duì)歌曲進(jìn)行較早收藏的用戶得分更高,以表現(xiàn)該用戶更好的鑒賞能力
- 升級(jí)幅度大:計(jì)算當(dāng)前歌曲等級(jí)(ground truth)與收藏時(shí)等級(jí)差值、播放次數(shù)差值,找出收藏行為對(duì)應(yīng)的后驗(yàn)熱度Lift
定義音樂(lè)鑒賞人時(shí),要注意到在國(guó)風(fēng)音樂(lè)鑒賞能力強(qiáng)的人,不見(jiàn)得能鑒賞英文Rap。所以音樂(lè)鑒賞人也需要分類,按照音樂(lè)垂類劃分,例如搖滾、R&B、日語(yǔ)、電子、民謠鄉(xiāng)村、爵士古典等等,給各個(gè)音樂(lè)鑒賞人在這個(gè)音樂(lè)垂類進(jìn)行打分。
結(jié)果:音樂(lè)鑒賞人成功地發(fā)現(xiàn)了許多優(yōu)質(zhì)小歌,這些小歌被扶持后的冷啟動(dòng)成功率(播放等級(jí)越遷成功率)超過(guò)40%,比例遠(yuǎn)高于之前人工打分的3%。優(yōu)化了平臺(tái)生態(tài)和長(zhǎng)尾內(nèi)容撈取不足的問(wèn)題。
網(wǎng)易云團(tuán)隊(duì)還提供了個(gè)品鑒人發(fā)現(xiàn)小眾歌曲的栗子:「多喝熱水」這首歌自上線以來(lái)長(zhǎng)期處于只有極少數(shù)人在聽(tīng)的狀態(tài),4月3日被鑒賞者發(fā)現(xiàn)并紅心收藏,鑒賞者對(duì)該歌曲的背書被算法立即識(shí)別到,進(jìn)行流量扶持分發(fā),之后退出扶持再讓其自然成長(zhǎng)。經(jīng)過(guò)2-3天的加量扶持后,歌曲有了一定的人群受眾,之后逐漸快速成長(zhǎng),因各項(xiàng)指標(biāo)一直良好,被算法再次加量扶持,最終沖上了站內(nèi)排行榜。
網(wǎng)易云是通過(guò)研究小眾歌曲的走紅,找到了音樂(lè)鑒賞家,實(shí)現(xiàn)對(duì)更多小眾歌曲的高效發(fā)掘。通過(guò)數(shù)據(jù)實(shí)現(xiàn)內(nèi)容找人,人找內(nèi)容,是數(shù)據(jù)產(chǎn)品的常見(jiàn)核心實(shí)踐。
Web3.0的數(shù)據(jù)公司Nansen旗下的數(shù)據(jù)產(chǎn)品Nansen.ai也是如此,通過(guò)對(duì)交易記錄的分析,給部分錢包地址打上了“smart money”的標(biāo)簽。這些地址在過(guò)去的交易中低買高賣,收益頗豐,地址背后往往是懂行且信息多的Crypto fund,smart LP等“聰明”的機(jī)構(gòu)和個(gè)人投資者。
用戶在尋找和研究區(qū)塊鏈項(xiàng)目時(shí),可以看這些smart money買了哪些,買了多少,什么時(shí)候入場(chǎng),跟著聰明的人走,比自己摸著石頭過(guò)河要好一點(diǎn)。
03 延伸思考
網(wǎng)易云的音樂(lè)品鑒人可以考慮在C端產(chǎn)品上公開(kāi),變成鼓勵(lì)用戶的榮耀機(jī)制(例如 “古典音樂(lè)專業(yè)品鑒人”認(rèn)證)。也能放到網(wǎng)易云的年度報(bào)告里面。告訴用戶這一年幫助多少小眾歌曲被更多人發(fā)現(xiàn),是一件很有價(jià)值的事情。
公開(kāi)后,也要防止品鑒人的認(rèn)證信息對(duì)用戶行為造成扭曲。上面舉的nansen的例子中,nansen.ai公布了smart money后,會(huì)有項(xiàng)目方向smart money地址直接發(fā)幣,營(yíng)造出站臺(tái)的假象,這些都造成了一定程度的信息擾亂。需要進(jìn)行規(guī)則打壓和治理。
本文由 @元小浩Yohann 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
網(wǎng)易云確實(shí)是小眾音樂(lè)愛(ài)好者的天堂哈哈哈哈哈哈
不得不說(shuō),網(wǎng)易云這個(gè)APP有時(shí)候真的是讓人愛(ài)不釋手,還有每次節(jié)日的H5瘋狂刷爆朋友圈。
不得不說(shuō)網(wǎng)易云的大數(shù)據(jù)還是很不錯(cuò)的,尤其是使用體驗(yàn)讓用戶覺(jué)得很棒
以前用網(wǎng)易云是里面的氛圍好點(diǎn),現(xiàn)在離不開(kāi)是因?yàn)橛脩敉扑兔看味甲屓撕荏@喜
網(wǎng)易云的用戶推薦我太喜歡了,有很多以前聽(tīng)過(guò)的歌想不起名字也可以推送過(guò)來(lái)
以前是用酷狗,剛開(kāi)始用網(wǎng)易云是沖著它的評(píng)論來(lái)的,現(xiàn)在好喜歡網(wǎng)易云,給我推的歌都是我喜歡的
我覺(jué)得網(wǎng)易云根據(jù)用戶風(fēng)格推的歌單就很不錯(cuò)啊,推給我的歌單風(fēng)格都是我喜歡的
很多自己喜歡的寶藏歌曲根本不想它走紅,有些歌一旦走紅以后就會(huì)產(chǎn)生聽(tīng)覺(jué)疲勞
很有意思的分析!感謝作者分享!
網(wǎng)易云雖然大熱歌的版權(quán)不多,不過(guò)在小眾音樂(lè)這塊儲(chǔ)備量還是蠻大的。
看了文章后了解了很多,原來(lái)推送給用戶的寶藏小眾音樂(lè)背后也立足于數(shù)據(jù)。