智能算法:個性化推薦到底是不是今日頭條們的原罪
![](http://image.woshipm.com/wp-files/img/45.jpg)
近日,人民網(wǎng)連發(fā)《不能讓算法決定內(nèi)容》、《別被算法困在“信息繭房”》、《警惕算法走向創(chuàng)新的反面》三篇評論文章,指出以今日頭條為代表,單純依靠算法推薦的平臺存在價值觀缺失、制造信息繭房、競爭手段屢破底線三大問題。
而后,人民網(wǎng)又發(fā)表文章《今日頭條如何用算法打擊“標題黨”》,為算法正名。
人民網(wǎng)如此頻繁的關(guān)注智能算法推薦,那么智能算法推薦到底是什么?于今日頭條意味著什么?為今日頭條帶來了哪些問題?今日頭條的智能算法推薦又當何去何從?
一、智能算法推薦是什么?
所謂智能算法推薦,是把合適的內(nèi)容推送給合適的人,平臺相當于流量分發(fā)機器。推薦算法大致分為三類:基于內(nèi)容的推薦算法、協(xié)同過濾算法、基于知識的推薦算法,此外還有以加權(quán)、串聯(lián)、并聯(lián)等方式融合以上算法的方法。
相比人工推薦,智能算法推薦投入產(chǎn)出比更高、覆蓋面更廣、個性化程度更高,但風險把控能力相對較低。
近來年,智能推薦算法在信息分發(fā)市場中的地位越來越重要,甚至已呈現(xiàn)出算法推薦超過人工推薦的趨勢。
盡管智能推薦算法五花八門,在內(nèi)容分發(fā)市場發(fā)揮的作用也越來越大,但是算法沒有思維,有思維的是隱藏在算法背后的人,算法的呈現(xiàn)形式由人的價值觀決定,由人的利益驅(qū)使。
人工智能技術(shù)與服務提供商第四范式的互聯(lián)網(wǎng)業(yè)務負責人周開拓在接受記者采訪時表示:
“算法推送出的內(nèi)容是企業(yè)自己在其中進行權(quán)衡的結(jié)果”
“人工智能,其實先有人工,后有智能,算法本身是沒有傾向的。我們在推行的時候會把用戶體驗拆成兩小塊,一個是短期體驗,另一個是長期體驗。所以長期和短期體驗的權(quán)衡,不是算法決定,而是人為決定。”
二、智能算法推薦于今日頭條意味著什么?
2012年,移動資訊平臺領(lǐng)域仍是騰訊新聞、搜狐新聞等傳統(tǒng)PC端媒體的天下,其內(nèi)容提供手段沿襲傳統(tǒng)媒體模式:優(yōu)質(zhì)內(nèi)容+編輯精選。然而隨著泛娛樂化、社交化時代的到來,用戶已不滿足于被動接收信息,他們渴望生產(chǎn)內(nèi)容、渴望創(chuàng)造影響力,傳統(tǒng)移動資訊平臺難以滿足用戶的個性化需求。
張一鳴緊緊抓住這一機遇,于2012年3月創(chuàng)立今日頭條,致力于為用戶提供個性化、社會化的移動資訊平臺,基于數(shù)據(jù)挖掘,為用戶推薦有價值的、個性化的信息,提供連接人與信息的新型服務。誕生僅一年多時間,今日頭條便已在中國手機新聞客戶端活躍用戶分布榜單中占據(jù)一席之地,并高居用戶滿意度榜單榜首。
(圖片來源:艾媒咨詢2013年中國手機新聞客戶端活躍用戶分布)
(圖片來源:艾媒咨詢2013年中國手機新聞客戶端用戶滿意度)
2014年6月,今日頭條估值為5億美元,截至目前,經(jīng)過三輪融資,估計已近200億,其估值在三年內(nèi)增長約40倍。
據(jù)公開數(shù)據(jù)顯示,2017年5月,今日頭條激活用戶數(shù)已經(jīng)超過7億,月活躍用戶數(shù)超過1.5億,單用戶日均使用時長超過Facebook,達到76分鐘,日均啟動次數(shù)約9次。
智能算法推薦在今日頭條的個性化服務及快速崛起中扮演著至關(guān)重要的角色。據(jù)了解,今日頭條共有4萬臺服務器進行運算,來保證以秒級速度收集信息,對用戶特征作出反應并推送信息,2016年更是成立人工智能實驗室,主要研究自然語言理解,計算機視覺,?機器學習(算法與系統(tǒng)),人機交互等AI技術(shù)。
憑借著智能算法,今日頭條快速抓取用戶數(shù)據(jù),精準分析用戶需求,高效把關(guān)內(nèi)容質(zhì)量、進而實現(xiàn)個性化推薦,這也是今日頭條能夠殺出重圍,在移動資訊領(lǐng)域站穩(wěn)腳跟的核心優(yōu)勢。
智能算法推薦帶來了哪些問題?
智能算法推薦于今日頭條的發(fā)展功不可沒,然而由于根據(jù)閱讀量、閱讀時長、轉(zhuǎn)發(fā)量、過往閱讀行業(yè)實施推薦,缺少必要的內(nèi)容審核機制,容易導致為抓住用戶眼球而犧牲文章質(zhì)量問題的出現(xiàn)。
正如人民網(wǎng)《不能讓算法決定內(nèi)容》一文所說:
內(nèi)容能否推送、推送給誰,由機器說了算,依據(jù)的標準就一條:能不能抓眼球、能不能吸引用戶。單一的標準不僅容易忽視優(yōu)質(zhì)內(nèi)容更為豐富的面向和維度,也增加了把關(guān)內(nèi)容產(chǎn)品的難度和成本。
這也就不難理解,為什么即使事后不斷處罰違規(guī)的內(nèi)容賬號,卻無法停止劣質(zhì)內(nèi)容的再次生長。
今日頭條質(zhì)量低下問題已多次引起官方關(guān)注。
2017年以來,今日頭條三度遭約談,成為低俗內(nèi)容重災區(qū)。
- 1月6日,北京市網(wǎng)信辦發(fā)現(xiàn)今日頭條”頭條問答“欄目多次登載”庸俗討論話題“,對今日頭條提出嚴肅批評,并責令其整改;
- 4月,央視曝光了今日頭條向用戶推送”艷俗“直播平臺:火山直播
- 4月18日,北京網(wǎng)信辦、市公安局、市文化市場行政執(zhí)法部隊聯(lián)合約談今日頭條、火山直播等平臺,責令限期整改。
- 7月,北京市網(wǎng)信辦約談今日頭條、微博等網(wǎng)絡(luò)信息平臺,并永久”封殺“了一批”內(nèi)容低俗“的違規(guī)自媒體帳號。
今日頭條自己不生產(chǎn)內(nèi)容,依靠智能算法抓取別人的內(nèi)容,容易導致侵權(quán)問題的發(fā)生。粗略統(tǒng)計,近半年來,今日頭條涉及的版權(quán)糾紛就有近10起。
今日頭條內(nèi)容質(zhì)量低下、版權(quán)糾紛等問題的出現(xiàn),真的是智能算法推薦的錯嗎?
人民網(wǎng)《今日頭條如何用算法打擊“標題黨”》一文中提到,”很多“標題黨”常用的內(nèi)容元素其實都是可以在文本層面進行總結(jié)的,交由機器處理的效率會更高“,實則間接為智能算法推薦正名。
正如周開拓所說:
“人工智能,其實先有人工,后有智能,算法本身是沒有傾向的”
“算法推送出的內(nèi)容是企業(yè)自己在其中進行權(quán)衡的結(jié)果”。
內(nèi)容質(zhì)量低下,源于平臺的利益目的及部分用戶對“低俗”內(nèi)容的需求。
今日頭條的算法推薦與內(nèi)容識別大部分是依靠用戶的行為,會在用戶瀏覽信息時智能抓取關(guān)鍵詞,并給用戶畫像,對用戶進行歸類,進而根據(jù)關(guān)鍵詞匹配出相關(guān)內(nèi)容,最后將這些內(nèi)容推薦給用戶,若用戶閱讀的低俗內(nèi)容多,則相應推薦的低俗內(nèi)容也會多。
智能算法推薦是技術(shù)發(fā)展的產(chǎn)物,技術(shù)本身并沒有錯,只是在高速發(fā)展的背景下,承擔了平臺利益屬性及部分用戶“低俗“需求的罪過。
今日頭條智能算法推薦的出路在哪?
人民網(wǎng)的一評、二評、三評,根源直指內(nèi)容質(zhì)量低下,為走出困境,今日頭條需提高內(nèi)容質(zhì)量,重視人工編輯的作用。
1、今日頭條遲遲不愿在提升內(nèi)容質(zhì)量上發(fā)力,源于其兩難選擇
今日頭條的內(nèi)容質(zhì)量問題自成立之日起,便為大眾所詬病,然而直至今日,仍是漏洞重重。2017年4月,經(jīng)過北京市網(wǎng)信辦、北京市公安局、北京市文化市場行政執(zhí)法總隊聯(lián)合調(diào)查,今日頭條并未能有效履行主體責任,在信息審核、應急處置、技術(shù)保障等方面存在制度缺失,在直播內(nèi)容、用戶分類管理、真實身份信息認證、處理公眾舉報等方面存在重大管理漏洞。
究其原因,在于剔除較為低俗的內(nèi)容和作者會導致大量用戶流失,而用戶的流失又可能會使優(yōu)質(zhì)原創(chuàng)作者將重心轉(zhuǎn)移到到其他自媒體平臺。對今日頭條而言,主動嚴格監(jiān)管廣告內(nèi)容勢必會影響其商業(yè)利益,但放松監(jiān)管又會對平臺信譽產(chǎn)生影響,兩難境地必將經(jīng)過一番博弈。
2、時至今日,面對官媒的連續(xù)實捶,今日頭條不得不直面問題
9月21日,今日頭條對人民網(wǎng)的三評做出回應稱將“正視不足,勉力前行”,并指出,“機器學習和人工編輯,在現(xiàn)階段,是相輔相成的。未來也是如此。再聰明的人工智能,也只是一個需要不斷升級的工具,而人是不可替代的。這是一個不斷磨合和優(yōu)化的過程。這也是人民網(wǎng)三篇評論的價值所在。”
3、今日頭條欲走出困境,提高內(nèi)容質(zhì)量、重視人工編輯的作用是關(guān)鍵,算法推薦+人工編輯是大勢所趨
信息爆炸時代,如果沿用過去的人工推送的形式,顯然會面臨效率低下、難以滿足“千人千面”的個性化需求等問題,而算法推送則大幅提升了推送效率和推送針對性,使用戶從海量信息中解放出來。但是由于無法準確判斷內(nèi)容價值,單純依賴算法進行個性化推薦容易導致內(nèi)容質(zhì)量低下,需要人工編輯修正對機器進行干預,降低點擊率對算法推薦的影響,加強對高價值內(nèi)容的人工干預,算法推薦與人工干預相結(jié)合將是大勢所趨。
面對普遍存在的內(nèi)容質(zhì)量困局,已有平臺開始實踐算法推薦+人工編輯的優(yōu)化路徑。
- 2016年10月,一點資訊請來原新浪網(wǎng)總編輯陳彤做總編輯,CEO李亞在也毫不掩飾的說:陳彤加入一點資訊,就是因為機器算法有缺陷。
- 2016年12月16日,F(xiàn)acebook上線Fact-Checking(事實審核)機制,將用戶舉報過多的信息交付機構(gòu)記者來判斷,如果記者判斷這則內(nèi)容是假新聞,就會將內(nèi)容標記為存在爭議,一方面會在前端頁面提示給用戶此內(nèi)容可能失實,另一方面會從分發(fā)量的角度進行控制。
- 2017年5月,扎克伯格發(fā)帖稱Facebook會再招聘3000名內(nèi)容審查員,在此次招聘后將會達到7500人。審查員會過濾社交媒體上的不適當內(nèi)容,如戀童癖、身體暴露、種族仇恨等內(nèi)容。
面對官媒的壓力、大眾的輿論,今日頭條需及早完成流量與質(zhì)量博弈,找到一條算法推薦和人工編輯的平衡之路。
作者:智能相對論(微信id:aixdlun):2個前人工智能行業(yè)管理咨詢老鳥+1個老媒體人組成的三人幫,深挖人工智能這口井,評出咸淡,講出黑白,道出深淺。
本文由 @智能相對論 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash ,基于 CC0 協(xié)議
低俗內(nèi)容不是今日頭條原創(chuàng)的,是那個原始數(shù)據(jù)來源的平臺上的,只是因為今日頭條的用戶多信息量大,曝光率也就高了。算法背了這個鍋。希望有關(guān)單位不要只盯著算法,還要整治低俗內(nèi)容的來源。
但是這是今日頭條的核心競爭力,現(xiàn)在要改的話,估計傷筋動骨。