從假AI到真AI,虛擬人是如何進(jìn)化的?
編輯導(dǎo)語(yǔ):隨著技術(shù)的發(fā)展,Web3.0、元宇宙、虛擬人等話題也被擺上臺(tái)面,越來(lái)越多樣的技術(shù)形態(tài)在萌現(xiàn),大廠們也紛紛投注這些產(chǎn)業(yè),試圖在未來(lái)的發(fā)展中多占一杯羹。那么在這其中,虛擬人產(chǎn)業(yè)是一門(mén)怎樣的產(chǎn)業(yè)?虛擬人產(chǎn)業(yè)的商業(yè)化路徑,又該如何跑通?
技術(shù)進(jìn)步,才是虛擬人火爆起來(lái)的根本推力。
1985年,英國(guó)卡爾頓電視臺(tái)第四頻道決定推出一檔自己的音樂(lè)視頻節(jié)目,但在當(dāng)時(shí)的英國(guó),類(lèi)似的節(jié)目層出不窮,新節(jié)目要想快速受到歡迎,并不容易。
導(dǎo)演洛基·莫頓主導(dǎo)的團(tuán)隊(duì)想出了一個(gè)新辦法:在主持人身上做文章。
接下來(lái)節(jié)目播出時(shí),出現(xiàn)在電視機(jī)屏幕里的,是穿著深色西裝,通常會(huì)搭配一個(gè)太陽(yáng)鏡的“AI主持人”Max Headroom。
后來(lái),外界把Max Headroom稱(chēng)為“第一位計(jì)算機(jī)生成的電視節(jié)目主持人”。
不過(guò),這個(gè)所謂的“AI主持人”其實(shí)是個(gè)假AI,當(dāng)時(shí)的計(jì)算技術(shù)還不夠先進(jìn),全運(yùn)動(dòng)、語(yǔ)音同步的人頭無(wú)法用于電視連續(xù)劇。因此除了角色的宣傳之外,Max Headroom的真實(shí)形象并不是電腦生成的,而是由真人演員扮演,為了拍攝要經(jīng)歷長(zhǎng)達(dá)四個(gè)半小時(shí)的化妝。
時(shí)隔近40年后,比Max Headroom更先進(jìn)的虛擬人開(kāi)始大范圍進(jìn)入大眾的視野。
這一次可是貨真價(jià)實(shí)的虛擬人,他們可以直播帶貨、可以像人工客服那樣與人對(duì)話、也可以像明星那樣登臺(tái)表演。
隨著越來(lái)越多的虛擬人開(kāi)始出現(xiàn),這門(mén)新興產(chǎn)業(yè)也迎來(lái)了一輪爆發(fā)性增長(zhǎng),入局的公司越來(lái)越多,他們對(duì)商業(yè)模式的探索也越來(lái)越清晰。
這篇文章,我們將重點(diǎn)探討:虛擬人到底是一門(mén)怎樣的產(chǎn)業(yè)?它的技術(shù)壁壘高不高?又憑什么賺錢(qián)?
一、進(jìn)化:虛擬人是如何越來(lái)越像人的?
Max Headroom誕生于虛擬人萌芽階段,同期還出現(xiàn)了世界首位虛擬歌姬林明美。
只不過(guò),在1980年代,這些虛擬人的擬人化程度很低,主要依靠手繪制作,僅僅是在外形上實(shí)現(xiàn)了對(duì)人類(lèi)的模仿。
2000年以后,CG(計(jì)算機(jī)動(dòng)畫(huà))、動(dòng)作捕捉等技術(shù)不斷革新,逐漸替代了早期手繪制作的方式。比如2001年上映的《指環(huán)王》中咕嚕角色,便是由CG和動(dòng)作捕捉技術(shù)創(chuàng)造出來(lái)的。
這一時(shí)期,出現(xiàn)了第一個(gè)現(xiàn)象級(jí)的虛擬數(shù)字人:初音未來(lái),一個(gè)3D虛擬偶像。
初音未來(lái)其實(shí)是一款歌曲合成軟件,當(dāng)時(shí)Crypton Future Media以雅馬哈的Vocaloid系列語(yǔ)音合成程序?yàn)榛A(chǔ),開(kāi)發(fā)了音源庫(kù),并以此制作、發(fā)售了虛擬歌姬角色主場(chǎng)系列。
后來(lái)2012年出道的中國(guó)內(nèi)地女虛擬歌手“洛天依”,同樣是以雅馬哈公司的Vocaloid3語(yǔ)音合成引擎為基礎(chǔ),制作的虛擬偶像。
但不論是“初音未來(lái)”還是“洛天依”,距離我們現(xiàn)在看到的虛擬人都還很遠(yuǎn),因?yàn)榧幢阌辛薈G、動(dòng)作捕捉等關(guān)鍵技術(shù)的加持,但他們還是無(wú)法實(shí)現(xiàn)一個(gè)最重要的功能:與人交互,也就是說(shuō),虛擬偶像沒(méi)有人格化。
直到2016年以后,虛擬人才開(kāi)始變得越來(lái)越像“人”。
這一年,谷歌AlphaGo戰(zhàn)勝?lài)骞谲娎钍朗?,成為第一個(gè)擊敗職業(yè)九段的計(jì)算機(jī)圍棋,人工智能開(kāi)始走入公眾視野。
語(yǔ)音識(shí)別、自然語(yǔ)音處理、語(yǔ)音合成、語(yǔ)音驅(qū)動(dòng)面部動(dòng)畫(huà)等技術(shù)、以及深度學(xué)習(xí)算法上的突破,為虛擬人的發(fā)展提供了技術(shù)支撐。
簡(jiǎn)單來(lái)說(shuō),以前要生成一個(gè)虛擬人,可能需要?jiǎng)赢?huà)師、建模師將人物形象一筆一筆、一幀一幀畫(huà)出來(lái),完成原畫(huà)建模之后,再通過(guò)實(shí)時(shí)渲染、真人動(dòng)作捕捉等技術(shù)才能夠?qū)崿F(xiàn),其中耗費(fèi)的時(shí)間成本及資金成本都比較高,主要用在影視娛樂(lè)行業(yè),比如數(shù)字替身。
但AI技術(shù)發(fā)展起來(lái)后,需求方可以直接利用AI來(lái)完成形象建模與后續(xù)的驅(qū)動(dòng)、渲染,或者最初的形象建??咳斯ぃ罄m(xù)的驅(qū)動(dòng)靠AI來(lái)完成,在擬人化程度不斷提高的同時(shí),也在很大程度上簡(jiǎn)化了制作流程、降低了制作成本。
比如2021年初,虛幻引擎的開(kāi)發(fā)商Epic Games發(fā)布可生成高保真角色形象的工具M(jìn)etahuman Creator,基于預(yù)先制作的高品質(zhì)人臉?biāo)夭膸?kù),允許用戶以自動(dòng)混合、手動(dòng)調(diào)節(jié)的方式來(lái)快速生成虛擬人,小團(tuán)隊(duì)也可以借助這一工具快速生成自己的作品主角。
這一時(shí)期,我們看到的虛擬人形象,便是常駐主持人陣營(yíng)的“小漾”、可以作詩(shī)作曲的清華大學(xué)虛擬學(xué)生“華智冰”、新晉帶貨達(dá)人“AYAYI”了。
二、產(chǎn)業(yè):誰(shuí)在做虛擬人?
去年,“元宇宙”的概念大火,帶火了虛擬人。AYAYI、艾靈、華智冰、小諍、小漾、柳夜熙等眾多虛擬人被推出。
緊接著,行業(yè)掀起了一股投資熱潮。
開(kāi)源證券在一份研報(bào)中指出,僅在2021年下半年,就有近20家相關(guān)企業(yè)完成了融資,包括IDG資本、紅杉中國(guó)、順為資本等明星投資機(jī)構(gòu)。
不過(guò),虛擬人受到廣泛歡迎并非只因?yàn)椤霸钪妗钡耐苿?dòng),如我們上文所述,AI和深度學(xué)習(xí)等技術(shù)的突破在很大程度上降低了虛擬人的制作門(mén)檻,所以技術(shù)進(jìn)步,才是虛擬人火爆起來(lái)的根本推力。
尤其對(duì)完全依靠AI驅(qū)動(dòng)的虛擬人而言,最后呈現(xiàn)出來(lái)的效果,受到語(yǔ)音識(shí)別(ASR)、自然語(yǔ)言處理(NLP)、語(yǔ)音合成(TTS)、語(yǔ)音驅(qū)動(dòng)面部動(dòng)畫(huà)(ADFA)等技術(shù)的共同影響。
換言之,只有具備了以上幾個(gè)技術(shù)要素,一個(gè)虛擬人才能夠看得見(jiàn)、聽(tīng)得懂、會(huì)思考、能回答、能呈現(xiàn)。
因此,想切入這一行業(yè)的玩家,需要具備以上某項(xiàng)或者幾項(xiàng)上的技術(shù)能力。
當(dāng)前數(shù)字虛擬人產(chǎn)業(yè)鏈分為三層:
基礎(chǔ)層:主要提供建模/渲染引擎等基礎(chǔ)硬件和軟件。
數(shù)字虛擬人視覺(jué)制作部分的工業(yè)化流程,涵蓋了建模、骨骼綁定、動(dòng)捕、面捕、渲染、材質(zhì)解算等各個(gè)環(huán)節(jié),需要用到顯示設(shè)備、光學(xué)器件、傳感器等硬件產(chǎn)品,建模綁定、渲染引擎等軟件產(chǎn)品。
這一層做得比較好的大多數(shù)是外國(guó)公司,比如大家熟知的《王者榮耀》《原神》,就是基于美國(guó)Unity公司的渲染引擎創(chuàng)作出來(lái)的。
平臺(tái)層:提供軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務(wù)平臺(tái)和AI能力平臺(tái)。
入局的中國(guó)企業(yè)大多數(shù)位于這一層。比如AI四小龍商湯、云從、依圖和曠視,比如在語(yǔ)音識(shí)別領(lǐng)域做得比較好的科大訊飛。
還需要特別關(guān)注的是百度、騰訊、阿里等頭部綜合大廠,他們基于自身在底層技術(shù)、硬件架構(gòu)上的沉淀,在產(chǎn)業(yè)鏈布局時(shí)會(huì)相對(duì)全面,往往會(huì)提供相應(yīng)的數(shù)字人技術(shù)服務(wù)平臺(tái),以及面向不同行業(yè)的解決方案。
比如網(wǎng)易的伏羲,能夠提供游戲行業(yè)解決方案、空間智能互動(dòng)解決方案、文旅虛擬代言人解決方案等等;
比如阿里有一個(gè)用在電商上的AI虛擬模特塔璣,商家只需要上傳一張商品的平鋪圖,就可以生成模特的實(shí)拍圖;
比如百度智能云推出了智能數(shù)字人平臺(tái)曦靈,致力于打造智能的服務(wù)型&演藝型數(shù)字人,還推出了基于終端實(shí)時(shí)渲染的虛擬形象智能交互解決方案。
應(yīng)用層:虛擬人所應(yīng)用的各個(gè)場(chǎng)景。
比如,相對(duì)比較成熟的影視、傳媒和游戲領(lǐng)域,以及金融、文旅等,這也是數(shù)字虛擬人實(shí)現(xiàn)商業(yè)化的重要途徑。
三、價(jià)值:虛擬人靠什么商業(yè)化?
隨著虛擬人的不斷出現(xiàn),外界對(duì)這一產(chǎn)業(yè)的市場(chǎng)前景,給出了較為樂(lè)觀的預(yù)測(cè)。
量子位在《數(shù)字虛擬人深度產(chǎn)業(yè)報(bào)告》中預(yù)測(cè),到2030年,我國(guó)數(shù)字虛擬人整體市場(chǎng)規(guī)模將達(dá)到2700億元。
樂(lè)觀預(yù)期背后,首先需要理解的一點(diǎn)是,虛擬人到底能帶來(lái)哪些價(jià)值?這決定著這個(gè)行業(yè)的天花板,以及產(chǎn)業(yè)鏈相關(guān)參與方如何商業(yè)化。
從應(yīng)用層來(lái)看,當(dāng)前主流的虛擬人可以分為兩種類(lèi)型:服務(wù)型虛擬人和身份型虛擬人。前者主要用于代替真人服務(wù),是現(xiàn)實(shí)世界中服務(wù)型角色的虛擬代表;后者多為虛擬IP/偶像,意在推動(dòng)虛擬內(nèi)容的生產(chǎn),也可以是虛擬世界里用戶的第二分身。
舉例說(shuō)明,拿下萬(wàn)科優(yōu)秀新人獎(jiǎng)的員工“崔筱盼”、浦發(fā)銀行的數(shù)字員工“小浦”,都是服務(wù)型虛擬人,他們的出現(xiàn),是要能實(shí)打?qū)嵉貛椭狡髽I(yè);而樂(lè)華娛樂(lè)的虛擬偶像團(tuán)體“A-soul”、靠短視頻火起來(lái)的柳夜熙、與周深一起登臺(tái)演唱的“鄧麗君”,都是身份型虛擬人。
具體到應(yīng)用場(chǎng)景、商業(yè)模式上,這兩類(lèi)虛擬人有著較大區(qū)別。
服務(wù)型虛擬人更多面向to B市場(chǎng),更重要的是如何通過(guò)AI來(lái)為企業(yè)賦能,經(jīng)濟(jì)效益不在于直接創(chuàng)造增量收入,而是降低人力成本。網(wǎng)易伏羲營(yíng)銷(xiāo)負(fù)責(zé)人湯銀辰就曾公開(kāi)表示,虛擬人本質(zhì)上的邏輯是降本增效,讓AI更好地服務(wù)于人類(lèi)。
因?yàn)楝F(xiàn)實(shí)中有很多簡(jiǎn)單、重復(fù)的工作,是可以被虛擬人所替代的,并且AI犯錯(cuò)的幾率比真人員工還要小,還不受空間、時(shí)間的限制。
對(duì)入局的企業(yè)來(lái)說(shuō),他們可以向外提供成熟的服務(wù)型虛擬人、可以提供某項(xiàng)或多項(xiàng)技術(shù),也可以為不同行業(yè)提供個(gè)性化的定制方案與服務(wù)。
這考驗(yàn)的公司底層的AI實(shí)力。
比如百度打造的首個(gè)可交互虛擬偶像度曉曉,她聚合了百度在多模態(tài)交互、3D數(shù)字人建模、機(jī)器翻譯、語(yǔ)音識(shí)別、自然語(yǔ)言理解等多項(xiàng)技術(shù)上的能力,甚至能在高考語(yǔ)文作文中拿下高分,創(chuàng)作的畫(huà)作還能參加西安美術(shù)學(xué)院畢業(yè)展。
身份型虛擬人更多面向的是to C市場(chǎng),目前主要集中在游戲、傳媒領(lǐng)域,變現(xiàn)模式以打造虛擬偶像或虛擬IP為主,先擴(kuò)大C端的粉絲流量,再通過(guò)流量進(jìn)行變現(xiàn)。
比如,AYAYI在小紅書(shū)亮相1個(gè)月后,就相繼與嬌蘭、保時(shí)捷等國(guó)際大牌達(dá)成了合作,2021年9月成為阿里巴巴的首個(gè)數(shù)字人員工,擔(dān)任天貓超級(jí)品牌日的數(shù)字主理人;虛擬人翎 Ling同樣成為商業(yè)寵兒,與VOGUE、奈雪的茶、特斯拉、樂(lè)町、KEEP 等品牌進(jìn)行了跨界合作。
也就是說(shuō),身份型的虛擬人,商業(yè)模式的核心是粉絲經(jīng)濟(jì),類(lèi)似于真人明星,通過(guò)品牌推廣、代言、參演節(jié)目、直播打賞、發(fā)布音樂(lè)專(zhuān)輯、售賣(mài)周邊等方式進(jìn)行變現(xiàn),特點(diǎn)是能夠帶來(lái)較高的收入增量。
樂(lè)華娛樂(lè)的泛娛樂(lè)業(yè)務(wù)收入從2020年的2110萬(wàn)元增長(zhǎng)至2021年的3790萬(wàn)元,主要原因便是虛擬藝人組合A—SOUL的商業(yè)發(fā)展產(chǎn)生的收益,安信證券預(yù)計(jì),A-SOUL貢獻(xiàn)了約1700萬(wàn)的增量收入。
但這類(lèi)虛擬人的要求也會(huì)相對(duì)較高,如何打造出一個(gè)一線的虛擬偶像,并且確保它能長(zhǎng)期留在一線,本來(lái)就非易事,這考驗(yàn)的,其實(shí)是品牌對(duì)IP、內(nèi)容的長(zhǎng)期運(yùn)營(yíng)能力。
從更宏觀的全球視角來(lái)看,在這一層面,中國(guó)是落后歐美的,畢竟,有太多中國(guó)企業(yè)都想成為迪士尼,但他們最終都漸行漸遠(yuǎn)。
原因在于,與國(guó)外成熟的IP運(yùn)營(yíng)體系相比,國(guó)內(nèi)文娛公司雖然已經(jīng)有了IP的構(gòu)建意識(shí),但是IP持續(xù)更新與運(yùn)營(yíng)能力有所欠缺。
虛擬人產(chǎn)業(yè)是一次實(shí)現(xiàn)追趕乃至反超的機(jī)會(huì),但已經(jīng)處在或者即將進(jìn)入這一產(chǎn)業(yè)的公司需要想好,要短期的利益還是長(zhǎng)期的數(shù)字資產(chǎn),在新一輪的IP孵化與商業(yè)化機(jī)會(huì)面前,這很可能會(huì)決定他們能在這個(gè)行業(yè)走多遠(yuǎn)。
作者:王玲;編輯:祝彰;公眾號(hào):數(shù)智界(ID:gh_1eabea2d9bab)
原文鏈接:https://mp.weixin.qq.com/s/pK2KzhJk6b0OI1isX2FtnQ
本文由 @數(shù)智界 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
AI離我們的生活越來(lái)越近,也有很多技術(shù)與之相關(guān)
照這發(fā)展擁有小說(shuō)里的智能機(jī)器人不是夢(mèng)!只是時(shí)間問(wèn)題
感覺(jué)A-soul虛擬又不夠虛擬,和開(kāi)頭所謂的“AI主持人”沒(méi)有區(qū)別
我認(rèn)為“與國(guó)外成熟的IP運(yùn)營(yíng)體系相比,國(guó)內(nèi)文娛公司雖然已經(jīng)有了IP的構(gòu)建意識(shí),但是IP持續(xù)更新與運(yùn)營(yíng)能力有所欠缺?!边@句話說(shuō)的很在點(diǎn)上
社會(huì)在不斷進(jìn)步,現(xiàn)在科學(xué)的技術(shù)確實(shí)是越來(lái)越好了
現(xiàn)在還多了很多虛擬博主,也是身份型虛擬人吧,不過(guò)這類(lèi)虛擬人多是頭部吃肉,剩下的只能喝粥了