越來(lái)越像“人”的數(shù)字人——形象介紹以及發(fā)展趨勢(shì)展望
虛擬數(shù)字人在各行業(yè)里的應(yīng)用已經(jīng)越來(lái)越廣泛,那么隨著技術(shù)越來(lái)越成熟,數(shù)字人未來(lái)的形象及發(fā)展,可能呈現(xiàn)怎樣的趨向呢?這篇文章里,作者圍繞數(shù)字人做了介紹和分析,不妨來(lái)看一下,或許可以幫你更加了解這一概念背后的圖景。
隨著數(shù)字人的熱度越來(lái)越高,各行業(yè)運(yùn)用的應(yīng)用場(chǎng)景越來(lái)越豐富,數(shù)字人也越來(lái)越被大眾所知曉。特別是2022年下半年到2023年,比如北京冬奧會(huì)的開幕式表演、氣象播報(bào)、手語(yǔ)解說中頻頻現(xiàn)身;數(shù)字人主播在電視臺(tái)中的主持。
各種晚會(huì)與明星互動(dòng)表演:2022年江蘇衛(wèi)視跨年晚會(huì)舞臺(tái)上,“虛擬鄧麗君”便與周深共同完成了《大魚》、《小城故事》和《漫步人生路》三首歌曲的合唱;2022年5月18日,首個(gè)文博界虛擬宣推官文夭夭:唐代花鈿妝容,雙髻丸子頭,著一襲淡雅長(zhǎng)裙,腰系唐朝花鳥鏤空香熏球。
本文就數(shù)字人的形象類型、不同類型的制作周期與限制條件、普及程度與大眾認(rèn)知程度、運(yùn)用的優(yōu)劣勢(shì)以及未來(lái)發(fā)展的趨勢(shì)這些維度就個(gè)人的見解與各位分享。
首先簡(jiǎn)單介紹一下什么是數(shù)字人:
虛擬數(shù)字人指存在于非物理世界中,由計(jì)算機(jī)圖形學(xué)、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)、語(yǔ)音合成等計(jì)算機(jī)手段創(chuàng)造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產(chǎn)物。
市面上也多將其稱為虛擬形象、虛擬人、數(shù)字人等,代表性的細(xì)分應(yīng)用包括虛擬助手、虛擬客服、虛擬偶像/主播等。
一、數(shù)字人類型
1. 行業(yè)內(nèi)根據(jù)虛擬數(shù)字人的角色形象一般分類主要有以下類型
其中在目前的運(yùn)用中,較為常見的有2D真人、2D卡通、3D卡通、3D寫實(shí)、3D超寫實(shí)這5個(gè)類型。
2D真人:通過真人在專業(yè)錄影棚錄制的視頻再加AI訓(xùn)練而成;用戶也可以通過圖片把用戶的外觀特征再加AI訓(xùn)練而成。其表情神態(tài)、肢體動(dòng)作等堪比真人效果——目前很多人可能接觸到的是抖音、淘寶等直播電商平臺(tái)上,有很多此類型數(shù)字人。
2D卡通:通過 2D 建模生成,具有非常強(qiáng)的可塑性。如世界第一虛擬偶像日本夢(mèng)幻歌姬“初音未來(lái)”的形象、洛天依等。——目前其實(shí)在運(yùn)用層面上,已經(jīng)不是很常見了。
3D卡通/3D寫實(shí):通過高精度原畫設(shè)計(jì)、高寫實(shí) 3D 建模、高水準(zhǔn)的虛擬人引擎導(dǎo)入、高精度動(dòng)作捕捉、最后完成精致的修幀渲染方能完成?!S著GPU以及算力的發(fā)展,目前越來(lái)越高進(jìn)度的3D數(shù)字人運(yùn)用在APP/小程序/機(jī)具終端上。
3D超寫實(shí):超寫實(shí)是指人物外觀仿真度高,栩栩如生,這種虛擬人需要面部面數(shù)在1萬(wàn)面以上,高精度經(jīng)得起360度無(wú)死角的懟拍。面部材質(zhì)不僅十分接近真實(shí)皮膚的質(zhì)感,還可以根據(jù)相機(jī)的距離進(jìn)行自動(dòng)優(yōu)化,皮膚、五官、頭發(fā)、肢體幾近真人。如Ling、柳夜熙等——目前更多的還是運(yùn)用在最為獨(dú)立IP,作為企業(yè)形象代言人,可以去承接視頻宣傳、海報(bào)宣傳、跨界互動(dòng)上。
2. 從制作周期、制作方式維度來(lái)說明闡述一下不同類型數(shù)字人的情況
制作周期:
- 2D真人:真人形象采集,+文本/聲音AI驅(qū)動(dòng),制作周期3-4周。
- 2D卡通:2D繪制,形象生成周期短,制作周期2-4周。
- 3D卡通人物/3D寫實(shí):3D繪制,制作周期2-4個(gè)月。
- 3D超寫實(shí):真人掃描/3D建模,制作周期3-6個(gè)月。
制作流程:
2D數(shù)字人:
2D卡通數(shù)字人較為簡(jiǎn)單:主要通過手繪或者美術(shù)人員來(lái)實(shí)現(xiàn)。
2D視頻數(shù)字人:
- 錄制真人視頻表演、采集數(shù)據(jù),一般錄制3-5分鐘的視頻。
- 再將視頻給到AI訓(xùn)練。
- 最終實(shí)現(xiàn)輸入文本/音頻文件,實(shí)現(xiàn)口唇驅(qū)動(dòng)。
3D數(shù)字人制作流程:
1)虛擬形象設(shè)定構(gòu)思:首先我們需要知道虛擬人的形象風(fēng)格及類別;
2)虛擬形象建模、建模形象綁定、動(dòng)作捕捉?;谔摂M形象IP設(shè)計(jì)或真人偶像繪制原畫和三視圖、招牌動(dòng)作表情。進(jìn)行面部及身體3D建模,選擇關(guān)鍵點(diǎn),將識(shí)別關(guān)鍵點(diǎn)映射至模型上,進(jìn)行綁定。關(guān)鍵點(diǎn)綁定的數(shù)量及位置影響最終效果。利用動(dòng)作捕捉設(shè)備或特定攝像頭+圖像識(shí)別,捕捉在形體、表情、眼神、手勢(shì)等方面的關(guān)鍵點(diǎn)變化。
3)實(shí)時(shí)驅(qū)動(dòng)渲染
真人演員(在虛擬偶像中稱為中之人)根據(jù)制作需要進(jìn)行相應(yīng)表演,實(shí)時(shí)驅(qū)動(dòng)虛擬數(shù)字人表演。
4)實(shí)時(shí)內(nèi)容輸出互動(dòng)
最終將復(fù)活的實(shí)時(shí)數(shù)字人接入實(shí)時(shí)渲染引擎。
——稍微展開聊聊(什么是恐怖谷效應(yīng)):
3D技術(shù)限制存在恐怖谷效應(yīng)。所謂恐怖谷效應(yīng),是指當(dāng)機(jī)器人或虛擬人對(duì)人類的擬真程度到達(dá)非常高的程度后,由于和真人只有一點(diǎn)點(diǎn)的差距,反而會(huì)使現(xiàn)實(shí)人類感到恐懼。而如果能突破這個(gè)臨界點(diǎn),人類對(duì)機(jī)器人或虛擬人的恐懼度就會(huì)迅速下降。
二、形象未來(lái)發(fā)展趨勢(shì)預(yù)測(cè)
隨著技術(shù)的越來(lái)越成熟,以及硬件設(shè)備(移動(dòng)手機(jī)、硬件大屏等)性能越來(lái)越強(qiáng)大,大眾對(duì)于數(shù)字人的期望也會(huì)變的越來(lái)越高。
1. 從制作的角度來(lái)看
近年來(lái),拍照式相機(jī)陣列掃描重建得到飛速發(fā)展,目前可實(shí)現(xiàn)毫秒級(jí)高速拍照掃描(高性能的相機(jī)陣列精度可達(dá)到亞毫米級(jí)),滿足數(shù)字人掃描重建需求,成為當(dāng)前人物建模主流方式。國(guó)際上 IR、Ten24 等公司已經(jīng)將靜態(tài)重建技術(shù)完全商業(yè)化,服務(wù)于好萊塢大型影視數(shù)字人制作,國(guó)內(nèi)凌云光等公司制作的拍照式人體掃描系統(tǒng)也已經(jīng)在電影、游戲、虛擬主播項(xiàng)目中成功應(yīng)用。
相比靜態(tài)重建技術(shù),動(dòng)態(tài)光場(chǎng)重建不僅可以重建人物的幾何模型,還可一次性獲取動(dòng)態(tài)的人物模型數(shù)據(jù),并高品質(zhì)重現(xiàn)不同視角下觀看人體的光影效果,成為數(shù)字人建模重點(diǎn)發(fā)展方向。
2. 從渲染的技術(shù)來(lái)看
實(shí)時(shí)渲染技術(shù)的突破助力寫實(shí)類數(shù)字人實(shí)現(xiàn)實(shí)時(shí)交互,應(yīng)用范圍快速擴(kuò)大。
隨著硬件能力的提升和算法的突破,渲染速度、渲染效果的真實(shí)度、渲染畫面的分辨率均大幅提升,在虛擬人物實(shí)時(shí)渲染方面,已經(jīng)能做到以假亂真。
3. 從形象展現(xiàn)端的角度來(lái)看
- 展示平臺(tái)主要以傳統(tǒng)顯示設(shè)備為主,PC、手機(jī)、大屏是主流顯示硬件。
- 未來(lái)數(shù)字人和3D數(shù)字內(nèi)容的結(jié)合,對(duì)于裸眼3D、VR、AR等硬件的普及具有推動(dòng)作用,沉浸式設(shè)備在特定領(lǐng)域?qū)⒊蔀樽顑?yōu)解。
4. 從客戶的需求角度來(lái)看
- 未來(lái)數(shù)字人的發(fā)展,正呈現(xiàn)出靜態(tài)向動(dòng)態(tài)、2D向3D、卡通向?qū)憣?shí)、單向向多向互動(dòng)的趨勢(shì);
- 人格化成為數(shù)字人爆火的新的發(fā)展方向。在“好看的皮囊”上精心打磨的同時(shí),生產(chǎn)者更希望數(shù)字人擁有“獨(dú)特的靈魂”,讓用戶感受到人格化數(shù)字人身上的情感力量。比如像銀行的虛擬客服形象多為西裝制服的精英女士,而虛擬美妝博主則以時(shí)尚精致的美麗姐姐為主。這種與所屬領(lǐng)域緊密貼近的造型能夠幫助人們更好的識(shí)別,增強(qiáng)人們的代入感和信任感,未來(lái)的區(qū)分度也會(huì)越來(lái)越明顯。
5. 從數(shù)字人IP角度來(lái)看
數(shù)字人作為數(shù)字 IP 不僅需要助力品牌實(shí)現(xiàn)差異化和年輕化,還能讓用戶快速建立品牌聯(lián)想和品牌標(biāo)識(shí)。
目前的打造趨勢(shì):造場(chǎng)景、立人設(shè)、創(chuàng)運(yùn)營(yíng)。
場(chǎng)景:
- 根據(jù)虛擬人的應(yīng)用場(chǎng)景劃分,虛擬人產(chǎn)業(yè)可以分為:內(nèi)容消費(fèi)型虛擬人、工具型虛擬人、內(nèi)容生產(chǎn)型虛擬人,分別面向C端市場(chǎng)、B端市場(chǎng)以及元宇宙的去中心化基建。
- 具象一點(diǎn),虛擬人物的主要活躍場(chǎng)景包括:娛樂綜藝、游戲、時(shí)尚、運(yùn)動(dòng)健身、視頻/大片、實(shí)時(shí)直播、全息/現(xiàn)場(chǎng)。
立人設(shè):
- 打造符合品牌調(diào)性的文化符號(hào),包括人物性格、身份背景、功能價(jià)值等,也就是給虛擬人賦予個(gè)性和靈魂。
- 虛擬人角色設(shè)定可以分為五個(gè)類別,分別是完美偶像、前沿實(shí)驗(yàn)、真實(shí)生活、智能助手和行業(yè)專家。
創(chuàng)運(yùn)營(yíng):采用“有故事 + 有進(jìn)化 + 有持續(xù)性”的運(yùn)營(yíng)模式,打通全域式營(yíng)銷通道,為數(shù)字人 IP 續(xù)航發(fā)展注入能量。
- 理解各種業(yè)務(wù)的特性和客戶特性;文字可以很好地體現(xiàn)出角色的個(gè)性特征;
- 增加在現(xiàn)實(shí)生活中暴露或與現(xiàn)實(shí)人物合影,增加逼真度;
- 將有意義的意見或信息(如服裝、攝影教程、好物、好電視劇、安利等等)提供給使用者,而非單純地強(qiáng)調(diào)人的“活起來(lái)”;
- 在與品牌的協(xié)作中,可以提供與之有關(guān)的圖片或錄像,增強(qiáng)其專業(yè)或職業(yè)的性格,并為其廣告做廣告;
- 盡量在線上尋找流量,或是參加熱點(diǎn)話題的探討,以提高曝光率;借助雜志,媒體,線下展會(huì)等多種途徑進(jìn)行宣傳。
三、虛擬數(shù)字人發(fā)展趨勢(shì)
1. 三個(gè)特點(diǎn)
1)技術(shù)向上,成本向下
在元宇宙時(shí)代,強(qiáng)大的企業(yè)將開始跨足不同領(lǐng)域,合并不同學(xué)科的知識(shí),以加速技術(shù)創(chuàng)新并將其應(yīng)用于實(shí)際產(chǎn)業(yè)。在技術(shù)不斷升級(jí)的情況下,這將推動(dòng)行業(yè)標(biāo)準(zhǔn)化和智能化的發(fā)展,提高生產(chǎn)效率。隨著技術(shù)的發(fā)展,高精度虛擬人的制作成本將不斷降低,使得內(nèi)容創(chuàng)作者能夠更輕松地專注于創(chuàng)造內(nèi)容,而不受成本的限制。這意味著未來(lái)我們將看到更多的創(chuàng)作者將資源用于創(chuàng)作本身,從而推動(dòng)內(nèi)容產(chǎn)業(yè)的進(jìn)一步發(fā)展。
2)價(jià)值向內(nèi),責(zé)任向外
在元宇宙時(shí)代,擁有內(nèi)容生產(chǎn)能力的虛擬人,將成為“內(nèi)生力量”,構(gòu)建起元宇宙價(jià)值的“內(nèi)循環(huán)”。創(chuàng)造內(nèi)容的虛擬人將成為元宇宙價(jià)值的重要組成部分,就像是一個(gè)內(nèi)部推動(dòng)力量,為元宇宙的發(fā)展構(gòu)建起一個(gè)內(nèi)部的循環(huán)。如果虛擬人在元宇宙中違反法律和道德規(guī)范,那么虛擬人的所有者將會(huì)被視為主要責(zé)任人,需要接受虛擬世界和現(xiàn)實(shí)社會(huì)的不同審判。
3)行業(yè)破壁,產(chǎn)業(yè)融合
元宇宙的核心是“融合”,隨著產(chǎn)業(yè)的升級(jí),它將重新連接整個(gè)產(chǎn)業(yè)鏈,引發(fā)新的場(chǎng)景和業(yè)態(tài)的涌現(xiàn)。人類社會(huì)與元宇宙將以“元宇宙+”的模式長(zhǎng)期共存,虛擬人作為一種關(guān)鍵的數(shù)字工具,將廣泛滲透到傳統(tǒng)產(chǎn)業(yè)中,實(shí)現(xiàn)向外擴(kuò)展,成為推動(dòng)各行業(yè)效率提升到新水平的關(guān)鍵手段,繼互聯(lián)網(wǎng)之后的又一重要推動(dòng)力。
2. 商業(yè)模式
國(guó)內(nèi)很多公司選擇自己開發(fā)語(yǔ)音、文字和圖像處理能力,而國(guó)外則更傾向于使用微軟、AWS、Google等公司提供的核心自然語(yǔ)言處理(NLP)技術(shù),將其整合到產(chǎn)品中,讓客戶可以自由選擇。
這可能是因?yàn)閲?guó)外主要由計(jì)算機(jī)圖形(CG)公司主導(dǎo)市場(chǎng),而國(guó)內(nèi)公司更注重業(yè)務(wù)集中化。未來(lái),一些國(guó)內(nèi)公司表示他們也會(huì)向外部公司開放部分技術(shù)能力。這種差異在未來(lái)可能逐漸減小,因?yàn)閲?guó)外公司更趨向于提供標(biāo)準(zhǔn)化的虛擬數(shù)字人形象,包括豐富的音效和模板。
相比之下,國(guó)內(nèi)公司的提供相對(duì)較有限,更多的是根據(jù)用戶需求進(jìn)行特定設(shè)計(jì),以滿足定制化項(xiàng)目的需求。在交付方面,國(guó)外主要以特定的虛擬數(shù)字人為主,讓客戶方進(jìn)行訓(xùn)練和迭代;而國(guó)內(nèi)則更注重提供內(nèi)容。
國(guó)內(nèi)大多是傳統(tǒng)的AI公司,在這個(gè)賽道中基于虛擬直播或虛擬主持人播報(bào)起家,并開始關(guān)注這兩項(xiàng)技術(shù)的周邊產(chǎn)業(yè),如完整的直播應(yīng)用方案、運(yùn)營(yíng)等并逐漸向其他領(lǐng)域延展。
但由于國(guó)內(nèi)市場(chǎng)和內(nèi)容消費(fèi)的市場(chǎng)太大,缺乏業(yè)務(wù)延展的動(dòng)力。部分公司在向消費(fèi)級(jí)的完整解決方案拓展。
除了 Epic這個(gè)游戲引擎公司外,其余的公司都是專注于這個(gè)領(lǐng)域的。就目前動(dòng)向而言,可能會(huì)沿垂直行業(yè)發(fā)展。國(guó)外企業(yè)更多聚焦于2C,延續(xù)了從日本興起的虛擬陪伴文化(這一方向在國(guó)內(nèi)主要體現(xiàn)在AcFu和嗶哩嗶哩中)。我國(guó)企業(yè)則多聚焦于實(shí)用性更強(qiáng)的2B2C領(lǐng)域,通過客服等服務(wù)型場(chǎng)景降本增效,更快的兌現(xiàn)技術(shù)價(jià)值。
3. 總結(jié)
目前,雖然數(shù)字人在應(yīng)用方面還面臨一些問題,比如產(chǎn)業(yè)鏈不夠順暢、場(chǎng)景無(wú)法很好地連接、成本較高等。但隨著“元宇宙”的快速崛起,整個(gè)產(chǎn)業(yè)鏈將更緊密地結(jié)合在一起,使技術(shù)更先進(jìn),成本更低,使得數(shù)字人進(jìn)入普通家庭,提高企業(yè)的質(zhì)量和效率。
在元宇宙中,每個(gè)人都將有一個(gè)數(shù)字身體,這個(gè)數(shù)字身體的主體就是虛擬人。虛擬人參與到元宇宙的社會(huì)活動(dòng)中,與由智能驅(qū)動(dòng)的虛擬人形成了“人機(jī)共生”的完美結(jié)合,創(chuàng)造了一種新的商業(yè)形式。
虛擬人已經(jīng)開始在政務(wù)、商業(yè)、娛樂、醫(yī)療、教育、金融、養(yǎng)老等各個(gè)領(lǐng)域發(fā)展,不斷提升自身能力。這體現(xiàn)了“元宇宙”中虛擬與實(shí)際的密切關(guān)系。
在未來(lái)很長(zhǎng)的時(shí)間里,元宇宙中的虛擬人將成為熱門話題。但無(wú)論如何,我們要尊重人類、尊重自然、尊重科技、尊重宇宙、尊重藝術(shù),讓這個(gè)不可避免的未來(lái)變得更美好。
本文由 @毅鳴 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!