正在閱讀:

數(shù)字人深度報(bào)告,元宇宙下的爆火概念,技術(shù)和應(yīng)用一文看懂

掃一掃下載界面新聞APP

數(shù)字人深度報(bào)告,元宇宙下的爆火概念,技術(shù)和應(yīng)用一文看懂

虛擬數(shù)字人,元宇宙的基本單元。

文|智東西

虛擬數(shù)字人指存在于非物理世界中,由計(jì)算機(jī)手段創(chuàng)造及使用,并具有多重人類(lèi)特征(外貌特征、人類(lèi)表演能力、交互能力等)的綜合產(chǎn)物。虛擬數(shù)字人可按人格象征和圖形維度劃分,亦可根據(jù)人物圖形維度劃分。人物形象、語(yǔ)音生成模塊、動(dòng)畫(huà)生成模塊、音視頻合成顯示模塊、交互模塊構(gòu)成虛擬數(shù)字人通用系統(tǒng)框架。

1982 年世界第一位虛擬歌姬林明美誕生,虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級(jí)和成長(zhǎng)四個(gè)階段。隨技術(shù)逐年突破,制作過(guò)程亦得到有效簡(jiǎn)化,從最早的手工繪制到現(xiàn)在的 CG、人工智能合成。在虛擬數(shù)字人產(chǎn)業(yè)鏈中,基礎(chǔ)層提供軟硬件的支撐;平臺(tái)層為制作及開(kāi)發(fā)提供技術(shù);應(yīng)用層為應(yīng)用領(lǐng)域提供解決方案,賦能各領(lǐng)域發(fā)展。虛擬數(shù)字人產(chǎn)業(yè)進(jìn)入門(mén)檻高,差異化顯著,受眾群體不斷拓展,因而虛擬數(shù)字人價(jià)值凸顯,應(yīng)用領(lǐng)域不斷拓展,未來(lái)有望加速商業(yè)化進(jìn)程。

來(lái)源 天風(fēng)證券

原標(biāo)題:《虛擬數(shù)字人:元宇宙的主角破圈而來(lái)》

作者:文浩

01.元宇宙主角,市場(chǎng)廣闊

虛擬人、數(shù)字人、虛擬數(shù)字人的目標(biāo)是通過(guò)計(jì)算機(jī)圖形學(xué)技術(shù)(Computer Graphic,CG)創(chuàng)造出與人類(lèi)形象接近的數(shù)字化形象,并賦予其特定的人物身份設(shè)定,在視覺(jué)上拉近和人的心理距離,為人類(lèi)帶來(lái)更加真實(shí)的情感互動(dòng)。按照各定義特征的要求,數(shù)字人的范疇包含虛擬人,虛擬人的范疇包含虛擬數(shù)字人。

▲數(shù)字人、虛擬人和虛擬數(shù)字人的關(guān)系圖

對(duì)于不要求必須具備交流互動(dòng)能力時(shí),數(shù)字人、虛擬人、虛擬數(shù)字人這三者概念可以認(rèn)為是等同的。但在嚴(yán)格意義下它們又有細(xì)微的差別。虛擬人的身份是虛構(gòu)的,現(xiàn)實(shí)世界中不存在的。數(shù)字人強(qiáng)調(diào)角色存在于數(shù)字世界。虛擬數(shù)字人強(qiáng)調(diào)虛擬身份和數(shù)字化制作特性。

虛擬數(shù)字人從最早的手工繪制到現(xiàn)在的 CG(Computer Graphics,電腦繪圖)、人工智能合成,虛擬數(shù)字人大致經(jīng)歷了萌芽、探索、初級(jí)和成長(zhǎng)四個(gè)階段。

▲虛擬數(shù)字人發(fā)展沿革

當(dāng)前虛擬數(shù)字人理論和技術(shù)日益成熟,應(yīng)用范圍不斷擴(kuò)大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應(yīng)的商業(yè)模式也在持續(xù)演進(jìn)和多元化。

▲虛擬數(shù)字人產(chǎn)業(yè)鏈視圖

基礎(chǔ)層為虛擬數(shù)字人提供基礎(chǔ)軟硬件支撐,硬件包括顯示設(shè)備、光學(xué)器件、傳感器、芯片 等,基礎(chǔ)軟件包括建模軟件、渲染引擎。顯示設(shè)備是數(shù)字人的載體,既包括手機(jī)、電視、投影、LED 顯示等 2D 顯示設(shè)備,也包括裸眼立體、AR、VR 等 3D 顯示設(shè)備。光學(xué)器件用于視覺(jué)傳感器、用戶顯示器的制作。傳感器用于數(shù)字人原始數(shù)據(jù)及用戶數(shù)據(jù)的采集。芯片用于傳感器數(shù)據(jù)預(yù)處理和數(shù)字人模型渲染、AI 計(jì)算。建模軟件能夠?qū)μ摂M數(shù)字人的人體、衣物進(jìn)行三維建模。渲染引擎能夠?qū)艄?、毛發(fā)、衣物等進(jìn)行渲染,主流引擎包括 UnityTechnologies 公司的 Unity 3D、Epic Games 公司的 Unreal Engine 等??傮w來(lái)看,處于基礎(chǔ)層的廠商已經(jīng)深耕行業(yè)多年,已經(jīng)形成了較為深厚的技術(shù)壁壘。

▲虛擬數(shù)字人產(chǎn)業(yè)鏈基礎(chǔ)層概覽

平臺(tái)層包括軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務(wù)平臺(tái)、AI 能力平臺(tái),為虛擬數(shù)字人的制作及開(kāi)發(fā) 提供技術(shù)能力。建模系統(tǒng)和動(dòng)作捕捉系統(tǒng)通過(guò)產(chǎn)業(yè)鏈上游的傳感器、光學(xué)器件等硬件獲取真人/實(shí)物的各類(lèi)信息,利用軟件算法實(shí)現(xiàn)對(duì)人物的建模、動(dòng)作的重現(xiàn);渲染平臺(tái)用于模型的云端渲染。解決方案平臺(tái)基于自身技術(shù)能力為廣大客戶提供數(shù)字人解決方案。AI 能力平臺(tái)提供計(jì)算機(jī)視覺(jué)、智能語(yǔ)音、自然語(yǔ)言處理技術(shù)能力。平臺(tái)層匯聚的企業(yè)較多,騰訊、百度、搜狗、魔琺科技、相芯科技均有提供相應(yīng)數(shù)字人技術(shù)服務(wù)平臺(tái)。

應(yīng)用層是指虛擬數(shù)字人技術(shù)結(jié)合實(shí)際應(yīng)用場(chǎng)景領(lǐng)域,切入各類(lèi),形成行業(yè)應(yīng)用解決方案, 賦能行業(yè)領(lǐng)域。按照應(yīng)用場(chǎng)景或行業(yè)的不同,已經(jīng)出現(xiàn)了娛樂(lè)型數(shù)字人(如虛擬主播、虛擬偶像)、教育型數(shù)字人(如虛擬教師)、助手型數(shù)字人(如虛擬客服、虛擬導(dǎo)游、智能助手)、影視數(shù)字人(如替身演員或虛擬演員)等。不同外形、不同功能的虛擬數(shù)字人賦能影視、傳媒、游戲、金融、文旅等領(lǐng)域,根據(jù)需求為用戶提供定制化服務(wù)。

▲虛擬數(shù)字人產(chǎn)業(yè)生虛擬數(shù)字人應(yīng)用領(lǐng)域、場(chǎng)景及充當(dāng)角色

虛擬數(shù)字人基礎(chǔ)技術(shù)架構(gòu)包括“五橫兩縱”。“五橫”是指用于數(shù)字人制作、交互的五大技術(shù)模塊,即人物生成、人物表達(dá)、合成顯示、識(shí)別感知、分析決策等模塊。其中,人物生成,即人物建模方面 2D 數(shù)字人較為簡(jiǎn)單,3D 數(shù)字人需要額外使用三維建模技術(shù)。人物表達(dá)包括語(yǔ)音生成和動(dòng)畫(huà)生成。動(dòng)畫(huà)生成則包含驅(qū)動(dòng)和渲染兩大部分?!皟煽v”是指 2D、3D 數(shù)字人,2D 數(shù)字人和 3D 數(shù)字人在技術(shù)架構(gòu)方面基本一致。3D 數(shù)字人需要額外使用三維建模技術(shù)生成數(shù)字形象,信息維度增加,所需的計(jì)算量更大。

建模技術(shù)分為靜態(tài)掃描建模和動(dòng)態(tài)光場(chǎng)重建,目前主流技術(shù)仍為靜態(tài)掃描,相比靜態(tài)重建技術(shù),具有高視覺(jué)保真度的動(dòng)態(tài)光場(chǎng)三維重建技術(shù)不僅可以重建人物的幾何模型,還可一次性獲取動(dòng)態(tài)的人物模型數(shù)據(jù),并高品質(zhì)重現(xiàn)不同視角下觀看人體的光影效果,成為數(shù)字人建模重點(diǎn)發(fā)展方向。

靜態(tài)掃描建模技術(shù)可分為結(jié)構(gòu)光掃描重建和相機(jī)陣列掃描重建,結(jié)構(gòu)光掃描重建掃描時(shí)間長(zhǎng),對(duì)于人體這類(lèi)運(yùn)動(dòng)目標(biāo)在友好度和適應(yīng)性方面都差強(qiáng)人意,更多的應(yīng)用于工業(yè)生產(chǎn)、檢測(cè)領(lǐng)域。相機(jī)陣列掃描重建替代結(jié)構(gòu)光掃描重建克服了以上問(wèn)題成為人物建模主流方式。隨著拍照式相機(jī)陣列掃描重建得到飛速發(fā)展,目前可實(shí)現(xiàn)毫秒級(jí)高速拍照掃描(高性能的相機(jī)陣列精度可達(dá)到亞毫米級(jí)),并成功應(yīng)用于游戲、電影、傳媒等行業(yè)。

▲結(jié)構(gòu)光掃描重建與相機(jī)陣列掃描重建分類(lèi)

國(guó)際上 IR、Ten24 等公司將靜態(tài)重建技術(shù)完全商業(yè)化,服務(wù)于好萊塢大型影視數(shù)字人制作。凌云光近年來(lái)大力發(fā)展立體視覺(jué)并研發(fā)了高精度人體3D建模系統(tǒng)——Human 3D+,其中核心的三維幾何和彩色數(shù)據(jù)采集部分均使用了以佳能專(zhuān)業(yè)鏡頭,配合佳能 SDK 軟件開(kāi)發(fā)包及凌云光專(zhuān)用 3D 建模軟件能快速、清晰成像并高速儲(chǔ)存,自動(dòng)完成高精度人體全身或局部重建,再利用三維動(dòng)畫(huà)制作軟件對(duì)重建結(jié)果進(jìn)行處理,得到高真實(shí)度數(shù)字人物。

動(dòng)態(tài)光場(chǎng)重建是目前世界上最新的深度掃描技術(shù),此技術(shù)可忽略材質(zhì),直接采集三維世界的光線,然后實(shí)時(shí)渲染出真實(shí)的動(dòng)態(tài)表演者模型,為 3D 建模提供更加豐富的圖像信息,它主要包含人體動(dòng)態(tài)三維重建和光場(chǎng)成像兩部分:

▲人體動(dòng)態(tài)三維重建與光場(chǎng)成像的區(qū)別

驅(qū)動(dòng):智能合成,動(dòng)作捕捉遷移成為主流動(dòng)作生產(chǎn)方式。2D、3D 數(shù)字人嘴型動(dòng)作智能合成的底層邏輯類(lèi)似,均建立在輸入文本到輸出音頻與輸出視覺(jué)信息的關(guān)聯(lián)映射。其中 3D 視頻驅(qū)動(dòng)方式為以下三個(gè)步驟:

1)視頻算法訓(xùn)練:對(duì)已采集到的文本到語(yǔ)音和嘴型視頻的數(shù)據(jù)進(jìn)行模型訓(xùn)練,得到一個(gè)輸入任意文本均可驅(qū)動(dòng)嘴型的模型。

2)語(yǔ)音自動(dòng)識(shí)別:對(duì)語(yǔ)音進(jìn)行標(biāo)注,綁定數(shù)據(jù)與動(dòng)作,使得虛擬數(shù)字人對(duì)特定詞語(yǔ)或語(yǔ)境做出相應(yīng)動(dòng)作。

3)動(dòng)捕設(shè)備采集:需真人穿戴動(dòng)捕設(shè)備,動(dòng)捕設(shè)備與真人肢體動(dòng)作相綁定,可實(shí)時(shí)傳遞到虛擬數(shù)字人身上。

通過(guò)將捕捉采集的動(dòng)作遷移至數(shù)字人是目前 3D 數(shù)字人動(dòng)作生成的主要方式,核心技術(shù)是動(dòng)作捕捉。動(dòng)作捕捉是指通過(guò)數(shù)字手段記錄現(xiàn)實(shí)人們的運(yùn)動(dòng)過(guò)程。同時(shí),動(dòng)作捕捉系統(tǒng)根據(jù)實(shí)現(xiàn)原理的不同,可以分成光學(xué)動(dòng)作捕捉、慣性動(dòng)作捕捉、Track 設(shè)備+IK 算法的動(dòng)作捕捉、以人工智能為主的動(dòng)作捕捉方案。現(xiàn)階段,光學(xué)式和慣性式動(dòng)作捕捉占據(jù)主導(dǎo)地位,基于計(jì)算機(jī)視覺(jué)的動(dòng)作捕捉成為聚焦熱點(diǎn)。

渲染:主打 Unreal 和 Unity 渲染引擎,真實(shí)性和實(shí)時(shí)性均大幅提升。當(dāng)通過(guò)不同的設(shè)備記錄下動(dòng)作方案之后,還需通過(guò)渲染引擎,對(duì)毛發(fā)、衣物等細(xì)節(jié)盡量還原。從引擎性能上來(lái)說(shuō),游戲領(lǐng)域的渲染引擎達(dá)到最好的渲染效果。PBR(PhysicallyBased Rendering,基于物理的渲染技術(shù))渲染技術(shù)的進(jìn)步以及重光照等新型渲染技術(shù)的出現(xiàn)使數(shù)字人皮膚紋理變得真實(shí),突破了恐怖谷效應(yīng)。

PBR 是基于真實(shí)物理世界的成像規(guī)律模擬的一類(lèi)渲染技術(shù)的集合,它的關(guān)鍵在于微表面模型和能量守恒計(jì)算,通過(guò)更真實(shí)的反映模型表面反射光線和折射光線的強(qiáng)弱,使得渲染效果突破了塑料感。常見(jiàn)的幾款 3D 引擎,如 Unreal Engine 4, CryEngine 3, Unity 3D5,均有了各自的 PBR 實(shí)現(xiàn)。

02.落地場(chǎng)景豐富,偶像營(yíng)銷(xiāo)或?yàn)橄劝l(fā)賽道

虛擬人及數(shù)字人應(yīng)用領(lǐng)域多元,主力文娛及服務(wù)行業(yè)。在畫(huà)面呈現(xiàn)方式日漸成熟的的基礎(chǔ)下,疊加 5G、算力、AI 等技術(shù)能力的提升,其落地場(chǎng)景日漸豐富。如今不再限于傳統(tǒng)文娛如影視、動(dòng)畫(huà)在人物建模、CG 等方面在虛擬形象塑造的應(yīng)用,還在社交、游戲、辦公等場(chǎng)景實(shí)現(xiàn)了真實(shí)人類(lèi)虛擬化身的身份職能,并逐漸于直播電商、偶像造星、陪伴服務(wù)等AI 虛擬數(shù)字人領(lǐng)域?qū)崿F(xiàn)商業(yè)變現(xiàn)。

1、游戲

中國(guó)游戲產(chǎn)業(yè)處存量博弈階段,角色扮演類(lèi)游戲在市場(chǎng)收入方面居于首位。2021 年中國(guó)游戲市場(chǎng)實(shí)際銷(xiāo)售收入 2965.13 億元,yoy+6.4%。2021 年中國(guó)游戲用戶規(guī)模 6.66 億,yoy+0.22%,用戶數(shù)量漸趨飽和。2021 年中國(guó)移動(dòng)游戲收入排名前 100 位產(chǎn)品中,角色扮演、卡牌、策略三類(lèi)游戲占據(jù)半壁江山,表明了玩家的偏好,以及企業(yè)相對(duì)集中的市場(chǎng)供給;此外,角色扮演、多人在線戰(zhàn)術(shù)競(jìng)技和射擊三類(lèi)游戲占總收入 50%以上,反映這三類(lèi)游戲用戶基數(shù)較大的客觀現(xiàn)實(shí)。

▲中國(guó)游戲整體市場(chǎng)規(guī)模(億元)

▲2021 收入排名前 100 移動(dòng)游戲產(chǎn)品類(lèi)型收入分布

游戲引擎作為虛擬世界的賣(mài)水人,有望破圈助力多行業(yè)數(shù)字人打造。以 Unity,Unreal 兩大游戲引擎為首,游戲引擎的強(qiáng)大性能使得數(shù)字人形象擬真度進(jìn)一步提升。

Unity 的渲染技術(shù) HDRP 是基于可編程渲染管線(SRP)構(gòu)建的,具有完全統(tǒng)一基于物理的渲染以獲得超高的畫(huà)質(zhì)表現(xiàn), HDRP 的設(shè)計(jì)遵循三個(gè)原則:1)渲染基于真實(shí)物理。2)光照統(tǒng)一、連貫。3)功能獨(dú)立于渲染路徑。HDRP 的強(qiáng)大性能讓數(shù)字人得以“逃離”恐怖谷,以更接近真人的狀態(tài)呈現(xiàn)在大眾面前。

2、偶像造星

虛擬偶像市場(chǎng)高速增長(zhǎng),帶動(dòng)衍生產(chǎn)業(yè)空間廣闊。據(jù)艾媒咨詢,2020 年中國(guó)虛擬偶像核心產(chǎn)業(yè)規(guī)模為 34.6 億元,yoy+70.3%,預(yù)計(jì) 2021 年將達(dá)到 62.2 億元;另一方面,隨著商業(yè)價(jià)值被不斷發(fā)掘,越來(lái)越多產(chǎn)業(yè)與虛擬偶像聯(lián)系在一起,虛擬偶像帶動(dòng)產(chǎn)業(yè)規(guī)模 2020 年 達(dá) 645.6 億元,預(yù)計(jì) 2021 年達(dá) 1074.9 億元。同時(shí)八成以上網(wǎng)民有追星行為,其中喜歡虛擬偶像的網(wǎng)民占 63.6%,根據(jù)粉絲需求策劃的偶像,能最大程度滿足粉絲的想象,有利于積累更龐大的粉絲群體。

▲2017-2023 年中國(guó)虛擬偶像核心市場(chǎng)和帶動(dòng)市場(chǎng)規(guī)模及預(yù)測(cè)

用戶對(duì)虛擬偶像付費(fèi)意愿較強(qiáng),周邊產(chǎn)品豐富帶動(dòng)變現(xiàn)能力。據(jù)艾媒咨詢,八成網(wǎng)民為虛擬偶像每月花費(fèi)在 1000 元以內(nèi),且 37.6%的網(wǎng)民表示愿意花更多的錢(qián)支持虛擬偶像。隨著虛擬偶像產(chǎn)業(yè)的延伸業(yè)態(tài)不斷發(fā)展,手辦、唱片等產(chǎn)品已經(jīng)成為了虛擬偶像流量變現(xiàn)的重要渠道,粉絲愿意花費(fèi)更多的金錢(qián)和精力去支持虛擬偶像。

虛擬偶像早期隨二次元文化滲透,國(guó)產(chǎn) VUP 直播崛起。早期具有代表性的虛擬偶像包括以初音未來(lái)、洛天依為代表的虛擬歌姬(VSinger),此外還有主要在 YouTube、B 站開(kāi)展活動(dòng)的虛擬主播(VTuber/VUP)。

20 年前,B 站虛擬直播區(qū)基本都被日系 VTuber 占領(lǐng),而隨著中國(guó) VUP 的崛起,據(jù) CEO 陳睿,截至 21 年 6 月,B 站擁有 3.2 萬(wàn)位 VUP,每月有約4000 多個(gè)虛擬主播開(kāi)播。據(jù) darkflame,20 年 B 站 VUP 總收入約 1.8 億元,21 年至今(截至 11 月 21 日)已達(dá) 4.5 億元,是去年全年的 2.5 倍。

分季度看,21Q3VUP 直播收入近 1.5億元,月付費(fèi)人數(shù)提升至約 30 萬(wàn)人。目前頭部 VUP 每月的直播收入在 50-200 萬(wàn)元不等,20 年全球收入最高 VTuber 收入約 1.5 億日元(約 840 萬(wàn)元),已被 VUP 全面趕上。從專(zhuān)業(yè)機(jī)構(gòu)來(lái)看,VirtualReal 和 A-SOUL 兩個(gè)專(zhuān)業(yè)化程度較高的機(jī)構(gòu)一直占據(jù)收入榜首位。

互聯(lián)網(wǎng)大廠青睞虛擬藝人領(lǐng)域,破圈走向主流文化已是大勢(shì)所趨。大廠布局分為兩類(lèi):1)推出技術(shù)平臺(tái)。2)搭建虛擬藝人的商業(yè)場(chǎng)景。

▲互聯(lián)網(wǎng)公司虛擬藝人行業(yè)布局

3、品牌營(yíng)銷(xiāo)

虛擬代言人市場(chǎng)空間充足,商業(yè)價(jià)值釋放領(lǐng)域多元。虛擬代言人可劃分為兩種類(lèi)型:1)品牌自主打造符合自身特性的虛擬代言人。2)品牌與外部團(tuán)隊(duì)商業(yè)合作,外部團(tuán)隊(duì)基于技術(shù)引擎開(kāi)發(fā)具有高擬真人類(lèi)形態(tài)的虛擬形象,并獨(dú)立運(yùn)營(yíng)。

虛擬數(shù)字人商業(yè)價(jià)值集中于:1)社交賬號(hào)潛力無(wú)限。大部分虛擬數(shù)字人的注冊(cè)時(shí)間集中于 2020-2021 年,雖然時(shí)間較短,但是部分賬號(hào)漲粉迅速。同時(shí)在微博上,百萬(wàn)粉絲量級(jí)的虛擬數(shù)字人 KOL 較少,仍有流量洼地可供挖掘。

2)活躍在社交平臺(tái)累積用戶粘性。虛擬數(shù)字人賬號(hào)在社交平臺(tái)上的活躍,通過(guò)抽獎(jiǎng)、科普、安利等多種形式和用戶進(jìn)行高頻互動(dòng),共創(chuàng)內(nèi)容。

3)多種方式釋放商業(yè)價(jià)值。虛擬數(shù)字人可以通過(guò)數(shù)字化、科技化、大數(shù)據(jù)為一體的諸多功能屬性,進(jìn)行與真人一樣的品牌營(yíng)銷(xiāo)模式。視頻大片、直播連線、聯(lián)名產(chǎn)品、封面雜志、產(chǎn)品上身等。為粉絲帶去更具想象并貼近完美的營(yíng)銷(xiāo)場(chǎng)景,釋放更多商業(yè)價(jià)值。

虛擬代言人深度洞察 Z 世代消費(fèi)新需求、助力品牌破圈。品牌打造符合自身文化和品牌調(diào)性的虛擬形象代言人,成為與年輕人建立溝通的突破口。從屈臣氏推出首位虛擬偶像代言人屈晨曦 Wilson 拉進(jìn)與年輕人距離,王者榮耀借勢(shì)時(shí)下最流行電競(jìng)虛擬男團(tuán)“無(wú)限王者團(tuán)”全面打開(kāi)社交屬性,到歐萊雅推出首位虛擬代言人“M 姐”迎合年輕人走進(jìn)圈層,花西子推出首個(gè)品牌虛擬形象“花西子“引領(lǐng)國(guó)貨新風(fēng)尚,虛擬形象代言人正幫助品牌迅速吸引年輕人的注意力,助力品牌俘獲更多的目標(biāo)用戶。

4、社交

數(shù)字人為次世代社交重要象征,用戶對(duì)個(gè)性化社交虛擬化身需求提升。次世代社交指的是一個(gè)與現(xiàn)實(shí)平行、實(shí)時(shí)在線的虛擬世界,用戶可以憑借自己的虛擬化身,并基于自己的興趣圖譜或推薦,體驗(yàn)多樣的沉浸式社交場(chǎng)景,在接近真實(shí)的共同體驗(yàn)中一起交流、娛樂(lè),最終找到志同道合的伙伴、建立社交連接。

▲數(shù)字人社交代表產(chǎn)品

5、影視

數(shù)字人于影視行業(yè)成熟運(yùn)用,計(jì)算機(jī)化虛擬動(dòng)捕已成為電影主流特效。技術(shù)發(fā)展并非一蹴而就, 而由大量技術(shù)突破和創(chuàng)作實(shí)踐積累疊加而成。通過(guò)觀察影史中虛擬形象的典型應(yīng)用案例,我們將虛擬動(dòng)捕技術(shù)概括為影史中的四個(gè)不同發(fā)展階段:萌芽期(1990-1999)、起步期(2000-2006)、成熟期(2006-2015)、新時(shí)期(2016-至今)。

▲電影史上虛擬數(shù)字人動(dòng)捕技術(shù)發(fā)展沿革

03.國(guó)內(nèi)外巨頭布局

國(guó)內(nèi)廠商在產(chǎn)業(yè)鏈基礎(chǔ)層、平臺(tái)層和應(yīng)用層發(fā)展較為均衡,虛擬數(shù)字人從開(kāi)發(fā)到落地的體 系逐漸趨于完整?;A(chǔ)層相關(guān)廠商主要著力點(diǎn)在人工智能、動(dòng)作捕捉、建模渲染以及虛擬數(shù)字人的技術(shù)服務(wù)??拼笥嶏w、捷成股份、新華網(wǎng)、標(biāo)貝科技、追一科技和小冰等專(zhuān)注人工智能,云舶科技專(zhuān)研動(dòng)作捕捉,環(huán)球墨非、億真科技、虛谷未來(lái)科技、半人貓、疊鏡數(shù)字、相芯科技以及 Tatame 等專(zhuān)注建模渲染,中科深智、魔琺科技和萬(wàn)像文化等負(fù)責(zé)虛擬數(shù)字人的技術(shù)服務(wù)。

產(chǎn)業(yè)鏈平臺(tái)層建設(shè)為虛擬數(shù)字人運(yùn)營(yíng),主要包括虛擬數(shù)字人的外觀設(shè)計(jì)、包裝、宣傳、落地和培養(yǎng),相關(guān)企業(yè)有上海禾念、樂(lè)華娛樂(lè)、動(dòng)圖宇宙、次世文化、創(chuàng)壹視頻、虛擬影業(yè)、魔塔時(shí)空和世悅星承等。應(yīng)用層主要投入在游戲、直播、動(dòng)畫(huà)、影視、音樂(lè)以及社交平臺(tái)等,應(yīng)用于娛樂(lè)和營(yíng)銷(xiāo)。騰訊音樂(lè)、芒果超媒、奧飛娛樂(lè)和嗶哩嗶哩等將虛擬主播和虛擬偶像等應(yīng)用于娛樂(lè)內(nèi)容。

藍(lán)色光標(biāo)、浙文互聯(lián)、引力傳媒、星期六(遙望網(wǎng)絡(luò))、華揚(yáng)聯(lián)眾和天下秀等已推出或籌備推出虛擬 IP 形象,著重廣告營(yíng)銷(xiāo),星期六(遙望網(wǎng)絡(luò))預(yù)計(jì)推出虛擬數(shù)字人與真人的互動(dòng)直播。中國(guó)移動(dòng)、阿里巴巴、騰訊、百度、網(wǎng)易等綜合型廠商支持旗下相關(guān)公司或事業(yè)部向虛擬數(shù)字人賽道發(fā)力。

▲國(guó)內(nèi)廠商-全鏈條

海外廠商主要聚焦于產(chǎn)業(yè)鏈基礎(chǔ)層的建設(shè),因起步較早,綜合實(shí)力強(qiáng)于國(guó)內(nèi)廠商。在技術(shù)領(lǐng)域方面,有一部分海外廠商如 Intel、Microsoft、Google 以及 Meta(Facebook)這類(lèi)綜合型廠商提供全棧式的技術(shù)服務(wù)。也有一部分海外廠商從不同的技術(shù)細(xì)分上發(fā)力,其中包括人工智能,渲染建模,動(dòng)作捕捉以及 VRAR 的應(yīng)用等。在 AI 虛擬形象生成技術(shù)廠商中,主要有 Soul-Machine、Oben 以及 Loom.ai 等廠商提供個(gè)性化的人機(jī)交互系統(tǒng)來(lái)強(qiáng)調(diào)擬人化的情緒帶來(lái)的商業(yè)價(jià)值的提升。

在渲染建模方面,主要海外廠商有 Epic Games、Unity 以及 NVIDIA 等。其開(kāi)發(fā)的引擎 Unreal engine、Unity 以及 NVIDIA Omniverse 提供了 3D 實(shí)時(shí)模擬和協(xié)作的工具和平臺(tái)。關(guān)于動(dòng)態(tài)捕捉的海外廠商有關(guān)注光學(xué)動(dòng)態(tài)捕捉技術(shù)的 VICON、Motion Analysis、Opti Track,以及關(guān)注慣性動(dòng)作捕捉技術(shù)的 Xsens 等。在 VRAR 方面,主要有 Wave 和 Stageverse 這樣的海外廠商使用 VRAR 技術(shù)向用戶提供虛擬服務(wù)的平臺(tái)以及應(yīng)用程序。

智東西認(rèn)為,數(shù)字人是元宇宙基礎(chǔ)交互單元,將為元宇宙和物理世界交互提供基礎(chǔ)技術(shù)支持;數(shù)字人是虛擬化身,幫助物理世界的每個(gè)個(gè)體建立元宇宙數(shù)字形象。從某種程度上說(shuō),虛擬數(shù)字人是元宇宙的一個(gè)分支,元宇宙的發(fā)展拉動(dòng)了數(shù)字人等虛擬產(chǎn)業(yè)的火爆,從長(zhǎng)線來(lái)看,這些產(chǎn)業(yè)代表著科技主導(dǎo)下未來(lái)的發(fā)展方向之一。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

數(shù)字人深度報(bào)告,元宇宙下的爆火概念,技術(shù)和應(yīng)用一文看懂

虛擬數(shù)字人,元宇宙的基本單元。

文|智東西

虛擬數(shù)字人指存在于非物理世界中,由計(jì)算機(jī)手段創(chuàng)造及使用,并具有多重人類(lèi)特征(外貌特征、人類(lèi)表演能力、交互能力等)的綜合產(chǎn)物。虛擬數(shù)字人可按人格象征和圖形維度劃分,亦可根據(jù)人物圖形維度劃分。人物形象、語(yǔ)音生成模塊、動(dòng)畫(huà)生成模塊、音視頻合成顯示模塊、交互模塊構(gòu)成虛擬數(shù)字人通用系統(tǒng)框架。

1982 年世界第一位虛擬歌姬林明美誕生,虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級(jí)和成長(zhǎng)四個(gè)階段。隨技術(shù)逐年突破,制作過(guò)程亦得到有效簡(jiǎn)化,從最早的手工繪制到現(xiàn)在的 CG、人工智能合成。在虛擬數(shù)字人產(chǎn)業(yè)鏈中,基礎(chǔ)層提供軟硬件的支撐;平臺(tái)層為制作及開(kāi)發(fā)提供技術(shù);應(yīng)用層為應(yīng)用領(lǐng)域提供解決方案,賦能各領(lǐng)域發(fā)展。虛擬數(shù)字人產(chǎn)業(yè)進(jìn)入門(mén)檻高,差異化顯著,受眾群體不斷拓展,因而虛擬數(shù)字人價(jià)值凸顯,應(yīng)用領(lǐng)域不斷拓展,未來(lái)有望加速商業(yè)化進(jìn)程。

來(lái)源 天風(fēng)證券

原標(biāo)題:《虛擬數(shù)字人:元宇宙的主角破圈而來(lái)》

作者:文浩

01.元宇宙主角,市場(chǎng)廣闊

虛擬人、數(shù)字人、虛擬數(shù)字人的目標(biāo)是通過(guò)計(jì)算機(jī)圖形學(xué)技術(shù)(Computer Graphic,CG)創(chuàng)造出與人類(lèi)形象接近的數(shù)字化形象,并賦予其特定的人物身份設(shè)定,在視覺(jué)上拉近和人的心理距離,為人類(lèi)帶來(lái)更加真實(shí)的情感互動(dòng)。按照各定義特征的要求,數(shù)字人的范疇包含虛擬人,虛擬人的范疇包含虛擬數(shù)字人。

▲數(shù)字人、虛擬人和虛擬數(shù)字人的關(guān)系圖

對(duì)于不要求必須具備交流互動(dòng)能力時(shí),數(shù)字人、虛擬人、虛擬數(shù)字人這三者概念可以認(rèn)為是等同的。但在嚴(yán)格意義下它們又有細(xì)微的差別。虛擬人的身份是虛構(gòu)的,現(xiàn)實(shí)世界中不存在的。數(shù)字人強(qiáng)調(diào)角色存在于數(shù)字世界。虛擬數(shù)字人強(qiáng)調(diào)虛擬身份和數(shù)字化制作特性。

虛擬數(shù)字人從最早的手工繪制到現(xiàn)在的 CG(Computer Graphics,電腦繪圖)、人工智能合成,虛擬數(shù)字人大致經(jīng)歷了萌芽、探索、初級(jí)和成長(zhǎng)四個(gè)階段。

▲虛擬數(shù)字人發(fā)展沿革

當(dāng)前虛擬數(shù)字人理論和技術(shù)日益成熟,應(yīng)用范圍不斷擴(kuò)大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應(yīng)的商業(yè)模式也在持續(xù)演進(jìn)和多元化。

▲虛擬數(shù)字人產(chǎn)業(yè)鏈視圖

基礎(chǔ)層為虛擬數(shù)字人提供基礎(chǔ)軟硬件支撐,硬件包括顯示設(shè)備、光學(xué)器件、傳感器、芯片 等,基礎(chǔ)軟件包括建模軟件、渲染引擎。顯示設(shè)備是數(shù)字人的載體,既包括手機(jī)、電視、投影、LED 顯示等 2D 顯示設(shè)備,也包括裸眼立體、AR、VR 等 3D 顯示設(shè)備。光學(xué)器件用于視覺(jué)傳感器、用戶顯示器的制作。傳感器用于數(shù)字人原始數(shù)據(jù)及用戶數(shù)據(jù)的采集。芯片用于傳感器數(shù)據(jù)預(yù)處理和數(shù)字人模型渲染、AI 計(jì)算。建模軟件能夠?qū)μ摂M數(shù)字人的人體、衣物進(jìn)行三維建模。渲染引擎能夠?qū)艄狻⒚l(fā)、衣物等進(jìn)行渲染,主流引擎包括 UnityTechnologies 公司的 Unity 3D、Epic Games 公司的 Unreal Engine 等??傮w來(lái)看,處于基礎(chǔ)層的廠商已經(jīng)深耕行業(yè)多年,已經(jīng)形成了較為深厚的技術(shù)壁壘。

▲虛擬數(shù)字人產(chǎn)業(yè)鏈基礎(chǔ)層概覽

平臺(tái)層包括軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務(wù)平臺(tái)、AI 能力平臺(tái),為虛擬數(shù)字人的制作及開(kāi)發(fā) 提供技術(shù)能力。建模系統(tǒng)和動(dòng)作捕捉系統(tǒng)通過(guò)產(chǎn)業(yè)鏈上游的傳感器、光學(xué)器件等硬件獲取真人/實(shí)物的各類(lèi)信息,利用軟件算法實(shí)現(xiàn)對(duì)人物的建模、動(dòng)作的重現(xiàn);渲染平臺(tái)用于模型的云端渲染。解決方案平臺(tái)基于自身技術(shù)能力為廣大客戶提供數(shù)字人解決方案。AI 能力平臺(tái)提供計(jì)算機(jī)視覺(jué)、智能語(yǔ)音、自然語(yǔ)言處理技術(shù)能力。平臺(tái)層匯聚的企業(yè)較多,騰訊、百度、搜狗、魔琺科技、相芯科技均有提供相應(yīng)數(shù)字人技術(shù)服務(wù)平臺(tái)。

應(yīng)用層是指虛擬數(shù)字人技術(shù)結(jié)合實(shí)際應(yīng)用場(chǎng)景領(lǐng)域,切入各類(lèi),形成行業(yè)應(yīng)用解決方案, 賦能行業(yè)領(lǐng)域。按照應(yīng)用場(chǎng)景或行業(yè)的不同,已經(jīng)出現(xiàn)了娛樂(lè)型數(shù)字人(如虛擬主播、虛擬偶像)、教育型數(shù)字人(如虛擬教師)、助手型數(shù)字人(如虛擬客服、虛擬導(dǎo)游、智能助手)、影視數(shù)字人(如替身演員或虛擬演員)等。不同外形、不同功能的虛擬數(shù)字人賦能影視、傳媒、游戲、金融、文旅等領(lǐng)域,根據(jù)需求為用戶提供定制化服務(wù)。

▲虛擬數(shù)字人產(chǎn)業(yè)生虛擬數(shù)字人應(yīng)用領(lǐng)域、場(chǎng)景及充當(dāng)角色

虛擬數(shù)字人基礎(chǔ)技術(shù)架構(gòu)包括“五橫兩縱”?!拔鍣M”是指用于數(shù)字人制作、交互的五大技術(shù)模塊,即人物生成、人物表達(dá)、合成顯示、識(shí)別感知、分析決策等模塊。其中,人物生成,即人物建模方面 2D 數(shù)字人較為簡(jiǎn)單,3D 數(shù)字人需要額外使用三維建模技術(shù)。人物表達(dá)包括語(yǔ)音生成和動(dòng)畫(huà)生成。動(dòng)畫(huà)生成則包含驅(qū)動(dòng)和渲染兩大部分?!皟煽v”是指 2D、3D 數(shù)字人,2D 數(shù)字人和 3D 數(shù)字人在技術(shù)架構(gòu)方面基本一致。3D 數(shù)字人需要額外使用三維建模技術(shù)生成數(shù)字形象,信息維度增加,所需的計(jì)算量更大。

建模技術(shù)分為靜態(tài)掃描建模和動(dòng)態(tài)光場(chǎng)重建,目前主流技術(shù)仍為靜態(tài)掃描,相比靜態(tài)重建技術(shù),具有高視覺(jué)保真度的動(dòng)態(tài)光場(chǎng)三維重建技術(shù)不僅可以重建人物的幾何模型,還可一次性獲取動(dòng)態(tài)的人物模型數(shù)據(jù),并高品質(zhì)重現(xiàn)不同視角下觀看人體的光影效果,成為數(shù)字人建模重點(diǎn)發(fā)展方向。

靜態(tài)掃描建模技術(shù)可分為結(jié)構(gòu)光掃描重建和相機(jī)陣列掃描重建,結(jié)構(gòu)光掃描重建掃描時(shí)間長(zhǎng),對(duì)于人體這類(lèi)運(yùn)動(dòng)目標(biāo)在友好度和適應(yīng)性方面都差強(qiáng)人意,更多的應(yīng)用于工業(yè)生產(chǎn)、檢測(cè)領(lǐng)域。相機(jī)陣列掃描重建替代結(jié)構(gòu)光掃描重建克服了以上問(wèn)題成為人物建模主流方式。隨著拍照式相機(jī)陣列掃描重建得到飛速發(fā)展,目前可實(shí)現(xiàn)毫秒級(jí)高速拍照掃描(高性能的相機(jī)陣列精度可達(dá)到亞毫米級(jí)),并成功應(yīng)用于游戲、電影、傳媒等行業(yè)。

▲結(jié)構(gòu)光掃描重建與相機(jī)陣列掃描重建分類(lèi)

國(guó)際上 IR、Ten24 等公司將靜態(tài)重建技術(shù)完全商業(yè)化,服務(wù)于好萊塢大型影視數(shù)字人制作。凌云光近年來(lái)大力發(fā)展立體視覺(jué)并研發(fā)了高精度人體3D建模系統(tǒng)——Human 3D+,其中核心的三維幾何和彩色數(shù)據(jù)采集部分均使用了以佳能專(zhuān)業(yè)鏡頭,配合佳能 SDK 軟件開(kāi)發(fā)包及凌云光專(zhuān)用 3D 建模軟件能快速、清晰成像并高速儲(chǔ)存,自動(dòng)完成高精度人體全身或局部重建,再利用三維動(dòng)畫(huà)制作軟件對(duì)重建結(jié)果進(jìn)行處理,得到高真實(shí)度數(shù)字人物。

動(dòng)態(tài)光場(chǎng)重建是目前世界上最新的深度掃描技術(shù),此技術(shù)可忽略材質(zhì),直接采集三維世界的光線,然后實(shí)時(shí)渲染出真實(shí)的動(dòng)態(tài)表演者模型,為 3D 建模提供更加豐富的圖像信息,它主要包含人體動(dòng)態(tài)三維重建和光場(chǎng)成像兩部分:

▲人體動(dòng)態(tài)三維重建與光場(chǎng)成像的區(qū)別

驅(qū)動(dòng):智能合成,動(dòng)作捕捉遷移成為主流動(dòng)作生產(chǎn)方式。2D、3D 數(shù)字人嘴型動(dòng)作智能合成的底層邏輯類(lèi)似,均建立在輸入文本到輸出音頻與輸出視覺(jué)信息的關(guān)聯(lián)映射。其中 3D 視頻驅(qū)動(dòng)方式為以下三個(gè)步驟:

1)視頻算法訓(xùn)練:對(duì)已采集到的文本到語(yǔ)音和嘴型視頻的數(shù)據(jù)進(jìn)行模型訓(xùn)練,得到一個(gè)輸入任意文本均可驅(qū)動(dòng)嘴型的模型。

2)語(yǔ)音自動(dòng)識(shí)別:對(duì)語(yǔ)音進(jìn)行標(biāo)注,綁定數(shù)據(jù)與動(dòng)作,使得虛擬數(shù)字人對(duì)特定詞語(yǔ)或語(yǔ)境做出相應(yīng)動(dòng)作。

3)動(dòng)捕設(shè)備采集:需真人穿戴動(dòng)捕設(shè)備,動(dòng)捕設(shè)備與真人肢體動(dòng)作相綁定,可實(shí)時(shí)傳遞到虛擬數(shù)字人身上。

通過(guò)將捕捉采集的動(dòng)作遷移至數(shù)字人是目前 3D 數(shù)字人動(dòng)作生成的主要方式,核心技術(shù)是動(dòng)作捕捉。動(dòng)作捕捉是指通過(guò)數(shù)字手段記錄現(xiàn)實(shí)人們的運(yùn)動(dòng)過(guò)程。同時(shí),動(dòng)作捕捉系統(tǒng)根據(jù)實(shí)現(xiàn)原理的不同,可以分成光學(xué)動(dòng)作捕捉、慣性動(dòng)作捕捉、Track 設(shè)備+IK 算法的動(dòng)作捕捉、以人工智能為主的動(dòng)作捕捉方案。現(xiàn)階段,光學(xué)式和慣性式動(dòng)作捕捉占據(jù)主導(dǎo)地位,基于計(jì)算機(jī)視覺(jué)的動(dòng)作捕捉成為聚焦熱點(diǎn)。

渲染:主打 Unreal 和 Unity 渲染引擎,真實(shí)性和實(shí)時(shí)性均大幅提升。當(dāng)通過(guò)不同的設(shè)備記錄下動(dòng)作方案之后,還需通過(guò)渲染引擎,對(duì)毛發(fā)、衣物等細(xì)節(jié)盡量還原。從引擎性能上來(lái)說(shuō),游戲領(lǐng)域的渲染引擎達(dá)到最好的渲染效果。PBR(PhysicallyBased Rendering,基于物理的渲染技術(shù))渲染技術(shù)的進(jìn)步以及重光照等新型渲染技術(shù)的出現(xiàn)使數(shù)字人皮膚紋理變得真實(shí),突破了恐怖谷效應(yīng)。

PBR 是基于真實(shí)物理世界的成像規(guī)律模擬的一類(lèi)渲染技術(shù)的集合,它的關(guān)鍵在于微表面模型和能量守恒計(jì)算,通過(guò)更真實(shí)的反映模型表面反射光線和折射光線的強(qiáng)弱,使得渲染效果突破了塑料感。常見(jiàn)的幾款 3D 引擎,如 Unreal Engine 4, CryEngine 3, Unity 3D5,均有了各自的 PBR 實(shí)現(xiàn)。

02.落地場(chǎng)景豐富,偶像營(yíng)銷(xiāo)或?yàn)橄劝l(fā)賽道

虛擬人及數(shù)字人應(yīng)用領(lǐng)域多元,主力文娛及服務(wù)行業(yè)。在畫(huà)面呈現(xiàn)方式日漸成熟的的基礎(chǔ)下,疊加 5G、算力、AI 等技術(shù)能力的提升,其落地場(chǎng)景日漸豐富。如今不再限于傳統(tǒng)文娛如影視、動(dòng)畫(huà)在人物建模、CG 等方面在虛擬形象塑造的應(yīng)用,還在社交、游戲、辦公等場(chǎng)景實(shí)現(xiàn)了真實(shí)人類(lèi)虛擬化身的身份職能,并逐漸于直播電商、偶像造星、陪伴服務(wù)等AI 虛擬數(shù)字人領(lǐng)域?qū)崿F(xiàn)商業(yè)變現(xiàn)。

1、游戲

中國(guó)游戲產(chǎn)業(yè)處存量博弈階段,角色扮演類(lèi)游戲在市場(chǎng)收入方面居于首位。2021 年中國(guó)游戲市場(chǎng)實(shí)際銷(xiāo)售收入 2965.13 億元,yoy+6.4%。2021 年中國(guó)游戲用戶規(guī)模 6.66 億,yoy+0.22%,用戶數(shù)量漸趨飽和。2021 年中國(guó)移動(dòng)游戲收入排名前 100 位產(chǎn)品中,角色扮演、卡牌、策略三類(lèi)游戲占據(jù)半壁江山,表明了玩家的偏好,以及企業(yè)相對(duì)集中的市場(chǎng)供給;此外,角色扮演、多人在線戰(zhàn)術(shù)競(jìng)技和射擊三類(lèi)游戲占總收入 50%以上,反映這三類(lèi)游戲用戶基數(shù)較大的客觀現(xiàn)實(shí)。

▲中國(guó)游戲整體市場(chǎng)規(guī)模(億元)

▲2021 收入排名前 100 移動(dòng)游戲產(chǎn)品類(lèi)型收入分布

游戲引擎作為虛擬世界的賣(mài)水人,有望破圈助力多行業(yè)數(shù)字人打造。以 Unity,Unreal 兩大游戲引擎為首,游戲引擎的強(qiáng)大性能使得數(shù)字人形象擬真度進(jìn)一步提升。

Unity 的渲染技術(shù) HDRP 是基于可編程渲染管線(SRP)構(gòu)建的,具有完全統(tǒng)一基于物理的渲染以獲得超高的畫(huà)質(zhì)表現(xiàn), HDRP 的設(shè)計(jì)遵循三個(gè)原則:1)渲染基于真實(shí)物理。2)光照統(tǒng)一、連貫。3)功能獨(dú)立于渲染路徑。HDRP 的強(qiáng)大性能讓數(shù)字人得以“逃離”恐怖谷,以更接近真人的狀態(tài)呈現(xiàn)在大眾面前。

2、偶像造星

虛擬偶像市場(chǎng)高速增長(zhǎng),帶動(dòng)衍生產(chǎn)業(yè)空間廣闊。據(jù)艾媒咨詢,2020 年中國(guó)虛擬偶像核心產(chǎn)業(yè)規(guī)模為 34.6 億元,yoy+70.3%,預(yù)計(jì) 2021 年將達(dá)到 62.2 億元;另一方面,隨著商業(yè)價(jià)值被不斷發(fā)掘,越來(lái)越多產(chǎn)業(yè)與虛擬偶像聯(lián)系在一起,虛擬偶像帶動(dòng)產(chǎn)業(yè)規(guī)模 2020 年 達(dá) 645.6 億元,預(yù)計(jì) 2021 年達(dá) 1074.9 億元。同時(shí)八成以上網(wǎng)民有追星行為,其中喜歡虛擬偶像的網(wǎng)民占 63.6%,根據(jù)粉絲需求策劃的偶像,能最大程度滿足粉絲的想象,有利于積累更龐大的粉絲群體。

▲2017-2023 年中國(guó)虛擬偶像核心市場(chǎng)和帶動(dòng)市場(chǎng)規(guī)模及預(yù)測(cè)

用戶對(duì)虛擬偶像付費(fèi)意愿較強(qiáng),周邊產(chǎn)品豐富帶動(dòng)變現(xiàn)能力。據(jù)艾媒咨詢,八成網(wǎng)民為虛擬偶像每月花費(fèi)在 1000 元以內(nèi),且 37.6%的網(wǎng)民表示愿意花更多的錢(qián)支持虛擬偶像。隨著虛擬偶像產(chǎn)業(yè)的延伸業(yè)態(tài)不斷發(fā)展,手辦、唱片等產(chǎn)品已經(jīng)成為了虛擬偶像流量變現(xiàn)的重要渠道,粉絲愿意花費(fèi)更多的金錢(qián)和精力去支持虛擬偶像。

虛擬偶像早期隨二次元文化滲透,國(guó)產(chǎn) VUP 直播崛起。早期具有代表性的虛擬偶像包括以初音未來(lái)、洛天依為代表的虛擬歌姬(VSinger),此外還有主要在 YouTube、B 站開(kāi)展活動(dòng)的虛擬主播(VTuber/VUP)。

20 年前,B 站虛擬直播區(qū)基本都被日系 VTuber 占領(lǐng),而隨著中國(guó) VUP 的崛起,據(jù) CEO 陳睿,截至 21 年 6 月,B 站擁有 3.2 萬(wàn)位 VUP,每月有約4000 多個(gè)虛擬主播開(kāi)播。據(jù) darkflame,20 年 B 站 VUP 總收入約 1.8 億元,21 年至今(截至 11 月 21 日)已達(dá) 4.5 億元,是去年全年的 2.5 倍。

分季度看,21Q3VUP 直播收入近 1.5億元,月付費(fèi)人數(shù)提升至約 30 萬(wàn)人。目前頭部 VUP 每月的直播收入在 50-200 萬(wàn)元不等,20 年全球收入最高 VTuber 收入約 1.5 億日元(約 840 萬(wàn)元),已被 VUP 全面趕上。從專(zhuān)業(yè)機(jī)構(gòu)來(lái)看,VirtualReal 和 A-SOUL 兩個(gè)專(zhuān)業(yè)化程度較高的機(jī)構(gòu)一直占據(jù)收入榜首位。

互聯(lián)網(wǎng)大廠青睞虛擬藝人領(lǐng)域,破圈走向主流文化已是大勢(shì)所趨。大廠布局分為兩類(lèi):1)推出技術(shù)平臺(tái)。2)搭建虛擬藝人的商業(yè)場(chǎng)景。

▲互聯(lián)網(wǎng)公司虛擬藝人行業(yè)布局

3、品牌營(yíng)銷(xiāo)

虛擬代言人市場(chǎng)空間充足,商業(yè)價(jià)值釋放領(lǐng)域多元。虛擬代言人可劃分為兩種類(lèi)型:1)品牌自主打造符合自身特性的虛擬代言人。2)品牌與外部團(tuán)隊(duì)商業(yè)合作,外部團(tuán)隊(duì)基于技術(shù)引擎開(kāi)發(fā)具有高擬真人類(lèi)形態(tài)的虛擬形象,并獨(dú)立運(yùn)營(yíng)。

虛擬數(shù)字人商業(yè)價(jià)值集中于:1)社交賬號(hào)潛力無(wú)限。大部分虛擬數(shù)字人的注冊(cè)時(shí)間集中于 2020-2021 年,雖然時(shí)間較短,但是部分賬號(hào)漲粉迅速。同時(shí)在微博上,百萬(wàn)粉絲量級(jí)的虛擬數(shù)字人 KOL 較少,仍有流量洼地可供挖掘。

2)活躍在社交平臺(tái)累積用戶粘性。虛擬數(shù)字人賬號(hào)在社交平臺(tái)上的活躍,通過(guò)抽獎(jiǎng)、科普、安利等多種形式和用戶進(jìn)行高頻互動(dòng),共創(chuàng)內(nèi)容。

3)多種方式釋放商業(yè)價(jià)值。虛擬數(shù)字人可以通過(guò)數(shù)字化、科技化、大數(shù)據(jù)為一體的諸多功能屬性,進(jìn)行與真人一樣的品牌營(yíng)銷(xiāo)模式。視頻大片、直播連線、聯(lián)名產(chǎn)品、封面雜志、產(chǎn)品上身等。為粉絲帶去更具想象并貼近完美的營(yíng)銷(xiāo)場(chǎng)景,釋放更多商業(yè)價(jià)值。

虛擬代言人深度洞察 Z 世代消費(fèi)新需求、助力品牌破圈。品牌打造符合自身文化和品牌調(diào)性的虛擬形象代言人,成為與年輕人建立溝通的突破口。從屈臣氏推出首位虛擬偶像代言人屈晨曦 Wilson 拉進(jìn)與年輕人距離,王者榮耀借勢(shì)時(shí)下最流行電競(jìng)虛擬男團(tuán)“無(wú)限王者團(tuán)”全面打開(kāi)社交屬性,到歐萊雅推出首位虛擬代言人“M 姐”迎合年輕人走進(jìn)圈層,花西子推出首個(gè)品牌虛擬形象“花西子“引領(lǐng)國(guó)貨新風(fēng)尚,虛擬形象代言人正幫助品牌迅速吸引年輕人的注意力,助力品牌俘獲更多的目標(biāo)用戶。

4、社交

數(shù)字人為次世代社交重要象征,用戶對(duì)個(gè)性化社交虛擬化身需求提升。次世代社交指的是一個(gè)與現(xiàn)實(shí)平行、實(shí)時(shí)在線的虛擬世界,用戶可以憑借自己的虛擬化身,并基于自己的興趣圖譜或推薦,體驗(yàn)多樣的沉浸式社交場(chǎng)景,在接近真實(shí)的共同體驗(yàn)中一起交流、娛樂(lè),最終找到志同道合的伙伴、建立社交連接。

▲數(shù)字人社交代表產(chǎn)品

5、影視

數(shù)字人于影視行業(yè)成熟運(yùn)用,計(jì)算機(jī)化虛擬動(dòng)捕已成為電影主流特效。技術(shù)發(fā)展并非一蹴而就, 而由大量技術(shù)突破和創(chuàng)作實(shí)踐積累疊加而成。通過(guò)觀察影史中虛擬形象的典型應(yīng)用案例,我們將虛擬動(dòng)捕技術(shù)概括為影史中的四個(gè)不同發(fā)展階段:萌芽期(1990-1999)、起步期(2000-2006)、成熟期(2006-2015)、新時(shí)期(2016-至今)。

▲電影史上虛擬數(shù)字人動(dòng)捕技術(shù)發(fā)展沿革

03.國(guó)內(nèi)外巨頭布局

國(guó)內(nèi)廠商在產(chǎn)業(yè)鏈基礎(chǔ)層、平臺(tái)層和應(yīng)用層發(fā)展較為均衡,虛擬數(shù)字人從開(kāi)發(fā)到落地的體 系逐漸趨于完整?;A(chǔ)層相關(guān)廠商主要著力點(diǎn)在人工智能、動(dòng)作捕捉、建模渲染以及虛擬數(shù)字人的技術(shù)服務(wù)??拼笥嶏w、捷成股份、新華網(wǎng)、標(biāo)貝科技、追一科技和小冰等專(zhuān)注人工智能,云舶科技專(zhuān)研動(dòng)作捕捉,環(huán)球墨非、億真科技、虛谷未來(lái)科技、半人貓、疊鏡數(shù)字、相芯科技以及 Tatame 等專(zhuān)注建模渲染,中科深智、魔琺科技和萬(wàn)像文化等負(fù)責(zé)虛擬數(shù)字人的技術(shù)服務(wù)。

產(chǎn)業(yè)鏈平臺(tái)層建設(shè)為虛擬數(shù)字人運(yùn)營(yíng),主要包括虛擬數(shù)字人的外觀設(shè)計(jì)、包裝、宣傳、落地和培養(yǎng),相關(guān)企業(yè)有上海禾念、樂(lè)華娛樂(lè)、動(dòng)圖宇宙、次世文化、創(chuàng)壹視頻、虛擬影業(yè)、魔塔時(shí)空和世悅星承等。應(yīng)用層主要投入在游戲、直播、動(dòng)畫(huà)、影視、音樂(lè)以及社交平臺(tái)等,應(yīng)用于娛樂(lè)和營(yíng)銷(xiāo)。騰訊音樂(lè)、芒果超媒、奧飛娛樂(lè)和嗶哩嗶哩等將虛擬主播和虛擬偶像等應(yīng)用于娛樂(lè)內(nèi)容。

藍(lán)色光標(biāo)、浙文互聯(lián)、引力傳媒、星期六(遙望網(wǎng)絡(luò))、華揚(yáng)聯(lián)眾和天下秀等已推出或籌備推出虛擬 IP 形象,著重廣告營(yíng)銷(xiāo),星期六(遙望網(wǎng)絡(luò))預(yù)計(jì)推出虛擬數(shù)字人與真人的互動(dòng)直播。中國(guó)移動(dòng)、阿里巴巴、騰訊、百度、網(wǎng)易等綜合型廠商支持旗下相關(guān)公司或事業(yè)部向虛擬數(shù)字人賽道發(fā)力。

▲國(guó)內(nèi)廠商-全鏈條

海外廠商主要聚焦于產(chǎn)業(yè)鏈基礎(chǔ)層的建設(shè),因起步較早,綜合實(shí)力強(qiáng)于國(guó)內(nèi)廠商。在技術(shù)領(lǐng)域方面,有一部分海外廠商如 Intel、Microsoft、Google 以及 Meta(Facebook)這類(lèi)綜合型廠商提供全棧式的技術(shù)服務(wù)。也有一部分海外廠商從不同的技術(shù)細(xì)分上發(fā)力,其中包括人工智能,渲染建模,動(dòng)作捕捉以及 VRAR 的應(yīng)用等。在 AI 虛擬形象生成技術(shù)廠商中,主要有 Soul-Machine、Oben 以及 Loom.ai 等廠商提供個(gè)性化的人機(jī)交互系統(tǒng)來(lái)強(qiáng)調(diào)擬人化的情緒帶來(lái)的商業(yè)價(jià)值的提升。

在渲染建模方面,主要海外廠商有 Epic Games、Unity 以及 NVIDIA 等。其開(kāi)發(fā)的引擎 Unreal engine、Unity 以及 NVIDIA Omniverse 提供了 3D 實(shí)時(shí)模擬和協(xié)作的工具和平臺(tái)。關(guān)于動(dòng)態(tài)捕捉的海外廠商有關(guān)注光學(xué)動(dòng)態(tài)捕捉技術(shù)的 VICON、Motion Analysis、Opti Track,以及關(guān)注慣性動(dòng)作捕捉技術(shù)的 Xsens 等。在 VRAR 方面,主要有 Wave 和 Stageverse 這樣的海外廠商使用 VRAR 技術(shù)向用戶提供虛擬服務(wù)的平臺(tái)以及應(yīng)用程序。

智東西認(rèn)為,數(shù)字人是元宇宙基礎(chǔ)交互單元,將為元宇宙和物理世界交互提供基礎(chǔ)技術(shù)支持;數(shù)字人是虛擬化身,幫助物理世界的每個(gè)個(gè)體建立元宇宙數(shù)字形象。從某種程度上說(shuō),虛擬數(shù)字人是元宇宙的一個(gè)分支,元宇宙的發(fā)展拉動(dòng)了數(shù)字人等虛擬產(chǎn)業(yè)的火爆,從長(zhǎng)線來(lái)看,這些產(chǎn)業(yè)代表著科技主導(dǎo)下未來(lái)的發(fā)展方向之一。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。