文 | 市值榜 王玲
編輯 | 祝彰
1985年,英國卡爾頓電視臺第四頻道決定推出一檔自己的音樂視頻節(jié)目,但在當時的英國,類似的節(jié)目層出不窮,新節(jié)目要想快速受到歡迎,并不容易。
導演洛基·莫頓主導的團隊想出了一個新辦法:在主持人身上做文章。
接下來節(jié)目播出時,出現(xiàn)在電視機屏幕里的,是穿著深色西裝,通常會搭配一個太陽鏡的“AI主持人”Max Headroom。
后來,外界把Max Headroom稱為“第一位計算機生成的電視節(jié)目主持人”。
不過,這個所謂的“AI主持人”其實是個假AI,當時的計算技術(shù)還不夠先進,全運動、語音同步的人頭無法用于電視連續(xù)劇。因此除了角色的宣傳之外,Max Headroom的真實形象并不是電腦生成的,而是由真人演員扮演,為了拍攝要經(jīng)歷長達四個半小時的化妝。
時隔近40年后,比Max Headroom更先進的虛擬人開始大范圍進入大眾的視野。
這一次可是貨真價實的虛擬人,他們可以直播帶貨、可以像人工客服那樣與人對話、也可以像明星那樣登臺表演。
隨著越來越多的虛擬人開始出現(xiàn),這門新興產(chǎn)業(yè)也迎來了一輪爆發(fā)性增長,入局的公司越來越多,他們對商業(yè)模式的探索也越來越清晰。
這篇文章,我們將重點探討:虛擬人到底是一門怎樣的產(chǎn)業(yè)?它的技術(shù)壁壘高不高?又憑什么賺錢?
一、進化:虛擬人是如何越來越像人的?
Max Headroom誕生于虛擬人萌芽階段,同期還出現(xiàn)了世界首位虛擬歌姬林明美。
只不過,在1980年代,這些虛擬人的擬人化程度很低,主要依靠手繪制作,僅僅是在外形上實現(xiàn)了對人類的模仿。
2000年以后,CG(計算機動畫)、動作捕捉等技術(shù)不斷革新,逐漸替代了早期手繪制作的方式。比如2001年上映的《指環(huán)王》中咕嚕角色,便是由CG和動作捕捉技術(shù)創(chuàng)造出來的。
這一時期,出現(xiàn)了第一個現(xiàn)象級的虛擬數(shù)字人:初音未來,一個3D虛擬偶像。
初音未來其實是一款歌曲合成軟件,當時Crypton Future Media以雅馬哈的Vocaloid系列語音合成程序為基礎,開發(fā)了音源庫,并以此制作、發(fā)售了虛擬歌姬角色主場系列。
后來2012年出道的中國內(nèi)地女虛擬歌手“洛天依”,同樣是以雅馬哈公司的Vocaloid3語音合成引擎為基礎,制作的虛擬偶像。
但不論是“初音未來”還是“洛天依”,距離我們現(xiàn)在看到的虛擬人都還很遠,因為即便有了CG、動作捕捉等關鍵技術(shù)的加持,但他們還是無法實現(xiàn)一個最重要的功能:與人交互,也就是說,虛擬偶像沒有人格化。
直到2016年以后,虛擬人才開始變得越來越像“人”。
這一年,谷歌AlphaGo戰(zhàn)勝圍棋冠軍李世石,成為第一個擊敗職業(yè)九段的計算機圍棋,人工智能開始走入公眾視野。
語音識別、自然語音處理、語音合成、語音驅(qū)動面部動畫等技術(shù)、以及深度學習算法上的突破,為虛擬人的發(fā)展提供了技術(shù)支撐。
簡單來說,以前要生成一個虛擬人,可能需要動畫師、建模師將人物形象一筆一筆、一幀一幀畫出來,完成原畫建模之后,再通過實時渲染、真人動作捕捉等技術(shù)才能夠?qū)崿F(xiàn),其中耗費的時間成本及資金成本都比較高,主要用在影視娛樂行業(yè),比如數(shù)字替身。
但AI技術(shù)發(fā)展起來后,需求方可以直接利用AI來完成形象建模與后續(xù)的驅(qū)動、渲染,或者最初的形象建??咳斯?,后續(xù)的驅(qū)動靠AI來完成,在擬人化程度不斷提高的同時,也在很大程度上簡化了制作流程、降低了制作成本。
比如2021年初,虛幻引擎的開發(fā)商Epic Games發(fā)布可生成高保真角色形象的工具Metahuman Creator,基于預先制作的高品質(zhì)人臉素材庫,允許用戶以自動混合、手動調(diào)節(jié)的方式來快速生成虛擬人,小團隊也可以借助這一工具快速生成自己的作品主角。
這一時期,我們看到的虛擬人形象,便是常駐主持人陣營的“小漾”、可以作詩作曲的清華大學虛擬學生“華智冰”、新晉帶貨達人“AYAYI”了。
二、產(chǎn)業(yè):誰在做虛擬人?
去年,“元宇宙”的概念大火,帶火了虛擬人。AYAYI、艾靈、華智冰、小諍、小漾、柳夜熙等眾多虛擬人被推出。
緊接著,行業(yè)掀起了一股投資熱潮。
開源證券在一份研報中指出,僅在2021年下半年,就有近20家相關企業(yè)完成了融資,包括IDG資本、紅杉中國、順為資本等明星投資機構(gòu)。
不過,虛擬人受到廣泛歡迎并非只因為“元宇宙”的推動,如我們上文所述,AI和深度學習等技術(shù)的突破在很大程度上降低了虛擬人的制作門檻,所以技術(shù)進步,才是虛擬人火爆起來的根本推力。
尤其對完全依靠AI驅(qū)動的虛擬人而言,最后呈現(xiàn)出來的效果,受到語音識別(ASR)、自然語言處理(NLP)、語音合成(TTS)、語音驅(qū)動面部動畫(ADFA)等技術(shù)的共同影響。
換言之,只有具備了以上幾個技術(shù)要素,一個虛擬人才能夠看得見、聽得懂、會思考、能回答、能呈現(xiàn)。
因此,想切入這一行業(yè)的玩家,需要具備以上某項或者幾項上的技術(shù)能力。
當前數(shù)字虛擬人產(chǎn)業(yè)鏈分為三層:
基礎層:主要提供建模/渲染引擎等基礎硬件和軟件。
數(shù)字虛擬人視覺制作部分的工業(yè)化流程,涵蓋了建模、骨骼綁定、動捕、面捕、渲染、材質(zhì)解算等各個環(huán)節(jié),需要用到顯示設備、光學器件、傳感器等硬件產(chǎn)品,建模綁定、渲染引擎等軟件產(chǎn)品。
這一層做得比較好的大多數(shù)是外國公司,比如大家熟知的《王者榮耀》《原神》,就是基于美國Unity公司的渲染引擎創(chuàng)作出來的。
平臺層:提供軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務平臺和AI能力平臺。
入局的中國企業(yè)大多數(shù)位于這一層。比如AI四小龍商湯、云從、依圖和曠視,比如在語音識別領域做得比較好的科大訊飛。
還需要特別關注的是百度、騰訊、阿里等頭部綜合大廠,他們基于自身在底層技術(shù)、硬件架構(gòu)上的沉淀,在產(chǎn)業(yè)鏈布局時會相對全面,往往會提供相應的數(shù)字人技術(shù)服務平臺,以及面向不同行業(yè)的解決方案。
比如網(wǎng)易的伏羲,能夠提供游戲行業(yè)解決方案、空間智能互動解決方案、文旅虛擬代言人解決方案等等;
比如阿里有一個用在電商上的AI虛擬模特塔璣,商家只需要上傳一張商品的平鋪圖,就可以生成模特的實拍圖;
比如百度智能云推出了智能數(shù)字人平臺曦靈,致力于打造智能的服務型&演藝型數(shù)字人,還推出了基于終端實時渲染的虛擬形象智能交互解決方案。
應用層:虛擬人所應用的各個場景。
比如,相對比較成熟的影視、傳媒和游戲領域,以及金融、文旅等,這也是數(shù)字虛擬人實現(xiàn)商業(yè)化的重要途徑。
三、價值:虛擬人靠什么商業(yè)化?
隨著虛擬人的不斷出現(xiàn),外界對這一產(chǎn)業(yè)的市場前景,給出了較為樂觀的預測。
量子位在《數(shù)字虛擬人深度產(chǎn)業(yè)報告》中預測,到2030年,我國數(shù)字虛擬人整體市場規(guī)模將達到2700億元。
樂觀預期背后,首先需要理解的一點是,虛擬人到底能帶來哪些價值?這決定著這個行業(yè)的天花板,以及產(chǎn)業(yè)鏈相關參與方如何商業(yè)化。
從應用層來看,當前主流的虛擬人可以分為兩種類型:服務型虛擬人和身份型虛擬人。前者主要用于代替真人服務,是現(xiàn)實世界中服務型角色的虛擬代表;后者多為虛擬IP/偶像,意在推動虛擬內(nèi)容的生產(chǎn),也可以是虛擬世界里用戶的第二分身。
舉例說明,拿下萬科優(yōu)秀新人獎的員工“崔筱盼”、浦發(fā)銀行的數(shù)字員工“小浦”,都是服務型虛擬人,他們的出現(xiàn),是要能實打?qū)嵉貛椭狡髽I(yè);而樂華娛樂的虛擬偶像團體“A-soul”、靠短視頻火起來的柳夜熙、與周深一起登臺演唱的“鄧麗君”,都是身份型虛擬人。
具體到應用場景、商業(yè)模式上,這兩類虛擬人有著較大區(qū)別。
服務型虛擬人更多面向to B市場,更重要的是如何通過AI來為企業(yè)賦能,經(jīng)濟效益不在于直接創(chuàng)造增量收入,而是降低人力成本。網(wǎng)易伏羲營銷負責人湯銀辰就曾公開表示,虛擬人本質(zhì)上的邏輯是降本增效,讓AI更好地服務于人類。
因為現(xiàn)實中有很多簡單、重復的工作,是可以被虛擬人所替代的,并且AI犯錯的幾率比真人員工還要小,還不受空間、時間的限制。
對入局的企業(yè)來說,他們可以向外提供成熟的服務型虛擬人、可以提供某項或多項技術(shù),也可以為不同行業(yè)提供個性化的定制方案與服務。
這考驗的公司底層的AI實力。
比如百度打造的首個可交互虛擬偶像度曉曉,她聚合了百度在多模態(tài)交互、3D數(shù)字人建模、機器翻譯、語音識別、自然語言理解等多項技術(shù)上的能力,甚至能在高考語文作文中拿下高分,創(chuàng)作的畫作還能參加西安美術(shù)學院畢業(yè)展。
身份型虛擬人更多面向的是to C市場,目前主要集中在游戲、傳媒領域,變現(xiàn)模式以打造虛擬偶像或虛擬IP為主,先擴大C端的粉絲流量,再通過流量進行變現(xiàn)。
比如,AYAYI在小紅書亮相1個月后,就相繼與嬌蘭、保時捷等國際大牌達成了合作,2021年9月成為阿里巴巴的首個數(shù)字人員工,擔任天貓超級品牌日的數(shù)字主理人;虛擬人翎 Ling同樣成為商業(yè)寵兒,與VOGUE、奈雪的茶、特斯拉、樂町、KEEP 等品牌進行了跨界合作。
也就是說,身份型的虛擬人,商業(yè)模式的核心是粉絲經(jīng)濟,類似于真人明星,通過品牌推廣、代言、參演節(jié)目、直播打賞、發(fā)布音樂專輯、售賣周邊等方式進行變現(xiàn),特點是能夠帶來較高的收入增量。
樂華娛樂的泛娛樂業(yè)務收入從2020年的2110萬元增長至2021年的3790萬元,主要原因便是虛擬藝人組合A—SOUL的商業(yè)發(fā)展產(chǎn)生的收益,安信證券預計,A-SOUL貢獻了約1700萬的增量收入。
但這類虛擬人的要求也會相對較高,如何打造出一個一線的虛擬偶像,并且確保它能長期留在一線,本來就非易事,這考驗的,其實是品牌對IP、內(nèi)容的長期運營能力。
從更宏觀的全球視角來看,在這一層面,中國是落后歐美的,畢竟,有太多中國企業(yè)都想成為迪士尼,但他們最終都漸行漸遠。
原因在于,與國外成熟的IP運營體系相比,國內(nèi)文娛公司雖然已經(jīng)有了IP的構(gòu)建意識,但是IP持續(xù)更新與運營能力有所欠缺。
虛擬人產(chǎn)業(yè)是一次實現(xiàn)追趕乃至反超的機會,但已經(jīng)處在或者即將進入這一產(chǎn)業(yè)的公司需要想好,要短期的利益還是長期的數(shù)字資產(chǎn),在新一輪的IP孵化與商業(yè)化機會面前,這很可能會決定他們能在這個行業(yè)走多遠。