文|螳螂觀察 青月
元宇宙的第二年,開始經(jīng)歷“冰火兩重天”。
一邊是關于元宇宙的搶人大戰(zhàn)愈演愈烈,比如網(wǎng)易為了招聘建造師、捏臉師等緊缺崗位,開出了百萬起步的年薪,但同時又有一些像影創(chuàng)科技這樣的小企業(yè),在蹭了一波元宇宙的熱度后,實力跟不上,結(jié)果被爆出被曝大規(guī)模、長時間欠薪,員工大量離職。
另一邊,今年以來,元宇宙已經(jīng)得到了多地政府的重視,成為產(chǎn)業(yè)發(fā)展布局的重點,比如河南省、上海市寶山區(qū)、山東省青島市南區(qū)等地都在近期相繼發(fā)布了元宇宙及相關產(chǎn)業(yè)的行動計劃和發(fā)展政策,可Meta作為最早開始布局元宇宙的企業(yè)之一,旗下的虛擬社交平臺Horizon Worlds卻在近日被爆出月活遠低于目標預期。
顯然,如果將一個概念的落地過程劃分成多個節(jié)點,那么元宇宙應當還處在由“發(fā)展期”向“成熟期”過渡的過程,未來還需要繼續(xù)試錯與磨合。不過,作為元宇宙的重要組成部分,當前,虛擬數(shù)字人的理論和技術正在日益成熟、產(chǎn)業(yè)逐步形成、相應的商業(yè)模式也在持續(xù)演進和多元化。
大廠“卷”進“工業(yè)級”虛擬數(shù)字人
通俗來說,虛擬數(shù)字人是虛擬人和數(shù)字人的集合,基于真人數(shù)據(jù)打造的叫數(shù)字人,基于非真人數(shù)據(jù)打造的叫虛擬人。
然而,不管是虛擬人還是數(shù)字人,由于其同時具備了近人的外表以及高度交互能力,所以這兩年也開始被視為元宇宙的“發(fā)展基礎”。這很好理解,如果將元宇宙看作一個大型MMORPG游戲,虛擬人就像是游戲中的NPC,而數(shù)字人則更像是玩家本身,沒有了NPC和玩家的MMORPG也就沒有了“靈魂”。
在對虛擬數(shù)字人進行探索時,海內(nèi)外互聯(lián)網(wǎng)巨頭最先在“工業(yè)級”虛擬數(shù)字人方向上取得了一些突破。所謂“工業(yè)級”虛擬數(shù)字人,在「螳螂觀察」看來,它們的需求直接來源于具體的行業(yè),對功能有著精準的定位,且產(chǎn)品和服務主要面向于企業(yè)。以直播行業(yè)為例,零門檻、低成本的數(shù)字人直播不僅可以幫助企業(yè)降本增效,在可控性、可編程性和標準化等方面也具有優(yōu)勢,企業(yè)不用擔心“翻車”,品牌IP自身的風險降至最低。
有需求就有市場,就最近兩個月的動作來看,在國內(nèi),百度智能云曦靈在杭州舉辦新品發(fā)布會,重磅推出兩大SaaS平臺“數(shù)字明星運營平臺1.0”及“數(shù)字人直播平臺2.0”;抖音旗下北京火山引擎的“虛擬數(shù)字人應用平臺”軟件著作權獲得登記批準,除此之外,快手、騰訊、嗶哩嗶哩等多家互聯(lián)網(wǎng)公司也在抓緊推出虛擬人生產(chǎn)平臺。
基于在建模、渲染領域的優(yōu)勢,國外科技公司在虛擬數(shù)字人方向上更快取得了突破性進展。比如英偉達首席執(zhí)行官黃仁勛的一段公開演講視頻中出現(xiàn)了數(shù)字人替身,雖然僅僅只有14秒,但逼真程度足以亂真;在今年的Meta Connect大會2022上,Meta打造了新的賬戶中心,其虛擬數(shù)字人設定不僅可以在任意的APP和終端平臺上遷移,并且Meta的虛擬數(shù)字人在形象細節(jié)上也得到了進一步完善。
除了在這些海內(nèi)外數(shù)一數(shù)二的互聯(lián)網(wǎng)巨頭外,天眼查數(shù)據(jù)顯示,我國現(xiàn)有“虛擬人”“數(shù)字人”相關企業(yè)28.8萬余家,并且光在2021年,虛擬人相關企業(yè)融資共有2843起,融資總金額為2540億元,甚至包括紅杉、IDG、順為資本等在內(nèi)的一線基金。
可以預見到的是,未來隨著元宇宙從發(fā)展期向成熟期轉(zhuǎn)變,虛擬數(shù)字人也會不斷進化,形象將越來越逼真,應用的范圍會越來越廣,商業(yè)價值也將持續(xù)提升,目前海內(nèi)外巨頭已經(jīng)“卷進”了“工業(yè)級”虛擬數(shù)字人浪潮中,但這并不是終點。
“消費級”虛擬數(shù)字人是“最優(yōu)解”還是退而求其次?
基于數(shù)字人可以與多元場景完美結(jié)合大力提升沉浸性和互動性意義,使得誰最先從虛擬數(shù)字人的探索中取得成績,誰就有可能嘗鮮元宇宙這塊“蛋糕”。
可是必須承認的是,在百度、字節(jié)、騰訊、英偉達、Meta等海內(nèi)外大廠的“努力”下,“工業(yè)級”虛擬數(shù)字人已經(jīng)逐漸滲透了營銷、政務、銀行、地產(chǎn)、電商等各個領域。面對“工業(yè)級”虛擬數(shù)字人里的“飽和”與“內(nèi)卷”,部分企業(yè)開始盯上“消費級”虛擬數(shù)字人。
「螳螂觀察」認為,“消費級”虛擬數(shù)字人以消費和娛樂的目的為主,比如“消費級”無人機主要用來拍照,而“消費級”虛擬數(shù)字人旨在讓每一個消費者都能擁有自己的“數(shù)字分身”。
截至目前,在“消費級”虛擬數(shù)字人領域取得了一些成績的企業(yè)大致可以分為兩種,一類是以百度、字節(jié)、天下秀為代表,已經(jīng)或者正在搭建實時互動社區(qū)的互聯(lián)網(wǎng)公司。
比如百度的“希壤”、天下秀的“虹宇宙”以及字節(jié)跳動還在測試中的“派對島”,這三個產(chǎn)品都屬于“模擬元宇宙”的線上實時互動社區(qū),在這里每一個用戶都有自己的虛擬形象化身,可以一起實時聊天互動,共同參與線上活動。
另一類則是優(yōu)鏈時代、影眸科技這樣的初創(chuàng)公司,他們在“工業(yè)級”虛擬數(shù)字人已經(jīng)取得了一些突破,比如影眸科技與Unity、騰訊、字節(jié)等公司已有合作,今年8月,還和本壹數(shù)娛及凌迪Style3D共同研發(fā)了一款超寫實數(shù)字人。
杭州優(yōu)鏈時代科技有限公司創(chuàng)始人兼CEO蔣亞洪博士對「螳螂觀察」介紹,公司今年4月份才開始做商業(yè)化,優(yōu)鏈3D云陣相機已經(jīng)應用在科研教學、品牌推廣、游戲娛樂、城市生活和文博旅游等多個行業(yè)和商業(yè)場景中,并且和中國移動、中南卡通、知名汽車品牌、知名旅游景區(qū)等多個中大型企業(yè)達成了合作,其“元宇宙數(shù)字人技術在亞運會的落地應用” 還成功入選杭州科技局亞運會智能應用項目。
在這部分企業(yè)的規(guī)劃中,“消費級”虛擬數(shù)字人都是重點方向,「界面新聞」報道,影眸科技CEO吳迪指出,隨著技術的發(fā)展,制作數(shù)字人的效率會更高、成本會更低,終極目標是把數(shù)字人打造成每一個C端用戶接入元宇宙的入口,成為每個人的元宇宙身份系統(tǒng)。
針對“消費級”虛擬數(shù)字人,優(yōu)鏈時代的動作相對更快一些,今年3月,就發(fā)布了“優(yōu)鏈3D云陣相機”。
蔣亞洪介紹,這款產(chǎn)品不同于傳統(tǒng)的單反相機陣列,而是通過使用普通手機攝像頭和自主研發(fā)的數(shù)字人引擎技術,把單個數(shù)字人的成本壓縮到了100元,獲取人體3D數(shù)據(jù)的時間只需要1秒,最快5分鐘可以完成創(chuàng)建3D人體數(shù)字模型。
就目前的行業(yè)發(fā)展來看,“工業(yè)級”虛擬數(shù)字人顯然比“消費級”虛擬數(shù)字人更成熟,但這并不意味著“工業(yè)級”的含金量就高于“消費級”,只能說明至少在現(xiàn)階段,“工業(yè)級”虛擬數(shù)字人能更好的平衡成本與收益。
“數(shù)字人自由”會由“消費級”虛擬數(shù)字人最先實現(xiàn)?
IDC報告認為,當前數(shù)字人大多處于L1~L3階段,即依賴算法驅(qū)動肢體、姿態(tài)、口型、表情等,數(shù)字人可執(zhí)行簡單的決策和操作。未來數(shù)字人將實現(xiàn)L4~L5水平,由數(shù)字人自主進行決策、執(zhí)行任務,完全實現(xiàn)智能化交互。
那么“數(shù)字人自由”想要真正意義上實現(xiàn)規(guī)?;涞兀肮I(yè)級”虛擬數(shù)字人和“消費級”虛擬數(shù)字人哪一個機會更大?
“工業(yè)級”虛擬數(shù)字人由于面向行業(yè),且對具體功能有著明確的需求,所以在技術、人才、成本三方面的要求都更高。中國人工智能學會專家委員郭濤表示,“引領數(shù)字人行業(yè)發(fā)展的多模態(tài)融合交互技術、AI深度的場景理解技術等關鍵核心技術還尚在摸索中,技術不成熟影響虛擬數(shù)字人行業(yè)的快速落地應用和商業(yè)化變現(xiàn)的步伐。”
“工業(yè)級”虛擬數(shù)字人還在經(jīng)歷漫長的技術爬坡期,也就造成了人才方面,市場難以供給,且制作周期較長、制作成本高昂,天風證券公開研報顯示,在基礎層方面,虛擬數(shù)字人需要基礎軟硬件為其提供支撐,硬件包括顯示設備、光學器件、傳感器、芯片等,基礎軟件包括建模軟件、驅(qū)動軟件,渲染引擎。
公開數(shù)據(jù)顯示,設計一個虛擬偶像形象花費10萬元至100萬元,而后續(xù)的內(nèi)容制作和智能驅(qū)動則需一年200萬元到500萬元的持續(xù)性投入。以柳夜熙為例,其制作團隊曾表示,在推出柳夜熙之前的半年多以來,研發(fā)成本、人員成本、技術成本等投入約在百萬元級別。這樣的高成本投入,顯然也將進一步制約“工業(yè)級”虛擬數(shù)字人的發(fā)展。
相對于“工業(yè)級”虛擬數(shù)字人需要的高端技術和專精人才,“消費級”虛擬數(shù)字人重點落在消費和娛樂上,能聽、能說、能理解、能互動就已經(jīng)滿足了大部分用戶的需求。
所以在追求“數(shù)字人自由”上,“消費級”虛擬數(shù)字人顯然進度更快一些,比如優(yōu)鏈時代的3D云陣相機,通過使用普通手機攝像頭和自主研發(fā)的數(shù)字人引擎技術,就已經(jīng)把單個數(shù)字人的成本壓縮到了100元。除此之外,在人工智能、AR/VR、圖形圖像、區(qū)塊鏈等“消費級”虛擬數(shù)字人需要涉及的領域,這兩年我國也已經(jīng)有了一定的人才積淀。
總而言之,如果是從技術、成本和人才的角度來看,“數(shù)字人自由”或許會先由“消費級”虛擬數(shù)字人實現(xiàn),但清博智能專家王蕓也曾表示,“目前大多數(shù)字人僅能進行簡單的決策,而無法達到完全智能化交互”,也就是說,即使“數(shù)字人自由”初步實現(xiàn)了,也僅能滿足一些追求新鮮感的用戶的獵奇心理,想要從更高維度讓普通人都能擁有一款高度智能、形象逼真的“數(shù)字人”,“消費級”虛擬數(shù)字人面臨的難度并不比“工業(yè)級”小。