文|真探AlphaSeeker 陳文琦
萬萬沒想到,2022年一開年的資本盛宴是由“它們”點(diǎn)燃的。
先是杭州李未可科技有限公司宣布已完成數(shù)千萬元天使輪融資,由字節(jié)跳動(dòng)獨(dú)家投資;隨后,核心技術(shù)為快速動(dòng)畫技術(shù)和實(shí)時(shí)數(shù)字人技術(shù)的世優(yōu)科技完成千萬級(jí)A+輪第一期投資。
一個(gè)月前,虛擬數(shù)字人及虛擬時(shí)尚研發(fā)商世悅星承則是完成了網(wǎng)易領(lǐng)投的千萬元天使輪融資;而“虛擬人”生態(tài)公司次世文化在過去一年時(shí)間里一共完成了三輪融資。
集原美、AYAYI、柳夜熙、翎_Ling、A-SOUL、韜斯曼、aespa、華智冰、崔筱盼、希加加……虛擬人已經(jīng)毫無疑問地走進(jìn)了我們的現(xiàn)實(shí)世界。據(jù)頭豹研究院數(shù)據(jù),當(dāng)前虛擬數(shù)字人市場(chǎng)規(guī)模已超過2000億元,預(yù)計(jì)這個(gè)數(shù)字到2030年將達(dá)到2703億元。
不過,熱鬧歸熱鬧,虛擬人發(fā)展至今究竟有哪些進(jìn)步?商業(yè)化價(jià)值又在何處?未來將如何發(fā)展?還有哪些不為人知的隱憂?這一系列問題或許才是各色虛擬人背后需要關(guān)注的核心。
來龍去脈
虛擬人不是一夜之間生成的。
硬要追溯的話,恐怕要回憶到1982年日本動(dòng)畫《超時(shí)空要塞》中的女主角林明美。當(dāng)時(shí)林明美被制作方包裝成演唱?jiǎng)赢嫴迩母枋?,并制作了音樂專輯,成為了世界上第一個(gè)虛擬歌姬。
此后,虛擬人伴隨著CG技術(shù)、動(dòng)作捕捉技術(shù)、語音合成技術(shù)等等技術(shù)的發(fā)展,不斷進(jìn)化——從二次元虛擬歌姬初音未來、洛天依的出現(xiàn),到現(xiàn)在各類型虛擬數(shù)字人被批量生產(chǎn),虛擬人有了很明顯的飛躍:
從人物設(shè)計(jì)上說,現(xiàn)在更多的虛擬形象外形多是超寫實(shí)、高保真,他們不僅在形象上與真人相似度極高,行為上也愈發(fā)貼近真人。
技術(shù)層面進(jìn)步,無論是虛擬人的智能化程度,還是動(dòng)作的流暢自然程度都大幅上升。按技術(shù)分類,也分為智能驅(qū)動(dòng)型和真人驅(qū)動(dòng)型(通過真人動(dòng)作捕捉完成動(dòng)作)。
從實(shí)用性角度考慮,虛擬人拓寬了可行的應(yīng)用場(chǎng)景,有高度工具化的服務(wù)型虛擬人,如虛擬主播、虛擬員工,也有對(duì)標(biāo)藝人、偶像、網(wǎng)紅的IP型虛擬人。
百度智能云AI人機(jī)交互實(shí)驗(yàn)室負(fù)責(zé)人李士巖認(rèn)為,數(shù)字人產(chǎn)業(yè)有三大核心推動(dòng)力,第一級(jí)火箭是用戶需求與技術(shù)升級(jí)、第二級(jí)是政策支持與資本涌入、第三級(jí)是計(jì)算平臺(tái)的迭代。
以目前的情況來看,三級(jí)火箭都處于相對(duì)早期、正在加熱的階段。在過去若干年的時(shí)間里,虛擬人的價(jià)值空間并未打開,直到去年元宇宙概念的火爆,才將虛擬人推至臺(tái)前,也讓虛擬人背后的復(fù)雜產(chǎn)業(yè)鏈浮出水面。
龔俊數(shù)字人
騰訊字節(jié)百度等大廠、虛擬人垂直賽道初創(chuàng)公司、技術(shù)提供商、影視制作公司、MCN、IP策劃運(yùn)營公司......都試圖在這場(chǎng)盛宴里占得一席之地。而虛擬人產(chǎn)業(yè)鏈上下游環(huán)節(jié)、角色眾多,因此對(duì)應(yīng)著的機(jī)遇與挑戰(zhàn)也很不一樣。
虛擬人的“上游”主要是虛擬人底層技術(shù)提供方,包括顯示設(shè)備、光學(xué)器件、傳感器、芯片等硬件制造商,建模軟件、渲染引擎等軟件制造商,專門化的AI廠商、XR廠商、CG廠商、自研虛擬人技術(shù)的垂直廠商。騰訊、百度等綜合性的互聯(lián)網(wǎng)大廠也有很強(qiáng)的技術(shù)輸出能力。
“中游”的主要玩家是IP策劃和運(yùn)營公司,完成虛擬人的IP孵化、形象設(shè)計(jì)、運(yùn)營經(jīng)紀(jì)等工作。虛擬人產(chǎn)品分為IP類和非IP類,前者是藝人型的,后者服務(wù)型,更注重實(shí)用性。分類方式和維度較多,或按應(yīng)用場(chǎng)景分,或按技術(shù)能力分、或按外形分。國盛證券研報(bào)將其分成服務(wù)型虛擬人(PGC+功能型)、虛擬偶像(PGC+IP價(jià)值)、數(shù)字化身(UGC+功能型)、創(chuàng)作載體(UGC+IP價(jià)值)。
“下游”則是場(chǎng)景的應(yīng)用,不同應(yīng)用場(chǎng)景對(duì)應(yīng)著不同需求的客戶,覆蓋泛娛樂行業(yè)、消費(fèi)品以及金融、文旅、教育、醫(yī)療等行業(yè)。
結(jié)合“上中下游”,不難推導(dǎo)出創(chuàng)造一個(gè)虛擬人的要素:實(shí)際應(yīng)用場(chǎng)景倒推出虛擬人的特征,再協(xié)同“內(nèi)容”與“技術(shù)”,將這些需求落地。
但目前,虛擬人產(chǎn)業(yè)鏈各個(gè)節(jié)點(diǎn)相對(duì)割裂,行業(yè)中的大部分公司都只是涉獵虛擬人全流程中的某個(gè)環(huán)節(jié),因此很難協(xié)同調(diào)優(yōu)。同時(shí),服務(wù)型虛擬人和演藝型虛擬人各自為陣,個(gè)性化和規(guī)?;己茈y做出突破,也暴露了虛擬人生產(chǎn)效率問題。
創(chuàng)造虛擬人
任何技術(shù)在早期階段總是伴隨著試錯(cuò)、迭代、不斷的投入。虛擬人也是如此,一個(gè)不那么完美的虛擬人,其實(shí)造價(jià)不菲。
比如“會(huì)捉妖的美妝達(dá)人”柳夜熙,10月份上線至今發(fā)布了6條視頻,抖音粉絲量為834.5萬。據(jù)其背后公司創(chuàng)壹科技CEO梁子康透露:“2018、2019年,我們每一秒視頻價(jià)格比1克黃金還貴,現(xiàn)在每一秒價(jià)格相當(dāng)于2到3克的黃金制作水準(zhǔn)和制作成本,其核心是建立壁壘?!?/p>
雖然他在采訪中表示,其實(shí)柳夜熙的人物創(chuàng)作周期不長(zhǎng),做片子花了不到兩個(gè)月,但是前期投入了巨大的研發(fā)、人員成本,幕后內(nèi)容團(tuán)隊(duì)超過100人。建模、制作、渲染所需的軟硬件設(shè)備、人員團(tuán)隊(duì)……虛擬人可以說是一只吞金獸。
另一位虛擬人行業(yè)從業(yè)者告訴「真探」,柳夜熙團(tuán)隊(duì)出一條片子,“如果沒有100萬的制作費(fèi),根本出不來,如果低于這個(gè)費(fèi)用,片子的質(zhì)量會(huì)令人吐槽?!?/p>
這也就是說,超寫實(shí)虛擬人視頻每秒的成本超萬元。
動(dòng)態(tài)的柳夜熙
業(yè)務(wù)覆蓋虛擬人策劃設(shè)計(jì)、制作集成以及內(nèi)容運(yùn)營的虛擬人垂直廠商雪爪科技的商業(yè)化負(fù)責(zé)人林雁也表示了投入的巨大。她告訴「真探」,雖然公司目前可以做到全鏈路多數(shù)環(huán)節(jié)的覆蓋,但是前期投入很大。
比如雪爪建成一個(gè)300m2左右的動(dòng)作捕捉場(chǎng)地,需要配備超過40臺(tái)肢體捕捉設(shè)備、還有臉部表情捕捉設(shè)備、以及動(dòng)捕服、攝像機(jī)、電視機(jī)等,整體造價(jià)超過200萬元。
時(shí)間上來說,隨著制作流程化,一個(gè)虛擬形象的制作的時(shí)間周期已經(jīng)壓縮,但是從原畫、模型制作、骨骼綁定到調(diào)整,整體流程需要6-8周。“每個(gè)公司對(duì)于數(shù)字人的產(chǎn)能也是有限的。” 林雁說。
雪爪手心實(shí)驗(yàn)室制作的虛擬人Gina
雪爪按形象,將虛擬人分類為超寫實(shí)、2.5次元、2次元、Q版/萌寵,不同精度虛擬人的制作成本差距巨大。
Q版形象從制作到執(zhí)行,整個(gè)制作周期大概只有一個(gè)月,但是一個(gè)超寫實(shí)虛擬人則需要更長(zhǎng)時(shí)間。
林雁告訴「真探」其有一款尚未上市的虛擬偶像,團(tuán)隊(duì)調(diào)整了近8個(gè)月,“她一根頭發(fā)絲的細(xì)膩程度的調(diào)整和渲染所耗費(fèi)的時(shí)間是一個(gè)二次元形象全部的時(shí)間”。
虛擬人的前途與隱憂
雖然虛擬人生產(chǎn)、運(yùn)營成本高,但是隨著虛擬人應(yīng)用場(chǎng)景越來越廣泛,受眾群體不斷拓展,需求端的熱情給予產(chǎn)業(yè)上的公司諸多掘金的機(jī)會(huì)。
除了IP型虛擬人,隨著NPL(自然語言處理)、XNR(深度神經(jīng)網(wǎng)絡(luò)渲染技術(shù))等AI技術(shù)的成熟,越來越多的服務(wù)型虛擬人也在具體行業(yè)中找到了自己的明確位置。
新近的案例有小冰公司公布的每日經(jīng)濟(jì)新聞主播、萬科數(shù)字化員工“崔筱盼”,前者能夠不間斷播報(bào)資訊,面容、形態(tài)與真人無異,后者在系統(tǒng)算法加持下可以提醒應(yīng)收/逾期以及偵測(cè)工作異常。
小冰公司與每日經(jīng)濟(jì)新聞合作的虛擬主播
與IP類虛擬人相比,此類虛擬人實(shí)現(xiàn)的技術(shù)條件和應(yīng)用場(chǎng)景有明顯不同。
首先,在形象生成上,這兩款虛擬人都沒有單純使用昂貴的CG技術(shù),而是利用XNR技術(shù),通過深度學(xué)習(xí),在大量數(shù)據(jù)中提取特征,加快傳統(tǒng)的渲染流程。從觀眾直觀感受來說,相比超寫實(shí)虛擬人,虛擬主播形象更近似于真人。除了形象,核心能力還有朗讀、播報(bào)、專業(yè)化的金融資訊撰寫、財(cái)經(jīng)摘要能力等等。
小冰公司COO徐元春告訴「真探」,其實(shí)小冰和每經(jīng)的合作從2019年就開始了,主要集中于做金融資訊。2019年末,雙方進(jìn)行了一次深入交流,思考AI技術(shù)還能做什么。當(dāng)時(shí)的初步預(yù)想是,做一個(gè)“對(duì)標(biāo)”彭博的財(cái)經(jīng)電視,可以全天候播報(bào)金融資訊。但是當(dāng)時(shí)的技術(shù)條件并不能實(shí)現(xiàn),人和聲音需要自然、真實(shí),整個(gè)系統(tǒng)整合需要完成實(shí)時(shí)視頻推送,中間穿插的視頻內(nèi)容也要由技術(shù)生成。
直到去年年末,虛擬主播才正式上線。其背后是小冰積年累月的技術(shù)投入,甚至難以量化。
百度在2019年也發(fā)布過一款虛擬數(shù)字人小浦,與浦發(fā)銀行、虛擬人技術(shù)公司原力動(dòng)畫合作,應(yīng)用于金融客服領(lǐng)域。去年,騰訊游戲NExT Studios與新華社媒體融合生產(chǎn)技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室共同打造了一位數(shù)字航天員小諍,面向載人航天工程、行星探測(cè)工程等中國航天重大項(xiàng)目開展新聞報(bào)道??拼笥嶏w推出AI虛擬主播解決方案,結(jié)合語音識(shí)別、語義理解、語音合成、虛擬形象驅(qū)動(dòng)等技術(shù)。
整體來看,服務(wù)型虛擬人大多針對(duì)產(chǎn)業(yè)數(shù)字化的需求,其商業(yè)模式與SaaS有一定的相似之處。
現(xiàn)在的收費(fèi)模式是標(biāo)準(zhǔn)化能力模塊選配,“按雇傭人的邏輯去收費(fèi)”。結(jié)合場(chǎng)景需求,客戶從小冰技術(shù)棧中選擇模塊,組成套餐,并且可以隨著需求的變化調(diào)整或升級(jí)模塊選擇。
“現(xiàn)在能看到在某些具體場(chǎng)景,大家選擇的套餐越來越趨同,這也證明這就是真實(shí)的使用場(chǎng)景?!毙煸赫f。
據(jù)徐元春介紹,小冰有能力完整的技術(shù)棧,在自然語音理解、計(jì)算機(jī)語音、計(jì)算機(jī)視覺、人工智能內(nèi)容生成等方面都有所積累,提供的是完整的技術(shù)框架,隨著各種與行業(yè)標(biāo)桿企業(yè)合作案例的落地,對(duì)行業(yè)的專業(yè)認(rèn)知和技術(shù)的復(fù)用性也在增強(qiáng)?!氨热绗F(xiàn)在另一個(gè)電視臺(tái)也想做一個(gè)24小時(shí)財(cái)經(jīng)電視,我們要解決是重新訓(xùn)練一個(gè)主播,這個(gè)過程現(xiàn)在只需要一周?!?/p>
科大訊飛的AI虛擬人多模態(tài)交互服務(wù)解決方案
對(duì)演藝型虛擬人的需求也在爆發(fā),相對(duì)于服務(wù)型虛擬人,他們擁有更多“個(gè)性”、“人設(shè)”。不過不用擔(dān)心,虛擬人的“人設(shè)”完全受控制,不會(huì)塌房。
但不同于服務(wù)型虛擬人對(duì)于虛擬人背后專業(yè)素質(zhì)的精準(zhǔn)要求。演藝型虛擬人市場(chǎng)更加“混亂”,質(zhì)量良莠不齊,優(yōu)劣差異化明顯,技術(shù)、內(nèi)容跟不上概念,加上高居不下的生產(chǎn)成本,商業(yè)化并不容易。
由于很多技術(shù)的重合性,很多影視特效公司進(jìn)入虛擬人領(lǐng)域,比如港股上市的視覺特效制作公司數(shù)字王國。在2022年江蘇衛(wèi)視跨年演唱會(huì)上,數(shù)字王國用高階渲染技術(shù)重現(xiàn)了“鄧麗君”,與歌手周深合唱。受益于元宇宙概念的拉升作用,數(shù)字王國股價(jià)在年初連續(xù)上漲一周。
影視特效行業(yè)本質(zhì)上做的是定制服務(wù),在產(chǎn)業(yè)鏈中對(duì)上游的議價(jià)能力弱,而且人力成本高。一部大片的成功通常少不了優(yōu)質(zhì)的視覺效果,但特效制作公司卻不在票房分紅的名單里。頂級(jí)特效公司破產(chǎn)的情況屢見不鮮,比如《少年P(guān)I的奇幻漂流》背后的R&H。
對(duì)于影視特效公司而言,切入虛擬人領(lǐng)域無疑是一個(gè)好機(jī)會(huì),但若這套在影視工業(yè)中不占優(yōu)勢(shì)的商業(yè)模式不改變,恐怕也很難從中謀利。
江蘇衛(wèi)視跨年演唱會(huì)上歌手周深與虛擬“鄧麗君”同臺(tái)演出
另一類非?;钴S的是垂直虛擬人廠商和經(jīng)紀(jì)運(yùn)營類公司,比如創(chuàng)壹科技、燃麥科技、次世文化、雪爪科技等。
虛擬IP的收益主要來自于演出、代言、直播電商等,按商業(yè)化類型分,也有兩種類型:一、先有獨(dú)立IP再拓展場(chǎng)景;二、根據(jù)客戶需求場(chǎng)景定制產(chǎn)品。
雪爪目前與天貓、花西子、卡姿蘭、認(rèn)養(yǎng)一頭牛、百聯(lián)、萬科等都進(jìn)行過不同方式的合作,據(jù)林雁說,由于品牌/平臺(tái)客戶需求差異,合作方式會(huì)有所不同,有長(zhǎng)短期的代言人、但是公司推動(dòng)的大多是年框的合作,量級(jí)在百萬以上,在一年中,基于虛擬人形象,結(jié)合營銷節(jié)點(diǎn),提供服務(wù)內(nèi)容。
行業(yè)處于上升期,“相比我們的前期投入,盈利還是微乎其微,但我們比較看好未來狀態(tài)”,林雁表示。她認(rèn)為,目前還是教育品牌、教育市場(chǎng)的階段,很多時(shí)間、費(fèi)用、使用方面的問題,客戶并不清晰,也是他們使用虛擬人之前最大的顧慮,但是隨著嘗鮮的品牌越來越多,收益效果明顯,她對(duì)行業(yè)持有樂觀態(tài)度。
現(xiàn)在市場(chǎng)上虛擬人形象眾多,但是同質(zhì)化嚴(yán)重,打造獨(dú)特的IP價(jià)值需要強(qiáng)大的運(yùn)營能力。頭部IP能賺錢,但是缺少穩(wěn)定粉絲群體、個(gè)性不鮮明的中腰部虛擬人身價(jià)不高。
以一張“神級(jí)證件照”在小紅書走紅的銀發(fā)少女AYAYI,第一張Po圖獲得10萬+點(diǎn)贊量,但是近期10張新圖平均點(diǎn)贊量只有181;“造價(jià)不菲”的柳夜熙從去年10月上線抖音至今,也只有5個(gè)視頻和1組圖文內(nèi)容,內(nèi)容儲(chǔ)備少,公司后續(xù)推出另一個(gè)虛擬人熱度一般。多數(shù)的虛擬人辨識(shí)度不高,過目即忘,曇花一現(xiàn)。
爆款難做,更難持續(xù)。
AYAYI和柳夜熙熱度下降
若虛擬人只停留在一個(gè)完美的形象,這終究不可持續(xù),更重要的是背后各種技術(shù)的協(xié)同集成,以及其作為一個(gè)內(nèi)容載體能傳遞表達(dá)的信息。
徐元春在與「真探」的對(duì)話中,不愿意將如萬科員工崔筱盼這樣的角色定義為「服務(wù)型」,他希望小冰的虛擬人是更有人性溫度的,而非僅僅為了完成流程性工作設(shè)置的一個(gè)環(huán)節(jié)?!八晕覀兎Q他們?yōu)锳I Beings,叫他們?yōu)樘摂M人是因?yàn)檫@是一個(gè)打了引號(hào)的人。”他說。
虛擬人賽道尚在起步階段,隨著行業(yè)發(fā)展、技術(shù)成熟、制作成本降低,“它們”與“我們”的互動(dòng)或許只是未來中再正常不過的事。