正在閱讀:

虛擬數(shù)字人,成互聯(lián)網(wǎng)大廠“魔鬼肌肉人”?

掃一掃下載界面新聞APP

虛擬數(shù)字人,成互聯(lián)網(wǎng)大廠“魔鬼肌肉人”?

虛擬數(shù)字人看似柔弱,其實渾身長滿“肌肉”,正在成為互聯(lián)網(wǎng)大廠的技術實力形象代言人。

圖片來源:Unsplash-Maxim Tolchinskiy

文|張書樂

虛擬數(shù)字人有多熱,看看南開大學就知道了。

在南開大學校慶日暨南開大學新聞與傳播學院成立一周年之際,中國首家元宇宙新聞與傳播學院10月17日在南開大學推出,根據(jù)南開大學新聞與傳播學院秀山堂現(xiàn)實物理空間虛擬復制的數(shù)字空間正式上線。

公開數(shù)據(jù)顯示,截至今年9月,國內(nèi)虛擬數(shù)字人賽道投融資金額已超過去年,達到24.9億元。

2021年虛擬數(shù)字人相關企業(yè)投融資金額約為19.71億元,而在2015年這一統(tǒng)計數(shù)字僅為0.33億元,6年間復合增長率達到97.71%。

各大科技巨頭也不約而同選擇在虛擬人領域“秀肌肉”:國外的Meta、微軟,國內(nèi)的騰訊、阿里、百度、快手、網(wǎng)易,均投入重金布局。

甚至于虛擬數(shù)字人的跨界行為也已經(jīng)開始。

近期的國際時裝周虛擬秀中,一群穿著時尚的虛擬數(shù)字人走上了舞臺,而這支由虛擬數(shù)字人組成的模特隊伍正是由百度AI數(shù)字人希加加領隊。

百度數(shù)字人希加加身穿安踏最新發(fā)布虛擬時裝,領銜走秀開啟的第一次T臺秀。元宇宙走秀給時尚行業(yè)帶來了諸多想象,也讓更多人感受到了AI數(shù)字人+虛擬場景+品牌IP的可能性。

虛擬數(shù)字人將會成為元宇宙的標配嗎?

互聯(lián)網(wǎng)大廠們?yōu)楹渭娂娭亟鹧鹤⑻摂M數(shù)字人?

虛擬數(shù)字人又面對怎樣的難題與挑戰(zhàn)呢?

對此,澎湃新聞吳宇欣和書樂進行了一番交流,貧道以為:

虛擬數(shù)字人看似柔弱,其實渾身長滿“肌肉”,正在成為互聯(lián)網(wǎng)大廠的技術實力形象代言人。

目前而言,虛擬數(shù)字人在時尚、直播領域目前更接近于一個噱頭。

但,虛擬人某種意義上是各大互聯(lián)網(wǎng)科技廠商展示肌肉的一個集中呈現(xiàn)物,即內(nèi)容創(chuàng)造、人工智能、動作捕捉和各種與之相關的技術的融匯。

本質(zhì)上,虛擬人不誕生新技術,而是用受眾最容易理解的方式,展示黑科技成果。

此前和時尚品牌合作進入時裝秀場,和更多合作伙伴一起開啟直播,也是同樣的一種集合人工智能、形象設計、文創(chuàng)內(nèi)容的“亮肌肉”表現(xiàn),時尚潮流行業(yè)和互聯(lián)網(wǎng)公司都需要這樣的跨界來達成一種展示。

不過據(jù)此認為虛擬數(shù)字人的發(fā)展已經(jīng)可以商用,這過于樂觀。

虛擬人現(xiàn)在除了虛擬歌姬這個發(fā)展了十余年,商業(yè)化模式和技術準備(聲源庫技術和3D成像技術)比較完備外,目前的虛擬人還大體是一個木偶,需要人工在內(nèi)容(演藝節(jié)目到動作、歌曲創(chuàng)作)上進行全面設定,人工智能的成分特別是人機互動的效果,還沒有真正走向泛受眾體驗層面。

看似永不坍塌人設的虛擬人,目前有兩類:

一類是AI驅(qū)動,類似皮洛曹,本身是人工智能算法集合而成,進而達成某種自主,如華智冰、微軟小冰、小愛同學,其形象只是一種外在呈。

另一種是聲源庫驅(qū)動,類似木偶,以聲源庫為底本,有內(nèi)容創(chuàng)作者為其創(chuàng)作從歌曲到動作乃至各種內(nèi)容,形成虛擬偶像的效果。

無論是哪一類虛擬人,其底層都是人力驅(qū)動,即有人工智能技術人員、內(nèi)容創(chuàng)作人員和各種后臺支持人員來為其有效展示“魅力”提供支撐。

最大的問題:有畫皮、沒畫魂

而當下最大的問題也就在于內(nèi)容支撐依然無力,整個產(chǎn)業(yè)中用來呈現(xiàn)的虛擬人依然如同“畫皮”,沒有“畫魂”。

事實上,虛擬偶像布局在2017年到2018年就有過一次大規(guī)模嘗試、然后降溫。

而在2021年眾多名人明星人設翻車后又開始爆發(fā),其本質(zhì)是科技互聯(lián)網(wǎng)行業(yè)習慣性的跟風老毛病,去年的爆發(fā)也有元宇宙和永不翻車人設的催化。

此外,互聯(lián)網(wǎng)大廠,也有提前占子和試錯積累經(jīng)驗的意味。

畢竟是一個風口,試試沒錯,但大多也只是淺嘗即止,不是重點突破方向。

據(jù)艾媒咨詢預測,虛擬人帶動的國內(nèi)產(chǎn)業(yè)市場規(guī)模將在2025年達到6402.7億元。

技術的躍進也正在發(fā)生。

在近日召開的Meta Connect大會上,扎克伯格介紹了更善于捕捉瞇眼、睜眼等物理交互細節(jié)的新一代虛擬數(shù)字人。

未來,逼真的虛擬數(shù)字人可以在Meta的所有APP(包括Facebook、Instagram和WhatsApp)以及VR中運用和遷移。

同時,虛擬數(shù)字人的斬獲看上去很美。

在短視頻、微博等社交平臺,聚集了更多虛擬數(shù)字人博主。

去年10月出道的虛擬人美妝博主柳夜熙,一場子鼠妝仿妝挑戰(zhàn)吸引超1482.3萬人觀看。

虛擬人網(wǎng)紅AYAYI頻頻為服飾和奢侈品牌代言,并在微博曬出入職阿里的員工卡。

與此同時,各大品牌的虛擬代言人形象也紛紛亮相。

在文娛、電商方面,虛擬數(shù)字人正在創(chuàng)造商業(yè)價值。大批虛擬人主播已經(jīng)上崗帶貨。

樂華娛樂和字節(jié)跳動聯(lián)合推出的虛擬偶像女團A-SOUL,去年11月在B站的直播收入已達249萬元。

2021年7月,虛擬嘻哈歌手HAJIANG哈醬正式簽約華納音樂旗下亞洲電子音樂廠牌Whet Records,成為其首位虛擬數(shù)字藝術家。

“AI智障”怎么破?創(chuàng)作怎么整?

但從產(chǎn)業(yè)層面而言,數(shù)字人在應用上,主要問題有三:

其一是內(nèi)容輸出依然需要人工完成,即依靠聲音庫生成俄非人工智能角度的虛擬數(shù)字人(如洛天依)演繹的大量內(nèi)容創(chuàng)作者來進行歌曲創(chuàng)作、動作捕捉,而這并不比配合現(xiàn)實藝人的演藝簡單。

其二是智能呈現(xiàn)還“智障”,即人工智能向的虛擬數(shù)字人,盡管可以進行有效問答,亦可針對特定內(nèi)容(如高考作文)進行創(chuàng)作,但大多只有特長,而無法如真人一般“德智體”全面發(fā)展,觸及設定盲點就會抓瞎。

其三是場景展示有局限,除了通過3D成像登上舞臺、演唱會,通過直播短視頻進行演藝外,更多的場景仍在拓展中,如成為車載導航的虛擬數(shù)字人,在駕駛過程中,進行人機交互的展示意義,和智能音箱并無二致,形象呈現(xiàn)也無實際意義。

此外,僅僅看到營銷成本降低,卻無視虛擬數(shù)字人的研發(fā)、維護和升級成本,都是將虛擬人看作是一種低成本營銷和蹭熱點手段的偏見。

畢竟,AI驅(qū)動的虛擬人,整體還在突破智障的技術研發(fā)階段,成本是海量的。

而聲源庫驅(qū)動的木偶,表面成本看似不高,但內(nèi)容原創(chuàng)成本不低,且真正實景展示(如演唱會),所需要不斷解鎖和升維的成像技術也必然是巨大的開銷。

僅僅看個別虛擬人“瘋狂賺錢”的戰(zhàn)績,難以掩蓋二八定律下更多虛擬人被世人無視的尷尬。

因此,整體成本上,虛擬人遠比讓練習生成為偶像更貴,事實上要么互聯(lián)網(wǎng)大廠才能持續(xù)的燒錢游戲,要么是極少數(shù)創(chuàng)意者借助既有程序而意外打開的星圖。

對于大眾而言,時間、精力、金錢都不足以進入這個賽道,只能成為看客,且目前并無多少可看的虛擬人,或許真正的大眾觀賞要在元宇宙中沉浸式打開。

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

虛擬數(shù)字人,成互聯(lián)網(wǎng)大廠“魔鬼肌肉人”?

虛擬數(shù)字人看似柔弱,其實渾身長滿“肌肉”,正在成為互聯(lián)網(wǎng)大廠的技術實力形象代言人。

圖片來源:Unsplash-Maxim Tolchinskiy

文|張書樂

虛擬數(shù)字人有多熱,看看南開大學就知道了。

在南開大學校慶日暨南開大學新聞與傳播學院成立一周年之際,中國首家元宇宙新聞與傳播學院10月17日在南開大學推出,根據(jù)南開大學新聞與傳播學院秀山堂現(xiàn)實物理空間虛擬復制的數(shù)字空間正式上線。

公開數(shù)據(jù)顯示,截至今年9月,國內(nèi)虛擬數(shù)字人賽道投融資金額已超過去年,達到24.9億元。

2021年虛擬數(shù)字人相關企業(yè)投融資金額約為19.71億元,而在2015年這一統(tǒng)計數(shù)字僅為0.33億元,6年間復合增長率達到97.71%。

各大科技巨頭也不約而同選擇在虛擬人領域“秀肌肉”:國外的Meta、微軟,國內(nèi)的騰訊、阿里、百度、快手、網(wǎng)易,均投入重金布局。

甚至于虛擬數(shù)字人的跨界行為也已經(jīng)開始。

近期的國際時裝周虛擬秀中,一群穿著時尚的虛擬數(shù)字人走上了舞臺,而這支由虛擬數(shù)字人組成的模特隊伍正是由百度AI數(shù)字人希加加領隊。

百度數(shù)字人希加加身穿安踏最新發(fā)布虛擬時裝,領銜走秀開啟的第一次T臺秀。元宇宙走秀給時尚行業(yè)帶來了諸多想象,也讓更多人感受到了AI數(shù)字人+虛擬場景+品牌IP的可能性。

虛擬數(shù)字人將會成為元宇宙的標配嗎?

互聯(lián)網(wǎng)大廠們?yōu)楹渭娂娭亟鹧鹤⑻摂M數(shù)字人?

虛擬數(shù)字人又面對怎樣的難題與挑戰(zhàn)呢?

對此,澎湃新聞吳宇欣和書樂進行了一番交流,貧道以為:

虛擬數(shù)字人看似柔弱,其實渾身長滿“肌肉”,正在成為互聯(lián)網(wǎng)大廠的技術實力形象代言人。

目前而言,虛擬數(shù)字人在時尚、直播領域目前更接近于一個噱頭。

但,虛擬人某種意義上是各大互聯(lián)網(wǎng)科技廠商展示肌肉的一個集中呈現(xiàn)物,即內(nèi)容創(chuàng)造、人工智能、動作捕捉和各種與之相關的技術的融匯。

本質(zhì)上,虛擬人不誕生新技術,而是用受眾最容易理解的方式,展示黑科技成果。

此前和時尚品牌合作進入時裝秀場,和更多合作伙伴一起開啟直播,也是同樣的一種集合人工智能、形象設計、文創(chuàng)內(nèi)容的“亮肌肉”表現(xiàn),時尚潮流行業(yè)和互聯(lián)網(wǎng)公司都需要這樣的跨界來達成一種展示。

不過據(jù)此認為虛擬數(shù)字人的發(fā)展已經(jīng)可以商用,這過于樂觀。

虛擬人現(xiàn)在除了虛擬歌姬這個發(fā)展了十余年,商業(yè)化模式和技術準備(聲源庫技術和3D成像技術)比較完備外,目前的虛擬人還大體是一個木偶,需要人工在內(nèi)容(演藝節(jié)目到動作、歌曲創(chuàng)作)上進行全面設定,人工智能的成分特別是人機互動的效果,還沒有真正走向泛受眾體驗層面。

看似永不坍塌人設的虛擬人,目前有兩類:

一類是AI驅(qū)動,類似皮洛曹,本身是人工智能算法集合而成,進而達成某種自主,如華智冰、微軟小冰、小愛同學,其形象只是一種外在呈。

另一種是聲源庫驅(qū)動,類似木偶,以聲源庫為底本,有內(nèi)容創(chuàng)作者為其創(chuàng)作從歌曲到動作乃至各種內(nèi)容,形成虛擬偶像的效果。

無論是哪一類虛擬人,其底層都是人力驅(qū)動,即有人工智能技術人員、內(nèi)容創(chuàng)作人員和各種后臺支持人員來為其有效展示“魅力”提供支撐。

最大的問題:有畫皮、沒畫魂

而當下最大的問題也就在于內(nèi)容支撐依然無力,整個產(chǎn)業(yè)中用來呈現(xiàn)的虛擬人依然如同“畫皮”,沒有“畫魂”。

事實上,虛擬偶像布局在2017年到2018年就有過一次大規(guī)模嘗試、然后降溫。

而在2021年眾多名人明星人設翻車后又開始爆發(fā),其本質(zhì)是科技互聯(lián)網(wǎng)行業(yè)習慣性的跟風老毛病,去年的爆發(fā)也有元宇宙和永不翻車人設的催化。

此外,互聯(lián)網(wǎng)大廠,也有提前占子和試錯積累經(jīng)驗的意味。

畢竟是一個風口,試試沒錯,但大多也只是淺嘗即止,不是重點突破方向。

據(jù)艾媒咨詢預測,虛擬人帶動的國內(nèi)產(chǎn)業(yè)市場規(guī)模將在2025年達到6402.7億元。

技術的躍進也正在發(fā)生。

在近日召開的Meta Connect大會上,扎克伯格介紹了更善于捕捉瞇眼、睜眼等物理交互細節(jié)的新一代虛擬數(shù)字人。

未來,逼真的虛擬數(shù)字人可以在Meta的所有APP(包括Facebook、Instagram和WhatsApp)以及VR中運用和遷移。

同時,虛擬數(shù)字人的斬獲看上去很美。

在短視頻、微博等社交平臺,聚集了更多虛擬數(shù)字人博主。

去年10月出道的虛擬人美妝博主柳夜熙,一場子鼠妝仿妝挑戰(zhàn)吸引超1482.3萬人觀看。

虛擬人網(wǎng)紅AYAYI頻頻為服飾和奢侈品牌代言,并在微博曬出入職阿里的員工卡。

與此同時,各大品牌的虛擬代言人形象也紛紛亮相。

在文娛、電商方面,虛擬數(shù)字人正在創(chuàng)造商業(yè)價值。大批虛擬人主播已經(jīng)上崗帶貨。

樂華娛樂和字節(jié)跳動聯(lián)合推出的虛擬偶像女團A-SOUL,去年11月在B站的直播收入已達249萬元。

2021年7月,虛擬嘻哈歌手HAJIANG哈醬正式簽約華納音樂旗下亞洲電子音樂廠牌Whet Records,成為其首位虛擬數(shù)字藝術家。

“AI智障”怎么破?創(chuàng)作怎么整?

但從產(chǎn)業(yè)層面而言,數(shù)字人在應用上,主要問題有三:

其一是內(nèi)容輸出依然需要人工完成,即依靠聲音庫生成俄非人工智能角度的虛擬數(shù)字人(如洛天依)演繹的大量內(nèi)容創(chuàng)作者來進行歌曲創(chuàng)作、動作捕捉,而這并不比配合現(xiàn)實藝人的演藝簡單。

其二是智能呈現(xiàn)還“智障”,即人工智能向的虛擬數(shù)字人,盡管可以進行有效問答,亦可針對特定內(nèi)容(如高考作文)進行創(chuàng)作,但大多只有特長,而無法如真人一般“德智體”全面發(fā)展,觸及設定盲點就會抓瞎。

其三是場景展示有局限,除了通過3D成像登上舞臺、演唱會,通過直播短視頻進行演藝外,更多的場景仍在拓展中,如成為車載導航的虛擬數(shù)字人,在駕駛過程中,進行人機交互的展示意義,和智能音箱并無二致,形象呈現(xiàn)也無實際意義。

此外,僅僅看到營銷成本降低,卻無視虛擬數(shù)字人的研發(fā)、維護和升級成本,都是將虛擬人看作是一種低成本營銷和蹭熱點手段的偏見。

畢竟,AI驅(qū)動的虛擬人,整體還在突破智障的技術研發(fā)階段,成本是海量的。

而聲源庫驅(qū)動的木偶,表面成本看似不高,但內(nèi)容原創(chuàng)成本不低,且真正實景展示(如演唱會),所需要不斷解鎖和升維的成像技術也必然是巨大的開銷。

僅僅看個別虛擬人“瘋狂賺錢”的戰(zhàn)績,難以掩蓋二八定律下更多虛擬人被世人無視的尷尬。

因此,整體成本上,虛擬人遠比讓練習生成為偶像更貴,事實上要么互聯(lián)網(wǎng)大廠才能持續(xù)的燒錢游戲,要么是極少數(shù)創(chuàng)意者借助既有程序而意外打開的星圖。

對于大眾而言,時間、精力、金錢都不足以進入這個賽道,只能成為看客,且目前并無多少可看的虛擬人,或許真正的大眾觀賞要在元宇宙中沉浸式打開。

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。