正在閱讀:

數(shù)字人:始于顏值,終于價值

掃一掃下載界面新聞APP

數(shù)字人:始于顏值,終于價值

未來將會有大規(guī)模的數(shù)字人與人類共存。

文|MetaPost

隨著ChatGPT爆火,生成式AI算法的突破,使得AIGC(人工智能生產(chǎn)內(nèi)容)進入應(yīng)用爆發(fā)期,將給元宇宙相關(guān)產(chǎn)業(yè)鏈帶來全新的想象空間。

近日,天娛數(shù)科等多家上市公司宣布,要將ChatGPT與公司虛擬數(shù)字人融合,研發(fā)出更加智能化、擬人化的虛擬數(shù)字人。

作為當前數(shù)字技術(shù)與文藝創(chuàng)作深度融合的產(chǎn)物,虛擬數(shù)字人(或數(shù)字人)體現(xiàn)了數(shù)字文化新業(yè)態(tài)、新模式的發(fā)展趨勢,也打開了網(wǎng)絡(luò)文藝新媒介產(chǎn)品的審美想象和創(chuàng)新創(chuàng)意空間。

所謂數(shù)字人,是指通過計算機圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等技術(shù)打造的虛擬或仿真人物。自2020年以來,隨著資本加速進入數(shù)字人市場,促進了技術(shù)的快速發(fā)展和應(yīng)用場景的加速探索,現(xiàn)在的數(shù)字人技術(shù)也在朝著多樣化、智能化、便捷化、精細化的方向發(fā)展。

據(jù)IDC《中國AI數(shù)字人市場現(xiàn)狀與機會分析,2022》報告顯示,中國AI數(shù)字人市場規(guī)模呈現(xiàn)高速增長趨勢,預(yù)計到2026年將達到102.4億元人民幣。

然而,透過豐富的“數(shù)字人景觀”可以發(fā)現(xiàn),令人過目不忘的優(yōu)質(zhì)數(shù)字人卻不多,而一些頻繁出場的數(shù)字人形象總體上趨向單一化、標簽化、扁平化,尚不能清晰傳遞數(shù)字人的功能、內(nèi)涵及審美。

如何賦予數(shù)字人豐富的文化內(nèi)涵,創(chuàng)造一批兼具中國文化品格和“流量密碼”的優(yōu)質(zhì)形象,滿足人們?nèi)找嬖鲩L的優(yōu)質(zhì)數(shù)字內(nèi)容需求,是數(shù)字人發(fā)展需要思考的問題。

01 對數(shù)字人同樣適用的“顏值即正義”

數(shù)字人的發(fā)展歷史由來已久。

早在20世紀80年代,人們就開始嘗試將虛擬人物引入到現(xiàn)實世界,比如1982年,世界上第一位虛擬歌姬林明美出現(xiàn)了,雖然當時技術(shù)是以傳統(tǒng)的手繪為主,但呈示出了虛擬人概念的萌芽。

21世紀初,計算機技術(shù)飛速發(fā)展,CG(計算機動畫)技術(shù)和動作捕捉技術(shù)發(fā)展日益成熟,日本制作了第一個被廣泛認可的虛擬偶像——初音未來,對虛擬數(shù)字人的探索越來越豐富。

近5年來,隨著深度學(xué)習(xí)的算法取得突破,數(shù)字人的制作過程也得到了有效簡化。

數(shù)字人的制作流程一般包括模型綁定、動作捕捉、動畫解算、實時渲染等步驟,其中要運用到大量的現(xiàn)實增強、深度學(xué)習(xí)等高科技前沿技術(shù)。比較簡單的動漫形象數(shù)字人,一般1個月就能完成;而制作一個超寫實的3D數(shù)字人,從角色設(shè)計到完成渲染需要3至6個月甚至更久。數(shù)字人越是精致、逼真,越花費時間、人力和金錢成本。

在數(shù)字人的形象表達方面,目前,在大多數(shù)VR、游戲、會議等場景中,供應(yīng)商往往會選擇“樂高式卡通”或其他二次元風(fēng)格的3D模型,如元宇宙第一股Roblox。

哪怕是微軟在Ignite大會上引以為傲的虛擬世界項目,也尚且沒有涉足到真實形象還原的階段??植拦刃?yīng)的存在使得虛擬形象“真人化”的難度極高,除此之外,超高精度的真身復(fù)刻3D數(shù)字人制作成本高也是一個制約因素,高成本意味著技術(shù)供應(yīng)商很難在短時間內(nèi)將技術(shù)進行商業(yè)化落地,更別說使其成為數(shù)字資產(chǎn),打造一個集中的交易平臺,去消費與收藏。

時拓智能創(chuàng)始人指出,真身復(fù)刻的孿生數(shù)字人,可以說是元宇宙的主角,金字塔的頂尖。在所有類型的復(fù)刻中,人的構(gòu)建無疑是最難的,對技術(shù)的要求不能與靜物相提并論,從皮膚質(zhì)感,到眼神和面部對于環(huán)境的判別,都非常復(fù)雜而精細。

時拓智能作為入選上??苿?chuàng)企業(yè)上市培育庫的數(shù)字人企業(yè),選擇采用陣列相機結(jié)合自主研發(fā)LFM技術(shù)的方案,通過200余臺相機進行光學(xué)立體三維建模,模型生成效率被大幅提高,從拍攝到建模完成最快只需要75秒,而目前即使是最先進的手持掃描儀激光點云建模方案,生成一個高清3D模型也需要數(shù)天的時間。

在人像真實度上,時拓智能已經(jīng)聚焦到了“毛孔級別”,一次拍攝可產(chǎn)生12億像素的數(shù)據(jù)量,經(jīng)過拓撲、法線貼圖、粗糙度貼圖、金屬貼圖、光線貼圖、AO閉環(huán)等20余層還原處理,3D模型最高可實現(xiàn)700億像素,靜態(tài)模型的分辨率達到6μm(約為頭發(fā)直徑的1/8),遠超人眼可分辨的極限。同時,時拓智能的技術(shù)支持以每秒60幀的速率捕獲3D模型,使得動態(tài)模型的分辨率能夠突破8K。

數(shù)字人的設(shè)計制作并非易事,既需要技術(shù)支撐,又需要“有趣的靈魂”賦予其文化與內(nèi)涵。

02 始于顏值,終于價值

2022年,數(shù)字人大量涌現(xiàn),中國文物交流中心的“文夭夭”、新華網(wǎng)的“筱竹”、浙江衛(wèi)視的“谷小雨”、敦煌研究院的“伽瑤”、國家博物館的“艾雯雯”、中華書局的“蘇東坡數(shù)字人”……他們或化身為文博場所的導(dǎo)游,或成為文化短劇的主角,或擔(dān)任對外傳播的文化大使,以又潮又酷的方式講述著傳統(tǒng)文化的故事。

不難看出,數(shù)字人要在弘揚傳承中華優(yōu)秀傳統(tǒng)文化方面發(fā)揮作用。可以始于顏值,但最后還是要終于價值,因為人們開發(fā)數(shù)字人,不是為了觀賞,而是為了使用。2022年被業(yè)界稱為“數(shù)字人元年”,數(shù)字人的相關(guān)應(yīng)用剛剛起步。傳統(tǒng)文化領(lǐng)域是應(yīng)用數(shù)字人比較多的領(lǐng)域,且應(yīng)用場景越來越豐富。

2022年7月,身著漢服的“艾雯雯”在國家博物館上崗。她穿梭于國博各展廳,為慕名而來的全球游客介紹著國博140多萬件館藏文物。中國文物交流中心的“文夭夭”,除了在各大博物館提供講解、導(dǎo)覽服務(wù),還擔(dān)任“文博虛擬新聞官”,經(jīng)常跟隨展覽出海,傳播中華文化。

圖 | 數(shù)字人艾雯雯

除了文化價值,數(shù)字人的商業(yè)價值也不可或缺。

今年2月,涉及數(shù)字人業(yè)務(wù)的企業(yè)世優(yōu)科技、風(fēng)語筑等均提到正在研發(fā)相關(guān)技術(shù),試圖將數(shù)字人接入ChatGPT。

這其中,吸引了大半科技圈關(guān)注的是,百度在短短一周時間內(nèi),連發(fā)四條官方推文,介紹其即將推出中國版“GPT大模型”文心一言。

而發(fā)布這條消息的責(zé)任編輯,正是百度的希加加、度曉曉等數(shù)字人“成員”。數(shù)字人和“ChatGPT”的聯(lián)動,讓不少網(wǎng)友期待不已。

據(jù)了解,目前已經(jīng)有包括互聯(lián)網(wǎng)、媒體、金融、保險、汽車、企業(yè)軟件等行業(yè)的近300家頭部企業(yè)宣布加入百度“文心一言”生態(tài)。

圖 | 不同類型的虛擬數(shù)字人

天娛數(shù)科證券部人士認為,AI和數(shù)字人結(jié)合會成為一種趨勢?!奥斆髑胰诵曰膶υ掦w驗,不再只依托于文字,而是以生動形象的數(shù)字人形式輸出,或?qū)⒊删虯IGC數(shù)字人的另一個里程碑?!?/p>

不過,業(yè)界也有觀點認為,當前ChatGPT尚處于發(fā)展的早期探索階段,關(guān)鍵核心技術(shù)發(fā)展尚不成熟。從數(shù)據(jù)上來看,目前ChatGPT背后的GPT3.5大模型,參數(shù)大概1750億個,而人腦擁有近1000億個神經(jīng)元和100萬億個連接,模型的參數(shù)量級還遠沒有達到人腦的數(shù)量級。同時,AIGC模型需要大量數(shù)據(jù)參與訓(xùn)練,因此對算力基礎(chǔ)設(shè)施有較高要求。

IDC中國助理研究總監(jiān)盧言霞指出,當前AI數(shù)字人在部分領(lǐng)域已經(jīng)發(fā)揮出明顯的商業(yè)價值,未來在生活與工作中,將會有大規(guī)模的數(shù)字人隊伍與人類共存。不過,也要理性看待行業(yè)發(fā)展,盡管目前數(shù)字人市場火熱,前行仍需腳踏實地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

數(shù)字人:始于顏值,終于價值

未來將會有大規(guī)模的數(shù)字人與人類共存。

文|MetaPost

隨著ChatGPT爆火,生成式AI算法的突破,使得AIGC(人工智能生產(chǎn)內(nèi)容)進入應(yīng)用爆發(fā)期,將給元宇宙相關(guān)產(chǎn)業(yè)鏈帶來全新的想象空間。

近日,天娛數(shù)科等多家上市公司宣布,要將ChatGPT與公司虛擬數(shù)字人融合,研發(fā)出更加智能化、擬人化的虛擬數(shù)字人。

作為當前數(shù)字技術(shù)與文藝創(chuàng)作深度融合的產(chǎn)物,虛擬數(shù)字人(或數(shù)字人)體現(xiàn)了數(shù)字文化新業(yè)態(tài)、新模式的發(fā)展趨勢,也打開了網(wǎng)絡(luò)文藝新媒介產(chǎn)品的審美想象和創(chuàng)新創(chuàng)意空間。

所謂數(shù)字人,是指通過計算機圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等技術(shù)打造的虛擬或仿真人物。自2020年以來,隨著資本加速進入數(shù)字人市場,促進了技術(shù)的快速發(fā)展和應(yīng)用場景的加速探索,現(xiàn)在的數(shù)字人技術(shù)也在朝著多樣化、智能化、便捷化、精細化的方向發(fā)展。

據(jù)IDC《中國AI數(shù)字人市場現(xiàn)狀與機會分析,2022》報告顯示,中國AI數(shù)字人市場規(guī)模呈現(xiàn)高速增長趨勢,預(yù)計到2026年將達到102.4億元人民幣。

然而,透過豐富的“數(shù)字人景觀”可以發(fā)現(xiàn),令人過目不忘的優(yōu)質(zhì)數(shù)字人卻不多,而一些頻繁出場的數(shù)字人形象總體上趨向單一化、標簽化、扁平化,尚不能清晰傳遞數(shù)字人的功能、內(nèi)涵及審美。

如何賦予數(shù)字人豐富的文化內(nèi)涵,創(chuàng)造一批兼具中國文化品格和“流量密碼”的優(yōu)質(zhì)形象,滿足人們?nèi)找嬖鲩L的優(yōu)質(zhì)數(shù)字內(nèi)容需求,是數(shù)字人發(fā)展需要思考的問題。

01 對數(shù)字人同樣適用的“顏值即正義”

數(shù)字人的發(fā)展歷史由來已久。

早在20世紀80年代,人們就開始嘗試將虛擬人物引入到現(xiàn)實世界,比如1982年,世界上第一位虛擬歌姬林明美出現(xiàn)了,雖然當時技術(shù)是以傳統(tǒng)的手繪為主,但呈示出了虛擬人概念的萌芽。

21世紀初,計算機技術(shù)飛速發(fā)展,CG(計算機動畫)技術(shù)和動作捕捉技術(shù)發(fā)展日益成熟,日本制作了第一個被廣泛認可的虛擬偶像——初音未來,對虛擬數(shù)字人的探索越來越豐富。

近5年來,隨著深度學(xué)習(xí)的算法取得突破,數(shù)字人的制作過程也得到了有效簡化。

數(shù)字人的制作流程一般包括模型綁定、動作捕捉、動畫解算、實時渲染等步驟,其中要運用到大量的現(xiàn)實增強、深度學(xué)習(xí)等高科技前沿技術(shù)。比較簡單的動漫形象數(shù)字人,一般1個月就能完成;而制作一個超寫實的3D數(shù)字人,從角色設(shè)計到完成渲染需要3至6個月甚至更久。數(shù)字人越是精致、逼真,越花費時間、人力和金錢成本。

在數(shù)字人的形象表達方面,目前,在大多數(shù)VR、游戲、會議等場景中,供應(yīng)商往往會選擇“樂高式卡通”或其他二次元風(fēng)格的3D模型,如元宇宙第一股Roblox。

哪怕是微軟在Ignite大會上引以為傲的虛擬世界項目,也尚且沒有涉足到真實形象還原的階段??植拦刃?yīng)的存在使得虛擬形象“真人化”的難度極高,除此之外,超高精度的真身復(fù)刻3D數(shù)字人制作成本高也是一個制約因素,高成本意味著技術(shù)供應(yīng)商很難在短時間內(nèi)將技術(shù)進行商業(yè)化落地,更別說使其成為數(shù)字資產(chǎn),打造一個集中的交易平臺,去消費與收藏。

時拓智能創(chuàng)始人指出,真身復(fù)刻的孿生數(shù)字人,可以說是元宇宙的主角,金字塔的頂尖。在所有類型的復(fù)刻中,人的構(gòu)建無疑是最難的,對技術(shù)的要求不能與靜物相提并論,從皮膚質(zhì)感,到眼神和面部對于環(huán)境的判別,都非常復(fù)雜而精細。

時拓智能作為入選上??苿?chuàng)企業(yè)上市培育庫的數(shù)字人企業(yè),選擇采用陣列相機結(jié)合自主研發(fā)LFM技術(shù)的方案,通過200余臺相機進行光學(xué)立體三維建模,模型生成效率被大幅提高,從拍攝到建模完成最快只需要75秒,而目前即使是最先進的手持掃描儀激光點云建模方案,生成一個高清3D模型也需要數(shù)天的時間。

在人像真實度上,時拓智能已經(jīng)聚焦到了“毛孔級別”,一次拍攝可產(chǎn)生12億像素的數(shù)據(jù)量,經(jīng)過拓撲、法線貼圖、粗糙度貼圖、金屬貼圖、光線貼圖、AO閉環(huán)等20余層還原處理,3D模型最高可實現(xiàn)700億像素,靜態(tài)模型的分辨率達到6μm(約為頭發(fā)直徑的1/8),遠超人眼可分辨的極限。同時,時拓智能的技術(shù)支持以每秒60幀的速率捕獲3D模型,使得動態(tài)模型的分辨率能夠突破8K。

數(shù)字人的設(shè)計制作并非易事,既需要技術(shù)支撐,又需要“有趣的靈魂”賦予其文化與內(nèi)涵。

02 始于顏值,終于價值

2022年,數(shù)字人大量涌現(xiàn),中國文物交流中心的“文夭夭”、新華網(wǎng)的“筱竹”、浙江衛(wèi)視的“谷小雨”、敦煌研究院的“伽瑤”、國家博物館的“艾雯雯”、中華書局的“蘇東坡數(shù)字人”……他們或化身為文博場所的導(dǎo)游,或成為文化短劇的主角,或擔(dān)任對外傳播的文化大使,以又潮又酷的方式講述著傳統(tǒng)文化的故事。

不難看出,數(shù)字人要在弘揚傳承中華優(yōu)秀傳統(tǒng)文化方面發(fā)揮作用??梢允加陬佒?,但最后還是要終于價值,因為人們開發(fā)數(shù)字人,不是為了觀賞,而是為了使用。2022年被業(yè)界稱為“數(shù)字人元年”,數(shù)字人的相關(guān)應(yīng)用剛剛起步。傳統(tǒng)文化領(lǐng)域是應(yīng)用數(shù)字人比較多的領(lǐng)域,且應(yīng)用場景越來越豐富。

2022年7月,身著漢服的“艾雯雯”在國家博物館上崗。她穿梭于國博各展廳,為慕名而來的全球游客介紹著國博140多萬件館藏文物。中國文物交流中心的“文夭夭”,除了在各大博物館提供講解、導(dǎo)覽服務(wù),還擔(dān)任“文博虛擬新聞官”,經(jīng)常跟隨展覽出海,傳播中華文化。

圖 | 數(shù)字人艾雯雯

除了文化價值,數(shù)字人的商業(yè)價值也不可或缺。

今年2月,涉及數(shù)字人業(yè)務(wù)的企業(yè)世優(yōu)科技、風(fēng)語筑等均提到正在研發(fā)相關(guān)技術(shù),試圖將數(shù)字人接入ChatGPT。

這其中,吸引了大半科技圈關(guān)注的是,百度在短短一周時間內(nèi),連發(fā)四條官方推文,介紹其即將推出中國版“GPT大模型”文心一言。

而發(fā)布這條消息的責(zé)任編輯,正是百度的希加加、度曉曉等數(shù)字人“成員”。數(shù)字人和“ChatGPT”的聯(lián)動,讓不少網(wǎng)友期待不已。

據(jù)了解,目前已經(jīng)有包括互聯(lián)網(wǎng)、媒體、金融、保險、汽車、企業(yè)軟件等行業(yè)的近300家頭部企業(yè)宣布加入百度“文心一言”生態(tài)。

圖 | 不同類型的虛擬數(shù)字人

天娛數(shù)科證券部人士認為,AI和數(shù)字人結(jié)合會成為一種趨勢?!奥斆髑胰诵曰膶υ掦w驗,不再只依托于文字,而是以生動形象的數(shù)字人形式輸出,或?qū)⒊删虯IGC數(shù)字人的另一個里程碑?!?/p>

不過,業(yè)界也有觀點認為,當前ChatGPT尚處于發(fā)展的早期探索階段,關(guān)鍵核心技術(shù)發(fā)展尚不成熟。從數(shù)據(jù)上來看,目前ChatGPT背后的GPT3.5大模型,參數(shù)大概1750億個,而人腦擁有近1000億個神經(jīng)元和100萬億個連接,模型的參數(shù)量級還遠沒有達到人腦的數(shù)量級。同時,AIGC模型需要大量數(shù)據(jù)參與訓(xùn)練,因此對算力基礎(chǔ)設(shè)施有較高要求。

IDC中國助理研究總監(jiān)盧言霞指出,當前AI數(shù)字人在部分領(lǐng)域已經(jīng)發(fā)揮出明顯的商業(yè)價值,未來在生活與工作中,將會有大規(guī)模的數(shù)字人隊伍與人類共存。不過,也要理性看待行業(yè)發(fā)展,盡管目前數(shù)字人市場火熱,前行仍需腳踏實地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。