正在閱讀:

AIGC的“含科量”與“含資量”

掃一掃下載界面新聞APP

AIGC的“含科量”與“含資量”

AIGC的故事恐怕還是要從“元宇宙”說起。

文|腦極體

2014年的時(shí)候,我在互聯(lián)網(wǎng)企業(yè)里做內(nèi)容工作,當(dāng)時(shí)業(yè)內(nèi)很流行凱文·凱利的“一千個(gè)粉絲”理論,相信“找到一千個(gè)種子用戶,產(chǎn)品就能夠活下去”。

找到種子用戶干嘛呢?核心KPI之一,就是鼓勵(lì)他們創(chuàng)造內(nèi)容,提高平臺(tái)的UGC數(shù)量與質(zhì)量。

普通人也輕松能創(chuàng)作的圖文短視頻,用愛發(fā)電的同人衍生,極具創(chuàng)意的鬼畜視頻……UGC(User-generated content用戶生產(chǎn)內(nèi)容),以高效、豐富、多元的產(chǎn)出方式,和PGC(Professional-generated content專家生產(chǎn)內(nèi)容)、OGC(Occupationally-generated Content職業(yè)生產(chǎn)內(nèi)容)一起,讓互聯(lián)網(wǎng)數(shù)字內(nèi)容呈現(xiàn)出前所未有的繁榮多彩。

一個(gè)時(shí)代有一個(gè)時(shí)代的主題,如今業(yè)內(nèi)流行的內(nèi)容生產(chǎn)模式,則是AIGC。

AI-generated content,字面意思是AI生產(chǎn)內(nèi)容。AI寫詩、AI作曲、AI繪畫、AI換臉……甚至有創(chuàng)始人認(rèn)為,游戲中導(dǎo)入圖片生成模型的“捏臉系統(tǒng)”都是AIGC。

那么問題來了,讓AI替人舞文弄墨,對(duì)話交互問答、創(chuàng)意寫作、生成詩歌圖文或是以假亂真的視頻,不都是舊新聞了嚒,都屬于自然語言生成Natural Language Generation (NLG)的應(yīng)用,是NLP自然語言處理技術(shù)的一大類任務(wù),已經(jīng)應(yīng)用將近30年了。

怎么突然就以AIGC的概念成為資本熱捧的對(duì)象呢?

故事恐怕還是要從“元宇宙”說起。

AIGC,到底生產(chǎn)的是什么內(nèi)容?

在內(nèi)外網(wǎng)搜索 “AIGC”時(shí),精準(zhǔn)匹配的是簡(jiǎn)體中文信息,而英文AI-generated content一詞,在海外平臺(tái)主要還是以自動(dòng)化生成文本的NLG技術(shù)為主。所以,AIGC應(yīng)該是一個(gè)在中國率先流行起來的專有名詞。

目前為止,與AIGC相關(guān)的創(chuàng)作類型主要有三種:

1、內(nèi)容平臺(tái)的一種自動(dòng)化作業(yè)方式,比如CCTV的AIGC平臺(tái),就包括智能采編、模板生成、畫質(zhì)優(yōu)化等等;部分語音類app,通過語音合成 (TTS)技術(shù),提供文本自動(dòng)轉(zhuǎn)語音的能力;流媒體平臺(tái),通過算法對(duì)畫面畫質(zhì)進(jìn)行優(yōu)化,提高清晰度等等。

2、AI科研機(jī)構(gòu)的多模態(tài)應(yīng)用,實(shí)現(xiàn)內(nèi)容生成。比如中科院自動(dòng)化所的跨模態(tài)通用人工智能平“紫東太初”,就能夠做到“以圖生音”“以音生圖”。百度文心大模型的“AI畫家”,則在前不久的元宵節(jié),生成與地點(diǎn)相匹配的專屬畫作。

3、科技企業(yè)及創(chuàng)業(yè)公司的數(shù)字人、虛擬人制作。通過自主開發(fā)、平臺(tái)開發(fā)等形式,合成全新的人物形象,與用戶開展互動(dòng)。比如AI手語主播,通過AI算法將文本轉(zhuǎn)化為手語信息,為聽障朋友提供服務(wù);品牌代言人,火星車數(shù)字人祝融號(hào)跟廣大用戶進(jìn)行互動(dòng);虛擬偶像,通過生動(dòng)的表情、動(dòng)作、語言等展示才藝,與粉絲對(duì)話;以及智能客服、游戲陪玩等等。

通過上述AIGC應(yīng)用,或許不難理解,為什么NLG往往依靠夸張新聞點(diǎn)(比如deepfake)偶爾進(jìn)入大眾視野,而AIGC一詞出道即爆紅了。

小紅靠捧,大紅靠命:AIGC的“含科量”有多高?

如前所說,自然語言生成NLG作為AI創(chuàng)作內(nèi)容的一種主流方式,此前在大部分時(shí)間內(nèi)都是行業(yè)內(nèi)自娛自樂,偶爾憑借“換臉”之類的奇趣新聞火一把,但僅此而已。

而AIGC這一概念,在當(dāng)下能夠迅速走紅,可以說是時(shí)也、運(yùn)也。

首先,深度學(xué)習(xí)技術(shù)本身不斷迭代,能夠生成更具個(gè)性化、擬人化的內(nèi)容。

隨著自然語言處理技術(shù)的不斷發(fā)展,近年來AI的閱讀理解創(chuàng)作能力進(jìn)步飛快,已經(jīng)達(dá)到了驚人的水平,技術(shù)成熟給了AIGC廣泛應(yīng)用的基礎(chǔ)。

隨著AI模型GPT-3的問世,機(jī)器已經(jīng)能夠達(dá)到人類小學(xué)的閱讀寫作水平,頂級(jí)AI企業(yè)的中文普通話識(shí)別準(zhǔn)確率能夠達(dá)到98%以上,多語言、小語種、方言的識(shí)別率也不斷升級(jí)。此外,情感計(jì)算、因果計(jì)算、知識(shí)圖譜、元學(xué)習(xí)等多種技術(shù)開始被引入深度學(xué)習(xí),大幅改善了人機(jī)交互的自然感。

這些新成果應(yīng)用在內(nèi)容創(chuàng)作上,就是大家能看到AI寫出更流利通順的文章、用更自然的音色去朗讀一本書、更聲情并茂地跟人對(duì)話、對(duì)用戶輸入的語句理解得更準(zhǔn)確,一句話,終于開始擺脫“人工智障”的標(biāo)簽了。

第二,AI基礎(chǔ)設(shè)施不斷發(fā)展,多模態(tài)大模型的相繼成熟落地。

如果只是生成單一的內(nèi)容,那么AIGC或許還不至于讓見多識(shí)廣的大眾眼前一亮。而多模態(tài)大模型的出現(xiàn),讓融合性創(chuàng)新成為可能。

多模態(tài)大模型,既需要具備NLP(自然語言理解)大模型、CV(計(jì)算機(jī)視覺)大模型等的能力,理解語言、視覺的內(nèi)容,還要能夠跨模態(tài)生成全新的內(nèi)容,由此帶來了非常多的創(chuàng)意空間。比如通過一部小說的文字描寫,生成故事畫面、人物形象、環(huán)境布景等,可以幫助創(chuàng)作者大大節(jié)省時(shí)間。

正因如此,多模態(tài)大模型需要處理的數(shù)據(jù)類型多,規(guī)模量大,模型參數(shù)已經(jīng)達(dá)到千億級(jí)別,需要龐大的算力來支撐。得益于全國多地對(duì)AI基礎(chǔ)設(shè)施的重視和建設(shè),才能夠讓多模態(tài)應(yīng)用達(dá)到比較好的效果,進(jìn)而支撐AIGC創(chuàng)作業(yè)態(tài)的進(jìn)一步發(fā)展。

此外,AI平臺(tái)化的生態(tài)搭建,以及充足廣闊的產(chǎn)業(yè)實(shí)踐空間。

大模型雖好,對(duì)于很多企業(yè)和創(chuàng)作者來說,想要自己從頭開發(fā)一套大模型用來進(jìn)行AIGC既不經(jīng)濟(jì)、也不現(xiàn)實(shí)。這時(shí)候,AI平臺(tái)化、民主化就變得至關(guān)重要。

去年推出的許多多模態(tài)大模型,如紫東太初、文心、M6等,都通過AI平臺(tái)進(jìn)行開源,可以直接調(diào)用并通過云端算力進(jìn)行訓(xùn)練。一些科技企業(yè)也將數(shù)字人技術(shù)開源開放,這些動(dòng)作大大降低了企業(yè)和創(chuàng)業(yè)者的開發(fā)門檻,創(chuàng)作效率提升,進(jìn)而助力高質(zhì)量AIGC變得普及。

目前,南京、武漢等地,已經(jīng)開始形成多模態(tài)應(yīng)用的產(chǎn)業(yè)集群。而千行百業(yè)的數(shù)字化、數(shù)字經(jīng)濟(jì)的持續(xù)發(fā)展,也給予了AIGC前所未有的產(chǎn)業(yè)空間與實(shí)踐場(chǎng)景。比如此次受資本追捧的一些AIGC公司,就瞄準(zhǔn)了“游戲+AI”場(chǎng)景,通過算法生成數(shù)字人、語言互動(dòng)等方式,滿足玩家在虛擬世界中個(gè)性化、定制化的體驗(yàn)需求。而更多的產(chǎn)業(yè)實(shí)踐,也會(huì)源源不斷地產(chǎn)生新的數(shù)據(jù),推動(dòng)算法的迭代升級(jí)。

AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化的發(fā)展,當(dāng)下已經(jīng)能夠支持內(nèi)容創(chuàng)作的大變革,AIGC的流行,自然也就水到渠成了。

“含資量”不低,警惕AIGC的虛火

AI創(chuàng)作的大行其道,是科技發(fā)展到一定水平后的必然現(xiàn)象。但資本熱捧,許多投融資消息突如其來,卻給“AIGC”一詞添上了一種別樣的味道。

為什么說是“突然”呢?如前所說,AI寫詩之類的NLG應(yīng)用并不罕見,但一直沒有被以“AIGC”一詞整合包裝起來。2021年7月,一位股民詢問擁有虛擬數(shù)字技術(shù)開發(fā)業(yè)務(wù)的絲路視覺:在AIGC技術(shù)上是否有儲(chǔ)備或應(yīng)用?結(jié)果被該企業(yè)發(fā)言人直接反問:啥是AIGC?顯然,當(dāng)時(shí)“AIGC”一詞就連從事相關(guān)業(yè)務(wù)的企業(yè)高管都不熟悉。

而在某問答平臺(tái)上,關(guān)于“AIGC未來會(huì)扮演什么樣的角色”的問題,只有一個(gè)回答,來自某投資機(jī)構(gòu),而該機(jī)構(gòu)正是某AIGC沙龍的組織方,參與討論的創(chuàng)始人也主要描繪了一種核心的AIGC應(yīng)用場(chǎng)景,那就是元宇宙。

而剛剛拿下千萬美金融資的某AI公司,正在布局的AIGC領(lǐng)域也聚焦在虛擬人技術(shù),為游戲行業(yè)提供基于AI的智能NPC、自動(dòng)化QA、對(duì)話系統(tǒng)和AI陪玩。完成1億美元融資、由紅杉中國領(lǐng)投的某獨(dú)角獸,核心產(chǎn)品則是AI bot,表示希望作為虛擬世界的先鋒,圍繞元宇宙開展多維度的基建。

從這些脈絡(luò)中不難看出,AIGC技術(shù)本身很真實(shí),但長期以來一直處于默默發(fā)展、偶爾出圈的狀態(tài)。能夠在近期快速成為一個(gè)風(fēng)口、一種網(wǎng)紅概念,與元宇宙的爆火、資本的動(dòng)向,不無關(guān)系。

在這個(gè)新故事中,一般會(huì)有如下邏輯:1.元宇宙需要很多數(shù)字人、需要個(gè)性化的數(shù)字環(huán)境;2.這些內(nèi)容光靠人來開發(fā)周期太長,需要更高效的生產(chǎn)方式;3.AI的能力就是提質(zhì)增效,適合用來創(chuàng)作;4.所以,AIGC有前途。

歸根結(jié)底就是,元宇宙要火了,AI能做。

AI能做是真,但元宇宙到底啥時(shí)候火,可就沒個(gè)準(zhǔn)數(shù)了。

我們此前探討過,作為一個(gè)復(fù)雜龐大的技術(shù)集群概念,元宇宙依賴很多技術(shù)的成熟,距離真正成型還很遙遠(yuǎn)。在這一天到來之前,沒有人能清楚地定義什么是元宇宙,自然也不可能量化出到底需要多少虛擬人、數(shù)字人。那么,為了元宇宙而生的AIGC,到底價(jià)值幾何,可能就跟元宇宙一樣,是個(gè)見仁見智的玄學(xué)了。

既然AIGC的走紅是技術(shù)發(fā)展的產(chǎn)物,那么它的上限,自然也要受到技術(shù)規(guī)律的約束。誠然,AI的發(fā)展給內(nèi)容創(chuàng)作帶來了很多可能,但技術(shù)也決定了很多內(nèi)容依然是AI無法做到的:

首先,AIGC的內(nèi)容質(zhì)量有待提升。

OpenAI用于編寫內(nèi)容的通用GPT-3模型發(fā)布之后,很多內(nèi)容機(jī)構(gòu)都基于它開發(fā)了相應(yīng)的創(chuàng)作模型。目前來看,主要應(yīng)用還是一些重復(fù)枯燥工作的自動(dòng)化,以CCTV的AIGC平臺(tái)為例,主要是自動(dòng)完成挖掘新聞熱點(diǎn),將新聞報(bào)道數(shù)據(jù)進(jìn)行深度關(guān)聯(lián)、輔助編輯選題策劃,基于模板快速生成海報(bào)圖片圖表,智能生成內(nèi)容標(biāo)簽,修復(fù)歷史視頻等等。

一些用于生成內(nèi)容的AI編寫器,創(chuàng)作能力實(shí)在是不太行。要么只能用于生成一些符合SEO(搜索引擎優(yōu)化)的營銷內(nèi)容,比如YouTube視頻標(biāo)題、Facebook廣告標(biāo)題、GoogleAds標(biāo)題和描述、亞馬遜產(chǎn)品描述等等,主要是更通順地把關(guān)鍵詞堆疊在一起,你不會(huì)覺得某寶的寶貝標(biāo)題就是一篇“大作”吧。

要么是由機(jī)器學(xué)習(xí)黑匣子生成的博客文章。對(duì)于這類文章,平臺(tái)們往往也會(huì)提醒,AI無法復(fù)制情感,沒有靈魂、同理心、經(jīng)驗(yàn)等細(xì)微差別。所以也會(huì)建議使用AIGC工具的創(chuàng)作者,雇用人類作家來校對(duì)這些工具創(chuàng)建的內(nèi)容。

所以至少目前為止,AIGC能提供很多幫助,但還是無法取代人類創(chuàng)作者的。

這是我用一個(gè)海外AI一句話生成器寫出來的文章,可以說是前言不搭后語,大家給它打幾分呢?

其次,AIGC的交互能力還不夠自然。

雖說NLP技術(shù)有了極大的進(jìn)步,人工智能聊天機(jī)器人可以幫助企業(yè)與潛在客戶聊天、給轄區(qū)居民撥打電話、為電商平臺(tái)用戶提供售前售后咨詢服務(wù)……但想必大家依然還是能夠很明顯地區(qū)別出,對(duì)面到底是真人還是聊天機(jī)器人。反正我本人,如果需要完成一些復(fù)雜的交流和操作,都會(huì)一開始就輸入“人工客服”“找人工”等命令,而不是跟智能客服在那里“鬼打墻”。

目前,基于AI技術(shù)的人機(jī)交互還需要漫長的試錯(cuò)、實(shí)踐、積累、迭代,更適用于一些重復(fù)率高、流程標(biāo)準(zhǔn)化、對(duì)專業(yè)度或靈活響應(yīng)度沒那么高的交流。比如在智能音箱里跟主人閑聊,作為虛擬偶像滿足粉絲的基本情感互動(dòng)需求,或是在電商場(chǎng)景里作為主播“念稿子”直播帶貨。

這里面其實(shí)已經(jīng)有非常大的想象空間了,雖然距離“元宇宙”中那種“和真實(shí)的人一樣”的愿景還有距離。

從應(yīng)用前景來看,“含科量”滿滿的AIGC,打開了內(nèi)容創(chuàng)作的想象力,將會(huì)給包括虛擬人、數(shù)字人、圖文音影游等各種應(yīng)用創(chuàng)新帶來可能。

在廣闊的產(chǎn)業(yè)和個(gè)人消費(fèi)市場(chǎng),AIGC正等待著展翅高飛。而“含資量”不低的AIGC風(fēng)口,當(dāng)元宇宙的熱潮退卻后,又會(huì)有多少裸泳的人,就需要時(shí)間來告訴我們答案了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

AIGC的“含科量”與“含資量”

AIGC的故事恐怕還是要從“元宇宙”說起。

文|腦極體

2014年的時(shí)候,我在互聯(lián)網(wǎng)企業(yè)里做內(nèi)容工作,當(dāng)時(shí)業(yè)內(nèi)很流行凱文·凱利的“一千個(gè)粉絲”理論,相信“找到一千個(gè)種子用戶,產(chǎn)品就能夠活下去”。

找到種子用戶干嘛呢?核心KPI之一,就是鼓勵(lì)他們創(chuàng)造內(nèi)容,提高平臺(tái)的UGC數(shù)量與質(zhì)量。

普通人也輕松能創(chuàng)作的圖文短視頻,用愛發(fā)電的同人衍生,極具創(chuàng)意的鬼畜視頻……UGC(User-generated content用戶生產(chǎn)內(nèi)容),以高效、豐富、多元的產(chǎn)出方式,和PGC(Professional-generated content專家生產(chǎn)內(nèi)容)、OGC(Occupationally-generated Content職業(yè)生產(chǎn)內(nèi)容)一起,讓互聯(lián)網(wǎng)數(shù)字內(nèi)容呈現(xiàn)出前所未有的繁榮多彩。

一個(gè)時(shí)代有一個(gè)時(shí)代的主題,如今業(yè)內(nèi)流行的內(nèi)容生產(chǎn)模式,則是AIGC。

AI-generated content,字面意思是AI生產(chǎn)內(nèi)容。AI寫詩、AI作曲、AI繪畫、AI換臉……甚至有創(chuàng)始人認(rèn)為,游戲中導(dǎo)入圖片生成模型的“捏臉系統(tǒng)”都是AIGC。

那么問題來了,讓AI替人舞文弄墨,對(duì)話交互問答、創(chuàng)意寫作、生成詩歌圖文或是以假亂真的視頻,不都是舊新聞了嚒,都屬于自然語言生成Natural Language Generation (NLG)的應(yīng)用,是NLP自然語言處理技術(shù)的一大類任務(wù),已經(jīng)應(yīng)用將近30年了。

怎么突然就以AIGC的概念成為資本熱捧的對(duì)象呢?

故事恐怕還是要從“元宇宙”說起。

AIGC,到底生產(chǎn)的是什么內(nèi)容?

在內(nèi)外網(wǎng)搜索 “AIGC”時(shí),精準(zhǔn)匹配的是簡(jiǎn)體中文信息,而英文AI-generated content一詞,在海外平臺(tái)主要還是以自動(dòng)化生成文本的NLG技術(shù)為主。所以,AIGC應(yīng)該是一個(gè)在中國率先流行起來的專有名詞。

目前為止,與AIGC相關(guān)的創(chuàng)作類型主要有三種:

1、內(nèi)容平臺(tái)的一種自動(dòng)化作業(yè)方式,比如CCTV的AIGC平臺(tái),就包括智能采編、模板生成、畫質(zhì)優(yōu)化等等;部分語音類app,通過語音合成 (TTS)技術(shù),提供文本自動(dòng)轉(zhuǎn)語音的能力;流媒體平臺(tái),通過算法對(duì)畫面畫質(zhì)進(jìn)行優(yōu)化,提高清晰度等等。

2、AI科研機(jī)構(gòu)的多模態(tài)應(yīng)用,實(shí)現(xiàn)內(nèi)容生成。比如中科院自動(dòng)化所的跨模態(tài)通用人工智能平“紫東太初”,就能夠做到“以圖生音”“以音生圖”。百度文心大模型的“AI畫家”,則在前不久的元宵節(jié),生成與地點(diǎn)相匹配的專屬畫作。

3、科技企業(yè)及創(chuàng)業(yè)公司的數(shù)字人、虛擬人制作。通過自主開發(fā)、平臺(tái)開發(fā)等形式,合成全新的人物形象,與用戶開展互動(dòng)。比如AI手語主播,通過AI算法將文本轉(zhuǎn)化為手語信息,為聽障朋友提供服務(wù);品牌代言人,火星車數(shù)字人祝融號(hào)跟廣大用戶進(jìn)行互動(dòng);虛擬偶像,通過生動(dòng)的表情、動(dòng)作、語言等展示才藝,與粉絲對(duì)話;以及智能客服、游戲陪玩等等。

通過上述AIGC應(yīng)用,或許不難理解,為什么NLG往往依靠夸張新聞點(diǎn)(比如deepfake)偶爾進(jìn)入大眾視野,而AIGC一詞出道即爆紅了。

小紅靠捧,大紅靠命:AIGC的“含科量”有多高?

如前所說,自然語言生成NLG作為AI創(chuàng)作內(nèi)容的一種主流方式,此前在大部分時(shí)間內(nèi)都是行業(yè)內(nèi)自娛自樂,偶爾憑借“換臉”之類的奇趣新聞火一把,但僅此而已。

而AIGC這一概念,在當(dāng)下能夠迅速走紅,可以說是時(shí)也、運(yùn)也。

首先,深度學(xué)習(xí)技術(shù)本身不斷迭代,能夠生成更具個(gè)性化、擬人化的內(nèi)容。

隨著自然語言處理技術(shù)的不斷發(fā)展,近年來AI的閱讀理解創(chuàng)作能力進(jìn)步飛快,已經(jīng)達(dá)到了驚人的水平,技術(shù)成熟給了AIGC廣泛應(yīng)用的基礎(chǔ)。

隨著AI模型GPT-3的問世,機(jī)器已經(jīng)能夠達(dá)到人類小學(xué)的閱讀寫作水平,頂級(jí)AI企業(yè)的中文普通話識(shí)別準(zhǔn)確率能夠達(dá)到98%以上,多語言、小語種、方言的識(shí)別率也不斷升級(jí)。此外,情感計(jì)算、因果計(jì)算、知識(shí)圖譜、元學(xué)習(xí)等多種技術(shù)開始被引入深度學(xué)習(xí),大幅改善了人機(jī)交互的自然感。

這些新成果應(yīng)用在內(nèi)容創(chuàng)作上,就是大家能看到AI寫出更流利通順的文章、用更自然的音色去朗讀一本書、更聲情并茂地跟人對(duì)話、對(duì)用戶輸入的語句理解得更準(zhǔn)確,一句話,終于開始擺脫“人工智障”的標(biāo)簽了。

第二,AI基礎(chǔ)設(shè)施不斷發(fā)展,多模態(tài)大模型的相繼成熟落地。

如果只是生成單一的內(nèi)容,那么AIGC或許還不至于讓見多識(shí)廣的大眾眼前一亮。而多模態(tài)大模型的出現(xiàn),讓融合性創(chuàng)新成為可能。

多模態(tài)大模型,既需要具備NLP(自然語言理解)大模型、CV(計(jì)算機(jī)視覺)大模型等的能力,理解語言、視覺的內(nèi)容,還要能夠跨模態(tài)生成全新的內(nèi)容,由此帶來了非常多的創(chuàng)意空間。比如通過一部小說的文字描寫,生成故事畫面、人物形象、環(huán)境布景等,可以幫助創(chuàng)作者大大節(jié)省時(shí)間。

正因如此,多模態(tài)大模型需要處理的數(shù)據(jù)類型多,規(guī)模量大,模型參數(shù)已經(jīng)達(dá)到千億級(jí)別,需要龐大的算力來支撐。得益于全國多地對(duì)AI基礎(chǔ)設(shè)施的重視和建設(shè),才能夠讓多模態(tài)應(yīng)用達(dá)到比較好的效果,進(jìn)而支撐AIGC創(chuàng)作業(yè)態(tài)的進(jìn)一步發(fā)展。

此外,AI平臺(tái)化的生態(tài)搭建,以及充足廣闊的產(chǎn)業(yè)實(shí)踐空間。

大模型雖好,對(duì)于很多企業(yè)和創(chuàng)作者來說,想要自己從頭開發(fā)一套大模型用來進(jìn)行AIGC既不經(jīng)濟(jì)、也不現(xiàn)實(shí)。這時(shí)候,AI平臺(tái)化、民主化就變得至關(guān)重要。

去年推出的許多多模態(tài)大模型,如紫東太初、文心、M6等,都通過AI平臺(tái)進(jìn)行開源,可以直接調(diào)用并通過云端算力進(jìn)行訓(xùn)練。一些科技企業(yè)也將數(shù)字人技術(shù)開源開放,這些動(dòng)作大大降低了企業(yè)和創(chuàng)業(yè)者的開發(fā)門檻,創(chuàng)作效率提升,進(jìn)而助力高質(zhì)量AIGC變得普及。

目前,南京、武漢等地,已經(jīng)開始形成多模態(tài)應(yīng)用的產(chǎn)業(yè)集群。而千行百業(yè)的數(shù)字化、數(shù)字經(jīng)濟(jì)的持續(xù)發(fā)展,也給予了AIGC前所未有的產(chǎn)業(yè)空間與實(shí)踐場(chǎng)景。比如此次受資本追捧的一些AIGC公司,就瞄準(zhǔn)了“游戲+AI”場(chǎng)景,通過算法生成數(shù)字人、語言互動(dòng)等方式,滿足玩家在虛擬世界中個(gè)性化、定制化的體驗(yàn)需求。而更多的產(chǎn)業(yè)實(shí)踐,也會(huì)源源不斷地產(chǎn)生新的數(shù)據(jù),推動(dòng)算法的迭代升級(jí)。

AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化的發(fā)展,當(dāng)下已經(jīng)能夠支持內(nèi)容創(chuàng)作的大變革,AIGC的流行,自然也就水到渠成了。

“含資量”不低,警惕AIGC的虛火

AI創(chuàng)作的大行其道,是科技發(fā)展到一定水平后的必然現(xiàn)象。但資本熱捧,許多投融資消息突如其來,卻給“AIGC”一詞添上了一種別樣的味道。

為什么說是“突然”呢?如前所說,AI寫詩之類的NLG應(yīng)用并不罕見,但一直沒有被以“AIGC”一詞整合包裝起來。2021年7月,一位股民詢問擁有虛擬數(shù)字技術(shù)開發(fā)業(yè)務(wù)的絲路視覺:在AIGC技術(shù)上是否有儲(chǔ)備或應(yīng)用?結(jié)果被該企業(yè)發(fā)言人直接反問:啥是AIGC?顯然,當(dāng)時(shí)“AIGC”一詞就連從事相關(guān)業(yè)務(wù)的企業(yè)高管都不熟悉。

而在某問答平臺(tái)上,關(guān)于“AIGC未來會(huì)扮演什么樣的角色”的問題,只有一個(gè)回答,來自某投資機(jī)構(gòu),而該機(jī)構(gòu)正是某AIGC沙龍的組織方,參與討論的創(chuàng)始人也主要描繪了一種核心的AIGC應(yīng)用場(chǎng)景,那就是元宇宙。

而剛剛拿下千萬美金融資的某AI公司,正在布局的AIGC領(lǐng)域也聚焦在虛擬人技術(shù),為游戲行業(yè)提供基于AI的智能NPC、自動(dòng)化QA、對(duì)話系統(tǒng)和AI陪玩。完成1億美元融資、由紅杉中國領(lǐng)投的某獨(dú)角獸,核心產(chǎn)品則是AI bot,表示希望作為虛擬世界的先鋒,圍繞元宇宙開展多維度的基建。

從這些脈絡(luò)中不難看出,AIGC技術(shù)本身很真實(shí),但長期以來一直處于默默發(fā)展、偶爾出圈的狀態(tài)。能夠在近期快速成為一個(gè)風(fēng)口、一種網(wǎng)紅概念,與元宇宙的爆火、資本的動(dòng)向,不無關(guān)系。

在這個(gè)新故事中,一般會(huì)有如下邏輯:1.元宇宙需要很多數(shù)字人、需要個(gè)性化的數(shù)字環(huán)境;2.這些內(nèi)容光靠人來開發(fā)周期太長,需要更高效的生產(chǎn)方式;3.AI的能力就是提質(zhì)增效,適合用來創(chuàng)作;4.所以,AIGC有前途。

歸根結(jié)底就是,元宇宙要火了,AI能做。

AI能做是真,但元宇宙到底啥時(shí)候火,可就沒個(gè)準(zhǔn)數(shù)了。

我們此前探討過,作為一個(gè)復(fù)雜龐大的技術(shù)集群概念,元宇宙依賴很多技術(shù)的成熟,距離真正成型還很遙遠(yuǎn)。在這一天到來之前,沒有人能清楚地定義什么是元宇宙,自然也不可能量化出到底需要多少虛擬人、數(shù)字人。那么,為了元宇宙而生的AIGC,到底價(jià)值幾何,可能就跟元宇宙一樣,是個(gè)見仁見智的玄學(xué)了。

既然AIGC的走紅是技術(shù)發(fā)展的產(chǎn)物,那么它的上限,自然也要受到技術(shù)規(guī)律的約束。誠然,AI的發(fā)展給內(nèi)容創(chuàng)作帶來了很多可能,但技術(shù)也決定了很多內(nèi)容依然是AI無法做到的:

首先,AIGC的內(nèi)容質(zhì)量有待提升。

OpenAI用于編寫內(nèi)容的通用GPT-3模型發(fā)布之后,很多內(nèi)容機(jī)構(gòu)都基于它開發(fā)了相應(yīng)的創(chuàng)作模型。目前來看,主要應(yīng)用還是一些重復(fù)枯燥工作的自動(dòng)化,以CCTV的AIGC平臺(tái)為例,主要是自動(dòng)完成挖掘新聞熱點(diǎn),將新聞報(bào)道數(shù)據(jù)進(jìn)行深度關(guān)聯(lián)、輔助編輯選題策劃,基于模板快速生成海報(bào)圖片圖表,智能生成內(nèi)容標(biāo)簽,修復(fù)歷史視頻等等。

一些用于生成內(nèi)容的AI編寫器,創(chuàng)作能力實(shí)在是不太行。要么只能用于生成一些符合SEO(搜索引擎優(yōu)化)的營銷內(nèi)容,比如YouTube視頻標(biāo)題、Facebook廣告標(biāo)題、GoogleAds標(biāo)題和描述、亞馬遜產(chǎn)品描述等等,主要是更通順地把關(guān)鍵詞堆疊在一起,你不會(huì)覺得某寶的寶貝標(biāo)題就是一篇“大作”吧。

要么是由機(jī)器學(xué)習(xí)黑匣子生成的博客文章。對(duì)于這類文章,平臺(tái)們往往也會(huì)提醒,AI無法復(fù)制情感,沒有靈魂、同理心、經(jīng)驗(yàn)等細(xì)微差別。所以也會(huì)建議使用AIGC工具的創(chuàng)作者,雇用人類作家來校對(duì)這些工具創(chuàng)建的內(nèi)容。

所以至少目前為止,AIGC能提供很多幫助,但還是無法取代人類創(chuàng)作者的。

這是我用一個(gè)海外AI一句話生成器寫出來的文章,可以說是前言不搭后語,大家給它打幾分呢?

其次,AIGC的交互能力還不夠自然。

雖說NLP技術(shù)有了極大的進(jìn)步,人工智能聊天機(jī)器人可以幫助企業(yè)與潛在客戶聊天、給轄區(qū)居民撥打電話、為電商平臺(tái)用戶提供售前售后咨詢服務(wù)……但想必大家依然還是能夠很明顯地區(qū)別出,對(duì)面到底是真人還是聊天機(jī)器人。反正我本人,如果需要完成一些復(fù)雜的交流和操作,都會(huì)一開始就輸入“人工客服”“找人工”等命令,而不是跟智能客服在那里“鬼打墻”。

目前,基于AI技術(shù)的人機(jī)交互還需要漫長的試錯(cuò)、實(shí)踐、積累、迭代,更適用于一些重復(fù)率高、流程標(biāo)準(zhǔn)化、對(duì)專業(yè)度或靈活響應(yīng)度沒那么高的交流。比如在智能音箱里跟主人閑聊,作為虛擬偶像滿足粉絲的基本情感互動(dòng)需求,或是在電商場(chǎng)景里作為主播“念稿子”直播帶貨。

這里面其實(shí)已經(jīng)有非常大的想象空間了,雖然距離“元宇宙”中那種“和真實(shí)的人一樣”的愿景還有距離。

從應(yīng)用前景來看,“含科量”滿滿的AIGC,打開了內(nèi)容創(chuàng)作的想象力,將會(huì)給包括虛擬人、數(shù)字人、圖文音影游等各種應(yīng)用創(chuàng)新帶來可能。

在廣闊的產(chǎn)業(yè)和個(gè)人消費(fèi)市場(chǎng),AIGC正等待著展翅高飛。而“含資量”不低的AIGC風(fēng)口,當(dāng)元宇宙的熱潮退卻后,又會(huì)有多少裸泳的人,就需要時(shí)間來告訴我們答案了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。