文|熊出墨請注意 彬彬
“注意看,眼前這個男人正在XX”
毫不夸張,現(xiàn)在無論我們走到哪都很難逃過上面這個聲音。雖然其在努力模仿人類的節(jié)奏語調(diào),但還是能一耳朵就能聽出來正在解說電影的,不是人,而是AI。
輸入文案,自動合成語音,AI已成當下短視頻批量化生產(chǎn)的標配。而在語音之外,影像亦是AI的主攻方向。
先是AI作畫火出圈,抖音平臺上,#AI作畫的話題播放量達1.7億次,#AI繪畫的播放量更是高達11.8億次。然后是文本生成視頻,AI的內(nèi)容生成能力再上一個臺階,Meta、Google近日陸續(xù)發(fā)布了由AI生成的短視頻,百家號、TikTok等內(nèi)容平臺同樣押注AI,更新相關(guān)輔助創(chuàng)作功能。
國慶期間《人民日報》官方賬號還專門發(fā)布了一條AI繪畫版《我的祖國》MV,全網(wǎng)網(wǎng)友喜聞樂見。
從語音到靜態(tài)畫面再到動態(tài)影像,至此,AIGC(人工智能生成內(nèi)容)對短視頻完成了全面滲透。
考慮到AI的進化速度,昨天還只會咿呀學語,今天就能憑空生成真實世界并不存在的視頻畫面,擔憂自然隨之而來。鏡頭交給AI,創(chuàng)作者何去何從、平臺怎樣應對?
AI對短視頻的“入侵”,牽扯出一系列值得討論的問題。
用戶愛看,不容小覷的AIGC
截至2022年中,中國短視頻用戶達到9.62億,占整體網(wǎng)民的91.5%。在這樣一個短視頻大盤里,AI生成的內(nèi)容的群眾基礎如何?
視頻平臺上近期興起的一類內(nèi)容可以作為參考。
選一首大眾熟悉的歌曲,讓AI根據(jù)歌詞生成畫面,組合起來便是一支由AI執(zhí)導的MV。比如《漠河舞廳》《孤勇者》《殺死那個石家莊人》《波西米亞狂想曲》等,都能找到相關(guān)的AI作畫視頻。
而且,此類視頻的關(guān)注度也相當可觀。以B站上《殺死那個石家莊人》相關(guān)視頻為例,畫面由名為“Midjourney”的AI繪畫程序所作,9月30日發(fā)布,十余天時間其播放量累計達103.4萬,點贊量4.4萬。
“學了五六年美術(shù),畫功不如AI輸入詞條幾十秒就出的畫”,在看過視頻之后,網(wǎng)友“奶酪”給出評價,“畫不完美,可學習能力讓人驚嘆。”而且,在好奇心的驅(qū)使下,奶酪開始在各個平臺搜索相關(guān)內(nèi)容。
切換到AI視角,感受算法模型對世界的認知,這其實正是AIGC贏得廣泛關(guān)注的直接原因。
AI創(chuàng)作的靜態(tài)畫面已然火爆至此,若進一步升級為短視頻,對用戶的吸引可以想象。
而從靜向動,從二維升級三維恰是AIGC發(fā)展的大勢所在,Meta和Google近期的動作就是風向標,二者先后發(fā)布了根據(jù)文本生成視頻的最新研究成果。
從Google發(fā)布的樣片來看,AI不僅可以理解文字并生成高清動態(tài)影像,如騎馬、沖咖啡等,還能在文字故事的基礎上以影像呈現(xiàn)一段完整的長鏡頭,時長可達2分鐘以上。
基于AI已經(jīng)初步具備創(chuàng)作短視頻能力的事實,有業(yè)內(nèi)人士評論稱,“隨著AI對于短視頻的‘入侵’與日俱深,短視頻平臺的內(nèi)容池里除傳統(tǒng)的UGC(專業(yè)生產(chǎn)內(nèi)容)、PGC(用戶生產(chǎn)內(nèi)容)以外,AIGC將占到更多比例,且流量號召力不容小覷。”
Gartner相關(guān)報告中也明確指出,預計到2023年,將有20%的內(nèi)容被生成式AI所創(chuàng)建。2025年,生成性AI所創(chuàng)造的數(shù)據(jù)將占到所有已生產(chǎn)數(shù)據(jù)的10%,當下該比例不足1%。
同為創(chuàng)作者,AI與人類同臺競技
在同一條賽道里爭奪用戶的注意力,AI與創(chuàng)作者之間的競爭關(guān)系顯現(xiàn)。Meta、Google的AI模型生成視頻的消息一出,“搶飯碗”的言論便甚囂塵上。
事實上,AI與人類之間的愛恨糾纏,并不是新鮮話題。聚焦到內(nèi)容創(chuàng)作領域,不久前網(wǎng)友剛進行過一次大規(guī)模辯論,起因為國外的一場藝術(shù)博覽會把頭獎頒給了AI繪畫的作品,引來人類藝術(shù)家全體不服。
在深圳經(jīng)營MCN機構(gòu)的彭磊,公司運營著多個短視頻平臺賬號,他認為,“對AI的反感可以理解,但是AI來搶飯碗、短視頻行業(yè)要變天的說法站不住腳。這種非黑即白的認知大概率是錯的,之前也有過驗證?!?/p>
舉個例子,在短視頻火起來之前,圖文媒體時代,AI技術(shù)被引入寫作,當時市場也一度悲觀地預判文字工作者將被取代。事實證明,擔心是多余的。
“短視頻行業(yè)繞不開AI,字幕、配音都是,接下來也會長期共存。大家使用技術(shù)目的是提高效率,可有些功能便利的代價就是影響作品整體觀感。比如配音,AI永遠是在模仿人類,對作品有要求的創(chuàng)作者來說一般是避開AI配音,因為它和真人差距明顯,工業(yè)化痕跡太重”,彭磊表示。
另一位做影視解說的博主表達了相同觀點,“按需使用,AI配音優(yōu)勢在于快速批量復制,以量取勝。真正的優(yōu)質(zhì)作品基本不會允許自己精心寫的文案以那種機器聲線讀出來,以質(zhì)取勝?!?/p>
因此,“AI技術(shù)在降低內(nèi)容生產(chǎn)的門檻,放低了下限,上限依然靠的是人類創(chuàng)作者?!?/p>
這便是AIGC固有的局限性,AI作畫、AI生成視頻同樣難以繞過。
以AI作畫為例,在欣賞了多幅畫作之后,奶酪發(fā)現(xiàn),“AI作畫初看驚嘆,卻非常容易造成審美疲勞,看多了感覺每一幅都在重復。”
在專業(yè)人士的解釋里,之所以會有上述感覺,原因很簡單,所有的AI作畫都是在人類已經(jīng)創(chuàng)造的畫風、技巧之上通過模型計算得出。而且,機器更多只是表層理解,無法參透深意,就是常說的“沒有靈魂”。
所以,當AIGC的新鮮感光環(huán)消散,觀眾的視線焦點回歸內(nèi)容本身,AI作畫、AI生成視頻將被重新審視。到時再說“搶飯碗”的話題,或許會得到不同的答案。
從輔助創(chuàng)作到原創(chuàng)生成,平臺的機遇與挑戰(zhàn)
行業(yè)新技術(shù)的出現(xiàn),除了直接影響到用戶、創(chuàng)作者群體,平臺方作為舞臺的搭建者,自然也在密切關(guān)注。
第一階段是「助手階段」,AIGC輔助人類進行內(nèi)容生產(chǎn);第二階段是「協(xié)作階段」,AIGC以虛實并存的虛擬人形態(tài)出現(xiàn),形成人機共生的局面;第三階段是「原創(chuàng)階段」,AIGC將獨立完成內(nèi)容創(chuàng)作。
參照李彥宏所講的AIGC的三個發(fā)展階段,縱觀當前內(nèi)容平臺的布局,無論圖文還是短視頻平臺,其服務能力大多停留在第一階段,即使用AI相關(guān)的技術(shù)幫助創(chuàng)作者進行更高效率的寫作、拍視頻。
如抖音官方剪輯軟件剪映提供的語音識別轉(zhuǎn)字幕、文字生成語音等,B站官方剪輯軟件必剪推出的智能摳圖等AI功能。
有業(yè)內(nèi)人士進一步補充,“包括拍短視頻時會用到的漫畫風、迪士尼風、變老這些特效濾鏡,也都和AI技術(shù)有結(jié)合。不過這些還沒有達到獨立生成視頻的高度,是介于輔助創(chuàng)作和原創(chuàng)生成之間,跟ZAO換臉APP一樣,借助生成類網(wǎng)絡完成?!?/p>
隨著AIGC技術(shù)發(fā)展,內(nèi)容平臺的服務能力將迎來升級。
以創(chuàng)作者的圖文轉(zhuǎn)視頻需求為例,剪映為此推出“圖文成片”功能,輸入一段文字,軟件智能匹配圖片素材、添加字幕、旁白和音樂,自動生成視頻。百家號等內(nèi)容平臺也提供了相關(guān)的解決方案。
身處創(chuàng)作一線的彭磊認為:“現(xiàn)在的轉(zhuǎn)視頻,工作時間上確實可以把一條視頻的制作縮短到分鐘級,可成片效果并不理想。單純是從素材庫選圖、選視頻拼湊實現(xiàn)。體驗都是一樣的雞肋,經(jīng)??梢杂龅絾栴}就是,本來完整的一句話,中間如果有停頓,系統(tǒng)可能就會根據(jù)前后句找來兩段完全沒關(guān)聯(lián)的素材拼在一起?!?/p>
正所謂能用起來的技術(shù)才是好技術(shù),現(xiàn)階段內(nèi)容平臺的服務能力尚存在較大進步空間,AIGC技術(shù)的發(fā)展正是解決之道。
而另一方面,AIGC的大面積上線,必然會給平臺內(nèi)容生態(tài)帶來新的管理挑戰(zhàn)。
此前,AI技術(shù)在短視頻領域的濫用已有不少前車之鑒。原因在于AIGC有一個非常顯著的特點——以假亂真。
最典型的,市面上有很多開放性的AI換臉工具,創(chuàng)作者使用軟件對視頻內(nèi)容進行加工,輕易就能達到移花接木的效果。此前抖音有人疑似使用AI換臉變身俄羅斯美女,吸粉近200萬后遭到平臺封禁;B站上AI換臉更是創(chuàng)作者鬼畜整活的最常用手段,平臺則會在相關(guān)視頻下方給出警醒提示。
目前最前沿的AI作畫、AI生成視頻,其無中生有的特性,無疑放大了內(nèi)容造假的風險。
國外熱度頗高的文本繪畫程序Stable Diffusion就遇到了這樣的麻煩,由于開發(fā)者不對生成內(nèi)容加以審核過濾,用戶可以生成各種圖片,為欺詐、侵犯他人肖像、盜版抄襲等提供了可乘之機。
對于抖音、快手、B站等平臺來說,如何加強對此類視頻進行“無害化處理”,顯然不比治理AI換臉來得輕松。這就意味著,在將新技術(shù)用好之前,平臺不可避免會經(jīng)歷一段陣痛期。
AIGC的明天,不止于短視頻
有人期待技術(shù)為己所用,有人擔心被AIGC搶了飯碗,更有甚者預言短視頻將要變天......
而在真正爆發(fā)之前,一切其實都還是未知數(shù)。但可以確定,AIGC對內(nèi)容領域的滲透還在繼續(xù),AIGC產(chǎn)業(yè)仍將快速擴張。
如果把AIGC的概念繼續(xù)放寬,在AI作畫、AI生成視頻等內(nèi)容生產(chǎn)之外,業(yè)內(nèi)通常還會把虛擬數(shù)字人也視作AIGC的另一核心載體。
鑒于虛擬數(shù)字人的極高熱度,AIGC的發(fā)展空間更加值得肯定。
當前短視頻平臺上的虛擬人隊伍正在不斷壯大,形象各異的他們已在短視頻創(chuàng)作群體中占據(jù)一席之地。數(shù)據(jù)顯示,平臺上相關(guān)視頻的播放總量早已破億。
而有關(guān)虛擬人的另一個客觀事實則告訴我們,短視頻只是其應用場景之一。VC數(shù)千億的投入,阿里、百度、字節(jié)、華為等科技互聯(lián)網(wǎng)公司共同出手,更大概率上瞄準的是虛擬人在短視頻之外的廣闊天地。
由點及面,AIGC在向短視頻全面滲透,但其未來的應用價值絕不止于此。放眼整個AI領域,AIGC所涵蓋的生成性AI技術(shù)被認定為AI領域過去10年最有前景的進展。
無可厚非的是,面對前沿技術(shù)所代表的未知,大家在期待的同時總是伴有本能的恐懼。
幾百年前火車問世,引擎轟鳴驅(qū)動人類社會進入高速時代,卻也上演了人拉火車的鬧??;幾年前5G商用之際,對于5G輻射過大的質(zhì)疑不絕于耳,現(xiàn)國內(nèi)三大運營商的5G套餐用戶已接近10億;再到方興未艾的AIGC,各方不同的態(tài)度其實都在情理之中。
作為從業(yè)者以及創(chuàng)作者,彭磊對AI生成視頻以及AIGC市場持有樂觀態(tài)度,“最直觀的一點,AI生成視頻可以從根源上解決創(chuàng)作者的素材困擾。找不到合適素材時,直接程序生成,如果平臺放開版權(quán)歸屬,甚至都不用考慮版權(quán)糾紛,放在現(xiàn)在的創(chuàng)作環(huán)境里是完全不敢想的?!?/p>
或許,將期待與恐懼疊加,放眼前沿的同時對技術(shù)審慎待之,這才是我們在討論AIGC之于短視頻產(chǎn)業(yè)的影響時應有的基本立場。