文|毒眸
寫(xiě)幾筆腦洞,就能生成視效大片。這在以前只存于幻想,可如今卻成了現(xiàn)實(shí)。
當(dāng)?shù)貢r(shí)間2月15日,美國(guó)人工智能研究公司OpenAI發(fā)布了文生視頻模型Sora,瞬間引爆全球網(wǎng)絡(luò)。這也是其司繼曾ChatGPT之后,再度將AI技術(shù)推至輿論高點(diǎn)。
據(jù)官方介紹,用戶(hù)只要輸入提示詞、文字指令或者靜態(tài)圖像,即可獲得一條長(zhǎng)達(dá)60S的內(nèi)容視頻,并且從案例來(lái)看,視頻的場(chǎng)景精細(xì)度高、鏡頭機(jī)位豐富,角色生動(dòng)有情緒,品質(zhì)極高。
(圖源:OpenAI頁(yè)面)
當(dāng)然,其中難免有一些bug,但是不影響主流聲音。很多專(zhuān)家學(xué)者認(rèn)為,Sora的出現(xiàn),拓展了AI視頻技術(shù)的極限,將為社會(huì)生產(chǎn)和生活帶來(lái)巨大改變,但是相應(yīng)的,由于技術(shù)的替代性,也會(huì)搶奪部分人員的“飯碗”,尤其是傳媒、影視、游戲等內(nèi)容創(chuàng)作領(lǐng)域。
《年會(huì)不能停!》的編劇、導(dǎo)演董潤(rùn)年就直接在微博表示:傳統(tǒng)影視行業(yè)基本要結(jié)束了,大家想想轉(zhuǎn)行以后做點(diǎn)什么。
理論上講,如果Sora的技術(shù)達(dá)到成熟,以及規(guī)避風(fēng)險(xiǎn)開(kāi)放公用,那么確實(shí)每一個(gè)人均能先用ChatGPT寫(xiě)劇本,再用Sora生成影像。屆時(shí),人人皆可是導(dǎo)演,人人亦不是導(dǎo)演。
這無(wú)疑會(huì)讓部分工種消失,不過(guò)于行業(yè)發(fā)展的大方向而言,卻也有相當(dāng)利好的一面。因?yàn)榧偈褂布谱鞫粟呌谕|(zhì)化,只會(huì)讓創(chuàng)作的本質(zhì)——?jiǎng)?chuàng)意顯得更加重要,同時(shí)行業(yè)會(huì)整體更為注重版權(quán)保護(hù),AI信息的輸入與輸出會(huì)非常謹(jǐn)慎。
以及,更關(guān)鍵的是,AI技術(shù)哪怕再?gòu)?qiáng)大,也不會(huì)凌駕于人的創(chuàng)作之上。藝術(shù)是生命的最高使命和生命本來(lái)的形而上活動(dòng)。技術(shù)和藝術(shù)的屬性即決定,AI永遠(yuǎn)只能是工具,不能取代生命力本身的勃發(fā)與光彩。
而亦正因如此,怎樣認(rèn)識(shí)與學(xué)會(huì)使用AI就變得很重要。就像學(xué)會(huì)使用汽車(chē)、電腦、互聯(lián)網(wǎng)等產(chǎn)品,令之服務(wù)于生活。畢竟,生產(chǎn)工具決定生產(chǎn)力,生產(chǎn)力推動(dòng)社會(huì)發(fā)展。
“導(dǎo)演”Sora
Sora可音譯為索拉,在日語(yǔ)里有“天空”的意思,也可引申為“自由”。顧名思義,產(chǎn)品目的即是讓創(chuàng)意靈感自由翱翔。正如在其官方介紹頁(yè)里,能看到很多紙飛機(jī)在空中肆意飛揚(yáng)。
其實(shí)在Sora之前,市面上已經(jīng)有了Runway、Pika Labs和Stable Video等AI生成視頻模型,但是均未引起如此大的關(guān)注與討論。歸根結(jié)底,是Sora的擬真度實(shí)在太高。
截止發(fā)稿前,OpenAI已更新了48個(gè)案例視頻,內(nèi)容包羅萬(wàn)象,比如可愛(ài)小狗在雪地玩耍、時(shí)尚女性行走在東京街頭、人群追隨舞龍隊(duì)伍等現(xiàn)實(shí)場(chǎng)景;再比如滅絕的猛犸象踏雪而來(lái)、鯊魚(yú)游在高樓大廈之間等偏奇幻場(chǎng)景;還有模擬的高品質(zhì)3D動(dòng)畫(huà)片,里面的動(dòng)物毛發(fā)清晰可見(jiàn)。
(圖源:OpenAI頁(yè)面)
這些視頻充分顯示,Sora在時(shí)長(zhǎng)規(guī)格、運(yùn)鏡構(gòu)圖、生物擬態(tài)等維度均有極大突破,甚至大多細(xì)節(jié)已和人工拍攝不相上下,很像一位真實(shí)的“導(dǎo)演”。
時(shí)長(zhǎng)方面,此前AI 生成的視頻都在 4 到 16 秒之間,并且有些卡頓,類(lèi)似PPT。而Sora則將這一數(shù)據(jù)提升了4到15倍,同時(shí)能保持流暢性。規(guī)格方面,其從寬屏的1920x1080p到豎屏的1080x1920均能適應(yīng),可以打造出匹配畫(huà)幅的高精度內(nèi)容。
(圖源:OpenAI頁(yè)面)
另外,Sora還有視頻時(shí)間線(xiàn)延展功能,用戶(hù)提供一段視頻,Sora能為其填補(bǔ)前面或者后面的視頻內(nèi)容。
運(yùn)鏡上,Sora有自己的“鏡頭語(yǔ)言”。區(qū)別于通常單一視角的AI視頻輸出,針對(duì)同樣的場(chǎng)景和人物關(guān)系動(dòng)作,Sora可以像拍電影一樣,變換鏡頭角度和景別位置,完成廣角、中景、近景、特寫(xiě)等不同視角的畫(huà)面,以及自動(dòng)形成剪輯。
(圖源:OpenAI頁(yè)面)
Sora也能融合場(chǎng)景,類(lèi)似用「一支筆掉落在桌上+零食袋掉落在地上」生成「零食袋掉落在桌上」。
生物擬態(tài)側(cè),情緒是人或者動(dòng)物特有的生命狀態(tài),在喜怒哀樂(lè)的表達(dá)上,Sora明顯更為靈動(dòng)自然。
(圖源:OpenAI頁(yè)面)
而得出以上效果,與Sora對(duì)于“世界模型”的探索息息相關(guān)。
“世界模型”是AI技術(shù)的終極目標(biāo),也就是理解、重建和模擬物理世界。原理大體為,讓AI像人類(lèi)一樣先認(rèn)識(shí)和了解這個(gè)世界,再做出反應(yīng),輸出內(nèi)容。由此,Sora的視頻更順暢且符合現(xiàn)實(shí)邏輯,可以跳出2D圖片的限制,模擬出接近真實(shí)世界的場(chǎng)景和體驗(yàn)。
其中,OpenAI特別在AI訓(xùn)練時(shí),給所用的視頻素材匹配了高質(zhì)量的文本描述,以求整體提高輸出視頻的質(zhì)量。
鑒于AI的訓(xùn)練水平和“世界模型”的構(gòu)建還不完善。Sora也有不少穿幫畫(huà)面,多為物理問(wèn)題。例如老奶奶吹蠟燭,蠟燭沒(méi)有熄滅;裝著水的玻璃杯沒(méi)有碎,可是水已經(jīng)流出;三只小狗一起玩,憑空出現(xiàn)了更多小狗;籃球撞破籃筐,發(fā)生了爆炸等。
簡(jiǎn)單說(shuō),作為“導(dǎo)演”,Sora還需要更多熟悉真實(shí)世界。
“鯰魚(yú)”Sora
Sora的出現(xiàn),引得眾多KOL紛紛發(fā)表評(píng)論,有人擔(dān)心引發(fā)行業(yè)危機(jī),也有人持贊賞的態(tài)度。360集團(tuán)創(chuàng)始人、董事長(zhǎng)周鴻祎就表示,隨著Sora的到來(lái),人類(lèi)離AGI真的不遠(yuǎn)了,不是十年、二十年的問(wèn)題,可能一兩年就可以實(shí)現(xiàn)。
而無(wú)可避免的,Sora亦帶來(lái)了長(zhǎng)時(shí)間伴隨AI的倫理問(wèn)題。前段時(shí)間,梅西的道歉視頻就曾被質(zhì)疑為AI所制,在網(wǎng)上引起了討論。假設(shè)Sora投入運(yùn)用,同樣的話(huà)題將會(huì)大大增多。
以后的事還需時(shí)間驗(yàn)證,不過(guò)至少在短期看,Sora會(huì)像一條鯰魚(yú),攪動(dòng)行業(yè)生產(chǎn)活水。
(圖源:OpenAI頁(yè)面)
實(shí)際上,不管是游戲行業(yè),還是影視行業(yè),抑或是工廠運(yùn)營(yíng)、自動(dòng)駕駛等實(shí)體產(chǎn)業(yè),相關(guān)公司從未停止對(duì)AI的探索。某種意義上,作為工業(yè)化和科技化的標(biāo)志,AI是降本增效的關(guān)鍵。
影視行業(yè),Netflix在2021年10月上線(xiàn)了一部AI創(chuàng)作的懸疑喜劇動(dòng)畫(huà)《謎題先生希望你少活一點(diǎn)》;好萊塢公會(huì)在去年3月宣布,在不影響編劇署名和分成的前提下,允許AI運(yùn)用于劇本創(chuàng)作,國(guó)內(nèi)如華策、光線(xiàn)等公司也公開(kāi)發(fā)出了鼓勵(lì)的聲音;阿里大文娛則在近期優(yōu)酷播出的劇集《大唐狄公案》中,以AI輔助生成了人流、街景、樓宇建筑等畫(huà)面。
(《大唐狄公案》AI輔助場(chǎng)景)
游戲行業(yè),基于對(duì)游戲體驗(yàn)和制作成本的剛性訴求,各大游戲公司一直致力于自研AI系統(tǒng),涉及語(yǔ)音、原畫(huà)、動(dòng)捕等諸多環(huán)節(jié),《王者榮耀》就有游戲試練AI“絕悟”。短視頻行業(yè),字節(jié)跳動(dòng)則在去年11月發(fā)布過(guò)文生視頻PixelDance,功能與Sora有部分類(lèi)似,但是至今未開(kāi)放用戶(hù)測(cè)試。
這樣看,在Sora的刺激下,本來(lái)就在AI賽道上發(fā)力的公司會(huì)加大馬力,升級(jí)技術(shù),保持戰(zhàn)略?xún)?yōu)勢(shì)和競(jìng)爭(zhēng)力。
值得一提的是,Sora的核心成員僅有13人,而且平均年齡不高,2位負(fù)責(zé)人剛剛博士畢業(yè),這也給國(guó)內(nèi)培養(yǎng)AI人才給予了啟示。
(圖源:OpenAI頁(yè)面)
技術(shù)之外,創(chuàng)意亦然,甚至更加珍貴。從Sora的流程屬性看,有了AI輔助,制作和技術(shù)側(cè)的局限會(huì)大幅降低,一個(gè)作品的品質(zhì)將無(wú)限依賴(lài)于創(chuàng)作者的審美水平和指令邏輯。
與此同時(shí),創(chuàng)作者使用現(xiàn)有藝術(shù)元素或者內(nèi)容的門(mén)檻會(huì)極大提高,IP版權(quán)的成本將取代制作環(huán)節(jié)的成本。
這種情況下,道具師、剪輯師、特效師等制作端崗位可能處境嚴(yán)峻,創(chuàng)作者的內(nèi)容也會(huì)愈發(fā)五花八門(mén),需要法律和監(jiān)管部門(mén)嚴(yán)格管控。
Sora發(fā)布不到12小時(shí),導(dǎo)演郭帆在朋友圈轉(zhuǎn)發(fā)了相關(guān)鏈接并感嘆“太快了……”。盡管現(xiàn)在還不能“一鍵”生成《流浪地球3》,但是《流浪地球10》,并非沒(méi)可能。