文|勝馬財經(jīng) 武可
編輯|歐陽文
在經(jīng)歷過“宮斗”的俗套劇情沒多久,OpenAI放出了一個“王炸”——Sora。
這一文生視頻新型模型以其卓越的技術(shù)突破,引起了業(yè)內(nèi)廣泛關(guān)注,不僅在技術(shù)層面上大幅刷新了行業(yè)標(biāo)桿,而且重新定義了AI文本生成在視頻領(lǐng)域的技術(shù)極限,給2024年開年后的AI生成世界帶來了一場震撼秀。
360創(chuàng)始人周鴻祎評價Sora時說道,“它看起來是個文生視頻的工具,但實際上是AGI的第二個突破點,是解決人工智能對這個世界的觀察、交互、認(rèn)知,以及建立常識的重要里程碑?!?/p>
勝馬財經(jīng)注意到,Sora最引人注目的技術(shù)突破之一是視頻時長的顯著提升。能夠生成長達(dá)1分鐘的視頻,這遠(yuǎn)超過市面上其他AI視頻模型。通過簡單的文本指令,Sora可以直接輸出細(xì)致入微的、具有復(fù)雜多角度鏡頭和富有情感的一整分鐘視頻。
而視頻中動畫和人物動作的逼真程度,被業(yè)內(nèi)人士視作人工智能對于人類所處的物理世界理解程度的真實反映,而Sora除了在更長維度上的獨特價值外,作為一種高效工具的它,也將會給諸多行業(yè)帶來徹底的顛覆。
Sora官方演示視頻截圖
01 “王炸”Sora
根據(jù)OpenAI官網(wǎng)介紹,“Sora是通過一次性為模型提供多幀的預(yù)測,我們解決了一個具有挑戰(zhàn)性的問題。我們正在教AI理解和模擬運動中的物理世界,目標(biāo)是訓(xùn)練模型來幫助人們解決需要現(xiàn)實世界交互的問題?!?/p>
其核心技術(shù)基于Transformer架構(gòu),建立在DALL·E 3和GPT模型之上,將視頻生成的時長一次性提升15倍,顛覆了市面上所有短視頻的時長要求。
一個顯著的創(chuàng)新是Sora帶有世界模型的特質(zhì),即對真實的物理世界進(jìn)行建模,使其對世界有一個全面而準(zhǔn)確的認(rèn)知。這不僅使得AI視頻生成更流暢、更符合邏輯,降低了視頻模型的訓(xùn)練成本,還提升了訓(xùn)練效率。例如,在視頻中添加逼近真實的傾斜和顛簸感,Sora的世界模型已經(jīng)展現(xiàn)出了驚人的能力。
在核心應(yīng)用方面,Sora不僅可以通過文本生成視頻,而且可以以靜態(tài)圖片生成視頻,甚至連接兩個完全不同主題和場景的視頻,實現(xiàn)無縫過渡。這種多模態(tài)數(shù)據(jù)的通才性質(zhì),讓人驚嘆不已。
有人這樣解釋Sora的原理:想象一下你有一堆照片,有的拍攝自山川,有的是城市風(fēng)光,還有一些是海灘日落。每張照片都有不同的尺寸、分辨率和風(fēng)格。這就像是一堆雜亂的拼圖,每個拼圖都有獨特的景色和細(xì)節(jié)。然而,你希望用一種更方便處理和存儲的方式來管理這些照片。
這時候,Sora就像是一位技術(shù)高手,使用一種叫做“視頻壓縮網(wǎng)絡(luò)”的技術(shù),將這些各式各樣的照片進(jìn)行處理。類似于把所有拼圖調(diào)整成相同的大小和形狀,這樣它們更容易被組織和處理。但重要的是,這并不是要忽略每張照片獨特的景色,而是把它們轉(zhuǎn)換成一種Sora更容易理解和處理的格式。
接下來,Sora將這些經(jīng)過處理的照片進(jìn)一步拆分成所謂的“空間時間補丁”。這些補丁可以看作是照片的基本構(gòu)建塊,就像是一張相冊中的每一張照片都可以分解成包含獨特景觀、顏色和紋理的小片段。這樣,無論原始照片的長度、分辨率或風(fēng)格如何,Sora都可以把它們處理成一種統(tǒng)一的內(nèi)部表示形式。
通過這種巧妙的處理方式,Sora在保留原始照片豐富信息的同時,成功地將不同來源和風(fēng)格的視覺數(shù)據(jù)整合成一種可操作的內(nèi)部形式。就好比當(dāng)你查看一本包含各種各樣世界名勝的相冊時,盡管照片各異,但你依然可以通過相同的方式去理解和欣賞它們。
Sora生成的視頻圖像;圖源:OpenAI官網(wǎng)
02 Sora將對哪些行業(yè)帶來顛覆?
毋庸置疑的是,Sora的出現(xiàn)將對多個行業(yè)產(chǎn)生深遠(yuǎn)影響。從短視頻行業(yè)、影視行業(yè)、游戲行業(yè),到廣告、教育、電商、科研、建筑等領(lǐng)域,都將因其強大的生成能力而發(fā)生巨變。
對廣告業(yè)、電影預(yù)告片和短視頻行業(yè),Sora可能會減少對真人演員和導(dǎo)演的依賴,降低制作成本。在教育領(lǐng)域,Sora可以用于創(chuàng)建生動有趣的教育視頻,提供更加互動的學(xué)習(xí)體驗。同時,Sora還可能改變視頻制作、剪輯、動畫設(shè)計等職業(yè)的工作方式,帶來新的職業(yè)機會。
在勝馬財經(jīng)看來,于國內(nèi)商業(yè)現(xiàn)狀而言,Sora的出現(xiàn)最有可能對一些廣告宣傳、人物出鏡、視頻預(yù)處理和初級剪輯等工作環(huán)節(jié)的人帶來挑戰(zhàn),比如說,在電商行業(yè),產(chǎn)品宣傳視頻對于促進(jìn)銷售至關(guān)重要。Sora的生成能力可能在一些標(biāo)準(zhǔn)化的產(chǎn)品宣傳視頻制作中替代部分工作,減少對專業(yè)制作人員的需求。
而在更有價值的科研領(lǐng)域,Sora的視頻生成技術(shù)可能被應(yīng)用于模擬實驗過程,幫助科研人員可視化實驗結(jié)果。這有助于簡化一些復(fù)雜實驗的展示和解釋。
當(dāng)然了,隨著Sora技術(shù)的進(jìn)步,它未來在內(nèi)容真實性、版權(quán)、隱私和數(shù)據(jù)安全方面,尤其是考慮到世界各國各地區(qū)法律法規(guī)的不同,Sora生成的視頻可能引發(fā)一系列道德和法律問題。如何確保AI生成的內(nèi)容不侵犯他人權(quán)益,不傳播虛假信息,將是一個亟待解決的問題。
但總體而言,Sora的出現(xiàn)標(biāo)志著人工智能領(lǐng)域又邁出了一大步。它既是對現(xiàn)有技術(shù)的顛覆性挑戰(zhàn),也是對我們思考人工智能在未來發(fā)展方向上的重要啟示。
03 哪些機會可以把握?
在給一些行業(yè)帶來挑戰(zhàn)和顛覆的同時,Sora也給更多行業(yè)帶來了更多的機遇,而在資本市場上,相應(yīng)的Sora概念股和潛在受益上市公司也著實火了一把。
據(jù)有關(guān)媒體統(tǒng)計,包括嶺南股份、名臣健康、因賽集團(tuán)、首都在線、中科信息、螢石網(wǎng)絡(luò)、凌云光、芒果超媒、華是科技、東港股份、實豐文化、世紀(jì)天鴻、天創(chuàng)時尚、創(chuàng)源股份、巨人網(wǎng)絡(luò)、會暢通訊、千方科技、北信源、智微智能和掌閱科技在內(nèi)的20家上市公司近兩日在互動平臺回復(fù)Sora相關(guān)情況。
其中,北信源表示,公司與Open AI已對接完成文生圖的技術(shù)研究工作,Sora(文生視頻)是Open AI最新發(fā)布的技術(shù),目前公司正在做技術(shù)相關(guān)方面對接和研究;當(dāng)虹科技表示,文生視頻技術(shù)已取得一定進(jìn)展,在生成視頻時長和效果方面,還在逐漸突破。另有多家上市公司回應(yīng)稱,Sora相關(guān)產(chǎn)品和應(yīng)用處于初級階段,有待進(jìn)一步研究,將根據(jù)自身業(yè)務(wù)特點,在文生視頻技術(shù)落地、Sora應(yīng)用等方面尋找突破入口。
廣發(fā)證券研報提出,在互聯(lián)網(wǎng)&視頻方面,Sora或更快帶來短視頻內(nèi)容生產(chǎn)體系變革,長視頻生產(chǎn)模式短期較難被顛覆,但有機會加速生產(chǎn)效率。例如Sora初步具備生產(chǎn)1分鐘內(nèi)容能力,并可以剪輯多個視頻,有望逐步替代部分人工創(chuàng)作;或迭代出新的商業(yè)模式,如電商、廣告等業(yè)態(tài)的智能化內(nèi)容生成替代,或加速短視頻平臺、商家、MCN的變現(xiàn)效率。
而在長視頻領(lǐng)域,Sora短期賦能PGC創(chuàng)意生成、提高內(nèi)容分發(fā)效率和降低內(nèi)容宣發(fā)成本;長視頻仍需較長故事線支撐和藝術(shù)家審美賦能,在真人出演類型中的應(yīng)用可能較為有限,但對科幻、動畫片等的生產(chǎn)提效或更為明確。
而更易理解的當(dāng)屬動畫、特效占比高的內(nèi)容公司,Sora強化文生視頻能力,關(guān)注買量素材降本;長期有望提升游戲生產(chǎn)效率、內(nèi)容豐富度并增強用戶體驗,進(jìn)一步提升用戶付費意愿。關(guān)注具備較強發(fā)行能力的游戲公司。
然而,在討論Sora所帶來的熱潮中,我們也看到了一系列商業(yè)行為和炒作,例如近期涌現(xiàn)出各類Sora相關(guān)的付費課程和服務(wù)。這一現(xiàn)象引起了社會各界的關(guān)注和討論。
必須提醒,目前Sora還在內(nèi)測階段,尚未對外開放使用。但在不少社交平臺和短視頻平臺上,一些個人和機構(gòu)在尚未使用Sora的情況下就推出相關(guān)的付費課程,在這其中,李一舟成為國內(nèi)AI課程領(lǐng)域的“明星”,推出的AI課程吸引了大量學(xué)員。然而,也有一些質(zhì)疑聲音認(rèn)為這些商業(yè)課程可能在“割韭菜”、收“智商稅”。
勝馬財經(jīng)認(rèn)為,Sora的出現(xiàn)確實為科技、娛樂和教育等領(lǐng)域帶來了新的機遇,但在商業(yè)推廣中也引發(fā)了一系列問題。Sora的大規(guī)模應(yīng)用可能創(chuàng)造新的職業(yè)機會,提高效率,但需要警惕商業(yè)行為中的不規(guī)范和炒作。在Sora面向大眾開放后,相關(guān)付費課程和服務(wù)可能會越來越多,這也需要對行業(yè)進(jìn)行規(guī)范和監(jiān)管,以確保大模型行業(yè)的良性發(fā)展。