文|真故研究室 鄭思芳
編輯|龔 正
輸入一句話,AI就能為有志于從事藝術創(chuàng)作的任何人,生成一幅創(chuàng)意畫作,不管創(chuàng)作者此前是否接受過專業(yè)的藝術訓練。
近兩年,海外用戶借助Disco Diffusion、MidJourney等AI繪畫軟件來進行藝術創(chuàng)作,逐漸成為一種風潮。在國內(nèi),也有了諸如百度文心一格、TIAMAT等這類適用于中文描述語輸入、更能理解中國文化審美的AI藝術和創(chuàng)意輔助平臺誕生。
對專業(yè)者而言,這類AI繪畫輔助工具是一個很好的創(chuàng)意助手。而一些素人則利用這些工具,發(fā)展出了自己的斜桿事業(yè),在抖音上做壁紙?zhí)?,在閑魚上賣描述語,有的還將自己的作品賣給了包裝廠或數(shù)字藏品業(yè)者,賺到些許零花錢。
01 AI式創(chuàng)作自由
吳先生本職工作是一位醫(yī)生,他愛玩抖音,閑暇之時常想著在抖音上做點什么來掙錢。
2個月前,他看到不少創(chuàng)作者在抖音上做壁紙?zhí)枺簿褪莿?chuàng)作者會發(fā)布一些好看的照片或圖片,用戶可以下載拿去當電腦或手機桌面。下載時用戶需要看一段平臺廣告,創(chuàng)作者則能從廣告播放中獲得平臺分成。
據(jù)吳先生的觀察,壁紙?zhí)柸θ詫傩”?,但圈中也?、30萬粉絲的創(chuàng)作者,通過向用戶輸送風景、人物、汽車等這類美照,月入上萬。
吳先生本身是風景照愛好者,也想做一個風景類的壁紙?zhí)枺嘤跊]有多少素材。正發(fā)愁時,他接觸到了AI繪畫,發(fā)現(xiàn)只需要在AI繪畫軟件里輸入相關描述語,就能生成好看的圖片,這解決了他素材缺乏的難題。
吳先生下載了兩款海外的AI繪畫產(chǎn)品,一款是Disco Diffusion,一款是MidJourney,在抖音上注冊了一個賬號,名為“AI美圖”,便開始作畫。
Disco Diffusion每天有3小時可免費使用,MidJourney吳先生則充了會員費,每月30美元。每張圖平均幾分鐘就能生成的創(chuàng)作效率,足以支撐起吳先生做賬號的素材需要。
在吳先生看來,這兩款軟件擅長的重點各有不同。Disco Diffusion擅長畫場景,MidJourney擅長畫人物或動物之類的近景。
圖 | 吳先生創(chuàng)作的作品,描述語有夢月(Dream moon)、銀河(Milky Way)、夜空下的空中花園(hanging garden under night sky)、魔力(magic)、光(light),此圖已獲創(chuàng)作者授權發(fā)布。
在有了這兩款軟件的加持后,身為醫(yī)生的吳先生實現(xiàn)了創(chuàng)作自由。
他通過輸入各種描述語,來不斷試錯,一天能夠發(fā)布7到8張作品。雖然后來吳先生發(fā)現(xiàn),因為用戶圈子太小,并不需要每日在抖音上傳這么多。
更難能可貴的是,雖然沒有藝術積淀,但并不妨礙吳先生創(chuàng)作出可賣出價格的作品。
據(jù)介紹,吳先生創(chuàng)作的一幅賽博朋克機器人,其背后的描述語,被一位從事數(shù)字藏品交易的人士以數(shù)十元價格買去,這讓吳先生驚訝不已。
爾后,這位人士又請吳先生創(chuàng)作了一組十二生肖圖片,用作數(shù)字藏品開發(fā)。吳先生用AI為每組生肖創(chuàng)作了3張圖片備選,最后這一組圖片背后的描述語,以數(shù)百元的價格售出。
這給了吳先生以啟發(fā)。由于吳先生的抖音號粉絲才200多人,難以通過廣告分成的方式掙到錢,他索性決定專門去賣描述語。
百條描述語標價20元,拿到抖音、閑魚上去賣,有印刷商前來購買,這形成了吳先生的零花錢收入。
與吳先生經(jīng)歷類似的還有小紅書博主土味牛仔,攝影專業(yè)出身的他,今年6月起開始嘗試用MidJourney來進行AI繪畫。
土味牛仔的AI繪畫作品多以牛仔為主題,風格涵蓋東方元素、未來感、科幻感等,點贊量高的達數(shù)千,他習慣把攝影時無法實現(xiàn)的腦洞告訴AI,讓AI幫他實現(xiàn)。
圖 | 土味牛仔創(chuàng)作的牛仔,已獲創(chuàng)作者授權發(fā)布。
4個月的時間里,土味牛仔一共在小紅書發(fā)布了117張AI繪畫作品,其中每張作品背后平均的生成次數(shù)為50次,可謂精益求精。
創(chuàng)作者在學習,AI也在學習。目前,MidJourney里共記錄了土味牛仔的10000多次生成記錄。現(xiàn)在土味牛仔只要一輸入相關詞匯,AI就能生成相關額外的聯(lián)想。有時土味牛仔會懷念“不太聽人話”、更具備天馬行空創(chuàng)意的AI,而不是對人類思維偏好越來越貼近的圓滑AI。
在小紅書上發(fā)布AI繪畫作品以后,土味牛仔說他接到過幾次約稿,也有人找上門想直接購買原圖留作NFT收藏,但這樣的人屈指可數(shù)。目前他在AI繪畫作品上的收入還不足以支付他在MidJourney上的投入。
據(jù)土味牛仔在圈子里的觀察,大家使用AI繪畫的原因各不相同。有插畫師朋友會用AI生成作品的草稿,以此為基礎進行創(chuàng)意和修改。做建筑設計的朋友則會利用AI來進行頭腦風暴。但更多素人就是圖一個新鮮,就是想要看“超人跟鋼鐵俠合在一起是什么樣子”。
在用戶們的推動下,B站、抖音上等介紹AI繪畫軟件和教程的視頻越來越多,小紅書則成了AI繪畫作品的一個重要展示平臺,閑魚則扮演了一個銷售描述語的平臺角色。
02 AI繪畫技術的迭代
AI繪畫的源頭可以追溯到上世紀70年代。
計算機問世后的10年,就有藝術家打造電腦程序AARON來進行繪畫創(chuàng)作,其主要原理是控制機械臂來作畫,但當時的技術成本比較高,且只能得到抽象的結果。
圖 | AARON和它的發(fā)明者Harold Cohen
而現(xiàn)代意義的AI繪畫,主要是指AI從海量圖文對應的數(shù)據(jù)中學習“語言描述”與“藝術畫面”的關聯(lián),以隨機化的起點開始,不斷修正畫作,最終形成在審美上與人類經(jīng)驗與知識高度一致的成品。
據(jù)百度文心一格相關負責人介紹,現(xiàn)代意義AI繪畫技術的雛形,主要出現(xiàn)在上一個十年中。
彼時的技術可以批量完成由文本信息指定的畫面生成,技術上包括風格遷移、元素拼接和對抗生成網(wǎng)絡(GAN—Generative Adverserial Network)等。
從生成的畫面質(zhì)量來看,雖然這些技術使AI繪畫的水平有了明顯進展,并且在比較強烈的風格上有了初步的應用可能性,但與人類作畫質(zhì)量依然存在差距。
AI繪畫最近的一次技術爆發(fā)是2022年對擴散生成模型的引入,這類模型用于文生圖后,能夠在更短的時間內(nèi),像素級建模并生成分辨率顯著提升的繪畫,并且在美感、細節(jié)精細度有非常顯著的提升,一些AI繪畫的成品已經(jīng)和人類作畫的質(zhì)量不相上下。
行業(yè)里普遍認為,從2021年到2022年,是AI文生圖技術發(fā)展最快的兩年,諸多新的學習模型或產(chǎn)品誕生,AI繪畫的風潮也開始發(fā)展。
一是Open AI于2021年初發(fā)布的深度學習模型 CLIP(Contrastive Language-Image Pre-Training)。
Open AI是一家于2015年12月成立于美國的人工智能研究公司,它用 CLIP先后創(chuàng)建了DALL-E 和DALL·E 2兩個AI系統(tǒng),為用戶構建了可以根據(jù)文字描述創(chuàng)建更逼真、更準確圖像的能力。
二是于今年2月初開始出現(xiàn)并流行的開源繪畫程序Disco Diffusion,它是一個由谷歌推出的AI,開發(fā)者是藝術家兼程序開發(fā)員的Somnai_dreams 。
Disco Diffusion的特點是能夠高效合成視覺數(shù)據(jù),圖片生成的質(zhì)量直接擊敗了GAN模型。但缺陷仍然存在,主要表現(xiàn)在AI繪畫欠缺細節(jié),渲染的時間過長,內(nèi)存資源消耗巨大。今年7月開始測試的Stable Diffusion程序,則很快改進了以上缺點。
三是今年6月推出的MidJourney,它是一個富有創(chuàng)造性的AI,用它生成的圖片質(zhì)量得到了大幅度的提升,且以月費為方式的商業(yè)化做得比較成功。目前公開資料顯示MidJourney的用戶成員已經(jīng)超過了240萬人。
圖 | MidJourney社區(qū)上的展示畫作
在國內(nèi),AI繪畫也開始逐漸有了熱度。
像Stable Diffusion、MidJourney這類模型,主要是針對英文世界的用戶,語言和文化的差異形成了國內(nèi)用戶使用海外AI繪畫軟件的阻礙。國內(nèi)用戶呼喚中文世界的文生圖產(chǎn)品,這形成了一定的市場需求。
TIAMAT成立于2021年、被稱為是國內(nèi)首批AI生成式平臺。今年上半年,TIAMAT開始在小紅書、抖音等社交媒體上發(fā)布中文文生圖的產(chǎn)品,趕上了AI繪畫的第一波熱潮。
圖 | 小紅書上的AI繪畫
圖 | 閑魚上的AI繪畫
TIAMAT致力于為個人用戶和企業(yè)客戶提供創(chuàng)意生產(chǎn)、廣告、數(shù)字藏品等場景形式下的服務。日前,TIAMAT已宣布完成數(shù)百萬美元天使輪融資,投資方為DCM。
今年8月,百度發(fā)布了AI藝術和創(chuàng)意輔助平臺文心一格,它使用了百度自主研發(fā)的產(chǎn)業(yè)級知識增強大模型—文心大模型,通過語義理解+多畫作風格適配+結果優(yōu)化排序,讓用戶只需要輸入一句話,就能完成畫作,包括意向、具象等多種類型和風格。
文心一格被認為有效地解決了中文世界中,需求描述困難、多樣化需求強、模型生成結果篩選難的困難,降低了中文世界用戶使用AI繪畫的難度。
基于文心一格平臺,由百度數(shù)字人度曉曉創(chuàng)作的“無界”系列畫作,已被專業(yè)美院教授評價為“已經(jīng)達到了本科美術生的基本要求”。
圖 | 度曉曉創(chuàng)作的無界系列
業(yè)內(nèi)人士指出,對于AI繪畫而言,如何讓AI準確理解中英文語境中的描述語至關重要。描述語不僅有中英文上的語言差異,也有語言承載的文化差異,從而影響到AI繪畫技術的研發(fā)。
例如“龍”對于英文環(huán)境基本沒有歧義,但在中文環(huán)境中則有東方龍和西方龍的形象差異,且東方龍和西方龍作為文化符號的意義也完全不同,這對AI繪畫技術提出了很大的挑戰(zhàn)。
從當下來看,如何處理好語言、文化的差異,AI繪畫還有很長的路要走。
03 AI繪畫的爭議點和未來發(fā)展
AI繪畫誕生后,市場上存在的一個爭議點主要圍繞版權展開。
AI繪畫平臺的底層邏輯是融合各創(chuàng)作者的作品以及現(xiàn)有的互聯(lián)網(wǎng)圖片生成的作品,提取原作的筆觸、用色、構圖等元素而進行的“二次創(chuàng)作”,至于版權是歸原作者、平臺方,還是現(xiàn)在的創(chuàng)作者,目前尚難以界定。
據(jù)使用過Disco Diffusion和MidJourney的用戶介紹,用Disco Diffusion生成的圖片版權屬于創(chuàng)作者自己所有,而使用MidJourney生成的圖片版權則屬于創(chuàng)作者與平臺共有。
百度文心一格相關負責人認為,AI技術生成的圖片并不是既有圖片的拼湊,而是類似人類經(jīng)過長期繪畫訓練后的再創(chuàng)作,既有繼承,也有自己的特色。
不過基于版權問題,行業(yè)仍在討論中,為了避免可能的風險以及解決可能發(fā)生的糾紛,百度文心一格方面就表示,未來如果平臺開放出來的生成圖片侵犯到原作者權益,會提供投訴反饋通道,為相關權利人提供權利救濟渠道,迅速處理。
據(jù)了解,目前國內(nèi)還無相關具體的法律案例能夠用來作參考。
圖 | 在文心一格中輸入“人工智能畫面、超現(xiàn)實主義”生成的圖片
關于AI繪畫的發(fā)展方向,本質(zhì)是AIGC(人工智能自主生成內(nèi)容)技術的發(fā)展,它是一種繼PGC、UGC之后全新的內(nèi)容生產(chǎn)方式,被認為能夠刺激內(nèi)容產(chǎn)業(yè)進一步發(fā)展。
公開數(shù)據(jù)顯示,全球庫存圖片市場規(guī)模接近3000億美元。但目前主流的圖片市場是平臺有什么用戶用什么,而不是用戶想要什么就有什么。內(nèi)容生產(chǎn)者仍然受限于生產(chǎn)的想象力,傳統(tǒng)圖片行業(yè)還處于“數(shù)字手工業(yè)”階段。
相較之下,AIGC的發(fā)展正好順應了內(nèi)容創(chuàng)作者對生產(chǎn)想象力的延伸。以前AI只是輔助內(nèi)容創(chuàng)作的工具,現(xiàn)在AI已經(jīng)能夠獨立完成寫作、設計、繪畫、作曲等創(chuàng)意性工作。
這里需要注意的一點是,AIGC 聽上去時髦,但自動化內(nèi)容生成并不是一個很新的概念。
利用計算機輔助人類進行內(nèi)容生產(chǎn)早已經(jīng)出現(xiàn),比如在計算機編程領域 IDE 的代碼提示、使用 Office Word 編輯內(nèi)容的錯誤修正,再到后來利用 NLG 自動化文本生成等都可以算在這個范圍里。
關于目前的AIGC技術處于哪個發(fā)展階段, 百度CEO李彥宏在2022年百度世界大會上有一個論述。
他將AIGC分為三個發(fā)展階段:第一階段是助手階段,AIGC 輔助人類進行內(nèi)容生產(chǎn);第二階段是協(xié)作階段,AIGC 以虛實并存的虛擬人形態(tài)出現(xiàn),形成人機共生的局面;第三階段是原創(chuàng)階段,AIGC 將獨立完成內(nèi)容創(chuàng)作。
從目前AI在作文、繪畫、寫歌等各個領域的發(fā)展來看,AIGC已經(jīng)進入助手階段,但總體處于發(fā)展早期。
未來AI作畫是否會取代設計師、原畫師等,這個還說不定。但從目前人們的反應來看,人們顯然還沒有那么憂慮。