文 | 音樂先聲 朋朋
編輯 | 范志輝
最近,谷歌圍繞著AIGC音樂打出了一套“組合拳”。
11月16日,谷歌旗下 DeepMind發(fā)布了最新的AIGC音樂生成模型Lyria,并與YouTube合作打造了兩個重要應(yīng)用場景:Dream Track和Music AI tools。同時,谷歌和YouTube還將AI識別工具SynthID擴(kuò)展到音樂領(lǐng)域,為Lyria生成的AI作品打上水印。
除了多個空降的AI音樂工具以外,谷歌還在緊鑼密鼓地掃除AIGC音樂所面臨的版權(quán)與道德問題。11月14日,谷歌旗下YouTube也發(fā)布博客文章《在YouTube上實施負(fù)責(zé)的AI創(chuàng)新的方法》,宣布了一系列關(guān)于AIGC內(nèi)容的治理規(guī)則,將在未來幾個月逐步實施。
可以看到,谷歌正在以其超強(qiáng)的音樂制作工具和明朗的治理路徑,抓緊在AIGC音樂領(lǐng)域的布局。而另一邊,環(huán)球音樂、華納音樂等為代表的版權(quán)方與Spotify、Deezer等平臺方也沒閑著,AIGC音樂的中場戰(zhàn)事已經(jīng)拉開帷幕。
Lyria,目前最強(qiáng)的AIGC音樂工具
“改變音樂創(chuàng)作的未來。”
11月16日,DeepMind以這個言簡意賅的標(biāo)題發(fā)布了博客文章,介紹了他們最新的AIGC音樂生成模型Lyria。相較于AI生成對話音頻,AI音樂模型需要“同時生成聲音的長序列”,難點在于“保持音樂在聽感上的連續(xù)性”。
這一全新的AI模型更加成熟,見長于“用樂器和人聲生成高質(zhì)量音樂、完成包含不同音樂風(fēng)格轉(zhuǎn)換和歌曲續(xù)寫的任務(wù),讓用戶可以更加細(xì)致地調(diào)試所輸出音樂的風(fēng)格和表現(xiàn)”。
同時,DeepMind與YouTube合作,為Lyria打造了兩個重要的應(yīng)用場景:Dream Track和Music AI tools。
其中,Dream Track主要面向YouTube Shorts上的短視頻創(chuàng)作者。這一工具目前向部分美國創(chuàng)作者提供了一系列授權(quán)的藝術(shù)家音源,只需輸入一個主題,并選擇一個藝術(shù)家,Lyria模型將生成一段30秒的視頻配樂,并同時生成配樂的音軌和歌詞。
截至目前,參與其中的藝術(shù)家音源已經(jīng)包括Alec Benjamin、Charlie Puth、Charli XCX、Demi Lovato、John Legend、Sia,、T-Pain、Troye Sivan、Papoose等等。
而Music AI tools則主要面向音樂人、藝術(shù)家以及制作人。谷歌表示,他們的研究人員一直與YouTube的AI孵化器中的藝術(shù)家、詞曲作者以及制作人合作,測試這一工具以便更好地支持音樂創(chuàng)作。
在Music AI tools上,音樂人只需要哼唱一段旋律,就能生成相應(yīng)的曲譜;輸入一段MIDI和弦,就能生成相應(yīng)的AI演唱;還可以在聲軌中隨意地加入一段器樂伴奏,就可以生成相應(yīng)的音樂作品。
依靠這一工具,音樂人創(chuàng)建用人聲和樂器創(chuàng)作原始的音樂作品,隨后AI就會幫助他們試驗各種各樣的音樂風(fēng)格、調(diào)試紛繁復(fù)雜的伴奏樂器,最終形成一首包含了器樂伴奏和人聲的完整作品。
除此之外,為了保障音樂人和創(chuàng)作者的權(quán)益,所有使用Lyria模型輔助創(chuàng)作和發(fā)布的音樂作品都將使用SynthID進(jìn)行標(biāo)記和識別。就在11 月,SynthID 正式擴(kuò)展到音樂和音頻領(lǐng)域AI水印的添加和識別。
據(jù)了解,SynthID將在AIGC的音頻內(nèi)容中嵌入水印,這種水印人耳聽不到,不會影響用戶的收聽體驗。唯有將聲音轉(zhuǎn)換成為二維可視化的頻譜圖,水印才會被識別工具所捕獲,哪怕歌曲經(jīng)過噪音增加、MP3壓縮、加速或降速等處理,SynthID仍能檢測到歌曲中水印的存在。Lyria一經(jīng)發(fā)布,將憑借著強(qiáng)大的功能受到廣泛的關(guān)注,外媒一度稱之為“音樂行業(yè)的未來”。然而,強(qiáng)大的Lyria離不開此前谷歌在AudioLM和MusicLM的實踐中累積下來的技術(shù)基礎(chǔ)。
AudioLM是谷歌在2022年9月發(fā)布的AI音樂模型,作為一個純音頻模型,它只需收聽音頻,就能生成和提示風(fēng)格相符的連貫音樂。
2023年2月,谷歌又發(fā)布了一個AIGC音樂模型MusicLM。相較于AudioLM,它標(biāo)記了一系列聲音片段,并將它們映射到語義片段中進(jìn)行訓(xùn)練。這就意味著,這一模型能夠接收用戶的文字或音頻輸入,并生成AI音樂作品。然而,谷歌表示,考慮到“可能引發(fā)音樂人的抗議和版權(quán)風(fēng)險”,并沒有正式發(fā)布這一模型,只進(jìn)行了小范圍的開放測試。
毫無疑問,從MusicLM到Lyria,經(jīng)過更多的音樂素材訓(xùn)練,Lyria模型所生成的音樂更加精準(zhǔn)、更加有深度。然而更重要的是,AIGC音樂模型正在被更多的音樂人接納,而谷歌也在與唱片公司的博弈中,逐漸學(xué)會規(guī)避AIGC的版權(quán)風(fēng)險。
如何構(gòu)建AIGC音樂時代的商業(yè)規(guī)則?
時間回到7個月前。
一首名為《Heart on My Sleeve》的AIGC歌曲在全網(wǎng)病毒式傳播。很快,這首歌激怒Drake和The Weeknd背后的唱片公司環(huán)球音樂。在環(huán)球音樂的投訴下,《Heart on My Sleeve》迎來了全網(wǎng)下架。
如今,這首歌帶來的長尾效應(yīng),讓YouTube開始正視AIGC音樂使用的限制問題。
在11月14日的公開博客中,YouTube表示“將為平臺上的音樂伙伴上線一項新的權(quán)益”,他們可以要求刪除那些“模仿藝術(shù)家獨特的演唱或說唱的AIGC內(nèi)容”。而平臺在評定這些要求時會考慮許多因素,比如這段音樂是否來自“新聞報道、分析或者評論”。
同時,YouTube在今年8月與環(huán)球音樂達(dá)成伙伴關(guān)系,共同研發(fā)AI音樂工具。因此,這些有爭議的內(nèi)容也將面向AI工具研發(fā)團(tuán)隊的音樂人和唱片公司開放,并且在未來幾個月,YouTube將持續(xù)擴(kuò)大開放范圍。
可見,訓(xùn)練AI模型所用的素材是否合乎版權(quán)規(guī)定,是音樂平臺與唱片公司爭議的核心。避免版權(quán)風(fēng)險,獲得藝術(shù)家的支持,是各家努力的同一方向。
遵循這一行動邏輯,Spotify選擇在播客領(lǐng)域用AI“克隆”明星,而不是爭議更加激烈的音樂領(lǐng)域。
今年9月,Spotify推出新的AI語音克隆工具。在OpenAI的自動語音識別模型Whisper的技術(shù)支持下,人物能夠自動切換到西班牙語、法語和德語等各種語言,而且是“完全原聲”,連說話節(jié)奏,語氣都能還原。這不僅沒有受到播客市場的不滿,反而獲得了Dax Shepard、Monica Padman、Lex Fridman等許多著名播客主的授權(quán)。
平息音樂內(nèi)容在版權(quán)端的爭議外,平臺方還在加強(qiáng)AIGC內(nèi)容的甄別與提示。
據(jù)悉,YouTube的新規(guī)將要求創(chuàng)作者披露他們“合成或修改的內(nèi)容”,并要表明其“修改或合成的材料”,以及他們“使用的AI工具”。而YouTube將會在描述頁增加一個新的標(biāo)簽,指出該內(nèi)容的“聲音或者畫面是被更改或者合成的”。
YouTube此舉可能正是受到了TikTok的啟發(fā)。
早在今年9月19日,TikTok就要求創(chuàng)作者給AI制作的內(nèi)容貼上“AI生成”的標(biāo)簽。此外,TikTok還表示,正在測試新的自動工具,以標(biāo)記“我們檢測到的是用AI編輯或創(chuàng)作的內(nèi)容”,而這也成為接下來許多平臺規(guī)制AIGC的工作重點。
在YouTube的公開博客中,表示接下來將集中部署運用“機(jī)器學(xué)習(xí)技術(shù)和審核人員相結(jié)合”的方式來“執(zhí)行社區(qū)的準(zhǔn)則”。其中,“AI工具有助于大規(guī)模檢測潛在的違規(guī)內(nèi)容,而審核人員會努力確認(rèn)內(nèi)容是否確實越過了政策界限”。而這可能正指的是首次擴(kuò)展到音樂領(lǐng)域的SynthID。
幾乎同時,Believe也對外公布了AI音樂識別技術(shù),并對識別的準(zhǔn)確度進(jìn)行了公開。
近期,Believe在Q3季度的財報中表示,他們“創(chuàng)造了一些令人興奮的AI技術(shù)”,該軟件能以98%的準(zhǔn)確率判斷音樂是否是人工智能生成的,并以93%的準(zhǔn)確率判斷它是否為“深度偽造”。公告表示,這項被稱之為“AI雷達(dá)”的技術(shù)正在逐步應(yīng)用。從AIGC音樂的版權(quán)保護(hù)、用戶提示到相關(guān)識別技術(shù),谷歌、Spotify、Believe、TikTok等各家平臺都走出了大致相仿的規(guī)制路徑。但直面AIGC的泛濫,在硬幣的另一面,各家平臺也緊鑼密鼓地加緊了在AIGC領(lǐng)域的布局。
正如前文所提到的,YouTube就與環(huán)球音樂達(dá)成合作,啟動了一個音樂AI孵化器,與環(huán)球旗下的藝術(shù)家合作探索人工智能在音樂中的應(yīng)用。藝術(shù)家能提前接觸到正在開發(fā)的人工智能產(chǎn)品,并提供反饋。而此次的Music AI Tools就充分考慮了這些藝術(shù)家的意見。
與此同時,YouTube還與三大唱片公司進(jìn)行洽談,希望能使用他們的版權(quán)音樂進(jìn)行AI模型訓(xùn)練。不過,從目前Dream Track合作藝人中主要集中在環(huán)球音樂、華納音樂以及其他唱片公司的音樂人時,看來索尼音樂還沒有談成。
當(dāng)與唱片公司合作進(jìn)行AIGC內(nèi)容創(chuàng)作的機(jī)遇十分有限,不乏有平臺方另辟蹊徑。
例如,2022年12月,Deezer就推出了app Zen,主要為用戶提供“健康指導(dǎo)、鍛煉音頻以及沉浸式的助眠、療愈音樂和音頻”。目前,Deezer正在使用AI技術(shù)為該平臺生產(chǎn)內(nèi)容。
在國內(nèi),網(wǎng)易云音樂也上線了AI音樂制作平臺Xstudio,與小冰公司合作,為音樂創(chuàng)作者提供可供使用的AI音源;TME旗下銀河音效、MUSE、天琴實驗室和Tencent AI Lab共同打造了智能音樂創(chuàng)作助手TME Studio,集成了音樂分離、MIR計算、輔助寫詞、智能曲譜等系列AI功能。
顯而易見,在AIGC音樂的浪潮中,手握版權(quán)的唱片公司和音樂人始終沖在技術(shù)限制的第一線。而各家平臺都在盡力協(xié)調(diào),在允許平臺上的創(chuàng)新行為與保護(hù)藝術(shù)家受版權(quán)保護(hù)的作品之間實現(xiàn)平衡。
正如Deezer的CEO Jeronimo Folgueira所言:“對于流媒體平臺,AI是個大問題,但是個更大的機(jī)遇”。
AIGC浪潮不會倒退,UGC時代已經(jīng)給出過答案
2023年9月末,華納音樂集團(tuán)的新任CEO Robert Kyncl參加了在加州舉辦的2023年代碼大會。他在演講中就指出,AIGC與UGC“類比非常明顯”。AI技術(shù)的威脅,也能從UGC中找到解決辦法。
在華納音樂履職前,Kyncl曾在YouTube和Netflix工作過20年,他曾幫助YouTube開創(chuàng)了這個屬于UGC內(nèi)容和YouTube網(wǎng)紅的時代,讓YouTube在全球范圍內(nèi)保持自身的競爭力。
這段履歷讓Kyncl面對AIGC少了一些憤怒,多了一些平和,畢竟AIGC“這一浪潮并不會倒退”。
演講中,Kyncl回顧了UGC剛剛興起時的YouTube。那時,YouTube經(jīng)常會受到大量內(nèi)容所有者的投訴信息,表示自己的視頻或者音樂未經(jīng)本人許可就被上傳到平臺上。
直到2006年,谷歌收購了YouTube后,建立了一種版權(quán)識別的Content ID技術(shù),追蹤平臺上受版權(quán)保護(hù)的內(nèi)容,并給予版權(quán)所有者相應(yīng)的權(quán)益,允許他們刪除這些內(nèi)容,或者從這些內(nèi)容中獲益。
正是此舉,將YouTube與版權(quán)所有者的關(guān)系從對抗性關(guān)系轉(zhuǎn)變成共贏的商業(yè)關(guān)系。
“這樣一來,我們就建立了一個數(shù)十億美元的業(yè)務(wù),現(xiàn)在已是每年數(shù)十億美元的業(yè)務(wù)。”Kyncl說,“這對每個人來說,都是一個令人難以置信的全新的收入來源。而AI就是這樣的全新的超級工具。所以,我們也需要以同樣的想法來對待它?!?/p>
依照YouTube在UGC時代的治理邏輯,Synth ID技術(shù)似乎有望成為下一個確保AIGC浪潮中各方利益的存在,接下來就剩下平臺方與版權(quán)方就分配規(guī)則的談判。
換言之,當(dāng)平臺標(biāo)記出這些AIGC音樂,他們將如何處理這些音樂?如何與涉及的不同主體分配版權(quán)收益?作為訓(xùn)練AI語料庫的音樂又要以何種比例瓜分收益?而這將成為平臺能否建立起可持續(xù)的商業(yè)合作關(guān)系的關(guān)鍵。
不過,雖然有各類問題亟待解決,但是平臺方所努力的方向卻是清晰而明確的。
從PGC到UGC再到AIGC,每一次互聯(lián)網(wǎng)內(nèi)容生產(chǎn)的話語權(quán)變革都要面臨新一輪的質(zhì)疑與規(guī)范。正如當(dāng)年,為了順應(yīng)UGC浪潮的發(fā)展所需,長短視頻平臺開啟了音樂版權(quán)集中采買的時代。
現(xiàn)如今,AIGC面對的侵權(quán)問題則更為復(fù)雜。但在生產(chǎn)力的爆發(fā)和內(nèi)容消費的熱情面前,平臺方終將再走一遍UGC時代的老路,與創(chuàng)作者、版權(quán)所有者再進(jìn)行一次可能要長期存續(xù)的版權(quán)拉鋸戰(zhàn)。
不過,無論是平臺方還是唱片公司,大家行進(jìn)的方向其實是一致的,只是在前進(jìn)的路上,共同探索運行規(guī)則罷了。