文|科技新知
大模型的開(kāi)、閉源之戰(zhàn),開(kāi)始得比想象中早上一些。
7月18日,F(xiàn)acebook母公司Meta表示,將發(fā)布其開(kāi)源大模型Llama的商用版本,為初創(chuàng)企業(yè)和其他企業(yè)提供了一個(gè)強(qiáng)大的免費(fèi)選擇,以取代OpenAI和谷歌出售的昂貴的專(zhuān)有模型。同時(shí)宣布,Llama將由微軟通過(guò)其Azure云服務(wù)分發(fā),并將在Windows操作系統(tǒng)上運(yùn)行,并稱(chēng)微軟是“我們的首選合作伙伴”。
一時(shí)間,有不少分析人士認(rèn)為,Llama將改變AIGC的產(chǎn)業(yè)格局。Meta 副總裁、人工智能部門(mén)負(fù)責(zé)人楊立昆也趕來(lái)站臺(tái),“Llama 2 將改變大語(yǔ)言模型市場(chǎng)的格局?!笔聦?shí)真的如此沒(méi)有懸念嗎?
開(kāi)源(Open Source),即開(kāi)放源代碼,最早起源于20世紀(jì)50、60年代的美國(guó)。早期開(kāi)發(fā)互聯(lián)網(wǎng)技術(shù)和電信網(wǎng)絡(luò)協(xié)議時(shí),研究人員需要進(jìn)行開(kāi)放式的協(xié)作環(huán)境。而1968年Internet的先驅(qū)阿帕網(wǎng)(ARPANET)的建立,成為了對(duì)開(kāi)放源代碼可行性展示的標(biāo)志。到了1985年,自由軟件運(yùn)動(dòng)領(lǐng)袖理查德·斯托曼(Richard Stallman),看到以專(zhuān)利軟件為手段的商業(yè)化逐漸取代實(shí)驗(yàn)室中免費(fèi)可自由流通的軟件后,發(fā)表了著名的GNU宣言,開(kāi)啟了開(kāi)源運(yùn)動(dòng),最終導(dǎo)致了免費(fèi)的Linux操作系統(tǒng)的誕生。
自ChatGPT爆火以來(lái),將其開(kāi)源的呼聲未曾斷絕??删驮贑hatGPT2發(fā)布之后,OpenAI選擇了閉源發(fā)展。這也未必完全出于規(guī)避競(jìng)爭(zhēng)的考量,就算某天OpenAI真的完全open了,其他同行也不能簡(jiǎn)單復(fù)制其成功的路徑。
因?yàn)镃hatGPT能夠引發(fā)“iPhone時(shí)刻”的原因在于,強(qiáng)大的生成能力給予了人們不一樣的場(chǎng)景體驗(yàn)。但這背后依賴(lài)OpenAI很長(zhǎng)一段時(shí)間內(nèi)在算力、算法和數(shù)據(jù)方面的積累。實(shí)際上,在這場(chǎng)全球大模型軍備賽中,有關(guān)開(kāi)源發(fā)展和閉源深耕的爭(zhēng)論將繼續(xù)下去不止不休。
開(kāi)源or閉源
歷史的車(chē)輪總會(huì)重復(fù)碾過(guò),在互聯(lián)網(wǎng)發(fā)展史上,有關(guān)開(kāi)源和閉源的戰(zhàn)爭(zhēng)一直都在上演。
除了上文理查德·斯托曼的GNU宣言,打響對(duì)閉源的第一槍外,隨后的PC時(shí)代有關(guān)開(kāi)閉源的爭(zhēng)論也沒(méi)停過(guò)。
PC剛興起之時(shí),微軟內(nèi)部的研發(fā)團(tuán)隊(duì)通過(guò)閉源開(kāi)發(fā)Windows操作系統(tǒng),并開(kāi)發(fā)配套的應(yīng)用軟件如Office等,并在生態(tài)建設(shè)方面組局Inter形成 Wintel 聯(lián)盟,成功搶占了PC市場(chǎng)。而Linux在那個(gè)時(shí)期,則屬于自發(fā)的“民間組織”,由全球開(kāi)發(fā)者共同參與建設(shè),通過(guò)開(kāi)源與微軟形成了一定的競(jìng)爭(zhēng)。
到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,谷歌的Android和蘋(píng)果的iOS開(kāi)閉源之爭(zhēng),也是各自走出了不同的路徑?;贏ndroid的開(kāi)放,誕生了一大批的定制化手機(jī)操作系統(tǒng),比如國(guó)內(nèi)小米的MIUI、OPPO的ColorOS等,就連車(chē)機(jī)端的比亞迪車(chē)機(jī)系統(tǒng)都是基于Android開(kāi)發(fā)而來(lái)。當(dāng)然,就商業(yè)成功的角度來(lái)看,微軟和蘋(píng)果的陣地一定時(shí)期內(nèi)更加牢靠。
在SaaS的發(fā)展史上,軟件的開(kāi)源也與上同理。中科院院士、CCF開(kāi)源發(fā)展委員會(huì)主任王懷民教授關(guān)于開(kāi)閉源認(rèn)為,在一個(gè)確定發(fā)展方向的時(shí)代中,閉源公司的推進(jìn)效果是明顯的,競(jìng)爭(zhēng)力也是極強(qiáng)的?!暗?dāng)一個(gè)不確定性的互聯(lián)網(wǎng)時(shí)代到來(lái)時(shí),開(kāi)源吸引了全球開(kāi)發(fā)者參與其中的可能,使得后來(lái)的服務(wù)器操作系統(tǒng)、云操作系統(tǒng)、手機(jī)操作系統(tǒng)、物聯(lián)網(wǎng)操作系統(tǒng)都是以開(kāi)源的Linux為基礎(chǔ)?!?/p>
國(guó)外有ChatGPT與Llama之爭(zhēng),國(guó)內(nèi)的大模型廠商也各有千秋。
如阿里云、智譜和清華EKG、百川智能等,選擇了開(kāi)源。阿里云公布1+4開(kāi)源戰(zhàn)略,推出大模型方向的開(kāi)源新勢(shì)力魔搭GPT。阿里巴巴達(dá)摩院高級(jí)算法工程師李晨亮,曾對(duì)外表示,“開(kāi)源生態(tài)肯定是有助于大模型的繁榮。”反之,華為的盤(pán)古大模型就選擇了閉源,也是為了其數(shù)據(jù)隱私和商業(yè)收益的考慮。
價(jià)優(yōu)者勝?
大模型開(kāi)源之后,會(huì)吸引更多的人才參與進(jìn)入,加快技術(shù)進(jìn)步,但想要實(shí)現(xiàn)突破,還需要從底層理解模型框架和算法基本原理。眾所周知,人工智能三要素是:算力、算法和數(shù)據(jù)。開(kāi)源只是處于算法階段,之后還需要對(duì)其進(jìn)行大量的算力支持和數(shù)據(jù)訓(xùn)練,這背后的成本就相當(dāng)高昂。
以O(shè)penAI為例:業(yè)內(nèi)人士表示,大模型訓(xùn)練和運(yùn)行將耗費(fèi)巨大的算力資源和數(shù)據(jù),僅是在 2022 年,OpenAI 總計(jì)花費(fèi)就達(dá)到了 5.4 億美元,與之形成鮮明對(duì)比的,則是其產(chǎn)生的收入只有 2800 萬(wàn)美元。
有行業(yè)消息透露,一家上市公司的人工智能部門(mén)打算用OpenAI的GPT-3.5開(kāi)發(fā)功能,但迫于成本和定制開(kāi)發(fā)以及不支持同一時(shí)間響應(yīng)大量用戶請(qǐng)求的原因,選擇了參數(shù)量更小的Llama和一個(gè)國(guó)內(nèi)公司的開(kāi)源大模型,在后期的訓(xùn)練和部署的成本也會(huì)更低。
“開(kāi)源模式的任何漸進(jìn)式改進(jìn)都在蠶食閉源模式的市場(chǎng)份額,因?yàn)槟憧梢砸愿偷某杀具\(yùn)行它們,而且依賴(lài)性更小。” 軟件開(kāi)發(fā)平臺(tái)Replit的首席執(zhí)行官Amjad Masad表示。
開(kāi)源也能讓其他新加入者更快適應(yīng)AI產(chǎn)業(yè)。比如在谷歌泄漏的文件中就提到:幾乎任何人都能按照自己的想法實(shí)現(xiàn)模型微調(diào),到時(shí)候一天之內(nèi)的訓(xùn)練周期將成為常態(tài)。以這樣的速度,微調(diào)的累積效應(yīng)將很快幫助小模型克服體量上的劣勢(shì)。
更多的人進(jìn)來(lái)使用,就會(huì)產(chǎn)生更多的數(shù)據(jù)。這些互聯(lián)網(wǎng)原生內(nèi)容的常態(tài)化訓(xùn)練,遠(yuǎn)比一家公司僅憑一己之力去做數(shù)據(jù)的采集和標(biāo)注要簡(jiǎn)單得多。
共享出Llama的Meta 表示,收集的數(shù)據(jù)代表著根據(jù)經(jīng)驗(yàn)采樣的人類(lèi)偏好,由人類(lèi)標(biāo)注員選擇自己更喜歡兩條模型輸出中的哪一條。人類(lèi)給出的反饋意見(jiàn)隨后將用于訓(xùn)練獎(jiǎng)勵(lì)模型,該模型會(huì)不斷學(xué)習(xí)人類(lèi)標(biāo)注員的偏好模式,再據(jù)此自動(dòng)執(zhí)行偏好決策。
開(kāi)源的好處顯而易見(jiàn),閉源的道理也邏輯扎實(shí)。
元?jiǎng)?chuàng)資本的研究顯示,相較于開(kāi)源來(lái)說(shuō),閉源模型相對(duì)成熟、數(shù)據(jù)質(zhì)量更有保障,同時(shí)也省去了部署的麻煩,費(fèi)用相對(duì)較低,僅需支付token的費(fèi)用。
當(dāng)然最重要的是,對(duì)于廠商來(lái)說(shuō), 閉源還有著商業(yè)的考量。根據(jù)權(quán)威雜志《Fast Company》預(yù)測(cè),OpenAI 2023年的收入將達(dá)到2億美元,包括提供API數(shù)據(jù)接口服務(wù)、聊天機(jī)器人訂閱服務(wù)費(fèi)等。
對(duì)壘剛開(kāi)始
上個(gè)月,獵豹移動(dòng)CEO傅盛與投資人朱嘯虎的口水戰(zhàn)引發(fā)熱議。核心沖突就在于行業(yè)對(duì)于大模型的價(jià)值思考,在于大模型能不能解決問(wèn)題。
如今,以O(shè)penAI為代表的大公司、強(qiáng)算力、強(qiáng)算法,共同砌成了一道普通創(chuàng)業(yè)者和開(kāi)發(fā)人員難以突破的圍墻,以至于當(dāng)市場(chǎng)上出現(xiàn)其他類(lèi)似開(kāi)源的應(yīng)用時(shí),人們都認(rèn)為是大模型行業(yè)的壟斷要被打破了。
實(shí)際上,自O(shè)penAI推出ChatGPT引發(fā)全球跟風(fēng)以來(lái),英偉達(dá)的股價(jià)便迎來(lái)了暴漲,主要源于廠商對(duì)算力芯片的強(qiáng)烈需求。換句話說(shuō),即使開(kāi)源了人人都有大模型,那算力、算法和數(shù)據(jù)訓(xùn)練的工作還是需要有人來(lái)做。并且開(kāi)源也僅僅相當(dāng)于開(kāi)放了設(shè)計(jì)圖紙,你可以在圖紙上進(jìn)行調(diào)優(yōu),但并不代表就能完整造出一幢建筑。
就比如一些大模型產(chǎn)品剛上線時(shí),經(jīng)常出現(xiàn)語(yǔ)義理解不準(zhǔn)確,產(chǎn)出結(jié)果令人啼笑皆非的現(xiàn)象。背后原因就是對(duì)高質(zhì)量數(shù)據(jù)的篩選和訓(xùn)練得過(guò)少,導(dǎo)致數(shù)據(jù)的準(zhǔn)確性直接影響人工智能的產(chǎn)出結(jié)果。
但訓(xùn)練數(shù)據(jù)并不是一時(shí)的,涉及到數(shù)據(jù)的采集、清洗、標(biāo)注的另一條產(chǎn)業(yè)鏈。在過(guò)去的很長(zhǎng)一段時(shí)間內(nèi),這個(gè)環(huán)節(jié)都是由專(zhuān)門(mén)的數(shù)據(jù)處理公司來(lái)做,也就是說(shuō),需要進(jìn)行長(zhǎng)期的人力投入。
有業(yè)內(nèi)的數(shù)據(jù)優(yōu)化工程師表達(dá)了類(lèi)似看法,大模型本身的泛化能力仍受限于數(shù)據(jù)。如果說(shuō)ChatGPT要替代某個(gè)職業(yè)或崗位的話,最簡(jiǎn)單的一個(gè)判定標(biāo)準(zhǔn)即是,是否具備數(shù)量足夠多、質(zhì)量非常好的數(shù)據(jù)。同理,想要通過(guò)開(kāi)源去打破壟斷的模型,還需要對(duì)數(shù)據(jù)進(jìn)行足夠的優(yōu)化,對(duì)基礎(chǔ)設(shè)施的投入足夠得多。
大模型的開(kāi)閉源之爭(zhēng),終究不會(huì)是靠某一個(gè)或幾個(gè)產(chǎn)品的出現(xiàn)而終結(jié),更多的還要頂尖人才參與、技術(shù)迭代和資金支持。想要打破壟斷,還需要考慮時(shí)間的因素以及對(duì)高質(zhì)量數(shù)據(jù)的篩選。
開(kāi)或閉,從來(lái)不是最根本的問(wèn)題,產(chǎn)品體驗(yàn)與市場(chǎng)需求的匹配,才是起決定作用的勝負(fù)手。