文|三易生活
早前Meta的LLaMA大模型“意外”泄露后,大模型的開源與閉源之爭就此提上了日程。大模型到底是開源好、還是閉源好?過去一年整個(gè)AI業(yè)界可謂是爭吵不休。如今,又有一位重量級人士站出來表態(tài)了。
就在4月11日,百度創(chuàng)始人李彥宏的內(nèi)部講話被傳出。據(jù)悉他在此次講話中表示,去年文心一言發(fā)布時(shí),百度方面就判斷市場上一定會(huì)有開源的模型,而且不止一家會(huì)開源,在這種情況下多百度一家開源不多、少百度一家開源也不少。并且他認(rèn)為,大模型開源意義不大,閉源才能走通商業(yè)模式。
李彥宏之所以堅(jiān)定押注閉源,在于他認(rèn)為開源大模型的運(yùn)行模式和傳統(tǒng)開源軟件不同,并不是眾人拾柴火焰高。作為從自由軟件思潮之中誕生的結(jié)晶,開源軟件也繼承了自由軟件所提倡的知識共享理念,同時(shí)又允許以專利的形式從知識產(chǎn)品中獲得收益。事實(shí)上,開源本身并不是一種商業(yè)模式,而是一種軟件的開發(fā)、發(fā)布和傳播模式。
而開源就使得大規(guī)模協(xié)作開發(fā)成為了可能,從GNU/Linux、Android、Chromium這一系列大名鼎鼎的項(xiàng)目,到XZ Utils這類深耕細(xì)分領(lǐng)域的產(chǎn)品,它們的成功都是源自于匯聚了開源社區(qū)的力量,大量的開發(fā)者都在為這些項(xiàng)目貢獻(xiàn)力量。
然而開源大模型的運(yùn)行模式則完全不同,如今無論是來自歐洲的AI獨(dú)角獸Mistral的Mixtral-8x7B,還是美國科技巨頭Meta的Llama-2,它們都鼓勵(lì)開發(fā)者貢獻(xiàn)各種各樣的數(shù)據(jù)、代碼,但Mixtral-8x7B、Llama-2的主要開發(fā)者依舊還是Mistral、Meta。
開源大模型很難從社區(qū)獲益,歸根結(jié)底在于社區(qū)貢獻(xiàn)的價(jià)值并不一定是正向的。AI大模型會(huì)出現(xiàn)“幻覺”(Hallucination),現(xiàn)在幾乎已經(jīng)是業(yè)界的共識,AI科學(xué)家也仍未完全解開這個(gè)謎題,但數(shù)據(jù)的質(zhì)量與大模型幻覺呈現(xiàn)正相關(guān)則是肯定的。
開源大模型接受垃圾代碼、低質(zhì)數(shù)據(jù)導(dǎo)致性能下降,這樣的事情不是沒有發(fā)生過。甚至Anthropic的研究人員曾發(fā)表論文警告,現(xiàn)階段的安全訓(xùn)練無法消除插入后門觸發(fā)機(jī)制的惡意行為,進(jìn)而會(huì)導(dǎo)致開源大模型變得不安全。
開源大模型缺乏安全性,這也是OpenAI、Anthropic等閉源陣營旗手攻擊開源的重要論點(diǎn)。
除此之外,開源大模型在性能上也還無法媲美閉源大模型。如今無論是哪個(gè)機(jī)構(gòu)給出的大模型評測榜單中,OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude,以及國產(chǎn)的文心一言、訊飛星火、KimiChat,對比它們的開源大模型競爭對手都更有優(yōu)勢。所以在同等參數(shù)的情況下,閉源大模型的能力更強(qiáng),李彥宏此言并非無的放矢。
此前福布斯的一篇文章《10 AI Predictions For 2024》就曾給了預(yù)測,盡管開源模型在某些領(lǐng)域有優(yōu)勢,但最先進(jìn)的商業(yè)閉源模型可能仍將在性能上保持領(lǐng)先。
大家不妨試想一下,如果GPT-4不能保持性能領(lǐng)先,用戶就會(huì)轉(zhuǎn)向免費(fèi)的開源模型。當(dāng)免費(fèi)、不受限制的替代品在質(zhì)量上具有可比性時(shí),用戶確實(shí)不會(huì)為受限制的模型付費(fèi)??扇缃竦那闆r,卻是開源大模型的性能還不能挑戰(zhàn)閉源大模型。
當(dāng)然,開源大模型最致命的缺陷其實(shí)是在商業(yè)層面。Meta的Llama-2開源之后,國內(nèi)的百模大戰(zhàn)立刻拉開了帷幕,市面上很快也多了一大堆套殼模型。從某種意義上來說,大模型的開源其實(shí)是給自己平白無故地增加了一大堆競爭對手,而且這一部分競爭者又會(huì)分食潛在的企業(yè)級用戶。
由于開源協(xié)議本身并沒有限制商業(yè)化,因此在許多開源軟件中存在著免費(fèi)社區(qū)版和收費(fèi)企業(yè)版共存的模式,也就是所謂的雙許可證。其中免費(fèi)版本負(fù)責(zé)擴(kuò)大軟件的影響力,再用付費(fèi)版本獲利,這就是開源軟件經(jīng)典的商業(yè)模式。比如在2018年被IBM以334億美元收購的開源軟件和技術(shù)供應(yīng)商Red Hat,就是這一模式的典型。
開源大模型沒有建立起商業(yè)模式,這是當(dāng)下開源大模型鼓吹者始終無法回避的一個(gè)問題。拋開眾說紛紜的B端業(yè)務(wù),OpenAI的GPT-4、百度的文心一言目前都有付費(fèi)訂閱版本,C端用戶的付費(fèi)是實(shí)打?qū)嵈嬖诘摹6掖髽I(yè)大的Meta打定主意要用開源來為自己挽回已經(jīng)跌入谷底的企業(yè)形象,Llama則可以被視為Meta方面精心設(shè)計(jì)的一個(gè)廣告。
但其他的開源大模型廠商不能總是只靠融資,事實(shí)上,即使是開源大模型的代表Mistral,如今對于開源也沒有那么堅(jiān)定。Mistral創(chuàng)始人Arthur Mensch近期在接受媒體采訪時(shí)就曾確認(rèn),Mistral已經(jīng)推出了商業(yè)模型,并且他還坦言,商業(yè)模型可以幫助Mistral創(chuàng)造收入。歸根結(jié)底,大模型太貴,開發(fā)成本比傳統(tǒng)的軟件要高出了數(shù)個(gè)量級,因此也更加依賴融資。
當(dāng)大模型與資本的牽扯如此之深的情況下,可后者顯然是要謀求回報(bào)的,所以這可能才是李彥宏堅(jiān)定看好閉源的原因。