2月14日早10點(diǎn),百度官方微信發(fā)布公告,用短短一句話宣布放棄堅(jiān)持了兩年的閉源之路,轉(zhuǎn)身站到自己曾不以為然的反面。公告寫道:
“我們將在未來幾個月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開源?!?/p>
從2023年3月16日文心一言啟動邀測至今的約兩年時間里,百度創(chuàng)始人李彥宏始終站在“大模型閉源”的一端,在多個公開場合表達(dá)自己“開源會越來越落后”“開源就是智商稅”的理念。
李彥宏于2024百度世界大會,圖源/百度 「電廠」查閱公開資料發(fā)現(xiàn),最晚在2024年下半年的一次百度內(nèi)部講話中,李彥宏還公開重申了自己對閉源的堅(jiān)持,“效率上開源模型是不行的”,閉源模型才是“商業(yè)模型”。
在百度堅(jiān)持閉源的時間里,李彥宏的觀點(diǎn)也曾引起多番業(yè)界討論,如360創(chuàng)始人周鴻祎就公開嗆聲。在2024年4月舉辦的第二十七屆哈佛中國論壇上,周鴻祎曾講道:“我是一直相信開源的力量,至于說網(wǎng)上有些名人胡說八道,你們別被忽悠了。他說開源不如閉源好?連說這話的公司自己都是借助了開源的力量才成長到今天。”
沒人能預(yù)料到,短短幾個月后,百度和李彥宏悄然調(diào)轉(zhuǎn)了船頭,這場曾在國內(nèi)AI市場持續(xù)的口水戰(zhàn)也有了階段性答案。而這種轉(zhuǎn)變很難說是出于主動還是被動。
DeepSeek技驚四座,百度被動防御?
2024年12月26日、2025年1月20日,由創(chuàng)企深度求索開發(fā)的DeepSeek-V3、DeepSeek模型分別上線并開源。兩款模型在性能與成本方面都達(dá)到了全球領(lǐng)先水平,因此一經(jīng)亮相,就吸引了AI圈乃至整個用戶市場的注意力。
與此同時,面向普通C端用戶的DeepSeek App也迎來了破天流量,1月27日,DeepSeek的下載量在中外蘋果App Store免費(fèi)榜登頂。另據(jù)QuestMobile統(tǒng)計,1月28日,DeepSeek App日活超越字節(jié)跳動旗下豆包,成為國內(nèi)日活用戶最多的大模型對話產(chǎn)品;2月1日,其日活突破3000萬大關(guān),成為了市場最快達(dá)到這一里程碑的應(yīng)用。凡此種種,引來了行業(yè)的關(guān)注與忌憚。
比如,當(dāng)?shù)貢r間1月31日,OpenAI創(chuàng)始人Sam Altman首次提及了對閉源模式的反思,作為一家從GPT3開始堅(jiān)持模型閉源的公司,稱“我們可能站在了歷史錯誤的一邊”;OpenAI首席研究官M(fèi)ark Chen也承認(rèn)DeepSeek在獨(dú)立研究的情況下發(fā)現(xiàn)了一些OpenAI o1 的核心idea,但同時指出外部反應(yīng)是夸大的,OpenAI未來將在成本與性能兩端持續(xù)優(yōu)化。
另一家AI大模型領(lǐng)軍企業(yè),同樣堅(jiān)持閉源的Claude大模型母公司Athotipic的CEO則于1月底發(fā)布萬字長文,分析了DeepSeek帶來的影響,認(rèn)為DeepSeek威脅了美國在AI界領(lǐng)導(dǎo)地位的說法是夸大的。
然而,不同于海外大模型巨頭等企業(yè)在第一時間就對DeepSeek表態(tài)及強(qiáng)調(diào)自己仍有競爭力,包括百度在內(nèi)的國內(nèi)大模型玩家則沉默了許多。直到近日,百度才開始做出反應(yīng)。
在2月11日開幕的2025迪拜世界政府高峰峰會上,李彥宏開始側(cè)面回應(yīng)DeepSeek的爆火,他講道:“我們到處都能看到創(chuàng)新,我們必須適應(yīng)這種快速變化的創(chuàng)新?!?/p>
同一天,百度宣布文小言App(原“文心一言”) 更新4.9.0版本,并接入DeepSeek R1模型。
2月12日,百度智能云事業(yè)群總裁沈抖在事業(yè)群全員會上提到:“每當(dāng)科技的發(fā)展走到瓶頸期,總會有一個引領(lǐng)性的組織制造出拐點(diǎn),而DeepSeek就是這個拐點(diǎn)?!彼J(rèn)為DeepSeek會促進(jìn)開發(fā)生態(tài)會進(jìn)一步繁榮,肯定了DeepSeek帶來的影響。
2月13日,百度官宣文心一言將從4月1日起全面免費(fèi),允許PC端與App端用戶體驗(yàn)文心系列最新模型。
不過百度并未提及接下來面向企業(yè)客戶與開發(fā)者的Token收費(fèi)規(guī)則是否變化,「電廠」就此詢問百度官方,截至發(fā)稿暫無回復(fù)。
2月14日,百度最終官宣了計劃為文心大模型新版本開源的消息。
百度開源能做到什么程度?
DeepSeek的官網(wǎng)中寫有這樣一句話:“‘以開源精神和長期主義追求普惠 AGI’是DeepSeek一直以來的堅(jiān)定信念?!?/p>
而這一點(diǎn)正與百度過往嘗試走通的大模型之路相悖。但在不到一個月的時間里,DeepSeek迅猛增長、甚至被稱為展現(xiàn)了AGI的曙光之時,所有人都不得不停下來重新思考開閉源之間的選擇,以及重新檢視過往兩年的大模型研發(fā)范式。
而在公眾眼里,百度則在短短數(shù)天之內(nèi),以一種戲劇化的方式倒向了自己的反面。
不過,百度并沒有給出有關(guān)文心一言開源的更多細(xì)致信息。曾就職于一家大模型公司的Lily(化名)告訴「電廠」:“目前開源社區(qū)中的中文大模型多數(shù)并非是完全可商用,一般開源社區(qū)用戶通常需要進(jìn)行復(fù)雜的商用授權(quán)申請流程,在某些情況,甚至有對公司規(guī)模、所在行業(yè)、用戶數(shù)等維度有明確規(guī)定不給予商業(yè)授權(quán)?!?/p>
而現(xiàn)有的開源協(xié)議繁多,較為常見的有GPL、LGPL、BSD、Apache、Mozilla、MIT等,對于是否包含源代碼、是否允許商業(yè)使用、是否授權(quán)轉(zhuǎn)售等規(guī)定不盡相同。
常見開源協(xié)議,圖源/CSDN GitCode開源社區(qū) 根據(jù)官方信息,DeepSeek-V3及R1模型均采用MIT協(xié)議開源,這是一種較為寬松的開源協(xié)議,意味著任何人都可以自由使用該模型,用于包括商業(yè)用途并進(jìn)行模型蒸餾,無需申請。
(注:模型蒸餾是一種模型壓縮技術(shù),可以將大型模型中的知識轉(zhuǎn)移到小型模型中。)
正因如此,DeepSeek堪稱最為強(qiáng)大和開放的開源模型之一。作為對比,Meta旗下Llama系列模型并未采取公開的開源協(xié)議,而是定制了許可協(xié)議。
其中Llama 1在發(fā)布時僅許可了研究用途;Llama 2支持產(chǎn)品活躍用戶小于7億的商業(yè)使用(如果超過7億需另向Meta進(jìn)行申請);Llama 3.2系列模型的許可證中則寫道“任何居住在歐盟的個人或在歐盟有主要營業(yè)地點(diǎn)的公司不被授予使用 Llama 3.2 中包含的多模態(tài)模型的許可權(quán)”。
而百度的大模型開源能夠做到什么程度,是否能夠刺激到足夠數(shù)目的開發(fā)者共建生態(tài),或許要到其新模型發(fā)布的那一天才有答案。