界面新聞記者 | 陳振芳
界面新聞編輯 | 宋佳楠
“今天這個震撼發(fā)布,明天那個史詩級更新,但是我要問,應用在哪里?誰從中獲益了?”
7月4日,百度董事長李彥宏在世界人工智能大會(WAIC)的產(chǎn)業(yè)發(fā)展主論壇上狠批大模型刷榜比拼之風,稱很多公司把關(guān)注點放在基礎模型上,一天到晚跑分、刷榜,誰又超越GPT4了,OpenAI又出了sora、GPT4o等。
大模型刷榜,主要是指各家公司和研究機構(gòu)競相在各種基準測試上取得最高分數(shù),以此來展示其模型的性能優(yōu)越性。在追求高分的過程中,一些模型可能被訓練于包含基準測試數(shù)據(jù)集的樣本上,從而導致不公平的優(yōu)勢。
此外,一些基準測試可能過于簡單或者不夠全面,無法完全反映模型在復雜場景下的真實能力,也可能導致資源分配的不平衡。
在李彥宏看來,當前最重要的是應用,“沒有應用,光有基礎模型,不管是開源還是閉源都一文不值?!彼粲酰?/span>不要卷模型了,要去卷應用。”
實際上,基于基礎模型的應用已經(jīng)逐漸在各行各業(yè)滲透。以快遞行業(yè)舉例,大模型能將訂單處理時間從3分多鐘縮短到19秒,解決90%以上的售后問題效率。而在代碼生成領域,百度內(nèi)部30%左右的代碼,已經(jīng)用AI生成,代碼的采用率超過了44%。
據(jù)李彥宏透露,兩個多月前文心大模型的日調(diào)用量超過了2億,近期則超過了5億。“調(diào)用量發(fā)生的變化體現(xiàn)了真實的需求,有人真的從大模型當中獲益?!?/span>
但他也特別提醒,要避免掉入“超級應用陷阱”,“DAU 10億的APP才叫成功”已經(jīng)是移動互聯(lián)網(wǎng)時代的思維邏輯。AI時代下,“超級能干”的應用比只看DAU的“超級應用”更重要,只要對產(chǎn)業(yè)、對應用場景能產(chǎn)生大的增益,整體價值就比移動互聯(lián)網(wǎng)大。
百度內(nèi)部看好的AI應用發(fā)展方向是智能體,制作好的智能體比互聯(lián)網(wǎng)時代制作網(wǎng)頁還要簡單。未來在醫(yī)療、金融、教育、制造、交通、農(nóng)業(yè)等領域,都會依據(jù)自己的場景、特有的經(jīng)驗、規(guī)則、數(shù)據(jù)等等,做出各種各樣的智能體。
“將來會有數(shù)以百萬量級的智能體出現(xiàn),形成龐大的智能體生態(tài)?!崩顝┖暾f。
對于行業(yè)熱議的開源和閉源之爭,他再次表達了自己的看法,稱有些外行混淆了模型開源和代碼開源。在他看來,同樣參數(shù)規(guī)模之下,閉源模型的能力比開源模型更好,開源想要追平閉源模型的能力,需要有更大的參數(shù),這意味著推理成本會更高,反應速度會更慢。
“開源模型并不能讓你站在巨人的肩膀上去迭代和開發(fā)。”他說,有公司通過開源模型來改款,只是創(chuàng)造一個孤本模型,無法從基礎模型持續(xù)升級當中獲益,也無法共享算力。開源模型只在學術(shù)研究、教學等少數(shù)領域有價值,并不適合大多數(shù)應用場景,尤其是處在激烈競爭的市場環(huán)境中,要讓公司的業(yè)務效率、成本優(yōu)于同行,商業(yè)化的閉源模型是最能打的。
不過,也有業(yè)內(nèi)人士向界面新聞表達了不同意見,認為李彥宏閉源大模型的言論只是站在百度的利益之上,開源模型有其商業(yè)價值,尤其從長遠來看,開源模型的能力會不斷追平閉源模型。
開閉源模型之爭只是國內(nèi)“百模大戰(zhàn)”的一隅。按照李彥宏的觀點,大戰(zhàn)造成了社會資源的巨大浪費,尤其是算力浪費,但另一方面,使得中國開始追趕世界上最先進的基礎模型。
上述種種言論背后,也在一定程度上反映出百度想要改變現(xiàn)狀的迫切。
在上一輪移動互聯(lián)網(wǎng)競爭中,百度不斷“掉隊”,轉(zhuǎn)而選擇押寶AI。而在這一輪的AI角逐戰(zhàn)中,不僅有老牌互聯(lián)網(wǎng)大廠,還有大模型創(chuàng)業(yè)明星公司,競爭更加激烈。
即使在百度最為強勢的搜索領域,也不得不面對競爭對手的“蠶食”——不僅盤踞著微信搜索、小紅書的內(nèi)容搜索,各家大模型公司都推出了AI搜索,例如Kimi、豆包、海螺AI、智譜清言等產(chǎn)品。搜索,已成為當下大模型消費端應用的必爭之地。
至少在聲量上,百度已有所落后。中金最新發(fā)布的研報顯示,Kimi在3月份爆火后,一直領先于百度的文心一言,拿下中國AI網(wǎng)站流量第一名。
以6月19日至25日這一周為例,中國AI網(wǎng)站的周度訪問量中,月之暗面旗下的Kimi chat以571.83分居于榜首,文心一言以412.97分居于第二名;而在中國Al app下載量以及日均活躍用戶數(shù)榜單中,字節(jié)跳動旗下的豆包成為斷層第一,百度始終居于后位。
如何在后續(xù)的競爭中持續(xù)保持優(yōu)勢,并實現(xiàn)突圍,將是李彥宏和百度需要共同面對的課題。