文|青橙財(cái)經(jīng) 青白
編輯|六子
“整個(gè)晉西北都亂成一鍋粥了?!贝藭r(shí)此刻,《亮劍》里的這句話用來形容大模型領(lǐng)域的競爭,竟然顯得意外合適。
五月剛剛過半,全球數(shù)得上名號(hào)的大模型玩家——包括OpenAI、谷歌、騰訊、阿里、字節(jié)跳動(dòng)等,突然一窩蜂地拋出大動(dòng)作,有能力突然全面升級(jí)的,有大模型轉(zhuǎn)為開源免費(fèi)使用的,有價(jià)格劇烈下行掀起價(jià)格戰(zhàn)的,景象熱鬧非凡。一開始,大家也許只是想在OpenAI預(yù)定的發(fā)布會(huì)時(shí)間湊個(gè)熱鬧,沒想到炸出了一堆“大招”。
在這場頗具火藥味兒的軍備競賽中,我們發(fā)現(xiàn),大模型的賽場上,似乎已經(jīng)只剩下中美兩個(gè)大國的巨頭還能留名。“爆炸式”競爭背后,是整個(gè)領(lǐng)域遲遲找不到合理商業(yè)模式的困境?;蛟S,巨頭們要因此“瘋狂”起來了。
01 大模型突發(fā)“爆炸式”競爭
世上的事,最怕一個(gè)“巧”字。阿里肯定會(huì)有這種想法,因?yàn)?月這輪技術(shù)大爆炸,居然是它開頭的。
5月9日,阿里云正式發(fā)布通義千問2.5,模型性能全面趕超GPT-4 Turbo。在通稿中,阿里直接用上了“地表最強(qiáng)中文大模型”的形容,中國大模型因此進(jìn)入與國外一流大模型一較高低的競技場中央。而在開源領(lǐng)域,通義千問1100億參數(shù)開源模型在多個(gè)基準(zhǔn)測評(píng)收獲最佳成績,超越Llama-3-70B,同樣成為行業(yè)最強(qiáng)。
彼時(shí),距離OpenAI發(fā)布會(huì)還有一周時(shí)間,阿里估計(jì)自己也沒想到,七天后,全球大模型領(lǐng)域巨頭突然集體狂飆:
5月14日,李開復(fù)領(lǐng)導(dǎo)的零一萬物正式發(fā)布千億參數(shù)規(guī)模的 Yi-Large閉源大模型,斯坦福評(píng)測機(jī)構(gòu) AlpacaEval 2.0的排行榜上,Yi-Large 模型的英語能力主要指標(biāo)僅次于 GPT-4 Turbo,Win Rate 登頂世界第一。
無獨(dú)有偶,李開復(fù)也說,一年前的中國大模型相比美國太落后,現(xiàn)在已經(jīng)趕上,且零一萬物的下一代大模型要沖擊GPT-5的水平。
緊接著,王炸登場。5月14日,OpenAI凌晨發(fā)布最新旗艦大模型GPT-4o,它是聽說讀畫都全能,甚至可以根據(jù)正在對(duì)話的人的語氣和狀態(tài),自主調(diào)節(jié)回復(fù)邏輯,全模態(tài)真人交互跟“成精了”一樣。而更讓業(yè)界震驚的是,它居然免費(fèi),付費(fèi)則可以獲得五倍的使用容量。OpenAI說,GPT-4o的“o”就是“omni”的意思,包羅萬象——野心可太大了。*來源OpenAI
轉(zhuǎn)眼天亮,中國玩家又跟上節(jié)奏了。騰訊于5月14日白天宣布,和Sora同架構(gòu)的混元文生圖大模型直接開源,免費(fèi)商用。評(píng)測數(shù)據(jù)顯示,這可是目前效果最好的開源文生圖模型。騰訊這個(gè)動(dòng)作,倒是很有其一貫的風(fēng)范,你們都卷是吧,我直接把使用門檻取消,先搶用戶再說。
白日落幕,5月15日凌晨,谷歌召開2024 I / O 開發(fā)者大會(huì)。這是一場很急的大會(huì),因?yàn)楣雀枰豢跉馊映鰜硎嗫町a(chǎn)品,堪稱AI“大亂燉”,目的就是狙擊OpenAI。其中,包括Gemini 1.5 Pro正式開放給訂閱了Geminni Advance的用戶,上下文窗口拓展到200萬token,推出開源模型Gemma2.0、文生圖像模型Imagen3、視頻生成模型Veo等。
5月15日下午,字節(jié)跳動(dòng)上場了。在2024 春季火山引擎Force原動(dòng)力大會(huì)上,字節(jié)發(fā)布豆包大模型家族,同樣包括多模態(tài)大模型。豆包就是原來的云雀大模型,據(jù)字節(jié)披露,目前豆包大模型日均處理1200億Tokens文本,生成3000萬張圖片,全平臺(tái)用戶超過2600萬,應(yīng)用下載量也位居AIGC行業(yè)第一。
僅僅是總結(jié)這些巨頭的發(fā)布動(dòng)作,便已經(jīng)讓人看花了眼。要知道,這里面還不包括那些不發(fā)新品,但是開打價(jià)格戰(zhàn)的鐵血玩家們。從年初Kimi的爆火開始,大模型領(lǐng)域的熱度和討論度似乎又到了新的臺(tái)階,所有大廠都在此時(shí)用實(shí)際行動(dòng)表態(tài):過去一年,它們都在養(yǎng)精蓄銳?,F(xiàn)在,巨頭要讓大模型領(lǐng)域燃起硝煙了。
02 混亂之中,寡頭格局已成型
其實(shí),從這些動(dòng)態(tài)中,我們也能讀到一點(diǎn)別的意味:中國和美國的大模型巨頭,基本上是在每天輪流唱大戲。白天中國公司放消息,晚上美國公司又頂上,這才連續(xù)震撼了行業(yè)。而這個(gè)過程呢,隨便哪個(gè)名字都是行業(yè)里無人不知無人不曉的。其實(shí),這就是兩個(gè)趨勢了。
第一個(gè)趨勢,是大模型行業(yè)的寡頭格局已經(jīng)形成了。典型的特征是,上述炸場動(dòng)態(tài)基本都是巨頭大模型產(chǎn)品的重磅升級(jí)迭代或者商業(yè)上的重要變化,并沒有哪個(gè)新玩家蹭上這波熱度。
實(shí)際上,對(duì)一個(gè)剛剛火起來沒多久的行業(yè)來說,這么快進(jìn)入寡頭競爭有點(diǎn)讓人驚訝。但考慮到大模型發(fā)展本質(zhì)上是算力、數(shù)據(jù)、算法三方面的大比武,只有巨頭和資源能力強(qiáng)的玩家能做,也并不奇怪。一開始,這個(gè)行業(yè)就只給很少的企業(yè)留了機(jī)會(huì)。像Kimi這樣有點(diǎn)技術(shù)的,也是靠著差異化的長文本打法才有機(jī)會(huì)成長起來,結(jié)果也迅速讓阿里、百度等巨頭比下去了。
第二個(gè)趨勢,就是國家問題了。大模型的國際態(tài)勢已經(jīng)很明顯了,和互聯(lián)網(wǎng)差不多,又是“美領(lǐng)跑,中緊跟,其他區(qū)域跟不上”的態(tài)勢。唯一一個(gè)可以算得上例外的,應(yīng)該是歐洲獨(dú)角獸Mistral AI。但是,這家公司能有個(gè)競爭位置,依然是因?yàn)镺penAI看好它。這個(gè)行業(yè),確實(shí)沒有中美之外的其他可能性了。
所以,我們不如來想一想,假設(shè)現(xiàn)在的寡頭們都能繼續(xù)走下去,他們會(huì)怎么塑造市場格局?贏者通吃還是多個(gè)贏家并存?這比較難判斷,但要說大模型能一直“無序”競爭,資源肯定是不足的,至少英偉達(dá)連顯卡都生產(chǎn)不過來。既然這樣,通過對(duì)大模型領(lǐng)域進(jìn)行分層,我們可以略微推導(dǎo)一下這些公司的發(fā)展方向。
一方面,是行業(yè)大模型和基礎(chǔ)大模型的分層。這次一起拱火的巨頭們,都是基礎(chǔ)大模型的一把好手,所以我們不妨看看沒有蹭這次熱度的大模型玩家在做什么——像科大訊飛、商湯等大模型玩家,其實(shí)已經(jīng)在重點(diǎn)發(fā)展行業(yè)賽道??拼笥嶏w星火大模型,和商湯日日新大模型,都已經(jīng)在汽車、教育、工業(yè)等賽道探索落地。而今天字節(jié)的發(fā)布會(huì)上,字節(jié)也請(qǐng)來了捷途汽車相關(guān)部門負(fù)責(zé)人等,講述大模型的行業(yè)應(yīng)用,并發(fā)布智能終端大模型聯(lián)盟,矩陣式進(jìn)攻。*來源火山引擎
其實(shí),這是一條不錯(cuò)的路?!盎A(chǔ)大模型→行業(yè)大模型→終端應(yīng)用”,是行業(yè)比較認(rèn)可的發(fā)展路線?;A(chǔ)大模型非常吃資源,也就是超級(jí)巨頭才卷得過。而行業(yè)更需要垂直領(lǐng)域的Know-How,懂行業(yè)、懂客戶,就能取得一定的成果。
另一方面,是開源大模型和閉源大模型的交鋒。OpenAI和谷歌為代表的巨頭,采用閉源大模型,而阿里、騰訊、Meta、Mistral AI,都在開源上下功夫。要強(qiáng)調(diào)的是,這并不絕對(duì),比如Meta和Mistral AI都是主要把精力放在開源上,而阿里騰訊都是兩者兼有,但對(duì)開源的態(tài)度很開放。OpenAI則是關(guān)起門來自己玩的純閉源選手。
至于為什么要開源,或者要兩手把握,原因就像前面說騰訊的時(shí)候提到的那樣,開源模型意味著垂直行業(yè)的公司想用,就不用從頭訓(xùn)練大模型,其實(shí)間接減少了對(duì)閉源大模型的需求——作為巨頭,我閉源干不過你,直接讓用戶先用上便宜好用的大模型也可以,你的客戶少了,我反正更安全。
說到底,現(xiàn)在大模型并沒有一個(gè)真正意義上特別穩(wěn)定的商業(yè)模式,賣會(huì)員、賣行業(yè)大模型,都只是階段性嘗試而已。整個(gè)階段,這些巨頭一方面在想搶客戶,另一方面其實(shí)需要防備客戶太傾向哪個(gè)大模型。于是,我們就在這場集體爆發(fā)里,看到了這么多的“拉扯”。
03 拼落地,商業(yè)模式仍缺思考
那么,現(xiàn)在大模型行業(yè)對(duì)商業(yè)模式的思考和探索,具體到哪一步了?現(xiàn)在,它們有什么明確的競爭焦點(diǎn)了嗎?這些問題,都是有答案的。
先來看最基礎(chǔ)的商業(yè)模式表現(xiàn),雖說行業(yè)確實(shí)有點(diǎn)迷茫,但正面的進(jìn)展是不少的。比如,字節(jié)跳動(dòng)豆包平臺(tái)上已經(jīng)有超過800萬個(gè)智能體被創(chuàng)建,2600萬的用戶量也在行業(yè)高度領(lǐng)先;零一萬物透露,其海外生產(chǎn)力應(yīng)用總用戶接近千萬,今年C端單一產(chǎn)品收入已經(jīng)達(dá)到1億元;通義通過阿里云服務(wù)企業(yè)超過9萬、通過釘釘服務(wù)企業(yè)超過220萬,就連小愛同學(xué)也和阿里牽手;百度則表示,已經(jīng)有近10萬家企業(yè)調(diào)用文心一言能力,百度文庫的AI能力,每天有250萬用戶都在用。*來源零一萬物
說起來,商業(yè)化無非就是兩派——GPT、Kimi、文心一言會(huì)員、豆包等平臺(tái)上的智能體,都是C端應(yīng)用的代表;反之,阿里把通義大模型嵌入釘釘、科大訊飛和商湯給客戶定制的行業(yè)大模型,則是B端應(yīng)用的代表。出現(xiàn)這種劃分,其實(shí)也就是公司基因的繼承,像阿里、騰訊、字節(jié)等公司本身就是雙端業(yè)務(wù)拓展,B端和C端自然都能做,而商湯這種一開始就做B端業(yè)務(wù)的公司,要用AI拿到新訂單也更容易。
所以,嚴(yán)格來說,大模型的商業(yè)化落地其實(shí)要思考“AI+”(以AI技術(shù)賦能行業(yè)的科技企業(yè))還是“+AI”(采用AI技術(shù)的傳統(tǒng)企業(yè))的問題。目前,無論是GPT這種“技術(shù)即產(chǎn)品”的方式,還是阿里、科大訊飛定制化和嵌入化的方式,目前都沒有突破傳統(tǒng)商業(yè)模式的范疇,估計(jì)不一定是大模型的終極形態(tài)。
更嚴(yán)峻的問題是,我們必須承認(rèn),當(dāng)阿里、騰訊都在開源,當(dāng)GPT的能力、谷歌Gemini的能力都有所重合,無論B端還是C端客戶,選擇單一大模型的動(dòng)力其實(shí)有點(diǎn)弱了。因?yàn)榇竽P偷幕A(chǔ)能力都差不多,無非是這個(gè)月我第一,下個(gè)月你第一,很難分出差異來。這個(gè)時(shí)候,競爭的焦點(diǎn)其實(shí)不在能力上。
在哪呢?QuestMobile數(shù)據(jù)顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,和移動(dòng)互聯(lián)網(wǎng)幾十億用戶比起來真是“灑灑水”的程度。為什么大眾沒那么樂意用呢?因?yàn)殚_源模型要部署,而收費(fèi)的模型真的不便宜。文心一言的用戶數(shù)已經(jīng)突破2億,專業(yè)版連續(xù)包月也要49.9元一個(gè)月,你說其中能有多少付費(fèi)會(huì)員?*來源文心一言網(wǎng)頁
如果用戶規(guī)模不夠,從實(shí)戰(zhàn)收回的反饋數(shù)據(jù)就不夠,大模型要向能用、好用的水平發(fā)展,就會(huì)更麻煩。所以,為了讓大模型加速落地,價(jià)格戰(zhàn)已經(jīng)打起來了。
行業(yè)其實(shí)有個(gè)平均水平,0.12元/千tokens。但是,這根本限制不了巨頭大降價(jià)的決心。
字節(jié)是個(gè)狠人,豆包模型在企業(yè)市場的定價(jià)低到了0.0008元/千tokens,比行業(yè)均價(jià)便宜99.3%。炸場的OpenAI價(jià)格也很炸裂,API價(jià)格打五折,速度還提高一倍,新推出的text-embedding-3-small模型,價(jià)格僅為上一代的五分之一,每1000個(gè)tokens的價(jià)格從0.0001美元降低到0.00002美元。
另外還有一些默默用價(jià)格卷同行的玩家,比如智譜AI,入門級(jí)產(chǎn)品GLM-3 Turbo,一塊錢就能買100萬tokens。
為什么卷生卷死?還不是因?yàn)閱渭兊募夹g(shù)競爭,其實(shí)已經(jīng)暫時(shí)無法出現(xiàn)質(zhì)的變化,最大的代表就是,OpenAI的GPT-4o很驚艷?很可能是GPT-5有點(diǎn)難產(chǎn),才只能用這種進(jìn)步來搪塞一下市場。
而大模型壞就壞在,這個(gè)領(lǐng)域太新了,如果沒有新的技術(shù)把水?dāng)嚋?,一旦用戶開始習(xí)慣了用某個(gè)大模型,市場格局就會(huì)很危險(xiǎn)。所以,沒有人希望這個(gè)領(lǐng)域太冷清,越熱鬧、越瘋狂,才能保證自己不被洗出局。這個(gè)領(lǐng)域沒有“王”,不管中國公司還是美國公司,比的就是誰敢闖、誰更狂。