文|腦極體
天氣轉涼,夏天即將過去。如果有人問,云計算廠商在這個火熱的夏天做了什么。答案是,他們做了三件事:大模型、大模型,以及大模型。
7月,在華為開發(fā)者大會2023(Cloud)期間,華為云公布了盤古大模型3.0,隨后進行了生態(tài)等方面的升級。而在此前更早時候,阿里云公布了通義千問大模型,并在8月3日宣布其正式開源。
來到9月,云計算廠商的大模型發(fā)布更加密集。9月5日,百度智能云在2023百度云智大會發(fā)布了千帆大模型平臺2.0,進一步集成百度的文心系列大模型,只隔兩天,騰訊就在2023騰訊全球數(shù)字生態(tài)大會發(fā)布了混元大模型,其主要出口則是騰訊云。
至此,中國幾大云計算廠商可以說是在大模型領域重兵集結。相較于AI算法公司與研究機構,云計算廠商做的大模型更貼近產業(yè)與應用的一線,而且大模型與云廠商原本的業(yè)務體系、營收模塊有著相對復雜的關系。因此,云廠商的大模型之爭,絕不是簡單的模型之間技術對比。
那么,云計算大廠做大模型究竟是為什么?云+大模型之戰(zhàn)的決勝點在哪?
本文中,我們希望通過多個層次的對比與梳理,和大家一起解答這個問題。
首先要明確兩個前提:一是伴隨著各行業(yè)IT投入的降低,云計算廠商普遍面臨著增速放緩,營收不利的情況。根據(jù)IDC報告預測,未來五年中國云計算行業(yè)的平均增長速度將下調10%左右,云計算廠商的正在普遍降低業(yè)務預期。因此,大模型突然爆火,對于云計算行業(yè)來說是難得的窗口,這個機會或許利益沒有想象中大,但目前也不得不做。
另一個情況是,從用戶界面來看云+大模型的需求是十分復雜的。有的用戶需要直接調取模型,有的用戶需要AI算力來自己訓練模型,還有用戶需要大量的模型定制化與解決方案集成。因此云廠商做大模型并不是很多人想象的短兵相接白刃戰(zhàn)。大模型相關業(yè)務,需要面向多個市場,多種商業(yè)模式。這場賽事更像是一場陣地戰(zhàn),各個戰(zhàn)略節(jié)點都不能出現(xiàn)缺口。
在這場大模型鏖戰(zhàn)的各個層面,都有一條明線和一條暗線在牽引著局勢的發(fā)展。
IaaS層:明線堆卡,暗線啟動國產AI算力
大模型帶給云計算廠商最直接的變化,其實并不來自于模型本身,而是大模型火了之后,涌現(xiàn)出來的大模型熱潮需要龐大的AI算力。大模型數(shù)據(jù)規(guī)模巨大,且訓練模型需要專屬的AI算力,這就給云計算服務商短期帶來了用云量的升級。在云計算IaaS層市場整體相對低迷的情況下,大模型的出現(xiàn)也算是注入了一針強心劑。
這個層面上云計算廠商的競爭節(jié)點,用一個詞概括就是“堆卡”。誰能提供充沛少排隊,且盡量價格低廉的AI算力,誰就算贏了。而AI算力的來源主要是英偉達的GPU,于是就出現(xiàn)了云計算廠商買空市面上GPU的現(xiàn)象,以及“云廠商都是給英偉達打工”的說法。
但不管怎么說,云計算廠商在IaaS層的堆卡競賽都不會結束,大量用戶依舊會以計算成本和計算效率來作為選擇公有云AI算力的考量依據(jù)。這個層面上,云計算廠商就需要提升在計算集群性、計算兼容性方面的能力,盡量發(fā)揮出每一張GPU的價值。
比如說,百度智能云就承諾在萬卡集群訓練大模型時,有效訓練時間達到95%以上,從而降低用戶的訓練時間成本,實現(xiàn)更好的計算加速比。阿里云則提出了能夠支持高達十萬卡GPU的單集群規(guī)模,可讓多個萬億參數(shù)大模型同時在線訓練。
而在堆卡這條明線之外,云+大模型在基礎設施層的競賽其實還有一條暗線,就是AI算力的國產化。
不久之前,英偉達高端GPU面向中國市場供應鏈不穩(wěn)定的消息沸沸揚揚,后來又傳出了“中國特供版GPU”價格貴、性能低的問題。這些現(xiàn)象愈發(fā)讓各界看到了AI算力走向自主可控的必然性。
在這輪大模型熱潮中,AI算力的國產化與云上獲取從趨勢變成了現(xiàn)實。其主要方式有兩種,一種是云計算廠商兼容更多的國產芯片,提供多樣化的AI算力。比如騰訊云、百度智能云等廠商都在強化自身的國產軟硬件兼容性,并且構建AI計算的相關生態(tài)。
在這一點上,華為云擁有天然的優(yōu)勢。受到制裁后的幾年里,華為逐漸將自主AI計算生態(tài)做大做強,已經成為國產AI計算中比較成熟的一支。伴隨著盤古大模型的升級,華為云同時宣布將提供自主化的AI云服務,為大模型訓練提供算力底座,這意味著華為的自主化AI算力正式由線下走上云端。
強調大模型、AI框架的自主可控已經是大勢所趨。接下來,有理由相信公有云+國產AI算力的模式,將在宏觀趨勢的推動下持續(xù)向上。最終成為左右IaaS市場的關鍵變量。
模型層:明線MaaS落地,暗線降低訂制化成本
從產業(yè)層面上看,大模型帶給云計算的最大變化是什么?就目前情況來看,MaaS的新商業(yè)模式是云廠商最為看重的一點。所謂MaaS,是指云廠商直接向用戶輸送AI大模型,從而實現(xiàn)模型即服務。
至少在目前的開局階段,各家云廠商對MaaS這個全新模式寄予厚望,甚至有廠商直接用MaaS替換了此前的SaaS,似乎經歷了久久為功之后,SaaS模式終于要被云產業(yè)放棄了。這也難怪。畢竟在中國市場SaaS的客單價較低,但需要進行的定制化工作卻很多,并且異常消耗后期服務。以大廠的綜合成本來看,SaaS始終難以擺脫食之無味棄之可惜的雞肋定位。
既然如此,還不如轉頭擁抱更加火熱的大模型。于是可以看到各個云廠商在2023年集體發(fā)力MaaS的新商業(yè)模式,并且為此做出了系列工作。
進軍MaaS的第一階段,云廠商主要布局在三個方面:
1、基礎模型要多且精,能夠滿足用戶在NLP、CV、多模態(tài)等幾個大方向的多樣性需求。同時,基礎模型還是云廠商的大模型門面?;A模型的體驗,決定著用戶與開發(fā)者對云廠商大模型能力的第一印象。比如文心一言的火爆,就給文心系列大模型與百度智能云的MaaS服務帶來了明顯的品牌加持效應。
2、重點領域要重點覆蓋,在可能被高頻次調用的行業(yè)類別與應用類別上,廠商要盡量做出成熟的大模型,以及基于大模型開發(fā)的應用,盡量實現(xiàn)低門檻集成與開箱即用。比如騰訊云的行業(yè)大模型精選商店,既提供混元大模型,還上架了金融、文旅、零售等20多個領域的行業(yè)大模型。行業(yè)大模型,已經成為MaaS模式的中堅力量。
3、要提供充沛的工具能力。除了基礎模型、高頻定制模型之外,還有海量的大模型需求。這要求用戶和開發(fā)者具備一定的開發(fā)能力,而云廠商需要提供模型精調、應用開發(fā)方面的工具鏈。比如百度智能云的千帆平臺,就在模型之外還提供預制數(shù)據(jù)集、應用范式,以及其他幫助企業(yè)應用大模型的工具。
但看似如火如荼的MaaS模式,實則也隱藏了一個暗線問題:SaaS不賺錢,于是轉頭擁抱MaaS,但誰說MaaS就賺錢了呢?
云廠商做AI也已經很多年了。但結果往往是效果很好,利潤很差。這其中的關節(jié)依舊在SaaS失速的那個關鍵原因上:定制化成本。
無論是企業(yè)應用AI還是現(xiàn)在應用大模型,本質上都難逃AI作為軟件的不確定性。不同企業(yè)之間的不同需求天差地別,加上AI在算力、數(shù)據(jù)與人才上都有極高的成本,任何定制行為都會產生一連串的連鎖反應。專家下工廠聽上去很美,但說一千道一萬,工廠最終是無法負擔專家薪資的。但如果不提供定制化,又會出現(xiàn)絕大多數(shù)AI需求無法被滿足的尷尬。
于是,怎么從頂層設計階段就降低MaaS模式可能產生的定制化成本,已經成了大模型一戰(zhàn)最為核心的競爭暗線。
在這個方面,各家廠商的探索幅度與實現(xiàn)方式各不相同。比如百度智能云更傾向用預置模型、預置應用的方式來降低定制化。除了模型平臺之外,百度智能云還發(fā)布了“AI 原生應用 Family”,通過模型+大模型應用的模式讓企業(yè)滿足自身需求。
在這方面,目前探索幅度最大的是華為云。華為云的盤古大模型3.0,從框架設計上搭建了一個“5+N+X”的三層架構。這個架構把大模型分為L0、L1、L2三層體系。其中L0層包括NLP、CV、多模態(tài)、預測、科學計算五個基礎大模型;L1則是N個行業(yè)大模型,比如政務、礦山、金融等;L2是面向各行業(yè)的細化場景模型,比如先導藥物篩選、傳送帶異物檢測等。
這個框架的設計理念,是用戶和伙伴、開發(fā)者可以根據(jù)自身需要,調用不同等級的模型進行組合拼裝,既可以直接調用集成模型,也可以基于模型進行精調,還可以獲得由不同開發(fā)者訓練的具體場景模型。這一思路的設計形式,就有了工業(yè)革命中模塊化、零部件化的特征,而具體效果如何,還有待在產業(yè)中檢驗。
整體而言,云廠商在MaaS上最討厭的就是定制化高、復用度低、后續(xù)服務工作量大的需求。這會把原廠有限的資源過度分散,最終回報難以達標。這也就是云計算行業(yè)經常討論的“小作坊式AI開發(fā)”。
在目前階段,云廠是可以在MaaS上只投入,不產出的。但長遠來看,從小作坊到流水線的改變能否實現(xiàn),是決定MaaS生死的背水一戰(zhàn)。
生態(tài)層:明線聚合眾力,暗線開源之爭
我們需要接著說大模型那個問題,定制化成本太高。正因為定制成本高,單一服務商的綜合資源有限,因此云廠商必須把大量工作分包出去。要由合作伙伴來完成咨詢、服務、分銷等工作。否則原廠會被漫長的流程與巨大的服務成本反復折磨。這也就導致,在走向MaaS模式的時候,云計算公司比以往更加需要伙伴生態(tài)的搭建。
另一方面,云廠商在目前不僅需要伙伴,開需要盡量聚攏應用開發(fā)者。AI大模型是個新東西,其能誕生的新應用模式具有很大的想象力。就像iPhone時刻有賴于大量的APP開發(fā)者,大模型這個“新iPhone時刻”也有賴于大量具有突破能力的AI開發(fā)者。為此,互聯(lián)網(wǎng)大廠一方面在自己做應用,另一方面也需要聚攏更多應用開發(fā)者。因為任何應用火了,都會為提供基礎模型與算力的云廠商帶來一系列連鎖效應。
這些因素綜合起來,讓云+大模型之戰(zhàn),在最開始就變成了一場生態(tài)爭奪戰(zhàn)。各個廠商可以說是擺開陣勢,盡一切可能來吸引伙伴和開發(fā)者加入自身的生態(tài)體系。其中,基礎措施是提供開發(fā)者與伙伴所需的技術與能力,進階模式則是推動基于大模型的技能培訓、應用開發(fā)大賽、免費資源、聯(lián)合創(chuàng)業(yè)計劃,在商業(yè)層面賦能伙伴和開發(fā)者。也有云廠商主張與伙伴進行全域協(xié)同,聯(lián)合創(chuàng)新,在細分市場與細分場景中以伙伴為主進行大模型落地。
而在如何吸引開發(fā)者、伙伴的生態(tài)之爭中,隱藏暗線是一個非常具有互聯(lián)網(wǎng)思維特征的命題:能不能干脆把模型開源免費,用極端降低成本的方式來吸納伙伴加入?
這也是最近被熱烈討論的“大模型開源閉源之爭”其來源之一。
支持開源者認為,免費就是最好的生態(tài)聚合策略,且靠免費引流的策略在互聯(lián)網(wǎng)時代屢試不爽。加上AI大模型作為基礎軟件,走向開源恐怕是早晚之事。
而反對者認為,大模型還處在剛剛發(fā)展的階段。廠商需要持續(xù)投入大量研發(fā)成本進行升級,盲目的免費會導致大模型發(fā)展陷入停滯,攪亂科技進步秩序。并且大模型開源不僅能降低伙伴和開發(fā)者的成本,也會導致市場最終定價降低,攤薄伙伴的利潤,最終導致企業(yè)不愿意投入研發(fā)創(chuàng)新。
不管怎么說,大模型開源與閉源的對壘,已經從產業(yè)探討變成了云計算市場的現(xiàn)實。8月3日,阿里云宣布通義千問開源,成為首個宣布大模型開源的中國互聯(lián)網(wǎng)云廠商,并且阿里云打造的AI模型社區(qū)魔搭ModelScope還以開源、免費、可商用作為主要買點,提供國內外的各種開源大模型。
此后,究竟是越來越多的云廠商在鲇魚效應下走向開源,還是依舊會保持高技術與低成本之間的對壘?讓我們拭目以待。
以我個人觀點來看,大模型的發(fā)展?jié)摿€很大,可探索空間眾多。處于發(fā)展中的技術其實并不適合快步走向開源,因此相當部分的大模型保持閉源商業(yè)模式,是一個更大概率事件。
解決方案層:明線首批大客戶,暗線政企上云新窗口
無論說的多么熱鬧,其實企業(yè)直接通過API接口調用大模型,這種MaaS服務模式的利潤并不高。甚至可以說,在目前“百模大戰(zhàn)”的背景下,簡單調用大模型變成了一件頗為廉價的事情。
而持續(xù)投入的云計算行業(yè),顯然不能滿足于這種商業(yè)模式,因此必然要爭取一些客單價高,利潤大的項目。而政企大客戶選用基于大模型的數(shù)字化解決方案,就成為了云計算廠商眼中的新機會窗口。
在眾多類型的政企大客戶中,又有錢,又有數(shù)字化能力,且愿意盡快探索大模型可能性的只有兩類:智慧城市與金融。其他更偏向實體的制造、能源、交通等行業(yè),則相對來說更加謹慎,還處在對大模型的觀望了解之中。
因此,爭奪政務與金融大客戶訂單,就成為了云計算廠商進入大模型賽道后的一個標準動作。比如我們可以看到在2023百度云智大會上,百度智能云發(fā)布了基于大模型的數(shù)字政府解決方案九州。華為云則在強化和推廣金融、智慧城市等領域結合盤古大模型的解決方案。
在可見的未來,云計算廠商除了在模型能力與模型平臺的競爭之外,還將在以城市、金融為代表的重點領域進行爭奪。而回答好這些領域為什么需要大模型,大模型能帶來哪些與以往不同的價值,是云廠商必須回答的第一道考題。
在為大客戶構建解決方案層面,也隱藏著一條暗線。這條線索直接關乎于云計算廠商的焦慮感:大型政企客戶,不那么愿意上云了。
在幾年前,大型政企上云是一種大勢所趨,可謂是能上盡上,多上快上,但在目前階段,政企客戶更加強調數(shù)據(jù)與數(shù)字化系統(tǒng)的安全可控,盲目上云被認為并不可取。尤其是否能把大量關鍵數(shù)據(jù)放互聯(lián)網(wǎng)云平臺上,開始逐漸變成一種疑問。目前階段,國資云、國家云的提法不斷強化,即使上云,大型政企也會優(yōu)先考慮以我為主,多云采購的策略,而這在無形中就分散了云廠商的利潤空間。
在這樣的背景下,云廠商對大模型的一個隱性期待,是能夠讓其成為推動大型政企繼續(xù)上云的技術契機。畢竟在云上獲取大模型,有天然的成本與可操作性優(yōu)勢。
因此,能不能更好展現(xiàn)出大型政企、重點實體行業(yè)部署大模型解決方案的重要性,同時打消政企在數(shù)據(jù)安全、自主可控、持續(xù)服務、品牌信任等領域的疑問,就成為了云廠商鏖戰(zhàn)大模型的另一道必答題。
事實上,云計算與大模型的結合,還有很多賽點可以討論。比如大模型與PaaS的結合;云廠商在辦公、網(wǎng)盤等toB應用結合大模型的情況等。整體而言,算力、MaaS、生態(tài)、大型政企解決方案,構成了云計算廠商能否在大模型之戰(zhàn)中獲得競爭力的四個層面。
無論對于哪家公有云廠商來說,這場競賽的目標都是一致的:讓模型有用,讓成本下降,讓AI成為盈利的起點
大模型最終會變成又一個雞肋,還是新時代的大門?路漫漫其修遠兮,云計算還需要上下求索。