文|腦極體
今年以來,大模型的熱度,讓云計算產(chǎn)業(yè)為之沸騰。要舉出一個最有力的證明,應(yīng)該是:MaaS(Model as Service)這種全新模式的出現(xiàn),一座座“模型工廠”,已經(jīng)建起來了。
所謂MaaS,模型即服務(wù),指的是用戶可以直接通過API調(diào)用基礎(chǔ)大模型,為不同的業(yè)務(wù)場景,來構(gòu)建、訓(xùn)練和部署專屬模型。云平臺會提供從數(shù)據(jù)、模型到應(yīng)用服務(wù)的全周期管理和工具。
目前,微軟云Azure、阿里云、華為云、騰訊云、百度云、京東云等云計算大廠,都已經(jīng)推出了MaaS服務(wù)。
云廠商做MaaS究竟是為什么?一個主要考量是,作為IT基礎(chǔ)設(shè)施服務(wù)商,也就是IaaS模式,長期面臨價格戰(zhàn)的市場競爭,而通過PaaS和SaaS為政企提供ToB的數(shù)字化服務(wù),又一直沒有完成行之有效的價值回收。
這種情況下,云廠商急需要找到一種全新的、高價值的商業(yè)模式,大模型就帶來了這個可能。
可是,方興未艾的MaaS,真的能幫云廠商“翻身”嗎?
必然到來的MaaS
先要聲明一下,MaaS模式的出現(xiàn),以及大量“模型工廠”的矗立,是非常有必要,也是有極大商業(yè)想象空間的。
你可能會問了,連OpenAI的模型訪問量都在下降,真的有那么多大模型的訓(xùn)練需求,要用到如此多的“模型工廠”和MaaS服務(wù)嗎?
我們的判斷是,大模型的產(chǎn)業(yè)化之路才剛剛開始,而產(chǎn)業(yè)化會催生大量細分的、不同參數(shù)、不同規(guī)格、不同場景的模型需求,必須提升模型訓(xùn)練部署的效率,推動模型生產(chǎn)走向工業(yè)化。不同模型是各式各樣的鋼材,用來蓋起一個個AI應(yīng)用,那么“模型工廠”就是“煉鋼廠”,是一定要建的。
MaaS模式的必然性,有三個支點:
第一,需求。通用性的基礎(chǔ)大模型,已經(jīng)被快速填滿了。剩下很多企業(yè),更希望調(diào)用基礎(chǔ)模型的能力來改造自己的業(yè)務(wù),或者開發(fā)新的AI應(yīng)用,而這些都需要更懂行業(yè)知識、技能更精準(zhǔn)、更貼合場景的垂直模型。有數(shù)據(jù)顯示,行業(yè)智能化滲透率將從2021年的7%增長到2026年的30%,更多行業(yè)的核心業(yè)務(wù)系統(tǒng)會被大模型能力滲透。所以,對于大模型的生產(chǎn)需求,還很旺盛。
第二,供給。目前,大模型的生產(chǎn)力依然有限,首先是計算資源稀缺,大模型的訓(xùn)練和推理對計算資源和存儲資源有很高的需求,很多企業(yè)和機構(gòu)“無卡可用”,導(dǎo)致無法進行大模型的訓(xùn)練和推理。
同時,訓(xùn)練專有大模型需要大量的高質(zhì)量數(shù)據(jù),數(shù)據(jù)清洗、預(yù)處理等一系列復(fù)雜工程,大大影響了開發(fā)效率,訓(xùn)練周期長,無法快速滿足業(yè)務(wù)上線的要求。
此外,訓(xùn)好的大模型要進行部署和應(yīng)用,需要考慮到計算資源、業(yè)務(wù)場景、不同參數(shù)規(guī)格、網(wǎng)絡(luò)帶寬、安全合規(guī)等方方面面的問題,很多企業(yè)和機構(gòu)缺乏相關(guān)的技術(shù)和經(jīng)驗,前期投入的心血很容易就打了水漂。
要提高大模型的供給數(shù)量和質(zhì)量,MaaS模式的“模型工廠”一定要建。
第三,催化劑。云廠商有充足的動力,催化MaaS模式的成熟,并推向市場。IaaS基礎(chǔ)設(shè)施即服務(wù),造就了公有云的崛起,但IaaS模式的前期基礎(chǔ)設(shè)施投入大,營收能力低下,積弊已久。PaaS需要云廠商投入大量的人力、回報周期長,SaaS的價值不足,客單價低,還需要大量定制化和運維服務(wù)。這時候,通過MaaS這一新模式,向用戶全面輸送模型能力,是一種高價值、強確定性的選擇。
一方面,大模型龐大的數(shù)據(jù)規(guī)模,會帶來更多的計算資源需求和用云量。另外,行業(yè)企業(yè)用戶的定制化需求,可以按項目制付費。大量AI應(yīng)用程序調(diào)用API,已經(jīng)產(chǎn)生了按token付費、訂閱付費、商業(yè)版等多種商業(yè)模式。
如此多的商業(yè)化前景,就如同一針針強心劑,促使云廠商們加速布局MaaS。
讓我們回歸到現(xiàn)實,來看一看國產(chǎn)云廠商,是如何做MaaS這門生意的。
“前店后廠”的國產(chǎn)MaaS
今天的整體形式是,國產(chǎn)云廠商的MaaS基本都走向了“前店后廠”模式。
怎么理解呢?
云廠商扮演“廠”的角色,是利用基礎(chǔ)設(shè)施、行業(yè)服務(wù)能力等優(yōu)勢,和全流程開發(fā)工具與套件,滿足客戶對模型預(yù)訓(xùn)練、模型精調(diào)、模型部署、智能應(yīng)用開發(fā)等多樣化需求,保障客戶的大模型能夠順利交付。
以微軟云的Azure OpenAI 服務(wù)為例,就支持開發(fā)者調(diào)用OpenAI GPT-4、GPT-3、Codex 和 DALL-E等模型的API,來構(gòu)建、微調(diào)模型,為應(yīng)用提供支持。這就是“工廠”模式,Azure主要提供一些企業(yè)級功能,如安全性、合規(guī)性和區(qū)域可用性等。
而縱觀國內(nèi)云廠商,會同時強調(diào)自己“店”的能力。
云廠商扮演“店”的角色,即還會自己參與開發(fā)行業(yè)大模型及AI原生應(yīng)用,把控模型和應(yīng)用的質(zhì)量,提供精選服務(wù),進行市場推廣和銷售。
比如今年6月份,騰訊云在行業(yè)大模型及智能應(yīng)用技術(shù)峰會上推出的MaaS一站式服務(wù),就是依托騰訊云TI平臺打造行業(yè)大模型精選商店,其中包含了騰訊企點、騰訊會議、騰訊云AI代碼助手等多款頭部SaaS產(chǎn)品。
9月華為全聯(lián)接大會2023,華為云的MaaS服務(wù),則采用了5個基礎(chǔ)大模型+N個行業(yè)大模型+X個場景模型的三層解耦架構(gòu),從L0層的基礎(chǔ)模型,到適配行業(yè)特征的L1層,以及開箱即用的AI應(yīng)用L2層,并上線了昇騰AI云服務(wù)百模千態(tài)專區(qū)。
而10月剛剛舉辦的百度世界2023,百度智能云的MaaS服務(wù)平臺千帆,則推出了千帆AI原生應(yīng)用商店,成為大模型商業(yè)機會的匯集地,為商家提供品牌曝光、流量支持和銷售資源等支持。首批精選應(yīng)用包含了百度內(nèi)部的曦靈數(shù)字人平臺、百度智能云一念智能創(chuàng)作平臺等。
可以看到,智能時代,垂直模型和AI應(yīng)用一定會百花齊放,一定離不開模型工廠。但整個階段才剛剛走出了第一步,目前上游的底座模型并不少,能力也都不差,但如何做出有說服力的垂直模型和應(yīng)用,難度還是很高的。
和數(shù)字化及SaaS市場較為成熟的歐美市場不同,這一輪國內(nèi)智能化的主力軍是傳統(tǒng)行業(yè)及企業(yè)。很多模型和應(yīng)用的潛在購買者,對大模型的能力并不清楚,不知道什么模型適合自己的業(yè)務(wù),也不知道如何找到需要的模型,更擔(dān)心自己的定制模型單子太小不被重視……
而ISV服務(wù)商和開發(fā)者,擔(dān)心投入時間精力一整套流程走下來,產(chǎn)品已經(jīng)落后了,或者找不到客戶進行商業(yè)變現(xiàn)。
這種情況下,云廠商僅僅做幕后“工廠”是遠遠不夠的,需要建立一套更完善的模型供應(yīng)鏈機制?!扒暗旰髲S”就成了國產(chǎn)MaaS的主流選擇,“工廠”負(fù)責(zé)生產(chǎn),“商店”負(fù)責(zé)推介。
而“前店后廠”模式,則大大增加了MaaS的難度。
突出重圍的持久戰(zhàn)
“前店后廠”模式下,云廠商既是生產(chǎn)者,也是銷售員;既是ToB服務(wù)生,也是ToC開發(fā)者。多重身份,不僅讓MaaS的競爭要素和難度增多,而且也帶來了云廠商與行業(yè)伙伴、客戶、開發(fā)者的種種沖突。具體來說有以下幾點:
想賺錢,只靠基礎(chǔ)模型還不夠。
只卷基礎(chǔ)模型,像Azure OpenAI 服務(wù)那樣,以O(shè)penAI GPT-4、GPT-3、Codex 和 DALL-E幾個精品為主,是不足以滿足企業(yè)用戶、行業(yè)伙伴和開發(fā)者的需求的。對于國產(chǎn)MaaS服務(wù)商來說,還需要在重點領(lǐng)域,比如金融、教育、政務(wù)、工業(yè)等高要求、高頻次的行業(yè)類別上,也做出成熟的垂直大模型,來滿足大模型落地行業(yè)的需求。
比如騰訊云的行業(yè)大模型精選商店,既提供混元大模型的調(diào)用服務(wù),還上架了金融、文旅、零售等20多個領(lǐng)域的行業(yè)大模型。華為云、百度云等也不例外,都在“通識教育”的基礎(chǔ)上,對大模型進行“專業(yè)課教學(xué)”,減少大模型走向行業(yè)的門檻。
這就形成了第一個矛盾,云廠商打造行業(yè)大模型,需要有大量人才、時間、資源與行業(yè)合作,每個重點行業(yè)來一遍,投入不菲,周期不短,增加了MaaS的盈利難度。但是,如果云廠商不打造行業(yè)大模型,從基礎(chǔ)模型到AI應(yīng)用之間的縫隙實在太大,ISV服務(wù)商、集成商和開發(fā)者不敢走、不會走,大量需求根本無法滿足,也會限制MaaS的增長。
第二個矛盾,是算力的充沛與成本。
大模型訓(xùn)練,算力是基礎(chǔ)。各個MaaS都將自身的算力集群規(guī)模和性能,作為首要賣點之一。
我們要意識到,算力充沛對云廠商來說,意味著極高的計算資源成本、能耗、運維成本等。大模型訓(xùn)練,需要動輒千卡、萬卡的GPU集群,如果一臺GPU服務(wù)器過熱宕機,整個集群都要停下來,訓(xùn)練任務(wù)要重啟,這對云服務(wù)商的硬件性能、運維能力等要求非常高,往往只有幾大頭部云廠商能支持。
為了提升推理效率、降低成本,云廠商們也在技術(shù)層面展開競速。比如為了實現(xiàn)AI算力的極致性能,華為云在基礎(chǔ)設(shè)施之上進行了針對AI云服務(wù)的技術(shù)優(yōu)化;騰訊云打造了面向模型訓(xùn)練的新一代HCC高性能計算集群;百度一直通過各種技術(shù)優(yōu)化推理成本,文心3.5版本推理成本較5月剛發(fā)布時,下降到原來的幾十分之一。一味堆卡不是長久之計,降本增效才是賽點。
除此之外,基礎(chǔ)設(shè)施層面,云廠商還面臨AI算力國產(chǎn)化、綠色低碳等現(xiàn)實考驗。其中,擁有自研芯片的華為云昇騰AI、昆侖芯片的百度智能云,能提供更穩(wěn)定的底層算力,后續(xù)應(yīng)該會有更多機會。而巨大的計算資源,需要用戶規(guī)模和使用量級來支撐,隨著幾大基礎(chǔ)模型的優(yōu)勝劣汰,屆時,誰的成本更高、模型使用量更低,就有可能出現(xiàn)資源閑置,屆時該如何回收成本,也是一個考驗云廠商智慧的問題。
第三個矛盾,則是MaaS的教具與教學(xué)。
作為“模型工廠”,MaaS平臺需要提供大模型的全套全流程開發(fā)工具與套件,已經(jīng)成為行業(yè)共識了。
目前,頭部云平臺的準(zhǔn)備也非常充分。華為云提供了盤古大模型工程化套件,覆蓋了數(shù)據(jù)工程、模型開發(fā)和應(yīng)用開發(fā)三大環(huán)節(jié)。據(jù)稱,完成一個千億行業(yè)模型端到端的開發(fā),從過去需要5個月縮短到現(xiàn)在1個月,整體速度提升5倍。百度智能云的千帆平臺,提供預(yù)制數(shù)據(jù)集、應(yīng)用范式,以及其他幫助企業(yè)應(yīng)用大模型的工具。騰訊云的TI平臺,同樣包括數(shù)據(jù)標(biāo)注、訓(xùn)練、評估、測試和部署等全套工具。
如此豐富的工具和平臺,相當(dāng)于把“教具”交到了行業(yè)客戶和伙伴手中,是不是就能實現(xiàn)大模型的工業(yè)化生產(chǎn)了呢?
顯然還不行。要訓(xùn)練好一個垂直大模型,并不是一件簡單的事,有些行業(yè)企業(yè)的數(shù)字化程度高、人才隊伍強,能第一時間用好MaaS平臺和工具,比如金蝶、中軟國際等。
但是,更多行業(yè)伙伴和企業(yè)客戶,就算有了這些工具和套件,沒有技術(shù)專家深入指導(dǎo),沒有產(chǎn)品經(jīng)理、項目經(jīng)理、運營、程序員等手把手教學(xué),很難搞定定制化需求。
騰訊云的工作人員曾分享過一個案例,在攜手中央電視臺打造“央視人工智能開放平臺”時,面臨數(shù)據(jù)量龐大、形態(tài)復(fù)雜的問題,導(dǎo)致傳統(tǒng)的數(shù)據(jù)標(biāo)簽體系都無法達標(biāo)。最后,騰訊云重新構(gòu)建了一套傳媒專屬的數(shù)據(jù)標(biāo)簽體系,同時也研發(fā)了創(chuàng)新的“標(biāo)簽權(quán)重引擎”,讓數(shù)據(jù)標(biāo)簽顆粒度更細,并按照核心度排序。在這套數(shù)據(jù)標(biāo)簽體系支撐下,視頻編輯用自然語言就能實現(xiàn)跨模態(tài)檢索。
顯然,MaaS模式也需要云廠商具備ToB服務(wù)能力,這是一個慢活、苦活、累活。指望靠MaaS工具“躺著賺錢”,至少目前階段,是肯定沒希望的。
“前店后廠”的MaaS模式,還有一個隱含的矛盾,就是云廠商也做應(yīng)用,如何避免與行業(yè)伙伴和開發(fā)者爭利的情況。
MaaS平臺上需要大量AI應(yīng)用程序,云廠商不可能全部自己開發(fā),必須像Appstore一樣,引入開發(fā)者機制,鼓勵軟件企業(yè)或個人開發(fā)者,來一同基于云平臺創(chuàng)造AI應(yīng)用程序。
但是,基于通用大模型能做出什么樣的AI應(yīng)用,還有很大的空白,所以云廠商也會自己“打樣”,上架一些AI應(yīng)用。
比如百度智能云的千帆AI原生應(yīng)用商店,就上線了百度曦靈數(shù)字人直播平臺、comate代碼助手這類百度自己出品的應(yīng)用,也有來自合作伙伴WPS365、梧桐招聘助手等應(yīng)用,并上線了應(yīng)用精選推薦。
Appstore曾被Spotify等應(yīng)用開發(fā)者質(zhì)疑,既當(dāng)裁判員,又當(dāng)運動員。那么,“前店后廠”模式下的MaaS平臺,也在做AI應(yīng)用,就必須打消開發(fā)者的顧慮,只做“拋磚引玉”式的創(chuàng)意型/代表性的應(yīng)用,做好業(yè)務(wù)區(qū)隔,聯(lián)合售賣,幫助開發(fā)者打通商業(yè)鏈路,獲得經(jīng)濟收益。
和移動互聯(lián)網(wǎng)時代開發(fā)ios或Android一樣,開發(fā)生態(tài)的繁榮,意味著內(nèi)容和體驗足夠豐富,滿足用戶的訴求,用戶規(guī)模又會吸引更多開發(fā)者前來掘金,形成“馬太效應(yīng)”,讓應(yīng)用商店持續(xù)繁榮,用戶和開發(fā)者都很難輕易切換到其他平臺。
基于大模型的AI原生應(yīng)用,也是如此。據(jù)百度智能云的工作人員透露,百度智能云為什么成為業(yè)內(nèi)第一個發(fā)布AI應(yīng)用商店,就是因為大家都有從眾的習(xí)慣,目前能做的,就是快,客戶的留存率也會更高一些。
MaaS模式,云廠商比以往更加需要生態(tài)伙伴。百度智能云的千帆AI原生應(yīng)用商店、騰訊云行業(yè)大模型生態(tài)計劃、華為云多樣化的伙伴賦能,都說明,不卷應(yīng)用卷生態(tài),盡量聚攏開發(fā)者,是MaaS成功的前提。
可以看到,圍繞MaaS模式的競爭,前程遠大,但道阻且長。一旦卷起來,各項成本都會直線上升,形成新的營收壓力。而如果不卷,就會眼睜睜錯過大模型及AI原生應(yīng)用的機會,徹底沒了從基礎(chǔ)設(shè)施服務(wù)商“翻身”的希望。
MaaS之于云廠商,并不是一個進退兩難的選擇困境,而是沒有后路的背水一戰(zhàn)。關(guān)關(guān)難過關(guān)關(guān)過,終有守得云開見月明的一天。