文|科技新知 樟稻
編輯|伊頁(yè)
“大語(yǔ)言模型改變?cè)朴?jì)算游戲規(guī)則”,李彥宏的這則斷言,愈發(fā)成為云計(jì)算行業(yè)的共識(shí)。
可以從兩方面來(lái)解釋這種新變化。一方面,大語(yǔ)言模型在訓(xùn)練和推理過(guò)程中需要大量的計(jì)算資源,即算力。而這些需求催生了云計(jì)算廠(chǎng)商為模型訓(xùn)練提供更強(qiáng)大、更高效的計(jì)算資源。
作為佐證,投資機(jī)構(gòu)A16Z認(rèn)為,生成式AI市場(chǎng)里的大量資金,其實(shí)最終流向了基礎(chǔ)設(shè)施公司。
A16Z估計(jì),應(yīng)用公司平均將約20%-40%的年收入,用于推理和定制化的微調(diào)。這部分通常直接支付給云服務(wù)提供商,以獲取實(shí)例或支付給第三方模型提供商,而后者將大約一半的收入投入于云基礎(chǔ)設(shè)施。據(jù)此有理由推測(cè),生成式AI總營(yíng)收的10%-20%將流向云服務(wù)提供商。
不僅如此,A16Z估算,許多擁有自家模型的初創(chuàng)公司已籌集到數(shù)十億美元的風(fēng)險(xiǎn)投資,其中大部分資金(在早期階段高達(dá)80%-90%),通常會(huì)支付給云服務(wù)提供商。這可是流向云廠(chǎng)商的“一大筆錢(qián)”。
另一方面,大語(yǔ)言模型的興起,讓許多復(fù)雜任務(wù)可以通過(guò)預(yù)訓(xùn)練模型來(lái)解決。企業(yè)無(wú)需擁有龐大的技術(shù)團(tuán)隊(duì)和資源,就能利用云計(jì)算服務(wù)快速實(shí)現(xiàn)AI應(yīng)用。
簡(jiǎn)單來(lái)說(shuō),模型即服務(wù)(Model as a Service,MaaS)將成為新的云計(jì)算服務(wù)形式。企業(yè)可以通過(guò)API調(diào)用預(yù)訓(xùn)練模型來(lái)滿(mǎn)足自身業(yè)務(wù)需求,而這降低了云計(jì)算服務(wù)的使用門(mén)檻。
微軟是最典型的案例。眼下,Azure OpenAI服務(wù)已經(jīng)普遍可用,企業(yè)可以申請(qǐng)?jiān)L問(wèn)包括GPT-3.5、Codex和DALL?E 2在內(nèi)的人工智能模型。目前,已經(jīng)使用Azure OpenAI的客戶(hù)有半導(dǎo)電視臺(tái)、畢馬威、RPA廠(chǎng)商Moveworks等等。
得益于上述新變化,國(guó)內(nèi)云計(jì)算行業(yè)迎來(lái)新的發(fā)展契機(jī)和活力,特別是在如今的低增長(zhǎng)速度背景下,更加鼓舞人心。
此前,市場(chǎng)研究機(jī)構(gòu)IDC在2022年底的預(yù)測(cè)報(bào)告中,將中國(guó)云計(jì)算行業(yè)未來(lái)五年的平均增長(zhǎng)速度下調(diào)了10%。這是考慮到互聯(lián)網(wǎng)行業(yè)整體增速放緩的影響,同時(shí)政企集成業(yè)務(wù)也在調(diào)整過(guò)程中。多方因素共同導(dǎo)致了互聯(lián)網(wǎng)云廠(chǎng)商普遍降低了業(yè)務(wù)預(yù)期。
從這個(gè)角度出發(fā),便能理解為何眾多云服務(wù)廠(chǎng)商,如此熱衷于成為國(guó)內(nèi)大模型熱潮中的舵手。
“賣(mài)鏟子”的火山引擎
前,大模型成為科技領(lǐng)域最熱門(mén)的話(huà)題。在中國(guó),至少有數(shù)十家企業(yè)和機(jī)構(gòu)已經(jīng)發(fā)布了大模型產(chǎn)品或公布了相關(guān)計(jì)劃。作為互聯(lián)網(wǎng)領(lǐng)域的翹楚,字節(jié)跳動(dòng)自然不會(huì)缺席這場(chǎng)AI競(jìng)賽。
據(jù)《晚點(diǎn)LatePost》報(bào)道,面對(duì)ChatGPT和背后的大模型機(jī)會(huì),張一鳴選擇親自跟進(jìn)。一位字節(jié)人士稱(chēng),張一鳴近期時(shí)常會(huì)和一些字節(jié)人士分享論文學(xué)習(xí)心得和對(duì)ChatGPT的思考。
據(jù)了解,字節(jié)今年初才開(kāi)始組建專(zhuān)門(mén)的大模型團(tuán)隊(duì),但一把手的跟進(jìn)也意味著諸多資源傾斜。果不其然,近日,在BAT先后展示自己在大模型產(chǎn)品領(lǐng)域的進(jìn)展后,字節(jié)終于亮出了自己手中“另類(lèi)”的牌。
字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎舉辦的“原動(dòng)力大會(huì)”上,火山引擎總裁譚待表示,火山引擎不做大模型,而是服務(wù)客戶(hù)做好大模型,為企業(yè)和消費(fèi)者提供更豐富的AI應(yīng)用。
進(jìn)一步解讀,眼下國(guó)內(nèi)很多科技公司投入到大模型建設(shè)中,火山引擎要做的就是為大模型客戶(hù)提供高穩(wěn)定性和高性?xún)r(jià)比的AI基礎(chǔ)設(shè)施。
曾經(jīng)的北美淘金熱時(shí)期,尋找黃金的人們需要購(gòu)買(mǎi)鏟子等必備工具,而出售這些商品的商人賺取了可觀(guān)的利潤(rùn)。在現(xiàn)代商業(yè)環(huán)境中,“賣(mài)鏟子”這一說(shuō)法常常用于形容為他人提供工具、服務(wù)或基礎(chǔ)設(shè)施的公司,而非直接參與某個(gè)行業(yè)的競(jìng)爭(zhēng)?;鹕揭娲舜蜗胱龅谋闶窃诖竽P蜔岢敝小百u(mài)鏟子”。
后續(xù)的宣傳環(huán)節(jié)中,有兩個(gè)噱頭十分玩味。一是,火山引擎宣稱(chēng),中國(guó)的大模型領(lǐng)域,七成以上已是其客戶(hù)。面對(duì)媒體群訪(fǎng),譚待解釋道,上述“七成”是火山引擎相關(guān)客戶(hù)與第三方機(jī)構(gòu)統(tǒng)計(jì)的大模型企業(yè)數(shù)量之比,能獲得這么多客戶(hù)是因?yàn)闄C(jī)器學(xué)習(xí)平臺(tái)解決了算力輔助的問(wèn)題。
二是,為了讓更多潛在客戶(hù)安心,譚待在多個(gè)場(chǎng)合公開(kāi)表示,火山引擎不做大模型?!拔覀儾患庇谕瞥鲆粋€(gè)只有30分且只能適用于本地部署的大模型,這不是最關(guān)鍵的,核心是賦能其他人做這件事情?!?/p>
這幾乎是公然叫囂其他大模型參與者,特別是前不久剛剛放言“不用造輪子”的云廠(chǎng)商們。
拿阿里云來(lái)說(shuō),此前的云峰會(huì)上宣傳口徑是,阿里云希望幫助更多企業(yè)用上大模型,讓每家企業(yè)都能基于“通義千問(wèn)”,擁有具備自己行業(yè)能力的專(zhuān)屬大模型。換句話(huà)說(shuō),在阿里巴巴提供的算力基礎(chǔ)設(shè)施、機(jī)器學(xué)習(xí)平臺(tái)以及大模型服務(wù)的支持下,企業(yè)們不再需要浪費(fèi)時(shí)間和精力去“造輪子”,或是陷入針對(duì)大模型通用能力的無(wú)謂競(jìng)爭(zhēng)。
百度也是同道中人。李彥宏認(rèn)為自家三月發(fā)布的文心一言距離GPT的差距大概在兩個(gè)月,并且認(rèn)為國(guó)內(nèi)大模型創(chuàng)業(yè)已經(jīng)基本沒(méi)有機(jī)會(huì),大家也沒(méi)必要在大模型上重復(fù)造輪子。為此,還引發(fā)了王小川的揶揄。
在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿態(tài),顯然是在丟掉時(shí)機(jī)優(yōu)勢(shì)后,寄希望于彎道超車(chē)。畢竟,哪個(gè)創(chuàng)業(yè)者沒(méi)有成為中國(guó)OpenAI的夢(mèng)呢?
字節(jié)云需要更多王小川
賣(mài)鏟子”商業(yè)模式的核心,是鼓吹更多淘金者加入。
歷史上,加州淘金熱期間,當(dāng)?shù)貓?bào)紙發(fā)表了關(guān)于在若干地點(diǎn)發(fā)現(xiàn)金子的文章,迅速引發(fā)了廣泛的關(guān)注。一些商人和企業(yè)便利用淘金熱來(lái)推廣他們的產(chǎn)品和服務(wù)。例如,郵輪公司和鐵路公司為了吸引更多的乘客,大肆宣傳推銷(xiāo)前往淘金地區(qū)的船票和車(chē)票。
放到此次大模型熱潮中,火山引擎想要靠“賣(mài)鏟子”發(fā)家致富,自然需要站在“王小川們”這一邊。
為此,火山引擎造了“多云多模態(tài)”這個(gè)概念。譚待表示,在大模型及下游應(yīng)用發(fā)展推動(dòng)下,無(wú)論傳統(tǒng)企業(yè)還是初創(chuàng)企業(yè),對(duì)AI算力都有迫切需求,企業(yè)使用多家云服務(wù)將成為常態(tài)。同時(shí),各行業(yè)有自己高質(zhì)量的私有語(yǔ)料,大模型不會(huì)一家獨(dú)大,而是會(huì)在千行百業(yè)生長(zhǎng),形成多模型共生甚至協(xié)作的生態(tài)。“未來(lái)將是‘多云多模型’的時(shí)代?!?/p>
對(duì)于該論斷,王慧文(美團(tuán)聯(lián)合創(chuàng)始人)、賈揚(yáng)清(原阿里技術(shù)副總裁)、周伯文(原京東高級(jí)副總裁)、李巖(快手前 MMU 負(fù)責(zé)人)、閆俊杰(原商湯科技副總裁)等創(chuàng)業(yè)者肯定贊同。
不過(guò),這里也還有一些不確定因素。其一,王小川等創(chuàng)業(yè)者一定會(huì)用火山引擎賣(mài)的“鏟子”嗎?
簡(jiǎn)單來(lái)說(shuō),火山引擎主要是為大模型客戶(hù)提供AI基礎(chǔ)設(shè)施,可以理解為AI算力需求。而對(duì)于算力需求,王小川并沒(méi)有直言通過(guò)云廠(chǎng)商來(lái)滿(mǎn)足。
此前在參訪(fǎng)中,王小川認(rèn)為中國(guó)可以購(gòu)買(mǎi)的英偉達(dá)A800和A100芯片性能差距只有5%,目前不會(huì)成為“卡脖子”的瓶頸,尤其對(duì)未來(lái)國(guó)產(chǎn)芯片有一定技術(shù)突破特別有信心。
簡(jiǎn)單來(lái)說(shuō),對(duì)于王小川等創(chuàng)業(yè)者而言,是否“借道”云廠(chǎng)商們猶未可知。
其二,火山引擎是否會(huì)堅(jiān)守不涉及大模型的立場(chǎng)?
據(jù)《晚點(diǎn) LatePost》披露,目前參與字節(jié)大模型的技術(shù)負(fù)責(zé)人有朱文佳、項(xiàng)亮、李航等,他們分屬字節(jié)多個(gè)部門(mén)。其中項(xiàng)亮、李航向火山引擎BU負(fù)責(zé)人楊震原匯報(bào)。
對(duì)于要不要做大模型,楊震源曾回應(yīng)稱(chēng)字節(jié)跳動(dòng)對(duì)大模型也在做一些學(xué)習(xí)和研究,現(xiàn)在還沒(méi)有什么結(jié)果,也沒(méi)有大模型產(chǎn)品落地時(shí)間表。從這里來(lái)看,火山引擎并沒(méi)有宣傳中那樣堅(jiān)定路線(xiàn)。畢竟不做大模型,直接意味著云廠(chǎng)商少了模型及服務(wù)這條營(yíng)收支線(xiàn)。
從這次整個(gè)宣傳動(dòng)作來(lái)看,火山引擎延續(xù)了一直以來(lái)的策略。此前,作為云市場(chǎng)的后來(lái)者,火山引擎的目標(biāo)是做阿里云、騰訊云、華為云之外的“第四朵云”。
對(duì)此,多云成為火山引擎反復(fù)強(qiáng)調(diào)的一個(gè)宣傳點(diǎn)。RightScale在2019年對(duì)全球企業(yè)用云策略的調(diào)查顯示,超過(guò)1000人的大型企業(yè)中,選擇多云部署的占比達(dá)到84%,其中混合云占比達(dá)到58%。這種多云策略,或是字節(jié)跳動(dòng)擴(kuò)大市場(chǎng)份額的轉(zhuǎn)機(jī)。
而這次,火山引擎在多云的基礎(chǔ)上還加上了多模態(tài)。
不過(guò),根據(jù)IDC最近發(fā)布的《中國(guó)公有云服務(wù)市場(chǎng)(2022上半年)跟蹤報(bào)告》顯示,2022年上半年,阿里云、華為云、天翼云、騰訊云和AWS這五大云廠(chǎng)商一直占據(jù)了70%以上的市場(chǎng)份額。火山引擎仍然處于名不見(jiàn)經(jīng)傳的其他廠(chǎng)商(Others)之列。
顯然,在這個(gè)已經(jīng)相對(duì)成熟的云市場(chǎng)中,火山引擎想要突圍并不容易。后發(fā)者想要顛覆格局,天時(shí)地利人和缺一不可,大模型熱潮可以看作機(jī)會(huì)窗口打開(kāi),但結(jié)局到底如何還要取決于字節(jié)團(tuán)隊(duì)的深耕細(xì)作。