文 | 硅星人 郭海惟
編輯 | VickyXiao
扎克伯格同學(xué)最近心情很不錯。
與馬斯克在線激情互噴垃圾話后,對標(biāo)“元宇宙版推特”的Threads僅用了不到五天的時間完成了1個億用戶的積累,成為了全球用戶總數(shù)破億速度最快的新社交平臺。Threads,成為小扎打在馬斯克臉上的一擊力拳。
但商場的拳臺上沒有裁判叫停,扎克伯格說Threads的用戶規(guī)模目標(biāo)是10億。而只有達(dá)到10億目標(biāo)以后,Meta才會認(rèn)真考慮Threads賺錢的問題。這一數(shù)字相當(dāng)于推特目前規(guī)模的兩倍。
扎克是認(rèn)真的。無論是反感馬斯克版推特的憤怒用戶,還是Meta帝國多年沉淀下的龐大商業(yè)機(jī)構(gòu)關(guān)系網(wǎng),都在極短的時間內(nèi)涌入了Threads平臺。而在無數(shù)游牧遷徙的用戶中,夾雜著一個硅谷最有權(quán)勢的光頭——微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)。
納德拉過去是尊貴的推特藍(lán)V,擁有307萬的用戶,每天像AI一樣毫無感情地轉(zhuǎn)推各種微軟的新聞公關(guān)稿。不過這次他專門注冊了一個Threads賬號,熱情洋溢地宣布了微軟將與Meta的“大模型婚姻”:
微軟云Azure將幫Meta訓(xùn)練和推廣Llama大模型,而Llama也將上線Azure庫和適配Windows系統(tǒng)。
而如雙方官宣文件所言,Azure從設(shè)備、硬件和軟件(facility, hardware and software)層面進(jìn)行了針對性的設(shè)計,從而支持世界領(lǐng)先的AI訓(xùn)練。而在本次合作后,Llama的開發(fā)者則可以利用Azure AI的工具進(jìn)行訓(xùn)練、微調(diào)、推理和安全方面的功能開發(fā)。
巨頭之間的云合作屢見不鮮。但全世界都知道,Azure可是OpenAI的御用云平臺。
在2019年微軟掏出10億美元投資OpenAI后,Azure就一直是OpenAI的獨家云服務(wù)商。而Azure為了更好地為大模型提供算力和對外服務(wù),重新進(jìn)行了部分架構(gòu)設(shè)計。甚至在一些觀察者眼中,當(dāng)年微軟拍板投資OpenAI的核心原因,其實就是Azure的發(fā)展——
畢竟彼時Transformer還沒有完全驗證,但微軟已經(jīng)多年下注AI并開始將云業(yè)務(wù)的未來愿景視作是“為AI服務(wù)的超級計算設(shè)施”。無論是算力支持,還是OpenAI開放全球的chatbot測試,Azure都功不可沒。
Altman本人甚至還曾經(jīng)專門發(fā)推對Azure團(tuán)隊的給力支持表示感謝,高度評價微軟是“世界上最好的AI基礎(chǔ)設(shè)施”。
如今Sam前腳剛燒了兩炷香,納德拉轉(zhuǎn)手就把這個“世界上最好的AI基礎(chǔ)設(shè)施”租給了扎克伯格。
不知道倆人是不是提前商量好的。又或許對納德拉來說,這大概都是計劃的一部分??傊瞬癖憩F(xiàn)得很高興。
在扎克伯格的Instagram賬號里,他貼出了一張與納德拉的親密合影以“感謝納德拉”,扎克伯格表示:
“(Meta)將Llama2開源給了微軟,而(這次開源)將成為下一代大模型建設(shè)工作的基礎(chǔ)。”
微軟與Meta的確是相互需要的。
Meta正在走向大模型的“深水區(qū)”,在70B參數(shù)的Llama2已經(jīng)達(dá)到了GPT3.0的水平,幾乎已經(jīng)成為了目前口碑最好的大模型底座。對于閉源大模型陣營來說,Llama2成功帶來的壓力一點不亞于Threads對于Twitter的震懾。
閉源公司花幾千萬搞不出來的東西,開源社區(qū)可以直接用,相當(dāng)于將未來全球開源大模型社區(qū)的起跑線提升到了3.0的水平。
最近登頂HuggingFace開源大模型榜單的Stability的Freewilly大模型,被認(rèn)為接近3.5的水平,正是基于Llama2.0調(diào)教優(yōu)化后的產(chǎn)品。
對于Meta來說,參數(shù)規(guī)模的提升帶來計算量的攀升、模型的逐步成熟也讓看到更好的商用潛質(zhì)。但如果要戰(zhàn)勝這些困難、落實這些潛力,扎克伯格需要一個更高效的合作伙伴。而那些Azure已經(jīng)有的、但Meta沒有的東西,對于Llama來說就顯得更重要了,比如Azure的算力經(jīng)驗、Azure的AI工具箱、以及Azure的云本身……
Meta是為數(shù)不多沒有公有云服務(wù)的互聯(lián)網(wǎng)巨頭。
在過去,Meta與亞馬遜都互為對方的超級大客戶,包括Meta的一些AI研發(fā)算力,也都是采購的AWS。而微軟這次撬墻角的方案,除了開放Windows場景以外,還開放了Azure的企業(yè)渠道能力,將Llama2加入到自己的產(chǎn)品名錄中。
Azure雖然在整體市場份額中依然落后AWS,但是在SaaS銷售領(lǐng)域卻顯著領(lǐng)先于同類競爭對手。而隨著云與SaaS的融合,微軟在渠道層面有顯著的差異化優(yōu)勢。通過Azure,Meta和它的生態(tài)追隨者們可以直接通過云端來銷售和使用Llama2的產(chǎn)品。
對于微軟來說,大模型的挑戰(zhàn)則更加多元的。
微軟過去在大模型應(yīng)用層面幾乎是all in OpenAI的產(chǎn)品。無論是最早接入的Bing,還是基于Windows生態(tài)的Copilot\面向開發(fā)者的工具生態(tài)AI Studio、甚至是新的AI云服務(wù)品牌OpenAI Azure,背后都是OpenAI的影子。
OpenAI是全球最好的大模型公司,Windows依然是全球最重要的生產(chǎn)力軟件生態(tài)。但在大模型全球軍備競賽中,這兩者的結(jié)合并不意味著絕對的勝券在握。
與Meta和微軟結(jié)合幾乎同時“官宣”的,則是蘋果的大模型計劃。
據(jù)海外媒體報道,蘋果已經(jīng)完成了名為“Ajax”的大預(yù)言模型基礎(chǔ)框架,將開發(fā)類似ChatGPT的對話式AI。而消費級產(chǎn)品的推出時間則計劃在明年發(fā)布。
蘋果的入場被認(rèn)為是硅谷大模型競賽中的重要變量。
相比于公有云之類的互聯(lián)網(wǎng)風(fēng)口,AI是被蘋果管理層高度認(rèn)可的科技方向,近期管理層口風(fēng)也有朝著AI加碼的趨勢。
除了長期關(guān)注AI科技外,蘋果是全球最有錢、最有場景的公司。蘋果每年凈利潤接近1000億美元、經(jīng)營凈現(xiàn)金流超過1200億美元,相當(dāng)于微軟與Meta的總和。蘋果生態(tài)已經(jīng)超過微軟成為全球最大的封閉操作系統(tǒng),活躍設(shè)備數(shù)量超過20億,而微軟只有15億。
而相比于賬面實力外,蘋果更具想象力的是它的半導(dǎo)體能力。它或許是全球參與大模型競賽的科技企業(yè)中,為數(shù)不多將來可以不用外采GPU與CPU的廠商。不僅如此,蘋果的芯片效率似乎更有想象力。
在2023年WWDC上,蘋果推出的M2 Ultra芯片。相比于普通廠商CPU、GPU分離的部署方式,M2 Ultra統(tǒng)一內(nèi)存架構(gòu)以及隨之帶來的超高內(nèi)存帶寬,甚至可以讓開發(fā)者在一張卡上就能跑大模型。
盡管類似的消費級芯片還無法和英偉達(dá)的專業(yè)芯片相媲美,但類似小秀肌肉,也讓外界對蘋果未來的GPU算力延展能力產(chǎn)生了興趣。
以O(shè)penAI為例,外界預(yù)估其大概同時動用了兩萬張顯卡進(jìn)行計算。但王小川近期對媒體表示,OpenAI正在測試1000萬張顯卡同時計算的模型,相當(dāng)于英偉達(dá)目前10年的產(chǎn)能,“完全是登月計劃(級別)”。
除了蘋果以外,微軟、谷歌、Meta、亞馬遜等巨頭都有自研AI芯片的計劃,但已經(jīng)有頂尖半導(dǎo)體開發(fā)能力的蘋果依然是最有資格“大力出奇跡”的人。
谷歌兇猛、蘋果虎視眈眈,微軟和Meta選擇結(jié)盟。
對于納德拉來說,與Meta隊形站位可以讓微軟在大模型的生態(tài)戰(zhàn)爭中更加穩(wěn)固。
首先,微軟依然需要開源,開源在未來的大模型競爭中將持續(xù)扮演重要的角色。
開源天然具有人才參與眾多、迭代速度快、垂類覆蓋效率更高的生態(tài)能力。雖然OpenAI拿下頭籌,但開源社區(qū)的進(jìn)步速度依然很可觀。比如Llama只用了大半年的時間、使用參數(shù)70B,已經(jīng)趕上了175B、耗時2年的GPT3。
尤其是如果未來開源路線成為了行業(yè)解決方案的主流,Llama與Azure深度結(jié)合,或許真的可以幫助微軟云業(yè)務(wù)完成對AWS的彎道超車(2022年底Azure市占率23%、AWS為32%)。畢竟相比于Windows和Office,Azure才是微軟最賺錢、最有潛力的業(yè)務(wù)。
其次,開源大模型的不斷發(fā)展,必然讓愿意砸錢做封閉系統(tǒng)的廠家也自然會越來越少。
比如Bard在Llama2之后就受到了不小的壓力。除了許多好事者在晚上討論bard未來長期發(fā)展的壓力外,有媒體報道稱谷歌內(nèi)部人士也曾撰文稱bard在對抗開源社區(qū)時優(yōu)點吃力,后者進(jìn)步神速且成本更少、場景更豐富。
在大模型超級投入的產(chǎn)業(yè)結(jié)構(gòu)沒有變化的情況下,封閉式大模型依然會有其存在的合理性,但可能將僅僅限于極少數(shù)領(lǐng)先者,而其中大概率會有OpenAI。
如果OpenAI有護(hù)城河,那它的名字可能叫Llama2。
當(dāng)然,OpenAI其實也并不是微軟的“親兒子”。
在100億美元投資后,微軟雖然擁有75%的分紅權(quán),但實際上也只占有OpenAI 49%的股權(quán)。換言之,微軟雖然手握大量的OpenAI資源,但并不完全擁有OpenAI絕對的控制權(quán)。
但與llama合作像是一個標(biāo)志,手握OpenAI的微軟其實正在成為游戲規(guī)則的制定者:
它既有最具潛力的AI基礎(chǔ)設(shè)施Azure,也有最前沿的商業(yè)化變現(xiàn)接口Windows copilot。而當(dāng)最核心的基礎(chǔ)設(shè)施和渠道能力在微軟手上時,OpenAI也只是微軟的“超級程序員”。
當(dāng)Meta等平臺成熟后,微軟可以再引入更多的“程序員”,甚至開放更多的系統(tǒng)級場景給開源生態(tài)、從而讓W(xué)indows系統(tǒng)的生產(chǎn)力進(jìn)一步提升。
實際上,OpenAI原本就只是納德拉重注AI和語言大模型的一個選項。
在ChatGPT之前,微軟甚至和英偉達(dá)合作開發(fā)過5300億參數(shù)的大語言模型威震天-圖靈Megatron-Turing,是當(dāng)年最大的基于transformer的模型,參數(shù)比GPT3多了好幾倍,講究的是絕對的大力出奇跡。
可最后威震天還是輸給了奧特曼,于是威震天才選擇了買下奧特曼。
但微軟內(nèi)部其實一直沒有放棄大模型的相關(guān)技術(shù)路線開發(fā)。
例如6月時,微軟就發(fā)布了13億參數(shù)的“小型”大語言模型 phi-1。有OpenAI作為核心資產(chǎn),微軟不走“大力奇跡”模式,而是改用號稱“教科書等級”的高品質(zhì)資料集訓(xùn)練模型,讓實際效果勝于千億參數(shù)的 GPT 3.5。7月時,微軟還提出了新的大模型架構(gòu)RetNet,稱其可以在更大數(shù)據(jù)維度基礎(chǔ)上,比transformer更優(yōu)。
大模型的戰(zhàn)事還遠(yuǎn)沒到中場,威震天與奧特曼們的游戲或許才剛剛開始。
來源:硅星人
原標(biāo)題:微軟不想被OpenAI架空