文|阿爾法工場
下周,馬斯克躊躇已久的Grok就要上線了。
在OpenAI接連甩出炸街新聞的這段時間,這事似乎沒掀起太大波瀾。
然而,越低調(diào)的狙擊,往往傷害越高。
具體來說,Grok的這次年末突襲,隱藏了老馬背刺OpenAI的一件“秘術(shù)”。
所謂的“秘術(shù)”,其實也很簡單,就是X平臺上不斷涌現(xiàn)的,真實的人類數(shù)據(jù)。
在大模型數(shù)據(jù)愈發(fā)吃緊的今天,連OpenAI自己,也開始直接拿用戶數(shù)據(jù)訓(xùn)練了。
在此情況下,掌握了X這樣一個源源不斷的“數(shù)據(jù)噴泉”,無疑就有了一張將來翻盤的“底牌”。
但話雖如此,但Grok畢竟是一個社交平臺,上面的大部分信息,都是未經(jīng)核驗,且質(zhì)量參差不齊的,直接拿來訓(xùn)練大模型,不怕幻覺迭出嗎?
了解大模型的老馬,一定知道這點(diǎn)。
但即便如此,Grok的上線,對特斯拉,對老馬也仍是利大于弊。
因為倘若不走這一步棋,將來的AI賽道上,馬斯克最多只能做割據(jù)一方的“數(shù)據(jù)封建主”,并且終將面臨“護(hù)城河”被攻破的命運(yùn)。
這樣的未來,很可能也是日后眾多國內(nèi)企業(yè)的命運(yùn)。
01 數(shù)據(jù)封建主
何謂“數(shù)據(jù)封建主”?
簡單來說,就是以獨(dú)有數(shù)據(jù)為壘,在某些垂直的行業(yè)、領(lǐng)域內(nèi)“圈地為王”的大小企業(yè)。
這樣的概念,最初由希臘前財政部長雅尼斯·瓦魯法克斯提出,是其在歐洲各國在美國科技企業(yè)壓榨、盤剝之下發(fā)出的感慨。
而自從11月初的OpenAI開發(fā)者大會后,這種爭當(dāng)“數(shù)據(jù)封建主”的聲音,就開始在業(yè)內(nèi)不絕于耳。
畢竟,在應(yīng)用層的路被GPTs堵死的情況下,獨(dú)有數(shù)據(jù)就成了很多企業(yè)唯一的優(yōu)勢。
那么,老馬推出Grok,是想以X平臺的數(shù)據(jù)為基礎(chǔ),成為新一代的“數(shù)據(jù)封建主”嗎?
答案是否定的。因為在未來,這類“數(shù)據(jù)封建主”的命運(yùn),就是其壁壘會隨著技術(shù)發(fā)展不斷被削弱,以至于被更強(qiáng)的通用模型步步蠶食。
在這方面,老馬的Grok,已經(jīng)展示出了兩種攻破這類“護(hù)城河”的方式。
其中一種,就是通過將模型置于“數(shù)據(jù)樞紐”的位置,使模型的觸手伸向原來鞭長莫及的行業(yè)、領(lǐng)域。
很多人都知道,美國并沒有中國的微信這樣集社交、支付、娛樂、資訊于一身的綜合平臺。這并不是因為美國人能力不行,而是美國的各大金融機(jī)構(gòu),與科技巨頭之間是一種互為競爭的關(guān)系。
馬斯克對于X的收購,不僅在某種程度上結(jié)束了這樣的“割據(jù)”,也為其打造成一個類似微信的超級APP提供了基礎(chǔ)。
倘若X平臺真的能成為一個以音頻、視頻、消息、支付/銀行為中心,同時鏈接商品、服務(wù)和機(jī)會的全球市場。那么到了那時,Grok就會成為這個數(shù)據(jù)樞紐的中心,從而獲得來自不同行業(yè)、地區(qū)或模態(tài)的海量數(shù)據(jù)。
如此一來,Grok的定位就不再是一個局限于社交平臺的整蠱大模型,而是成為了連接各領(lǐng)域的綜合性交互入口。
隨著時間的推移,這種綜合性入口+大模型的協(xié)同效應(yīng),將會使那些不用Grok,或不上X的用戶,與經(jīng)常使用的用戶之間差距越來越大。
這種情況下,各個垂類行業(yè)的數(shù)據(jù)壁壘盡管依然存在,但若脫離了Grok,卻很難被用戶接受。
于是,這些被拿捏的“數(shù)據(jù)封建主”們?yōu)榱饲蟠妫坏孟騁rok效忠。
02 協(xié)同效應(yīng)
除了以占據(jù)數(shù)據(jù)樞紐的方式,對各個“數(shù)字封地”進(jìn)行蠶食外,Grok這類大模型攻破數(shù)據(jù)護(hù)城河的另一大方式,就是端云協(xié)同的形態(tài),編織一張巨大的包圍網(wǎng)。
具體來說,在將來的端側(cè)大模型這條賽道上,由特斯拉提供算力(Dojo),X和特斯拉提供訓(xùn)練數(shù)據(jù),xAI進(jìn)行模型研發(fā),最終將產(chǎn)出模型反哺給X平臺和特斯拉的產(chǎn)品(汽車、人形機(jī)器人),將構(gòu)成極為堅固的三角陣營。
那么,在大模型逐漸走向端側(cè)的未來,這樣的三角陣營,將怎樣攻破一個個“數(shù)據(jù)護(hù)城河”?
在這里,我們可以用一個電商行業(yè)的例子進(jìn)行推演。
假設(shè),有一個企業(yè),基于某個局部的電商賽道,用行業(yè)獨(dú)有數(shù)據(jù)訓(xùn)練出了個專有大模型,而馬斯克的Grok打算入侵這個領(lǐng)域,那么在數(shù)據(jù)收集階段,其很有可能會采取一種“領(lǐng)域交叉”的戰(zhàn)術(shù)。
具體來說,特斯拉汽車在行駛過程中收集到的交通、地理和用戶行為數(shù)據(jù);機(jī)器人在家庭、工廠等場景中收集到的環(huán)境和操作數(shù)據(jù);以及X平臺上的社交信息,都為馬斯克的團(tuán)隊提供了豐富的信息來源。
當(dāng)馬斯克的團(tuán)隊將這些數(shù)據(jù)整合在一起時,他們就可能會發(fā)現(xiàn)一些新的模式和關(guān)聯(lián),從而在某種程度上削弱這個專有大模型的獨(dú)特優(yōu)勢。
這種戰(zhàn)術(shù)的核心理念就在于:這個世界上沒有任何一個行業(yè)、領(lǐng)域,是完全孤立存在的。
除了外圍攻勢外,這樣的三角陣營,還能通過“合縱連橫”的方式,瓦解掉一個個孤立的“數(shù)據(jù)護(hù)城河”。
簡單來說,面對大模型逐漸端側(cè)化的趨勢,馬斯克的三角陣營提供了一種端到端的解決方案。
其涵蓋了從不同來源進(jìn)行數(shù)據(jù)采集、處理、訓(xùn)練到部署的整個流程。這意味著企業(yè)無需在各個環(huán)節(jié)尋找不同的技術(shù)和服務(wù)提供商,從而降低了實施難度和成本。
簡化的流程有助于企業(yè)更快地應(yīng)用AI技術(shù),提高數(shù)據(jù)處理和分析能力。
在此情況下,就可能會有相當(dāng)一部分企業(yè),決定犧牲數(shù)據(jù)的獨(dú)有性,加入三角陣營的生態(tài),從而換來更高的AI部署效率。
這種邏輯,本質(zhì)上就和移動互聯(lián)網(wǎng)時代,很多商家即使忍受高抽成,也要入駐平臺,換取更低的獲客成本一樣。
在這樣圍困之下,一座座孤立的“數(shù)據(jù)城堡”,終將難以抵擋日漸壯大的Grok。
03 通向AGI之路
面對Grok潛在的,咄咄逼人的攻勢,各個想以數(shù)據(jù)為壘的AI企業(yè),將何去何從?
在回答這個問題之前,有一個更重要的問題,那就是:
這種對“數(shù)據(jù)護(hù)城河”的堅守,真的是一種正確的方向嗎?
此前,在紅杉資本總結(jié)報告《生成式AI的第二幕》中,曾有那么一段話:
“‘?dāng)?shù)據(jù)護(hù)城河是站不住腳的’:應(yīng)用公司生成的數(shù)據(jù)并沒有創(chuàng)造出無法逾越的護(hù)城河,而且下一代基礎(chǔ)模型很可能會摧毀創(chuàng)業(yè)公司構(gòu)建的任何數(shù)據(jù)護(hù)城河。相反,工作流程和用戶網(wǎng)絡(luò)似乎正在創(chuàng)造更持久的競爭優(yōu)勢?!?/p>
那么,未來真的會如紅杉所說:“下一代基礎(chǔ)模型會摧毀任何數(shù)據(jù)護(hù)城河”嗎?
至少從技術(shù)層面上看,這種可能性是存在的。
此前,在討論OpenAI泄露的Q*項目時,NVIDIA的高級AI科學(xué)家Jim Fan,就在推特上和馬斯克、LeCun討論了合成數(shù)據(jù)的問題。
Jim Fan認(rèn)為使用計算機(jī)生成(合成)數(shù)據(jù)可以提供下一次幾十萬億高質(zhì)量數(shù)據(jù)集。唯一的問題,就是需要想辦法確保數(shù)據(jù)的持續(xù)高質(zhì)量和多樣性。
而AI三大教父之一的LeCun則表示:“動物和人類只需少量的訓(xùn)練數(shù)據(jù),就能很快變得非常聰明。我認(rèn)為新的架構(gòu)可以像動物和人類一樣高效地學(xué)習(xí)?!?/p>
總體來說,對于數(shù)據(jù)問題,Jim Fan和LeCun代表了兩種不同的解決思路。
一種是通過合成數(shù)據(jù)的方式解決;另一種則是研發(fā)新的架構(gòu)(如世界模型),讓模型僅用很少的數(shù)據(jù),就能“舉一反三”。
但無論方案優(yōu)劣如何,這些技術(shù)構(gòu)想,都代表了學(xué)術(shù)界渴望打破“數(shù)據(jù)限制”的一種集體意志。
同樣地,站在用戶的角度來說,人們也更樂于看到一個通用性更強(qiáng),能精通更多任務(wù)的大模型,而不是每換一種場景,就要切換不同的模型。
而當(dāng)一種技術(shù)方向,成為上至科學(xué)家,下至百姓的共同意志時,它的實現(xiàn)就只是時間問題了。
從這個角度上說,所謂的“數(shù)據(jù)壁壘”,都是終將要消失的。
現(xiàn)在的很多互聯(lián)網(wǎng)公司,都是根據(jù)用戶的行為數(shù)據(jù),結(jié)合模型在做一些業(yè)務(wù),而如果用戶遇到了整合能力更強(qiáng)的大模型,那之前的很多業(yè)務(wù)、功能(例如聽歌),也許就會變成一個個插件,這樣就沒有數(shù)據(jù)壁壘了。
而在這個向AGI過渡的階段中,真正有潛力的團(tuán)隊,應(yīng)該是那些能夠摸索出“數(shù)據(jù)壁壘”之外的核心競爭優(yōu)勢的團(tuán)隊。
誠如月之暗面的CEO楊植麟所說:不同組織衍生不同的文化,文化又衍生不同的系統(tǒng),而系統(tǒng)又了衍生不同的結(jié)果。
在技術(shù)、數(shù)據(jù)方面發(fā)展趨于平緩的情況下,開發(fā)范式,制度和觀念,這些軟性的、抽象的因素,就成為了決勝的關(guān)鍵。
而這種“數(shù)據(jù)”之外的因素,這也是AI時代,人之為人最偉大的源泉所在。