文|阿爾法工場(chǎng)
下周,馬斯克躊躇已久的Grok就要上線了。
在OpenAI接連甩出炸街新聞的這段時(shí)間,這事似乎沒(méi)掀起太大波瀾。
然而,越低調(diào)的狙擊,往往傷害越高。
具體來(lái)說(shuō),Grok的這次年末突襲,隱藏了老馬背刺O(píng)penAI的一件“秘術(shù)”。
所謂的“秘術(shù)”,其實(shí)也很簡(jiǎn)單,就是X平臺(tái)上不斷涌現(xiàn)的,真實(shí)的人類數(shù)據(jù)。
在大模型數(shù)據(jù)愈發(fā)吃緊的今天,連OpenAI自己,也開(kāi)始直接拿用戶數(shù)據(jù)訓(xùn)練了。
在此情況下,掌握了X這樣一個(gè)源源不斷的“數(shù)據(jù)噴泉”,無(wú)疑就有了一張將來(lái)翻盤(pán)的“底牌”。
但話雖如此,但Grok畢竟是一個(gè)社交平臺(tái),上面的大部分信息,都是未經(jīng)核驗(yàn),且質(zhì)量參差不齊的,直接拿來(lái)訓(xùn)練大模型,不怕幻覺(jué)迭出嗎?
了解大模型的老馬,一定知道這點(diǎn)。
但即便如此,Grok的上線,對(duì)特斯拉,對(duì)老馬也仍是利大于弊。
因?yàn)樘热舨蛔哌@一步棋,將來(lái)的AI賽道上,馬斯克最多只能做割據(jù)一方的“數(shù)據(jù)封建主”,并且終將面臨“護(hù)城河”被攻破的命運(yùn)。
這樣的未來(lái),很可能也是日后眾多國(guó)內(nèi)企業(yè)的命運(yùn)。
01 數(shù)據(jù)封建主
何謂“數(shù)據(jù)封建主”?
簡(jiǎn)單來(lái)說(shuō),就是以獨(dú)有數(shù)據(jù)為壘,在某些垂直的行業(yè)、領(lǐng)域內(nèi)“圈地為王”的大小企業(yè)。
這樣的概念,最初由希臘前財(cái)政部長(zhǎng)雅尼斯·瓦魯法克斯提出,是其在歐洲各國(guó)在美國(guó)科技企業(yè)壓榨、盤(pán)剝之下發(fā)出的感慨。
而自從11月初的OpenAI開(kāi)發(fā)者大會(huì)后,這種爭(zhēng)當(dāng)“數(shù)據(jù)封建主”的聲音,就開(kāi)始在業(yè)內(nèi)不絕于耳。
畢竟,在應(yīng)用層的路被GPTs堵死的情況下,獨(dú)有數(shù)據(jù)就成了很多企業(yè)唯一的優(yōu)勢(shì)。
那么,老馬推出Grok,是想以X平臺(tái)的數(shù)據(jù)為基礎(chǔ),成為新一代的“數(shù)據(jù)封建主”嗎?
答案是否定的。因?yàn)樵谖磥?lái),這類“數(shù)據(jù)封建主”的命運(yùn),就是其壁壘會(huì)隨著技術(shù)發(fā)展不斷被削弱,以至于被更強(qiáng)的通用模型步步蠶食。
在這方面,老馬的Grok,已經(jīng)展示出了兩種攻破這類“護(hù)城河”的方式。
其中一種,就是通過(guò)將模型置于“數(shù)據(jù)樞紐”的位置,使模型的觸手伸向原來(lái)鞭長(zhǎng)莫及的行業(yè)、領(lǐng)域。
很多人都知道,美國(guó)并沒(méi)有中國(guó)的微信這樣集社交、支付、娛樂(lè)、資訊于一身的綜合平臺(tái)。這并不是因?yàn)槊绹?guó)人能力不行,而是美國(guó)的各大金融機(jī)構(gòu),與科技巨頭之間是一種互為競(jìng)爭(zhēng)的關(guān)系。
馬斯克對(duì)于X的收購(gòu),不僅在某種程度上結(jié)束了這樣的“割據(jù)”,也為其打造成一個(gè)類似微信的超級(jí)APP提供了基礎(chǔ)。
倘若X平臺(tái)真的能成為一個(gè)以音頻、視頻、消息、支付/銀行為中心,同時(shí)鏈接商品、服務(wù)和機(jī)會(huì)的全球市場(chǎng)。那么到了那時(shí),Grok就會(huì)成為這個(gè)數(shù)據(jù)樞紐的中心,從而獲得來(lái)自不同行業(yè)、地區(qū)或模態(tài)的海量數(shù)據(jù)。
如此一來(lái),Grok的定位就不再是一個(gè)局限于社交平臺(tái)的整蠱大模型,而是成為了連接各領(lǐng)域的綜合性交互入口。
隨著時(shí)間的推移,這種綜合性入口+大模型的協(xié)同效應(yīng),將會(huì)使那些不用Grok,或不上X的用戶,與經(jīng)常使用的用戶之間差距越來(lái)越大。
這種情況下,各個(gè)垂類行業(yè)的數(shù)據(jù)壁壘盡管依然存在,但若脫離了Grok,卻很難被用戶接受。
于是,這些被拿捏的“數(shù)據(jù)封建主”們?yōu)榱饲蟠?,只得向Grok效忠。
02 協(xié)同效應(yīng)
除了以占據(jù)數(shù)據(jù)樞紐的方式,對(duì)各個(gè)“數(shù)字封地”進(jìn)行蠶食外,Grok這類大模型攻破數(shù)據(jù)護(hù)城河的另一大方式,就是端云協(xié)同的形態(tài),編織一張巨大的包圍網(wǎng)。
具體來(lái)說(shuō),在將來(lái)的端側(cè)大模型這條賽道上,由特斯拉提供算力(Dojo),X和特斯拉提供訓(xùn)練數(shù)據(jù),xAI進(jìn)行模型研發(fā),最終將產(chǎn)出模型反哺給X平臺(tái)和特斯拉的產(chǎn)品(汽車、人形機(jī)器人),將構(gòu)成極為堅(jiān)固的三角陣營(yíng)。
那么,在大模型逐漸走向端側(cè)的未來(lái),這樣的三角陣營(yíng),將怎樣攻破一個(gè)個(gè)“數(shù)據(jù)護(hù)城河”?
在這里,我們可以用一個(gè)電商行業(yè)的例子進(jìn)行推演。
假設(shè),有一個(gè)企業(yè),基于某個(gè)局部的電商賽道,用行業(yè)獨(dú)有數(shù)據(jù)訓(xùn)練出了個(gè)專有大模型,而馬斯克的Grok打算入侵這個(gè)領(lǐng)域,那么在數(shù)據(jù)收集階段,其很有可能會(huì)采取一種“領(lǐng)域交叉”的戰(zhàn)術(shù)。
具體來(lái)說(shuō),特斯拉汽車在行駛過(guò)程中收集到的交通、地理和用戶行為數(shù)據(jù);機(jī)器人在家庭、工廠等場(chǎng)景中收集到的環(huán)境和操作數(shù)據(jù);以及X平臺(tái)上的社交信息,都為馬斯克的團(tuán)隊(duì)提供了豐富的信息來(lái)源。
當(dāng)馬斯克的團(tuán)隊(duì)將這些數(shù)據(jù)整合在一起時(shí),他們就可能會(huì)發(fā)現(xiàn)一些新的模式和關(guān)聯(lián),從而在某種程度上削弱這個(gè)專有大模型的獨(dú)特優(yōu)勢(shì)。
這種戰(zhàn)術(shù)的核心理念就在于:這個(gè)世界上沒(méi)有任何一個(gè)行業(yè)、領(lǐng)域,是完全孤立存在的。
除了外圍攻勢(shì)外,這樣的三角陣營(yíng),還能通過(guò)“合縱連橫”的方式,瓦解掉一個(gè)個(gè)孤立的“數(shù)據(jù)護(hù)城河”。
簡(jiǎn)單來(lái)說(shuō),面對(duì)大模型逐漸端側(cè)化的趨勢(shì),馬斯克的三角陣營(yíng)提供了一種端到端的解決方案。
其涵蓋了從不同來(lái)源進(jìn)行數(shù)據(jù)采集、處理、訓(xùn)練到部署的整個(gè)流程。這意味著企業(yè)無(wú)需在各個(gè)環(huán)節(jié)尋找不同的技術(shù)和服務(wù)提供商,從而降低了實(shí)施難度和成本。
簡(jiǎn)化的流程有助于企業(yè)更快地應(yīng)用AI技術(shù),提高數(shù)據(jù)處理和分析能力。
在此情況下,就可能會(huì)有相當(dāng)一部分企業(yè),決定犧牲數(shù)據(jù)的獨(dú)有性,加入三角陣營(yíng)的生態(tài),從而換來(lái)更高的AI部署效率。
這種邏輯,本質(zhì)上就和移動(dòng)互聯(lián)網(wǎng)時(shí)代,很多商家即使忍受高抽成,也要入駐平臺(tái),換取更低的獲客成本一樣。
在這樣圍困之下,一座座孤立的“數(shù)據(jù)城堡”,終將難以抵擋日漸壯大的Grok。
03 通向AGI之路
面對(duì)Grok潛在的,咄咄逼人的攻勢(shì),各個(gè)想以數(shù)據(jù)為壘的AI企業(yè),將何去何從?
在回答這個(gè)問(wèn)題之前,有一個(gè)更重要的問(wèn)題,那就是:
這種對(duì)“數(shù)據(jù)護(hù)城河”的堅(jiān)守,真的是一種正確的方向嗎?
此前,在紅杉資本總結(jié)報(bào)告《生成式AI的第二幕》中,曾有那么一段話:
“‘?dāng)?shù)據(jù)護(hù)城河是站不住腳的’:應(yīng)用公司生成的數(shù)據(jù)并沒(méi)有創(chuàng)造出無(wú)法逾越的護(hù)城河,而且下一代基礎(chǔ)模型很可能會(huì)摧毀創(chuàng)業(yè)公司構(gòu)建的任何數(shù)據(jù)護(hù)城河。相反,工作流程和用戶網(wǎng)絡(luò)似乎正在創(chuàng)造更持久的競(jìng)爭(zhēng)優(yōu)勢(shì)?!?/p>
那么,未來(lái)真的會(huì)如紅杉所說(shuō):“下一代基礎(chǔ)模型會(huì)摧毀任何數(shù)據(jù)護(hù)城河”嗎?
至少?gòu)募夹g(shù)層面上看,這種可能性是存在的。
此前,在討論OpenAI泄露的Q*項(xiàng)目時(shí),NVIDIA的高級(jí)AI科學(xué)家Jim Fan,就在推特上和馬斯克、LeCun討論了合成數(shù)據(jù)的問(wèn)題。
Jim Fan認(rèn)為使用計(jì)算機(jī)生成(合成)數(shù)據(jù)可以提供下一次幾十萬(wàn)億高質(zhì)量數(shù)據(jù)集。唯一的問(wèn)題,就是需要想辦法確保數(shù)據(jù)的持續(xù)高質(zhì)量和多樣性。
而AI三大教父之一的LeCun則表示:“動(dòng)物和人類只需少量的訓(xùn)練數(shù)據(jù),就能很快變得非常聰明。我認(rèn)為新的架構(gòu)可以像動(dòng)物和人類一樣高效地學(xué)習(xí)。”
總體來(lái)說(shuō),對(duì)于數(shù)據(jù)問(wèn)題,Jim Fan和LeCun代表了兩種不同的解決思路。
一種是通過(guò)合成數(shù)據(jù)的方式解決;另一種則是研發(fā)新的架構(gòu)(如世界模型),讓模型僅用很少的數(shù)據(jù),就能“舉一反三”。
但無(wú)論方案優(yōu)劣如何,這些技術(shù)構(gòu)想,都代表了學(xué)術(shù)界渴望打破“數(shù)據(jù)限制”的一種集體意志。
同樣地,站在用戶的角度來(lái)說(shuō),人們也更樂(lè)于看到一個(gè)通用性更強(qiáng),能精通更多任務(wù)的大模型,而不是每換一種場(chǎng)景,就要切換不同的模型。
而當(dāng)一種技術(shù)方向,成為上至科學(xué)家,下至百姓的共同意志時(shí),它的實(shí)現(xiàn)就只是時(shí)間問(wèn)題了。
從這個(gè)角度上說(shuō),所謂的“數(shù)據(jù)壁壘”,都是終將要消失的。
現(xiàn)在的很多互聯(lián)網(wǎng)公司,都是根據(jù)用戶的行為數(shù)據(jù),結(jié)合模型在做一些業(yè)務(wù),而如果用戶遇到了整合能力更強(qiáng)的大模型,那之前的很多業(yè)務(wù)、功能(例如聽(tīng)歌),也許就會(huì)變成一個(gè)個(gè)插件,這樣就沒(méi)有數(shù)據(jù)壁壘了。
而在這個(gè)向AGI過(guò)渡的階段中,真正有潛力的團(tuán)隊(duì),應(yīng)該是那些能夠摸索出“數(shù)據(jù)壁壘”之外的核心競(jìng)爭(zhēng)優(yōu)勢(shì)的團(tuán)隊(duì)。
誠(chéng)如月之暗面的CEO楊植麟所說(shuō):不同組織衍生不同的文化,文化又衍生不同的系統(tǒng),而系統(tǒng)又了衍生不同的結(jié)果。
在技術(shù)、數(shù)據(jù)方面發(fā)展趨于平緩的情況下,開(kāi)發(fā)范式,制度和觀念,這些軟性的、抽象的因素,就成為了決勝的關(guān)鍵。
而這種“數(shù)據(jù)”之外的因素,這也是AI時(shí)代,人之為人最偉大的源泉所在。