正在閱讀:

馬斯克、Grok與“數(shù)據(jù)封建主”

掃一掃下載界面新聞APP

馬斯克、Grok與“數(shù)據(jù)封建主”

“下一代基礎(chǔ)模型會摧毀任何數(shù)據(jù)護城河”。

文|阿爾法工場

下周,馬斯克躊躇已久的Grok就要上線了。

在OpenAI接連甩出炸街新聞的這段時間,這事似乎沒掀起太大波瀾。

然而,越低調(diào)的狙擊,往往傷害越高。

具體來說,Grok的這次年末突襲,隱藏了老馬背刺OpenAI的一件“秘術(shù)”。

所謂的“秘術(shù)”,其實也很簡單,就是X平臺上不斷涌現(xiàn)的,真實的人類數(shù)據(jù)。

在大模型數(shù)據(jù)愈發(fā)吃緊的今天,連OpenAI自己,也開始直接拿用戶數(shù)據(jù)訓(xùn)練了。

在此情況下,掌握了X這樣一個源源不斷的“數(shù)據(jù)噴泉”,無疑就有了一張將來翻盤的“底牌”。

但話雖如此,但Grok畢竟是一個社交平臺,上面的大部分信息,都是未經(jīng)核驗,且質(zhì)量參差不齊的,直接拿來訓(xùn)練大模型,不怕幻覺迭出嗎?

了解大模型的老馬,一定知道這點。

但即便如此,Grok的上線,對特斯拉,對老馬也仍是利大于弊。

因為倘若不走這一步棋,將來的AI賽道上,馬斯克最多只能做割據(jù)一方的“數(shù)據(jù)封建主”,并且終將面臨“護城河”被攻破的命運。

這樣的未來,很可能也是日后眾多國內(nèi)企業(yè)的命運。

01 數(shù)據(jù)封建主

何謂“數(shù)據(jù)封建主”?

簡單來說,就是以獨有數(shù)據(jù)為壘,在某些垂直的行業(yè)、領(lǐng)域內(nèi)“圈地為王”的大小企業(yè)。

這樣的概念,最初由希臘前財政部長雅尼斯·瓦魯法克斯提出,是其在歐洲各國在美國科技企業(yè)壓榨、盤剝之下發(fā)出的感慨。

而自從11月初的OpenAI開發(fā)者大會后,這種爭當(dāng)“數(shù)據(jù)封建主”的聲音,就開始在業(yè)內(nèi)不絕于耳。

畢竟,在應(yīng)用層的路被GPTs堵死的情況下,獨有數(shù)據(jù)就成了很多企業(yè)唯一的優(yōu)勢。

那么,老馬推出Grok,是想以X平臺的數(shù)據(jù)為基礎(chǔ),成為新一代的“數(shù)據(jù)封建主”嗎?

答案是否定的。因為在未來,這類“數(shù)據(jù)封建主”的命運,就是其壁壘會隨著技術(shù)發(fā)展不斷被削弱,以至于被更強的通用模型步步蠶食。

在這方面,老馬的Grok,已經(jīng)展示出了兩種攻破這類“護城河”的方式。

其中一種,就是通過將模型置于“數(shù)據(jù)樞紐”的位置,使模型的觸手伸向原來鞭長莫及的行業(yè)、領(lǐng)域。

很多人都知道,美國并沒有中國的微信這樣集社交、支付、娛樂、資訊于一身的綜合平臺。這并不是因為美國人能力不行,而是美國的各大金融機構(gòu),與科技巨頭之間是一種互為競爭的關(guān)系。

馬斯克對于X的收購,不僅在某種程度上結(jié)束了這樣的“割據(jù)”,也為其打造成一個類似微信的超級APP提供了基礎(chǔ)。

倘若X平臺真的能成為一個以音頻、視頻、消息、支付/銀行為中心,同時鏈接商品、服務(wù)和機會的全球市場。那么到了那時,Grok就會成為這個數(shù)據(jù)樞紐的中心,從而獲得來自不同行業(yè)、地區(qū)或模態(tài)的海量數(shù)據(jù)。

如此一來,Grok的定位就不再是一個局限于社交平臺的整蠱大模型,而是成為了連接各領(lǐng)域的綜合性交互入口。

隨著時間的推移,這種綜合性入口+大模型的協(xié)同效應(yīng),將會使那些不用Grok,或不上X的用戶,與經(jīng)常使用的用戶之間差距越來越大。

這種情況下,各個垂類行業(yè)的數(shù)據(jù)壁壘盡管依然存在,但若脫離了Grok,卻很難被用戶接受。

于是,這些被拿捏的“數(shù)據(jù)封建主”們?yōu)榱饲蟠?,只得向Grok效忠。

02 協(xié)同效應(yīng)

除了以占據(jù)數(shù)據(jù)樞紐的方式,對各個“數(shù)字封地”進行蠶食外,Grok這類大模型攻破數(shù)據(jù)護城河的另一大方式,就是端云協(xié)同的形態(tài),編織一張巨大的包圍網(wǎng)。

具體來說,在將來的端側(cè)大模型這條賽道上,由特斯拉提供算力(Dojo),X和特斯拉提供訓(xùn)練數(shù)據(jù),xAI進行模型研發(fā),最終將產(chǎn)出模型反哺給X平臺和特斯拉的產(chǎn)品(汽車、人形機器人),將構(gòu)成極為堅固的三角陣營。

那么,在大模型逐漸走向端側(cè)的未來,這樣的三角陣營,將怎樣攻破一個個“數(shù)據(jù)護城河”?

在這里,我們可以用一個電商行業(yè)的例子進行推演。

假設(shè),有一個企業(yè),基于某個局部的電商賽道,用行業(yè)獨有數(shù)據(jù)訓(xùn)練出了個專有大模型,而馬斯克的Grok打算入侵這個領(lǐng)域,那么在數(shù)據(jù)收集階段,其很有可能會采取一種“領(lǐng)域交叉”的戰(zhàn)術(shù)。

具體來說,特斯拉汽車在行駛過程中收集到的交通、地理和用戶行為數(shù)據(jù);機器人在家庭、工廠等場景中收集到的環(huán)境和操作數(shù)據(jù);以及X平臺上的社交信息,都為馬斯克的團隊提供了豐富的信息來源。

當(dāng)馬斯克的團隊將這些數(shù)據(jù)整合在一起時,他們就可能會發(fā)現(xiàn)一些新的模式和關(guān)聯(lián),從而在某種程度上削弱這個專有大模型的獨特優(yōu)勢。

這種戰(zhàn)術(shù)的核心理念就在于:這個世界上沒有任何一個行業(yè)、領(lǐng)域,是完全孤立存在的。

除了外圍攻勢外,這樣的三角陣營,還能通過“合縱連橫”的方式,瓦解掉一個個孤立的“數(shù)據(jù)護城河”。

簡單來說,面對大模型逐漸端側(cè)化的趨勢,馬斯克的三角陣營提供了一種端到端的解決方案。

其涵蓋了從不同來源進行數(shù)據(jù)采集、處理、訓(xùn)練到部署的整個流程。這意味著企業(yè)無需在各個環(huán)節(jié)尋找不同的技術(shù)和服務(wù)提供商,從而降低了實施難度和成本。

簡化的流程有助于企業(yè)更快地應(yīng)用AI技術(shù),提高數(shù)據(jù)處理和分析能力。

在此情況下,就可能會有相當(dāng)一部分企業(yè),決定犧牲數(shù)據(jù)的獨有性,加入三角陣營的生態(tài),從而換來更高的AI部署效率。

這種邏輯,本質(zhì)上就和移動互聯(lián)網(wǎng)時代,很多商家即使忍受高抽成,也要入駐平臺,換取更低的獲客成本一樣。

在這樣圍困之下,一座座孤立的“數(shù)據(jù)城堡”,終將難以抵擋日漸壯大的Grok。

03 通向AGI之路

面對Grok潛在的,咄咄逼人的攻勢,各個想以數(shù)據(jù)為壘的AI企業(yè),將何去何從?

在回答這個問題之前,有一個更重要的問題,那就是:

這種對“數(shù)據(jù)護城河”的堅守,真的是一種正確的方向嗎?

此前,在紅杉資本總結(jié)報告《生成式AI的第二幕》中,曾有那么一段話:

“‘?dāng)?shù)據(jù)護城河是站不住腳的’:應(yīng)用公司生成的數(shù)據(jù)并沒有創(chuàng)造出無法逾越的護城河,而且下一代基礎(chǔ)模型很可能會摧毀創(chuàng)業(yè)公司構(gòu)建的任何數(shù)據(jù)護城河。相反,工作流程和用戶網(wǎng)絡(luò)似乎正在創(chuàng)造更持久的競爭優(yōu)勢?!?/p>

那么,未來真的會如紅杉所說:“下一代基礎(chǔ)模型會摧毀任何數(shù)據(jù)護城河”嗎?

至少從技術(shù)層面上看,這種可能性是存在的。

此前,在討論OpenAI泄露的Q*項目時,NVIDIA的高級AI科學(xué)家Jim Fan,就在推特上和馬斯克、LeCun討論了合成數(shù)據(jù)的問題。

Jim Fan認為使用計算機生成(合成)數(shù)據(jù)可以提供下一次幾十萬億高質(zhì)量數(shù)據(jù)集。唯一的問題,就是需要想辦法確保數(shù)據(jù)的持續(xù)高質(zhì)量和多樣性。

而AI三大教父之一的LeCun則表示:“動物和人類只需少量的訓(xùn)練數(shù)據(jù),就能很快變得非常聰明。我認為新的架構(gòu)可以像動物和人類一樣高效地學(xué)習(xí)?!?/p>

總體來說,對于數(shù)據(jù)問題,Jim Fan和LeCun代表了兩種不同的解決思路。

一種是通過合成數(shù)據(jù)的方式解決;另一種則是研發(fā)新的架構(gòu)(如世界模型),讓模型僅用很少的數(shù)據(jù),就能“舉一反三”。

但無論方案優(yōu)劣如何,這些技術(shù)構(gòu)想,都代表了學(xué)術(shù)界渴望打破“數(shù)據(jù)限制”的一種集體意志。

同樣地,站在用戶的角度來說,人們也更樂于看到一個通用性更強,能精通更多任務(wù)的大模型,而不是每換一種場景,就要切換不同的模型。

而當(dāng)一種技術(shù)方向,成為上至科學(xué)家,下至百姓的共同意志時,它的實現(xiàn)就只是時間問題了。

從這個角度上說,所謂的“數(shù)據(jù)壁壘”,都是終將要消失的。

現(xiàn)在的很多互聯(lián)網(wǎng)公司,都是根據(jù)用戶的行為數(shù)據(jù),結(jié)合模型在做一些業(yè)務(wù),而如果用戶遇到了整合能力更強的大模型,那之前的很多業(yè)務(wù)、功能(例如聽歌),也許就會變成一個個插件,這樣就沒有數(shù)據(jù)壁壘了。

而在這個向AGI過渡的階段中,真正有潛力的團隊,應(yīng)該是那些能夠摸索出“數(shù)據(jù)壁壘”之外的核心競爭優(yōu)勢的團隊。

誠如月之暗面的CEO楊植麟所說:不同組織衍生不同的文化,文化又衍生不同的系統(tǒng),而系統(tǒng)又了衍生不同的結(jié)果。

在技術(shù)、數(shù)據(jù)方面發(fā)展趨于平緩的情況下,開發(fā)范式,制度和觀念,這些軟性的、抽象的因素,就成為了決勝的關(guān)鍵。

而這種“數(shù)據(jù)”之外的因素,這也是AI時代,人之為人最偉大的源泉所在。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

馬斯克、Grok與“數(shù)據(jù)封建主”

“下一代基礎(chǔ)模型會摧毀任何數(shù)據(jù)護城河”。

文|阿爾法工場

下周,馬斯克躊躇已久的Grok就要上線了。

在OpenAI接連甩出炸街新聞的這段時間,這事似乎沒掀起太大波瀾。

然而,越低調(diào)的狙擊,往往傷害越高。

具體來說,Grok的這次年末突襲,隱藏了老馬背刺OpenAI的一件“秘術(shù)”。

所謂的“秘術(shù)”,其實也很簡單,就是X平臺上不斷涌現(xiàn)的,真實的人類數(shù)據(jù)。

在大模型數(shù)據(jù)愈發(fā)吃緊的今天,連OpenAI自己,也開始直接拿用戶數(shù)據(jù)訓(xùn)練了。

在此情況下,掌握了X這樣一個源源不斷的“數(shù)據(jù)噴泉”,無疑就有了一張將來翻盤的“底牌”。

但話雖如此,但Grok畢竟是一個社交平臺,上面的大部分信息,都是未經(jīng)核驗,且質(zhì)量參差不齊的,直接拿來訓(xùn)練大模型,不怕幻覺迭出嗎?

了解大模型的老馬,一定知道這點。

但即便如此,Grok的上線,對特斯拉,對老馬也仍是利大于弊。

因為倘若不走這一步棋,將來的AI賽道上,馬斯克最多只能做割據(jù)一方的“數(shù)據(jù)封建主”,并且終將面臨“護城河”被攻破的命運。

這樣的未來,很可能也是日后眾多國內(nèi)企業(yè)的命運。

01 數(shù)據(jù)封建主

何謂“數(shù)據(jù)封建主”?

簡單來說,就是以獨有數(shù)據(jù)為壘,在某些垂直的行業(yè)、領(lǐng)域內(nèi)“圈地為王”的大小企業(yè)。

這樣的概念,最初由希臘前財政部長雅尼斯·瓦魯法克斯提出,是其在歐洲各國在美國科技企業(yè)壓榨、盤剝之下發(fā)出的感慨。

而自從11月初的OpenAI開發(fā)者大會后,這種爭當(dāng)“數(shù)據(jù)封建主”的聲音,就開始在業(yè)內(nèi)不絕于耳。

畢竟,在應(yīng)用層的路被GPTs堵死的情況下,獨有數(shù)據(jù)就成了很多企業(yè)唯一的優(yōu)勢。

那么,老馬推出Grok,是想以X平臺的數(shù)據(jù)為基礎(chǔ),成為新一代的“數(shù)據(jù)封建主”嗎?

答案是否定的。因為在未來,這類“數(shù)據(jù)封建主”的命運,就是其壁壘會隨著技術(shù)發(fā)展不斷被削弱,以至于被更強的通用模型步步蠶食。

在這方面,老馬的Grok,已經(jīng)展示出了兩種攻破這類“護城河”的方式。

其中一種,就是通過將模型置于“數(shù)據(jù)樞紐”的位置,使模型的觸手伸向原來鞭長莫及的行業(yè)、領(lǐng)域。

很多人都知道,美國并沒有中國的微信這樣集社交、支付、娛樂、資訊于一身的綜合平臺。這并不是因為美國人能力不行,而是美國的各大金融機構(gòu),與科技巨頭之間是一種互為競爭的關(guān)系。

馬斯克對于X的收購,不僅在某種程度上結(jié)束了這樣的“割據(jù)”,也為其打造成一個類似微信的超級APP提供了基礎(chǔ)。

倘若X平臺真的能成為一個以音頻、視頻、消息、支付/銀行為中心,同時鏈接商品、服務(wù)和機會的全球市場。那么到了那時,Grok就會成為這個數(shù)據(jù)樞紐的中心,從而獲得來自不同行業(yè)、地區(qū)或模態(tài)的海量數(shù)據(jù)。

如此一來,Grok的定位就不再是一個局限于社交平臺的整蠱大模型,而是成為了連接各領(lǐng)域的綜合性交互入口。

隨著時間的推移,這種綜合性入口+大模型的協(xié)同效應(yīng),將會使那些不用Grok,或不上X的用戶,與經(jīng)常使用的用戶之間差距越來越大。

這種情況下,各個垂類行業(yè)的數(shù)據(jù)壁壘盡管依然存在,但若脫離了Grok,卻很難被用戶接受。

于是,這些被拿捏的“數(shù)據(jù)封建主”們?yōu)榱饲蟠?,只得向Grok效忠。

02 協(xié)同效應(yīng)

除了以占據(jù)數(shù)據(jù)樞紐的方式,對各個“數(shù)字封地”進行蠶食外,Grok這類大模型攻破數(shù)據(jù)護城河的另一大方式,就是端云協(xié)同的形態(tài),編織一張巨大的包圍網(wǎng)。

具體來說,在將來的端側(cè)大模型這條賽道上,由特斯拉提供算力(Dojo),X和特斯拉提供訓(xùn)練數(shù)據(jù),xAI進行模型研發(fā),最終將產(chǎn)出模型反哺給X平臺和特斯拉的產(chǎn)品(汽車、人形機器人),將構(gòu)成極為堅固的三角陣營。

那么,在大模型逐漸走向端側(cè)的未來,這樣的三角陣營,將怎樣攻破一個個“數(shù)據(jù)護城河”?

在這里,我們可以用一個電商行業(yè)的例子進行推演。

假設(shè),有一個企業(yè),基于某個局部的電商賽道,用行業(yè)獨有數(shù)據(jù)訓(xùn)練出了個專有大模型,而馬斯克的Grok打算入侵這個領(lǐng)域,那么在數(shù)據(jù)收集階段,其很有可能會采取一種“領(lǐng)域交叉”的戰(zhàn)術(shù)。

具體來說,特斯拉汽車在行駛過程中收集到的交通、地理和用戶行為數(shù)據(jù);機器人在家庭、工廠等場景中收集到的環(huán)境和操作數(shù)據(jù);以及X平臺上的社交信息,都為馬斯克的團隊提供了豐富的信息來源。

當(dāng)馬斯克的團隊將這些數(shù)據(jù)整合在一起時,他們就可能會發(fā)現(xiàn)一些新的模式和關(guān)聯(lián),從而在某種程度上削弱這個專有大模型的獨特優(yōu)勢。

這種戰(zhàn)術(shù)的核心理念就在于:這個世界上沒有任何一個行業(yè)、領(lǐng)域,是完全孤立存在的。

除了外圍攻勢外,這樣的三角陣營,還能通過“合縱連橫”的方式,瓦解掉一個個孤立的“數(shù)據(jù)護城河”。

簡單來說,面對大模型逐漸端側(cè)化的趨勢,馬斯克的三角陣營提供了一種端到端的解決方案。

其涵蓋了從不同來源進行數(shù)據(jù)采集、處理、訓(xùn)練到部署的整個流程。這意味著企業(yè)無需在各個環(huán)節(jié)尋找不同的技術(shù)和服務(wù)提供商,從而降低了實施難度和成本。

簡化的流程有助于企業(yè)更快地應(yīng)用AI技術(shù),提高數(shù)據(jù)處理和分析能力。

在此情況下,就可能會有相當(dāng)一部分企業(yè),決定犧牲數(shù)據(jù)的獨有性,加入三角陣營的生態(tài),從而換來更高的AI部署效率。

這種邏輯,本質(zhì)上就和移動互聯(lián)網(wǎng)時代,很多商家即使忍受高抽成,也要入駐平臺,換取更低的獲客成本一樣。

在這樣圍困之下,一座座孤立的“數(shù)據(jù)城堡”,終將難以抵擋日漸壯大的Grok。

03 通向AGI之路

面對Grok潛在的,咄咄逼人的攻勢,各個想以數(shù)據(jù)為壘的AI企業(yè),將何去何從?

在回答這個問題之前,有一個更重要的問題,那就是:

這種對“數(shù)據(jù)護城河”的堅守,真的是一種正確的方向嗎?

此前,在紅杉資本總結(jié)報告《生成式AI的第二幕》中,曾有那么一段話:

“‘?dāng)?shù)據(jù)護城河是站不住腳的’:應(yīng)用公司生成的數(shù)據(jù)并沒有創(chuàng)造出無法逾越的護城河,而且下一代基礎(chǔ)模型很可能會摧毀創(chuàng)業(yè)公司構(gòu)建的任何數(shù)據(jù)護城河。相反,工作流程和用戶網(wǎng)絡(luò)似乎正在創(chuàng)造更持久的競爭優(yōu)勢?!?/p>

那么,未來真的會如紅杉所說:“下一代基礎(chǔ)模型會摧毀任何數(shù)據(jù)護城河”嗎?

至少從技術(shù)層面上看,這種可能性是存在的。

此前,在討論OpenAI泄露的Q*項目時,NVIDIA的高級AI科學(xué)家Jim Fan,就在推特上和馬斯克、LeCun討論了合成數(shù)據(jù)的問題。

Jim Fan認為使用計算機生成(合成)數(shù)據(jù)可以提供下一次幾十萬億高質(zhì)量數(shù)據(jù)集。唯一的問題,就是需要想辦法確保數(shù)據(jù)的持續(xù)高質(zhì)量和多樣性。

而AI三大教父之一的LeCun則表示:“動物和人類只需少量的訓(xùn)練數(shù)據(jù),就能很快變得非常聰明。我認為新的架構(gòu)可以像動物和人類一樣高效地學(xué)習(xí)。”

總體來說,對于數(shù)據(jù)問題,Jim Fan和LeCun代表了兩種不同的解決思路。

一種是通過合成數(shù)據(jù)的方式解決;另一種則是研發(fā)新的架構(gòu)(如世界模型),讓模型僅用很少的數(shù)據(jù),就能“舉一反三”。

但無論方案優(yōu)劣如何,這些技術(shù)構(gòu)想,都代表了學(xué)術(shù)界渴望打破“數(shù)據(jù)限制”的一種集體意志。

同樣地,站在用戶的角度來說,人們也更樂于看到一個通用性更強,能精通更多任務(wù)的大模型,而不是每換一種場景,就要切換不同的模型。

而當(dāng)一種技術(shù)方向,成為上至科學(xué)家,下至百姓的共同意志時,它的實現(xiàn)就只是時間問題了。

從這個角度上說,所謂的“數(shù)據(jù)壁壘”,都是終將要消失的。

現(xiàn)在的很多互聯(lián)網(wǎng)公司,都是根據(jù)用戶的行為數(shù)據(jù),結(jié)合模型在做一些業(yè)務(wù),而如果用戶遇到了整合能力更強的大模型,那之前的很多業(yè)務(wù)、功能(例如聽歌),也許就會變成一個個插件,這樣就沒有數(shù)據(jù)壁壘了。

而在這個向AGI過渡的階段中,真正有潛力的團隊,應(yīng)該是那些能夠摸索出“數(shù)據(jù)壁壘”之外的核心競爭優(yōu)勢的團隊。

誠如月之暗面的CEO楊植麟所說:不同組織衍生不同的文化,文化又衍生不同的系統(tǒng),而系統(tǒng)又了衍生不同的結(jié)果。

在技術(shù)、數(shù)據(jù)方面發(fā)展趨于平緩的情況下,開發(fā)范式,制度和觀念,這些軟性的、抽象的因素,就成為了決勝的關(guān)鍵。

而這種“數(shù)據(jù)”之外的因素,這也是AI時代,人之為人最偉大的源泉所在。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。