正在閱讀:

大廠“擁抱”Deepseek,打不過就加入?

掃一掃下載界面新聞APP

大廠“擁抱”Deepseek,打不過就加入?

技術(shù)上的逆襲,尚不足以徹底震驚科技界,真正引爆Deepseek的變量,其實(shí)是“開源”。

文|新媒科技評(píng)論

這個(gè)春節(jié),人工智能無疑成為了社交話題的C位,前有人形機(jī)器人在春晚跳扭秧歌而出圈,后有“Deepseek”的強(qiáng)勢(shì)崛起。

網(wǎng)友們瘋狂涌入Deepseek,有人找Deepseek算命,有人問Deepseek怎樣才能暴富,還有科技金融行業(yè)的打工人,年還沒有過完,就得忙著加班寫研報(bào)、測(cè)試模型。

但海外市場(chǎng)對(duì)此卻態(tài)度微妙,OpenAI一度宣稱Deepseek“偷竊”了其“技術(shù)成果”,但一轉(zhuǎn)頭,微軟、英偉達(dá)等大廠都宣布在自家產(chǎn)品中接入Deepseek,OpenAI CEO山姆·奧特曼更表示Deepseek的R1模型“令人印象深刻”。

國(guó)內(nèi)的互聯(lián)網(wǎng)巨頭們也沒有錯(cuò)失這波Deepseek的熱度,2月6日,有道正式宣布全面擁抱DeepSeek-R1。此外,Hi Echo、有道智云、QAnything等產(chǎn)品也將全面接入DeepSeek的推理能力,并于近日陸續(xù)升級(jí)。

一時(shí)之間,這場(chǎng)AI大模型的技術(shù)迭代,不知不覺就演變成全球科技行業(yè)的現(xiàn)象級(jí)事件,Deepseek也被視為引領(lǐng)大模型行業(yè)從“大而全”到“小而美”的全新變量。

但熱鬧過后,Deepseek還需要回答更多的新問題,全球大模型行業(yè)該如何抓住“變革的火花”,或許才是接下來的關(guān)鍵。

三大變量引爆Deepseek

在普通用戶看來,Deepseek是在此次中美大模型技術(shù)之爭(zhēng)中“一戰(zhàn)成名”,但更早之前,Deepseek便已經(jīng)因?yàn)椤皟r(jià)格便宜”而被AI圈廣泛關(guān)注。

去年中,國(guó)內(nèi)大模型行業(yè)大打“價(jià)格戰(zhàn)”,但第一個(gè)“挑起戰(zhàn)火”的并非阿里、百度等大廠,而是Deepseek,彼時(shí)其新推出的DeepSeek-V2價(jià)格僅為 GPT-4-Turbo 的百分之一左右。

此次“降價(jià)”也讓Deepseek被冠以“AI界拼多多”之稱,但相較于大廠們的“以價(jià)換市場(chǎng)”的慣常做法,Deepseek對(duì)于“降價(jià)”并沒有太多壓力,因?yàn)槠浣祪r(jià)之后也仍有利潤(rùn)。

事實(shí)上,這才是Deepseek能夠震驚全球科技界的主要原因,其能夠以更低的成本換來更高的性能,顛覆了過去大模型行業(yè)依靠堆顯卡、堆資本來發(fā)展AI的“Scaling law”。

這是因?yàn)镈eepseek的模型訓(xùn)練路徑不同于傳統(tǒng)通用大模型,以ChatGPT為代表的傳統(tǒng)AI,主要采用監(jiān)督微調(diào)(簡(jiǎn)稱 SFT)作為大模型訓(xùn)練的核心環(huán)節(jié),即通過人工標(biāo)注數(shù)據(jù)進(jìn)行監(jiān)督訓(xùn)練,再結(jié)合強(qiáng)化學(xué)習(xí)進(jìn)行優(yōu)化,本質(zhì)上大模型并不會(huì)思考,只是通過模仿人類思維方式來提升推理能力。

但在1月底發(fā)布的Deepseek-R1-Zero卻顛覆了這一規(guī)則,其對(duì)模型架構(gòu)進(jìn)行了全方位創(chuàng)新,通過單純的強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練實(shí)現(xiàn)推理能力。簡(jiǎn)單來說,SFT是人類生成數(shù)據(jù),機(jī)器學(xué)習(xí);而RL是機(jī)器生成數(shù)據(jù),機(jī)器學(xué)習(xí)。

除此以外,據(jù)每日財(cái)經(jīng)新聞報(bào)道,DeepSeek創(chuàng)新性地同時(shí)使用了FP8、MLA(多頭潛在注意力)和MoE(利用混合專家架構(gòu))三種技術(shù)。

其中,相較于其他模型使用的MoE架構(gòu),DeepSeek-V3的更為精簡(jiǎn)有效,其就像是醫(yī)院的“分診制度”,可以將大模型拆分成多個(gè)“專家”,訓(xùn)練時(shí)分工協(xié)作,推理時(shí)根據(jù)任務(wù)分配給最適合的專家模塊。據(jù)悉,Deepseek能夠?qū)o效訓(xùn)練從傳統(tǒng)模型的90%降低至60%。

在Deepseek-R1發(fā)布后,一位Meta員工在美國(guó)匿名職場(chǎng)社區(qū)teamblind上留言,稱Deepseek最近的一系列動(dòng)作讓Meta的生成式AI團(tuán)隊(duì)陷入了恐慌。

據(jù)這位員工爆料,“Meta一個(gè)負(fù)責(zé)AI項(xiàng)目的高管年薪拿出來,就足夠訓(xùn)練Deepseek了”。據(jù)每日經(jīng)濟(jì)新聞報(bào)道,Deepseek R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,還不到OpenAI GPT-4o模型訓(xùn)練成本的十分之一。

但從實(shí)際性能來看,Deepseek-R1已經(jīng)能夠比肩OpenAI-o1正式版,特別是在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上。

在美國(guó)數(shù)學(xué)競(jìng)賽(AMC)以及全球頂級(jí)編程競(jìng)賽(codeforces)等權(quán)威評(píng)測(cè)中,DeepSeek-R1-Lite-Preview 模型已經(jīng)大幅超越了 GPT-4o 等頂尖模型,有三項(xiàng)成績(jī)還領(lǐng)先于 OpenAI o1-preview。

除了“低成本、高算力”這一突破之外,Deepseek之所以在這個(gè)春節(jié)“燃起來”,還因?yàn)槠渚谷徊皇浅鲎詡鹘y(tǒng)的大廠,而是一家量化基金公司。

Deepseek成立于2023年12月,在此之前,其創(chuàng)始人梁文鋒于2015年便成立了名為“幻方量化”的量化對(duì)沖基金,可以說Deepseek的前身其實(shí)是服務(wù)于量化交易的。

這樣的背景也為Deepseek增添了更多“看點(diǎn)”,比如梁文鋒之所以不差錢,是因?yàn)槠湓诹炕灰咨腺嵉蔑L(fēng)生水起,網(wǎng)友甚至戲稱Deepseek的訓(xùn)練成本是來自于造空英偉達(dá)。

還有背靠千億量化基金的梁文鋒,明明可以選擇輕松躺賺,卻選擇投身到全球創(chuàng)新的浪潮里,他坦言“對(duì)AGI的好奇與探索比商業(yè)回報(bào)更具驅(qū)動(dòng)力”,這種一往無前的“理想主義”,想讓也讓Deepseek的“故事”變得更加動(dòng)人。

大廠打不過就加入

不過,技術(shù)上的逆襲,尚不足以徹底震驚科技界,真正引爆Deepseek的變量,其實(shí)是“開源”。據(jù)悉,Deepseek已經(jīng)把模型架構(gòu)和參數(shù)開源,在大模型公司普遍選擇閉源的當(dāng)下,訓(xùn)練數(shù)據(jù)的開源在業(yè)界少有先例。

梁文鋒曾在媒體采訪中表示,“過去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過來做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。我們的出發(fā)點(diǎn)不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。”

從商業(yè)角度來看,“開源”是不是一個(gè)更佳的策略,尚難以下定論。畢竟訓(xùn)練模型需要成本,招攬用戶也需要推廣費(fèi)用,從此前字節(jié)豆包大規(guī)模投放廣告、kimi多次接受融資就可以看出,大模型公司有自己的難處。

但對(duì)于中國(guó)大模型行業(yè)來說,或許正是梁文鋒的“理想主義”,才讓Deepseek能夠成為顛覆行業(yè)格局的“變量”。

一方面,開源將能吸引更多大廠和技術(shù)人才加入,通過共建共創(chuàng)讓Deepseek變得更加強(qiáng)大,從而推動(dòng)整個(gè)人工智能大模型生態(tài)的發(fā)展,形成一個(gè)全新的生態(tài)。

梁文鋒曾對(duì)媒體表示,公司未來不會(huì)像OpenAI一樣選擇從開源走向閉源,“我們認(rèn)為先有一個(gè)強(qiáng)大的技術(shù)生態(tài)更重要” 。

另一方面,對(duì)于以O(shè)penAI為代表的競(jìng)爭(zhēng)對(duì)手來說,這也是一個(gè)致命的打擊。畢竟,當(dāng)一個(gè)旗鼓相當(dāng)?shù)?,還是免費(fèi)的產(chǎn)品出現(xiàn)在消費(fèi)者面前,大家難免就會(huì)進(jìn)行比較,誰的性價(jià)比更高,誰的性能更優(yōu)秀,都需要實(shí)打?qū)嵉氖褂眯Ч麃眚?yàn)證,而不僅僅只是“吹泡沫”。

而率先作出選擇的,便是一眾海外大廠,目前包括英偉達(dá)、英特爾、亞馬遜、微軟、AMD、等海外科技大廠,均宣布在自家產(chǎn)品中接入Deepseek。

值得一提的是,歐美多國(guó)對(duì)于Deepseek的安全性、隱私問題依然存在質(zhì)疑。美國(guó)多位官員表示正在對(duì)Deepseek開展國(guó)家安全調(diào)查,包括國(guó)防部、國(guó)會(huì)和NASA等部門均被要求禁用Deepseek。

此外,據(jù)彭博社等媒體報(bào)道,微軟還曾調(diào)查 OpenAI 技術(shù)輸出的數(shù)據(jù)是否被中國(guó)的Deepseek團(tuán)隊(duì)以未經(jīng)授權(quán)的方式獲取,比如通過“蒸餾技術(shù)”非法獲取其模型輸出數(shù)據(jù)。

但在這些爭(zhēng)議尚未解決之前,大廠們顯然已經(jīng)迫不及待想要加入Deepseek生態(tài),本質(zhì)上還是基于“利益至上”的原則。

據(jù)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系和電子工程系副教授吳恩達(dá)表示,OpenAI - o1模型每百萬輸出token 的成本為60美元,而Deepseek-R1 則僅需 2.19 美元,這接近30倍的成本差距,相信大廠們也會(huì)算賬。

其次則是生態(tài)效應(yīng),吳恩達(dá)認(rèn)為,“降價(jià)”+“開源”正在將基礎(chǔ)模型層商品化,為應(yīng)用開發(fā)者創(chuàng)造了巨大的機(jī)遇。盡早加入這一生態(tài),讓自家大模型與之相結(jié)合,也有望帶來更多創(chuàng)新體驗(yàn),“收攏”部分DeepSeek用戶的需求。

因此,除了海外大廠之外,諸如阿里云、百度云等國(guó)內(nèi)大廠也開始集中接入Deepseek,在各自平臺(tái)提供的適配服務(wù),打不過就加入,才能共享創(chuàng)新紅利。

乘上Deepseek的東風(fēng)

事實(shí)上,在開春爆火的Deepseek,不僅為大模型行業(yè)帶來了一陣“春風(fēng)”,對(duì)于普通用戶來說,也帶來了更多新機(jī)會(huì)。

第一批利用Deepseek搞錢的人已經(jīng)出現(xiàn)了,跟彼時(shí)橫空出世的ChatGPT一樣,面對(duì)更加智能、更加高效的大模型,AI取代人類的焦慮感,再次成為收割用戶的“武器”。

社交平臺(tái)上已經(jīng)出現(xiàn)了不少“如何使用Deepseek進(jìn)行XXX”的課程,面向社交媒體、電商、廣告等不同行業(yè)的應(yīng)用和變現(xiàn)。

當(dāng)然,學(xué)習(xí)新知識(shí)肯定是沒錯(cuò)的,但相較于被焦慮感“收割”,并淪為大V私域流量中的一員,大家不妨根據(jù)自己的實(shí)際工作和擅長(zhǎng)內(nèi)容,先上手試用一下Deepseek。

目前來看,Deepseek在技術(shù)上確實(shí)有意想不到的突破,對(duì)于普通用戶來說,其能夠展示思維鏈全過程,更方便人類與AI交流,業(yè)內(nèi)人士甚至稱之為當(dāng)前最好用的開源模型,但也不需要過度“神化”Deepseek。

首先,從使用體驗(yàn)來看,Deepseek尚無法承受蜂擁而至的流量。其實(shí),Deepseek在年前便已經(jīng)小范圍的“爆火”,其當(dāng)時(shí)尚能同時(shí)使用深度思考和聯(lián)網(wǎng)功能,輸出的文章框架和成文確實(shí)比較驚艷。

但隨著使用者不斷增多,目前Deepseek已經(jīng)關(guān)閉了聯(lián)網(wǎng)功能,整理輸出質(zhì)量有較大的下降,且大部分時(shí)間Deepseek都呈現(xiàn)“服務(wù)繁忙”的狀態(tài)。

雖然梁文鋒曾表示“商業(yè)化”不是當(dāng)前首要考慮的問題,但按私募基金的體量來推算“幻方”的資金規(guī)模,千億規(guī)模不等于千億資金體量,“幻方”只是在千億規(guī)模上收取管理費(fèi),其跟大廠之間的資金差距還是很大的。

但要繼續(xù)維持C端的使用體驗(yàn),Deepseek必然需要燒錢,后續(xù)如何補(bǔ)充資金,還是調(diào)整使用模式,梁文鋒都需要提出更明確的打法。

其次,目前Deepseek在圖文、視頻方面的能力是缺失的,現(xiàn)階段要說Deepseek能夠與頭部閉源模型直接打擂臺(tái),恐怕還為時(shí)尚早。

不過,其發(fā)展也給Open AI,以及更多垂直模型帶來了壓力,相信將能在一定程度上推動(dòng)整個(gè)大模型生態(tài)的發(fā)展。

最后,Deepseek依然面臨著政策、數(shù)據(jù)安全等爭(zhēng)議,要走向全球依然是漫漫長(zhǎng)路;此外,其在計(jì)算資源與算力方面依然受限,這意味著國(guó)產(chǎn)硬件還需要繼續(xù)努力,才能支撐軟件的不斷創(chuàng)新。

當(dāng)然,對(duì)于全球大模型行業(yè)來說,有競(jìng)爭(zhēng)才有動(dòng)力,就像智能手機(jī)行業(yè)一樣,參與者多了,行業(yè)盤子就會(huì)越來越多,也才有機(jī)會(huì)爆發(fā)出更多的機(jī)會(huì)。

Deepseek的出現(xiàn)就像是國(guó)內(nèi)大模型行業(yè)的一點(diǎn)“火花”,既是思維碰撞的突破,也是靈感乍現(xiàn)的瞬間。接下來,相信還需要國(guó)內(nèi)大模型行業(yè)在軟硬件方面的持續(xù)創(chuàng)新,才能抓住這一機(jī)遇,讓中國(guó)科技行業(yè)能夠從“跟隨者”向“引領(lǐng)者”進(jìn)發(fā)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大廠“擁抱”Deepseek,打不過就加入?

技術(shù)上的逆襲,尚不足以徹底震驚科技界,真正引爆Deepseek的變量,其實(shí)是“開源”。

文|新媒科技評(píng)論

這個(gè)春節(jié),人工智能無疑成為了社交話題的C位,前有人形機(jī)器人在春晚跳扭秧歌而出圈,后有“Deepseek”的強(qiáng)勢(shì)崛起。

網(wǎng)友們瘋狂涌入Deepseek,有人找Deepseek算命,有人問Deepseek怎樣才能暴富,還有科技金融行業(yè)的打工人,年還沒有過完,就得忙著加班寫研報(bào)、測(cè)試模型。

但海外市場(chǎng)對(duì)此卻態(tài)度微妙,OpenAI一度宣稱Deepseek“偷竊”了其“技術(shù)成果”,但一轉(zhuǎn)頭,微軟、英偉達(dá)等大廠都宣布在自家產(chǎn)品中接入Deepseek,OpenAI CEO山姆·奧特曼更表示Deepseek的R1模型“令人印象深刻”。

國(guó)內(nèi)的互聯(lián)網(wǎng)巨頭們也沒有錯(cuò)失這波Deepseek的熱度,2月6日,有道正式宣布全面擁抱DeepSeek-R1。此外,Hi Echo、有道智云、QAnything等產(chǎn)品也將全面接入DeepSeek的推理能力,并于近日陸續(xù)升級(jí)。

一時(shí)之間,這場(chǎng)AI大模型的技術(shù)迭代,不知不覺就演變成全球科技行業(yè)的現(xiàn)象級(jí)事件,Deepseek也被視為引領(lǐng)大模型行業(yè)從“大而全”到“小而美”的全新變量。

但熱鬧過后,Deepseek還需要回答更多的新問題,全球大模型行業(yè)該如何抓住“變革的火花”,或許才是接下來的關(guān)鍵。

三大變量引爆Deepseek

在普通用戶看來,Deepseek是在此次中美大模型技術(shù)之爭(zhēng)中“一戰(zhàn)成名”,但更早之前,Deepseek便已經(jīng)因?yàn)椤皟r(jià)格便宜”而被AI圈廣泛關(guān)注。

去年中,國(guó)內(nèi)大模型行業(yè)大打“價(jià)格戰(zhàn)”,但第一個(gè)“挑起戰(zhàn)火”的并非阿里、百度等大廠,而是Deepseek,彼時(shí)其新推出的DeepSeek-V2價(jià)格僅為 GPT-4-Turbo 的百分之一左右。

此次“降價(jià)”也讓Deepseek被冠以“AI界拼多多”之稱,但相較于大廠們的“以價(jià)換市場(chǎng)”的慣常做法,Deepseek對(duì)于“降價(jià)”并沒有太多壓力,因?yàn)槠浣祪r(jià)之后也仍有利潤(rùn)。

事實(shí)上,這才是Deepseek能夠震驚全球科技界的主要原因,其能夠以更低的成本換來更高的性能,顛覆了過去大模型行業(yè)依靠堆顯卡、堆資本來發(fā)展AI的“Scaling law”。

這是因?yàn)镈eepseek的模型訓(xùn)練路徑不同于傳統(tǒng)通用大模型,以ChatGPT為代表的傳統(tǒng)AI,主要采用監(jiān)督微調(diào)(簡(jiǎn)稱 SFT)作為大模型訓(xùn)練的核心環(huán)節(jié),即通過人工標(biāo)注數(shù)據(jù)進(jìn)行監(jiān)督訓(xùn)練,再結(jié)合強(qiáng)化學(xué)習(xí)進(jìn)行優(yōu)化,本質(zhì)上大模型并不會(huì)思考,只是通過模仿人類思維方式來提升推理能力。

但在1月底發(fā)布的Deepseek-R1-Zero卻顛覆了這一規(guī)則,其對(duì)模型架構(gòu)進(jìn)行了全方位創(chuàng)新,通過單純的強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練實(shí)現(xiàn)推理能力。簡(jiǎn)單來說,SFT是人類生成數(shù)據(jù),機(jī)器學(xué)習(xí);而RL是機(jī)器生成數(shù)據(jù),機(jī)器學(xué)習(xí)。

除此以外,據(jù)每日財(cái)經(jīng)新聞報(bào)道,DeepSeek創(chuàng)新性地同時(shí)使用了FP8、MLA(多頭潛在注意力)和MoE(利用混合專家架構(gòu))三種技術(shù)。

其中,相較于其他模型使用的MoE架構(gòu),DeepSeek-V3的更為精簡(jiǎn)有效,其就像是醫(yī)院的“分診制度”,可以將大模型拆分成多個(gè)“專家”,訓(xùn)練時(shí)分工協(xié)作,推理時(shí)根據(jù)任務(wù)分配給最適合的專家模塊。據(jù)悉,Deepseek能夠?qū)o效訓(xùn)練從傳統(tǒng)模型的90%降低至60%。

在Deepseek-R1發(fā)布后,一位Meta員工在美國(guó)匿名職場(chǎng)社區(qū)teamblind上留言,稱Deepseek最近的一系列動(dòng)作讓Meta的生成式AI團(tuán)隊(duì)陷入了恐慌。

據(jù)這位員工爆料,“Meta一個(gè)負(fù)責(zé)AI項(xiàng)目的高管年薪拿出來,就足夠訓(xùn)練Deepseek了”。據(jù)每日經(jīng)濟(jì)新聞報(bào)道,Deepseek R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,還不到OpenAI GPT-4o模型訓(xùn)練成本的十分之一。

但從實(shí)際性能來看,Deepseek-R1已經(jīng)能夠比肩OpenAI-o1正式版,特別是在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上。

在美國(guó)數(shù)學(xué)競(jìng)賽(AMC)以及全球頂級(jí)編程競(jìng)賽(codeforces)等權(quán)威評(píng)測(cè)中,DeepSeek-R1-Lite-Preview 模型已經(jīng)大幅超越了 GPT-4o 等頂尖模型,有三項(xiàng)成績(jī)還領(lǐng)先于 OpenAI o1-preview。

除了“低成本、高算力”這一突破之外,Deepseek之所以在這個(gè)春節(jié)“燃起來”,還因?yàn)槠渚谷徊皇浅鲎詡鹘y(tǒng)的大廠,而是一家量化基金公司。

Deepseek成立于2023年12月,在此之前,其創(chuàng)始人梁文鋒于2015年便成立了名為“幻方量化”的量化對(duì)沖基金,可以說Deepseek的前身其實(shí)是服務(wù)于量化交易的。

這樣的背景也為Deepseek增添了更多“看點(diǎn)”,比如梁文鋒之所以不差錢,是因?yàn)槠湓诹炕灰咨腺嵉蔑L(fēng)生水起,網(wǎng)友甚至戲稱Deepseek的訓(xùn)練成本是來自于造空英偉達(dá)。

還有背靠千億量化基金的梁文鋒,明明可以選擇輕松躺賺,卻選擇投身到全球創(chuàng)新的浪潮里,他坦言“對(duì)AGI的好奇與探索比商業(yè)回報(bào)更具驅(qū)動(dòng)力”,這種一往無前的“理想主義”,想讓也讓Deepseek的“故事”變得更加動(dòng)人。

大廠打不過就加入

不過,技術(shù)上的逆襲,尚不足以徹底震驚科技界,真正引爆Deepseek的變量,其實(shí)是“開源”。據(jù)悉,Deepseek已經(jīng)把模型架構(gòu)和參數(shù)開源,在大模型公司普遍選擇閉源的當(dāng)下,訓(xùn)練數(shù)據(jù)的開源在業(yè)界少有先例。

梁文鋒曾在媒體采訪中表示,“過去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過來做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。我們的出發(fā)點(diǎn)不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展?!?/p>

從商業(yè)角度來看,“開源”是不是一個(gè)更佳的策略,尚難以下定論。畢竟訓(xùn)練模型需要成本,招攬用戶也需要推廣費(fèi)用,從此前字節(jié)豆包大規(guī)模投放廣告、kimi多次接受融資就可以看出,大模型公司有自己的難處。

但對(duì)于中國(guó)大模型行業(yè)來說,或許正是梁文鋒的“理想主義”,才讓Deepseek能夠成為顛覆行業(yè)格局的“變量”。

一方面,開源將能吸引更多大廠和技術(shù)人才加入,通過共建共創(chuàng)讓Deepseek變得更加強(qiáng)大,從而推動(dòng)整個(gè)人工智能大模型生態(tài)的發(fā)展,形成一個(gè)全新的生態(tài)。

梁文鋒曾對(duì)媒體表示,公司未來不會(huì)像OpenAI一樣選擇從開源走向閉源,“我們認(rèn)為先有一個(gè)強(qiáng)大的技術(shù)生態(tài)更重要” 。

另一方面,對(duì)于以O(shè)penAI為代表的競(jìng)爭(zhēng)對(duì)手來說,這也是一個(gè)致命的打擊。畢竟,當(dāng)一個(gè)旗鼓相當(dāng)?shù)?,還是免費(fèi)的產(chǎn)品出現(xiàn)在消費(fèi)者面前,大家難免就會(huì)進(jìn)行比較,誰的性價(jià)比更高,誰的性能更優(yōu)秀,都需要實(shí)打?qū)嵉氖褂眯Ч麃眚?yàn)證,而不僅僅只是“吹泡沫”。

而率先作出選擇的,便是一眾海外大廠,目前包括英偉達(dá)、英特爾、亞馬遜、微軟、AMD、等海外科技大廠,均宣布在自家產(chǎn)品中接入Deepseek。

值得一提的是,歐美多國(guó)對(duì)于Deepseek的安全性、隱私問題依然存在質(zhì)疑。美國(guó)多位官員表示正在對(duì)Deepseek開展國(guó)家安全調(diào)查,包括國(guó)防部、國(guó)會(huì)和NASA等部門均被要求禁用Deepseek。

此外,據(jù)彭博社等媒體報(bào)道,微軟還曾調(diào)查 OpenAI 技術(shù)輸出的數(shù)據(jù)是否被中國(guó)的Deepseek團(tuán)隊(duì)以未經(jīng)授權(quán)的方式獲取,比如通過“蒸餾技術(shù)”非法獲取其模型輸出數(shù)據(jù)。

但在這些爭(zhēng)議尚未解決之前,大廠們顯然已經(jīng)迫不及待想要加入Deepseek生態(tài),本質(zhì)上還是基于“利益至上”的原則。

據(jù)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系和電子工程系副教授吳恩達(dá)表示,OpenAI - o1模型每百萬輸出token 的成本為60美元,而Deepseek-R1 則僅需 2.19 美元,這接近30倍的成本差距,相信大廠們也會(huì)算賬。

其次則是生態(tài)效應(yīng),吳恩達(dá)認(rèn)為,“降價(jià)”+“開源”正在將基礎(chǔ)模型層商品化,為應(yīng)用開發(fā)者創(chuàng)造了巨大的機(jī)遇。盡早加入這一生態(tài),讓自家大模型與之相結(jié)合,也有望帶來更多創(chuàng)新體驗(yàn),“收攏”部分DeepSeek用戶的需求。

因此,除了海外大廠之外,諸如阿里云、百度云等國(guó)內(nèi)大廠也開始集中接入Deepseek,在各自平臺(tái)提供的適配服務(wù),打不過就加入,才能共享創(chuàng)新紅利。

乘上Deepseek的東風(fēng)

事實(shí)上,在開春爆火的Deepseek,不僅為大模型行業(yè)帶來了一陣“春風(fēng)”,對(duì)于普通用戶來說,也帶來了更多新機(jī)會(huì)。

第一批利用Deepseek搞錢的人已經(jīng)出現(xiàn)了,跟彼時(shí)橫空出世的ChatGPT一樣,面對(duì)更加智能、更加高效的大模型,AI取代人類的焦慮感,再次成為收割用戶的“武器”。

社交平臺(tái)上已經(jīng)出現(xiàn)了不少“如何使用Deepseek進(jìn)行XXX”的課程,面向社交媒體、電商、廣告等不同行業(yè)的應(yīng)用和變現(xiàn)。

當(dāng)然,學(xué)習(xí)新知識(shí)肯定是沒錯(cuò)的,但相較于被焦慮感“收割”,并淪為大V私域流量中的一員,大家不妨根據(jù)自己的實(shí)際工作和擅長(zhǎng)內(nèi)容,先上手試用一下Deepseek。

目前來看,Deepseek在技術(shù)上確實(shí)有意想不到的突破,對(duì)于普通用戶來說,其能夠展示思維鏈全過程,更方便人類與AI交流,業(yè)內(nèi)人士甚至稱之為當(dāng)前最好用的開源模型,但也不需要過度“神化”Deepseek。

首先,從使用體驗(yàn)來看,Deepseek尚無法承受蜂擁而至的流量。其實(shí),Deepseek在年前便已經(jīng)小范圍的“爆火”,其當(dāng)時(shí)尚能同時(shí)使用深度思考和聯(lián)網(wǎng)功能,輸出的文章框架和成文確實(shí)比較驚艷。

但隨著使用者不斷增多,目前Deepseek已經(jīng)關(guān)閉了聯(lián)網(wǎng)功能,整理輸出質(zhì)量有較大的下降,且大部分時(shí)間Deepseek都呈現(xiàn)“服務(wù)繁忙”的狀態(tài)。

雖然梁文鋒曾表示“商業(yè)化”不是當(dāng)前首要考慮的問題,但按私募基金的體量來推算“幻方”的資金規(guī)模,千億規(guī)模不等于千億資金體量,“幻方”只是在千億規(guī)模上收取管理費(fèi),其跟大廠之間的資金差距還是很大的。

但要繼續(xù)維持C端的使用體驗(yàn),Deepseek必然需要燒錢,后續(xù)如何補(bǔ)充資金,還是調(diào)整使用模式,梁文鋒都需要提出更明確的打法。

其次,目前Deepseek在圖文、視頻方面的能力是缺失的,現(xiàn)階段要說Deepseek能夠與頭部閉源模型直接打擂臺(tái),恐怕還為時(shí)尚早。

不過,其發(fā)展也給Open AI,以及更多垂直模型帶來了壓力,相信將能在一定程度上推動(dòng)整個(gè)大模型生態(tài)的發(fā)展。

最后,Deepseek依然面臨著政策、數(shù)據(jù)安全等爭(zhēng)議,要走向全球依然是漫漫長(zhǎng)路;此外,其在計(jì)算資源與算力方面依然受限,這意味著國(guó)產(chǎn)硬件還需要繼續(xù)努力,才能支撐軟件的不斷創(chuàng)新。

當(dāng)然,對(duì)于全球大模型行業(yè)來說,有競(jìng)爭(zhēng)才有動(dòng)力,就像智能手機(jī)行業(yè)一樣,參與者多了,行業(yè)盤子就會(huì)越來越多,也才有機(jī)會(huì)爆發(fā)出更多的機(jī)會(huì)。

Deepseek的出現(xiàn)就像是國(guó)內(nèi)大模型行業(yè)的一點(diǎn)“火花”,既是思維碰撞的突破,也是靈感乍現(xiàn)的瞬間。接下來,相信還需要國(guó)內(nèi)大模型行業(yè)在軟硬件方面的持續(xù)創(chuàng)新,才能抓住這一機(jī)遇,讓中國(guó)科技行業(yè)能夠從“跟隨者”向“引領(lǐng)者”進(jìn)發(fā)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。