正在閱讀:

國(guó)產(chǎn)大模型之戰(zhàn):是危險(xiǎn)競(jìng)賽還是iPhone時(shí)刻?

掃一掃下載界面新聞APP

國(guó)產(chǎn)大模型之戰(zhàn):是危險(xiǎn)競(jìng)賽還是iPhone時(shí)刻?

危機(jī)感與恐懼是最好的原動(dòng)力。

文 | 財(cái)經(jīng)無(wú)忌 山核桃

熱火烹油的大模型賽道打起了“嘴仗”。

搜狗前CEO王小川評(píng)價(jià)百度創(chuàng)始人李彥宏的采訪發(fā)言稱:“你們采訪的可能是平行世界的他,不是我們這個(gè)世界里的?!?/p>

而針對(duì)王小川的評(píng)論,百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)又回應(yīng)道:“王小川脫離一線太久,確實(shí)跟我們不在一個(gè)宇宙,自然對(duì)國(guó)內(nèi)人工智能技術(shù)的發(fā)展缺乏了解?!?/p>

意外的是,王小川在14日凌晨又“嘲諷”了一把,稱對(duì)方是“脫離一線15年的人,去懟離開(kāi)1.5年的人”。

這場(chǎng)爭(zhēng)論也暴露出創(chuàng)業(yè)派與大廠間微妙的競(jìng)爭(zhēng)關(guān)系。

毋庸置疑,大模型技術(shù)徹底點(diǎn)燃了科技圈的熱情,創(chuàng)業(yè)者忙著招兵買馬,生怕錯(cuò)過(guò)了新風(fēng)口;一級(jí)市場(chǎng)關(guān)于大模型的投融資熱度攀升,不少FA們甚至跑去B站開(kāi)始惡補(bǔ)AI知識(shí)。

政策端也在吹來(lái)暖風(fēng),北京市經(jīng)濟(jì)和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》顯示,今年,北京將支持頭部企業(yè)打造對(duì)標(biāo)ChatGPT的大模型。

熱鬧只是硬幣的A面。

無(wú)論是忙著官宣大模型的科技大廠,還是廣發(fā)英雄帖的創(chuàng)業(yè)公司,身處這股浪潮之中的人們都在思考一些關(guān)鍵問(wèn)題:率先做出第一個(gè)中國(guó)版GPT的是誰(shuí)?還有多久才能做出來(lái)?市場(chǎng)格局又會(huì)是發(fā)生怎樣的變化?

這些問(wèn)題都難以給出正確的答案,事實(shí)上,也沒(méi)有人能給出準(zhǔn)確的回答。畢竟,人們總是高估一項(xiàng)科技所帶來(lái)的短期效益,卻又低估它的長(zhǎng)期影響。

本文將圍繞當(dāng)下中國(guó)的大模型競(jìng)爭(zhēng)現(xiàn)狀,基于行業(yè)資料與研究,主要回答三個(gè)問(wèn)題:

1. 為什么國(guó)內(nèi)科技公司要紛紛競(jìng)逐大模型?

2. 火熱背后,中國(guó)科技公司究竟缺什么?

3. 中國(guó)科技公司“大模型之戰(zhàn)”的走向會(huì)是什么?

為什么極客們都愛(ài)大模型?

理解中國(guó)科技巨頭們的“大模型焦慮”,一張產(chǎn)品發(fā)布時(shí)刻表就夠了。

在OpenAI發(fā)布GPT-4大模型后,百度用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,53歲的周鴻祎決定“把剛出生的孩子抱出來(lái)給大家看看”,他推出360的大模型產(chǎn)品,甚至倉(cāng)促到名字都要現(xiàn)場(chǎng)取。

隨后的一個(gè)多月里,科技巨頭、創(chuàng)業(yè)公司與高校研究院們展開(kāi)了一輪關(guān)于“大模型”的軍備競(jìng)賽,整個(gè)4月可以被稱為“大模型的發(fā)布月”,繼百度之后,華為、商湯、阿里已在4月亮出自己的大模型產(chǎn)品。

最新的消息是,京東計(jì)劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”,被視為“京東版”ChatGPT。

大模型也成為了互聯(lián)網(wǎng)大佬扎堆二次創(chuàng)業(yè)的熱門賽道。

原美團(tuán)聯(lián)合創(chuàng)始人王惠文、創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù)、前京東AI掌門人周伯文、前阿里技術(shù)副總裁賈揚(yáng)清等均入局創(chuàng)業(yè)。前搜狗CEO王小川的百川智能已完成了5000萬(wàn)美元融資,王小川給了自己一個(gè)DDL:“今年年底做到國(guó)內(nèi)最好的”。

一位業(yè)內(nèi)人士這樣形容當(dāng)下百花齊放的圖景:“(這波創(chuàng)業(yè))很像2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮?!?/p>

普通讀者們很難理解科技圈對(duì)大模型的擁躉,畢竟類似的創(chuàng)業(yè)潮在元宇宙、XR行業(yè)也都復(fù)現(xiàn)過(guò)。但如果深入理解人工智能的發(fā)展歷史與傳統(tǒng)AI時(shí)代的困境,就能理解為何這群極客們?nèi)绱藷釔?ài)大模型。

關(guān)于大模型的定義,OpenAI創(chuàng)始人Altman與李開(kāi)復(fù)更愿意將大模型定義為“一種新技術(shù)平臺(tái)”,而學(xué)界則將“大模型”對(duì)比“小模型”,定義為一種“基于大量數(shù)據(jù)訓(xùn)練的、擁有巨量參數(shù)的模型”,這種模型能適應(yīng)廣泛的下游任務(wù)。

在AI1.0時(shí)代,比起創(chuàng)業(yè)者對(duì)AI智能化的疾呼,大多數(shù)人對(duì)人工智能只停留在一些單一場(chǎng)景產(chǎn)品端的理解。

例如人工智能客服、人工智能質(zhì)檢等,上述場(chǎng)景都是針對(duì)一項(xiàng)任務(wù)具體開(kāi)發(fā)一個(gè)專用小模型,并不具備“理解能力”。就像周鴻祎將此前的人工智能產(chǎn)品形容為“人工智障”,在他看來(lái):“在GPT之前,從來(lái)沒(méi)有一個(gè)人工智能的產(chǎn)品能真正的理解我們這個(gè)世界?!?/p>

從人工智障到人工智能的進(jìn)化,大模型的出現(xiàn)意味著人們正式進(jìn)入到AI2.0時(shí)代,這背后是大模型的涌現(xiàn)性使然。

涌現(xiàn)是人工智能領(lǐng)域經(jīng)常會(huì)被提及到的概念,代表一種從量變到質(zhì)變的過(guò)程,當(dāng)數(shù)據(jù)規(guī)模足夠大,參數(shù)達(dá)到千億級(jí),即使在沒(méi)有專門訓(xùn)練過(guò)的領(lǐng)域,AI也能涌現(xiàn)出知識(shí)理解和邏輯推理能力,華東政法大學(xué)人工智能與大數(shù)據(jù)指數(shù)研究院將“涌現(xiàn)性”定義為一個(gè)“多種技術(shù)融合的結(jié)果”:“(大模型)有效集成自然語(yǔ)言處理等多個(gè)人工智能核心研究領(lǐng)域的多項(xiàng)技術(shù),實(shí)現(xiàn)1+1>2的融合式涌現(xiàn)?!?/p>

換言之,大模型有望解決“人工智能如何理解世界”的問(wèn)題,實(shí)則提供了一條可能邁向AGI(通用人工智能)的可能性。

另一方面,大模型的通用性也在激發(fā)更多的商業(yè)圖景,解決了AI1.0時(shí)代的諸多問(wèn)題。

在上一波AI創(chuàng)業(yè)潮中,總結(jié)AI企業(yè)所面臨的問(wèn)題主要兩點(diǎn):一是成本問(wèn)題,清洗與標(biāo)注海量的數(shù)據(jù)需要耗費(fèi)巨大的成本,商湯科技聯(lián)合創(chuàng)始人、副總裁楊帆曾表示,對(duì)于每一個(gè)新場(chǎng)景,公司都要重新收集新數(shù)據(jù),搭建定制化模型。

這種開(kāi)發(fā)模式很像“小作坊”,不但解決問(wèn)題的成本極高,開(kāi)發(fā)模式也十分低效。

在實(shí)際落地過(guò)程中,應(yīng)用場(chǎng)景的復(fù)雜性導(dǎo)致AI應(yīng)用的“孤島化”,李開(kāi)復(fù)曾提到一個(gè)例子:“如果今天一家銀行想做AI應(yīng)用,但沒(méi)有任何數(shù)據(jù)可以用來(lái)冷啟動(dòng),還要收集、清洗、標(biāo)注數(shù)據(jù),再去做模型,整個(gè)過(guò)程代價(jià)都很大。”

而當(dāng)大模型已成為上層應(yīng)用的技術(shù)底座,可以實(shí)現(xiàn)在AI1.0時(shí)代無(wú)法實(shí)現(xiàn)的跨領(lǐng)域部署,支撐終端、平臺(tái)、系統(tǒng)等產(chǎn)品應(yīng)用落地。這種像搭積木一樣“組合創(chuàng)新”的可能性,以及商業(yè)化的能力就像ChatGPT一樣,人們不僅發(fā)現(xiàn),它可以深夜聊天,撫慰人心,還會(huì)寫程序和講故事。

成本問(wèn)題之外,并不具備通用能力的小模型,由于無(wú)法向行業(yè)進(jìn)行推廣與復(fù)用,難以形成規(guī)模效應(yīng),也就更難言盈利。

這種“通用性”激發(fā)出諸多新的商業(yè)圖景,可以將其理解為AI時(shí)代的“操作系統(tǒng)”,在降低開(kāi)發(fā)成本的同時(shí),人人都可以是開(kāi)發(fā)者,由此發(fā)現(xiàn)與生產(chǎn)出新的產(chǎn)品與應(yīng)用場(chǎng)景。

找錢、找人、找應(yīng)用場(chǎng)景

大模型競(jìng)賽的槍響之后,創(chuàng)投行業(yè)又復(fù)現(xiàn)“元宇宙”的熱潮。

有大模型企業(yè)1個(gè)月見(jiàn)的投資人相當(dāng)于去年一整年。一級(jí)市場(chǎng)關(guān)于大模型的投融資熱度攀升,不少FA們甚至跑去B站開(kāi)始惡補(bǔ)AI知識(shí),生怕錯(cuò)過(guò)一個(gè)好項(xiàng)目。

但搶到這張通往新世界的“船票”并非容易,區(qū)別于AI1.0時(shí)代,找錢、找人與找應(yīng)用場(chǎng)景的焦慮,在這一波競(jìng)逐中,體現(xiàn)的尤為明顯。

首先是找錢。參考多位創(chuàng)業(yè)者的觀點(diǎn),2億美元是行業(yè)普遍認(rèn)為的啟動(dòng)資金。拆解來(lái)看,以硬件成本為例,研究機(jī)構(gòu)TrendForce在一份報(bào)告中指出,要處理1800億參數(shù)的GPT-3.5大型模型,需要的GPU芯片數(shù)量高達(dá)2萬(wàn)顆,未來(lái)GPT大模型商業(yè)化所需的GPU芯片數(shù)量甚至?xí)^(guò)3萬(wàn)顆。

僅在算力門檻上,很多創(chuàng)業(yè)企業(yè)便無(wú)力與大廠抗衡。

因此,表面上熱火朝天的大模型賽道,風(fēng)大“魚”貴,但實(shí)際投資人們心里也知道,僅靠幾張PPT創(chuàng)新的時(shí)代過(guò)去了,投資既是要投靠譜的人,也要考慮賽道與具體的商業(yè)路徑,畢竟,錢也一定要投在刀刃上。

云啟資本合伙人陳昱在接受《甲子光年》采訪時(shí)就表示:“做大模型創(chuàng)業(yè)的公司要融到大錢不容易了?!?/p>

英諾天使基金合伙人王晟曾表示,“我們也經(jīng)?!⒄撐摹吹紸I領(lǐng)域里很棒的論文,直接就去找作者了,看他是一個(gè)學(xué)霸,還是有創(chuàng)業(yè)潛質(zhì)、業(yè)務(wù)沒(méi)有商業(yè)化的潛力,如果合適,我們也會(huì)建議他創(chuàng)業(yè)并考慮投資?!?/p>

比起AI1.0時(shí)代的純科學(xué)家創(chuàng)業(yè),AI2.0時(shí)代更像是一場(chǎng)互聯(lián)網(wǎng)大佬與科學(xué)家們的“集體二次創(chuàng)業(yè)”。

能夠融到“大錢”的要么是有創(chuàng)始人經(jīng)歷或個(gè)人魅力背書,要么就是此前長(zhǎng)期跟蹤孵化,雙方一直保持著良好的合作關(guān)系。

比如,目前融資總額已達(dá)數(shù)億元的瀾舟科技是創(chuàng)新工場(chǎng)從0到1孵化出的企業(yè),而由前京東技術(shù)委員會(huì)主席周伯文創(chuàng)立的銜遠(yuǎn)科技,背后的參投方啟明創(chuàng)投等均是AI領(lǐng)域的長(zhǎng)期捕手。

其次,找到合適的人也并不容易,在這一點(diǎn)上,科技巨頭與創(chuàng)業(yè)公司面臨相同的處境。在一檔播客節(jié)目中,已宣布加入光年之外的北京智源人工智能研究院副院長(zhǎng)劉江曾發(fā)出呼吁:“所有的同學(xué),如果你是AI的頂級(jí)人才,或者有這樣的人,歡迎來(lái)到光年之外?!?/p>

“大數(shù)據(jù)+強(qiáng)算法+大算力”被視為支撐大模型落地的重要公式,大廠有算力,也有數(shù)據(jù),能夠提供標(biāo)準(zhǔn)化的產(chǎn)品,但算法背后對(duì)應(yīng)的則是人才。大廠很難留住強(qiáng)算法人才的原因在于,大模型投入是一件長(zhǎng)期主義的事,必定會(huì)面臨與既有業(yè)務(wù)之間的沖突,從大廠出走的諸多大模型創(chuàng)業(yè)者的經(jīng)歷已然說(shuō)明了這一點(diǎn)。

而對(duì)創(chuàng)業(yè)公司而言,即便有首席科學(xué)家的支撐,找到合適的人也并不容易。

聆心智能創(chuàng)始人、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授黃民烈認(rèn)為,如OpenAI這種技術(shù)見(jiàn)長(zhǎng)的公司需要很多特別牛的工程技術(shù)人才。

對(duì)創(chuàng)業(yè)企業(yè)而言,回到前述的融資環(huán)境下,無(wú)論是基于創(chuàng)始人的背景背書,抑或是資源合作,都需要長(zhǎng)期積淀。

同時(shí),在強(qiáng)調(diào)生態(tài)的大模型賽道,創(chuàng)業(yè)型企業(yè)勢(shì)必要面臨來(lái)自投資方、合作方乃至競(jìng)對(duì)間的博弈,一個(gè)合適的伙伴不僅要在自己的細(xì)分領(lǐng)域內(nèi)做到頂尖(懂技術(shù)+懂產(chǎn)品),還有隨時(shí)保持戰(zhàn)略的獨(dú)立性,不輕易站隊(duì)。

最后,能否找到合適的應(yīng)用場(chǎng)景,另辟賽道,并迅速建立護(hù)城河壁壘,這一問(wèn)題也同樣拷問(wèn)著入局者。

百度李彥宏將當(dāng)前的大模型生態(tài)分為三類,他最看好應(yīng)用層的市場(chǎng)機(jī)遇。

第一類是新型云計(jì)算公司,云計(jì)算主流商業(yè)模式將會(huì)從IaaS變?yōu)镸aaS(模型即服務(wù))。

第二類是進(jìn)行行業(yè)模型精調(diào)的公司,介于通用大模型和企業(yè)之間的中間,這類企業(yè)可以基于對(duì)行業(yè)的洞察,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。

第三類是應(yīng)用層的企業(yè),基于通用大語(yǔ)言模型開(kāi)發(fā)應(yīng)用服務(wù),這可能才是真正的機(jī)會(huì)。

區(qū)別于國(guó)外專業(yè)化的分工,當(dāng)前,國(guó)內(nèi)的大模型賽道的創(chuàng)業(yè)模式主要分類是三類:一類是聚焦基礎(chǔ)層,對(duì)標(biāo)OpenAI,發(fā)揮基礎(chǔ)設(shè)施的作用。一類是錨定中間層,不需要如OpenAI一樣花大錢做底層,掌握通用化能力,可以通過(guò)開(kāi)源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。還有一類就是調(diào)用大模型API的企業(yè),專注開(kāi)發(fā)大模型具體場(chǎng)景的應(yīng)用,如Jasper。

如果將大模型比喻成AI時(shí)代的電,那么基礎(chǔ)層與中間層擔(dān)任的都是“發(fā)電廠”的角色,需要極高的門檻,對(duì)資金、技術(shù)以及資源有嚴(yán)格的準(zhǔn)入壁壘,大多也是大公司間的競(jìng)逐。

百度、阿里、華為頭部企業(yè)均采取“模型+工具平臺(tái)+生態(tài)”三層共建模式的模式,推動(dòng)業(yè)務(wù)的正向循環(huán)。

大廠的競(jìng)逐中,也涌現(xiàn)出一些創(chuàng)業(yè)公司,既做大模型,又將其能力輸出至垂直行業(yè),形成定制化模型,雖然避開(kāi)了與有錢有勢(shì)的大廠們的直接競(jìng)爭(zhēng),但也面臨三大難題。

一是數(shù)據(jù)如何才能做專做細(xì),很多行業(yè)定制化模型依舊難以形成數(shù)據(jù)飛輪與場(chǎng)景飛輪。二是大廠極容易摘低垂的果實(shí),垂直大模型實(shí)現(xiàn)復(fù)用的前提是必須要在該行業(yè)建立壁壘與護(hù)城河,即“人無(wú)我有”的競(jìng)爭(zhēng)優(yōu)勢(shì)。三是通用化往往是歷史的趨勢(shì),因此“未來(lái)垂直大模型是否會(huì)最終被通用大模型取代”這一問(wèn)題也值得思考。

大船票or小船票?

人工智能專家侯世達(dá)的學(xué)生梅拉妮·米歇爾在《AI 3.0時(shí)代》里認(rèn)為,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過(guò)度的承諾和媒體炒作,接下來(lái)便是“人工智能的寒冬”。從某種程度上來(lái)說(shuō),這種模式以5~10年為周期在不斷上演。

正在興起的“大模型熱”也必定會(huì)經(jīng)歷從繁榮到擠去泡沫的過(guò)程。

對(duì)中國(guó)的科技公司而言,“能不能做出一個(gè)中國(guó)版GPT”“中國(guó)創(chuàng)業(yè)公司里是否會(huì)出現(xiàn)一個(gè)OpenAI”。對(duì)上述大模型行業(yè)的叩問(wèn),從業(yè)者們看法不一。

李彥宏在被問(wèn)到“中國(guó)創(chuàng)業(yè)公司里會(huì)不會(huì)再出一個(gè)OpenAI?”時(shí),他直接回答“基本不會(huì)了”,“沒(méi)有必要再重新發(fā)明一遍輪子?!?/p>

但另一種觀點(diǎn)也認(rèn)為,中國(guó)攻堅(jiān)大模型依舊難以繞開(kāi)OpenAI,這種危機(jī)感越發(fā)強(qiáng)烈。曠視科技聯(lián)合創(chuàng)始人印奇在接受鈦媒體采訪時(shí)表示,中國(guó)攻堅(jiān) AI 大模型要先把GPT-3.5復(fù)現(xiàn)出來(lái),但面臨長(zhǎng)期技術(shù)創(chuàng)新與短周期商業(yè)化兩重壓力:

“未來(lái)的一段時(shí)間,能不能有一個(gè)公司首先把大模型真的做出來(lái),且性能真的是達(dá)到GPT-3.5,這是所有事情的起點(diǎn)。就像菜你沒(méi)有炒過(guò),不知道鹽和味精怎么放,而且GPT所消耗的資源、門檻都非常高。”

是崇尚“大算力+大數(shù)據(jù)+強(qiáng)算法”的暴力美學(xué),還是專注將一個(gè)垂直模型做透做專?中國(guó)企業(yè)的機(jī)會(huì)又在哪里?又可以在哪些方面深耕與挖掘?

這些問(wèn)題的答案都亟待解決。

與此同時(shí),人們也關(guān)注大模型行業(yè)未來(lái)的市場(chǎng)格局演進(jìn)。未來(lái)究竟是兩三家企業(yè)間的競(jìng)爭(zhēng),還是百花齊放?“大船票”和“小船票”或牽引企業(yè)走向不一樣的結(jié)局。

在關(guān)于大模型的這場(chǎng)游戲中,盡管尚未看到終局,但對(duì)入局者而言,有兩大方向是確定的:

一個(gè)是應(yīng)用與場(chǎng)景先行的邏輯。國(guó)產(chǎn)大模型極為強(qiáng)調(diào)產(chǎn)業(yè)側(cè)的價(jià)值,一方面當(dāng)前中國(guó)智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化實(shí)踐本就有廣闊的市場(chǎng)需求,另一方面在2B生態(tài)下,基于垂直應(yīng)用的實(shí)踐本身也有利于形成數(shù)據(jù)飛輪與場(chǎng)景飛輪。

以金融業(yè)為例,BloombergGPT的誕生已說(shuō)明了這一領(lǐng)域既有數(shù)據(jù)基礎(chǔ),也有多元化場(chǎng)景需求。但在此前的實(shí)踐中,存在的問(wèn)題一是數(shù)據(jù)量龐大,AI專家培養(yǎng)成本高,因此只有頭部銀行機(jī)構(gòu)愿意嘗試。二是金融機(jī)構(gòu)對(duì)業(yè)務(wù)的連續(xù)性與數(shù)據(jù)的準(zhǔn)確性有著嚴(yán)苛要求,因此也對(duì)大模型廠商對(duì)行業(yè)的理解能力提出了高要求。

換言之,回到業(yè)務(wù)本質(zhì),需要什么就用什么。

通用意味著泛化,這為能夠輸出精準(zhǔn)能力的企業(yè)提供了機(jī)會(huì)窗口。如果能將一個(gè)垂直領(lǐng)域做專做透,用高質(zhì)量的數(shù)據(jù)持續(xù)優(yōu)化模型,將價(jià)值鏈做長(zhǎng)。對(duì)創(chuàng)企而言,金融、醫(yī)療、教育等領(lǐng)域都有市場(chǎng)空間。

二是先行者已提供了路線參照。如周鴻祎所言,差距并非是天壤之別,路線已經(jīng)明確。周鴻祎指出:“發(fā)展大語(yǔ)言模型,別人已經(jīng)指明了技術(shù)路線,剩下的就是長(zhǎng)期主義指導(dǎo)下的時(shí)間問(wèn)題。”

很難回答,此輪的大模型競(jìng)逐是否是人工智能競(jìng)賽浪潮最后的哨聲,但幾乎每個(gè)從業(yè)者都害怕自己會(huì)成為“最后的一個(gè)”??萍即蠊緜兛謶直活嵏?,創(chuàng)業(yè)公司恐懼被大公司們顛覆,更大的恐懼則來(lái)自于大模型超越摩爾定律的技術(shù)迭代速度。

而在商業(yè)世界里,危機(jī)與恐懼往往是最好的原動(dòng)力。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

百度

6k
  • 李彥宏堅(jiān)稱不做視頻生成模型,中國(guó)版Sora到底值不值得做?
  • 百度智能云海東數(shù)據(jù)標(biāo)注基地正式啟動(dòng)

京東

7.1k
  • 京東在珠海成立貿(mào)易公司,含新能源汽車整車銷售業(yè)務(wù)
  • 這個(gè)11.11,京東交出了怎樣的答卷?

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

國(guó)產(chǎn)大模型之戰(zhàn):是危險(xiǎn)競(jìng)賽還是iPhone時(shí)刻?

危機(jī)感與恐懼是最好的原動(dòng)力。

文 | 財(cái)經(jīng)無(wú)忌 山核桃

熱火烹油的大模型賽道打起了“嘴仗”。

搜狗前CEO王小川評(píng)價(jià)百度創(chuàng)始人李彥宏的采訪發(fā)言稱:“你們采訪的可能是平行世界的他,不是我們這個(gè)世界里的?!?/p>

而針對(duì)王小川的評(píng)論,百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)又回應(yīng)道:“王小川脫離一線太久,確實(shí)跟我們不在一個(gè)宇宙,自然對(duì)國(guó)內(nèi)人工智能技術(shù)的發(fā)展缺乏了解?!?/p>

意外的是,王小川在14日凌晨又“嘲諷”了一把,稱對(duì)方是“脫離一線15年的人,去懟離開(kāi)1.5年的人”。

這場(chǎng)爭(zhēng)論也暴露出創(chuàng)業(yè)派與大廠間微妙的競(jìng)爭(zhēng)關(guān)系。

毋庸置疑,大模型技術(shù)徹底點(diǎn)燃了科技圈的熱情,創(chuàng)業(yè)者忙著招兵買馬,生怕錯(cuò)過(guò)了新風(fēng)口;一級(jí)市場(chǎng)關(guān)于大模型的投融資熱度攀升,不少FA們甚至跑去B站開(kāi)始惡補(bǔ)AI知識(shí)。

政策端也在吹來(lái)暖風(fēng),北京市經(jīng)濟(jì)和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》顯示,今年,北京將支持頭部企業(yè)打造對(duì)標(biāo)ChatGPT的大模型。

熱鬧只是硬幣的A面。

無(wú)論是忙著官宣大模型的科技大廠,還是廣發(fā)英雄帖的創(chuàng)業(yè)公司,身處這股浪潮之中的人們都在思考一些關(guān)鍵問(wèn)題:率先做出第一個(gè)中國(guó)版GPT的是誰(shuí)?還有多久才能做出來(lái)?市場(chǎng)格局又會(huì)是發(fā)生怎樣的變化?

這些問(wèn)題都難以給出正確的答案,事實(shí)上,也沒(méi)有人能給出準(zhǔn)確的回答。畢竟,人們總是高估一項(xiàng)科技所帶來(lái)的短期效益,卻又低估它的長(zhǎng)期影響。

本文將圍繞當(dāng)下中國(guó)的大模型競(jìng)爭(zhēng)現(xiàn)狀,基于行業(yè)資料與研究,主要回答三個(gè)問(wèn)題:

1. 為什么國(guó)內(nèi)科技公司要紛紛競(jìng)逐大模型?

2. 火熱背后,中國(guó)科技公司究竟缺什么?

3. 中國(guó)科技公司“大模型之戰(zhàn)”的走向會(huì)是什么?

為什么極客們都愛(ài)大模型?

理解中國(guó)科技巨頭們的“大模型焦慮”,一張產(chǎn)品發(fā)布時(shí)刻表就夠了。

在OpenAI發(fā)布GPT-4大模型后,百度用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,53歲的周鴻祎決定“把剛出生的孩子抱出來(lái)給大家看看”,他推出360的大模型產(chǎn)品,甚至倉(cāng)促到名字都要現(xiàn)場(chǎng)取。

隨后的一個(gè)多月里,科技巨頭、創(chuàng)業(yè)公司與高校研究院們展開(kāi)了一輪關(guān)于“大模型”的軍備競(jìng)賽,整個(gè)4月可以被稱為“大模型的發(fā)布月”,繼百度之后,華為、商湯、阿里已在4月亮出自己的大模型產(chǎn)品。

最新的消息是,京東計(jì)劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”,被視為“京東版”ChatGPT。

大模型也成為了互聯(lián)網(wǎng)大佬扎堆二次創(chuàng)業(yè)的熱門賽道。

原美團(tuán)聯(lián)合創(chuàng)始人王惠文、創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù)、前京東AI掌門人周伯文、前阿里技術(shù)副總裁賈揚(yáng)清等均入局創(chuàng)業(yè)。前搜狗CEO王小川的百川智能已完成了5000萬(wàn)美元融資,王小川給了自己一個(gè)DDL:“今年年底做到國(guó)內(nèi)最好的”。

一位業(yè)內(nèi)人士這樣形容當(dāng)下百花齊放的圖景:“(這波創(chuàng)業(yè))很像2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮?!?/p>

普通讀者們很難理解科技圈對(duì)大模型的擁躉,畢竟類似的創(chuàng)業(yè)潮在元宇宙、XR行業(yè)也都復(fù)現(xiàn)過(guò)。但如果深入理解人工智能的發(fā)展歷史與傳統(tǒng)AI時(shí)代的困境,就能理解為何這群極客們?nèi)绱藷釔?ài)大模型。

關(guān)于大模型的定義,OpenAI創(chuàng)始人Altman與李開(kāi)復(fù)更愿意將大模型定義為“一種新技術(shù)平臺(tái)”,而學(xué)界則將“大模型”對(duì)比“小模型”,定義為一種“基于大量數(shù)據(jù)訓(xùn)練的、擁有巨量參數(shù)的模型”,這種模型能適應(yīng)廣泛的下游任務(wù)。

在AI1.0時(shí)代,比起創(chuàng)業(yè)者對(duì)AI智能化的疾呼,大多數(shù)人對(duì)人工智能只停留在一些單一場(chǎng)景產(chǎn)品端的理解。

例如人工智能客服、人工智能質(zhì)檢等,上述場(chǎng)景都是針對(duì)一項(xiàng)任務(wù)具體開(kāi)發(fā)一個(gè)專用小模型,并不具備“理解能力”。就像周鴻祎將此前的人工智能產(chǎn)品形容為“人工智障”,在他看來(lái):“在GPT之前,從來(lái)沒(méi)有一個(gè)人工智能的產(chǎn)品能真正的理解我們這個(gè)世界?!?/p>

從人工智障到人工智能的進(jìn)化,大模型的出現(xiàn)意味著人們正式進(jìn)入到AI2.0時(shí)代,這背后是大模型的涌現(xiàn)性使然。

涌現(xiàn)是人工智能領(lǐng)域經(jīng)常會(huì)被提及到的概念,代表一種從量變到質(zhì)變的過(guò)程,當(dāng)數(shù)據(jù)規(guī)模足夠大,參數(shù)達(dá)到千億級(jí),即使在沒(méi)有專門訓(xùn)練過(guò)的領(lǐng)域,AI也能涌現(xiàn)出知識(shí)理解和邏輯推理能力,華東政法大學(xué)人工智能與大數(shù)據(jù)指數(shù)研究院將“涌現(xiàn)性”定義為一個(gè)“多種技術(shù)融合的結(jié)果”:“(大模型)有效集成自然語(yǔ)言處理等多個(gè)人工智能核心研究領(lǐng)域的多項(xiàng)技術(shù),實(shí)現(xiàn)1+1>2的融合式涌現(xiàn)。”

換言之,大模型有望解決“人工智能如何理解世界”的問(wèn)題,實(shí)則提供了一條可能邁向AGI(通用人工智能)的可能性。

另一方面,大模型的通用性也在激發(fā)更多的商業(yè)圖景,解決了AI1.0時(shí)代的諸多問(wèn)題。

在上一波AI創(chuàng)業(yè)潮中,總結(jié)AI企業(yè)所面臨的問(wèn)題主要兩點(diǎn):一是成本問(wèn)題,清洗與標(biāo)注海量的數(shù)據(jù)需要耗費(fèi)巨大的成本,商湯科技聯(lián)合創(chuàng)始人、副總裁楊帆曾表示,對(duì)于每一個(gè)新場(chǎng)景,公司都要重新收集新數(shù)據(jù),搭建定制化模型。

這種開(kāi)發(fā)模式很像“小作坊”,不但解決問(wèn)題的成本極高,開(kāi)發(fā)模式也十分低效。

在實(shí)際落地過(guò)程中,應(yīng)用場(chǎng)景的復(fù)雜性導(dǎo)致AI應(yīng)用的“孤島化”,李開(kāi)復(fù)曾提到一個(gè)例子:“如果今天一家銀行想做AI應(yīng)用,但沒(méi)有任何數(shù)據(jù)可以用來(lái)冷啟動(dòng),還要收集、清洗、標(biāo)注數(shù)據(jù),再去做模型,整個(gè)過(guò)程代價(jià)都很大?!?/p>

而當(dāng)大模型已成為上層應(yīng)用的技術(shù)底座,可以實(shí)現(xiàn)在AI1.0時(shí)代無(wú)法實(shí)現(xiàn)的跨領(lǐng)域部署,支撐終端、平臺(tái)、系統(tǒng)等產(chǎn)品應(yīng)用落地。這種像搭積木一樣“組合創(chuàng)新”的可能性,以及商業(yè)化的能力就像ChatGPT一樣,人們不僅發(fā)現(xiàn),它可以深夜聊天,撫慰人心,還會(huì)寫程序和講故事。

成本問(wèn)題之外,并不具備通用能力的小模型,由于無(wú)法向行業(yè)進(jìn)行推廣與復(fù)用,難以形成規(guī)模效應(yīng),也就更難言盈利。

這種“通用性”激發(fā)出諸多新的商業(yè)圖景,可以將其理解為AI時(shí)代的“操作系統(tǒng)”,在降低開(kāi)發(fā)成本的同時(shí),人人都可以是開(kāi)發(fā)者,由此發(fā)現(xiàn)與生產(chǎn)出新的產(chǎn)品與應(yīng)用場(chǎng)景。

找錢、找人、找應(yīng)用場(chǎng)景

大模型競(jìng)賽的槍響之后,創(chuàng)投行業(yè)又復(fù)現(xiàn)“元宇宙”的熱潮。

有大模型企業(yè)1個(gè)月見(jiàn)的投資人相當(dāng)于去年一整年。一級(jí)市場(chǎng)關(guān)于大模型的投融資熱度攀升,不少FA們甚至跑去B站開(kāi)始惡補(bǔ)AI知識(shí),生怕錯(cuò)過(guò)一個(gè)好項(xiàng)目。

但搶到這張通往新世界的“船票”并非容易,區(qū)別于AI1.0時(shí)代,找錢、找人與找應(yīng)用場(chǎng)景的焦慮,在這一波競(jìng)逐中,體現(xiàn)的尤為明顯。

首先是找錢。參考多位創(chuàng)業(yè)者的觀點(diǎn),2億美元是行業(yè)普遍認(rèn)為的啟動(dòng)資金。拆解來(lái)看,以硬件成本為例,研究機(jī)構(gòu)TrendForce在一份報(bào)告中指出,要處理1800億參數(shù)的GPT-3.5大型模型,需要的GPU芯片數(shù)量高達(dá)2萬(wàn)顆,未來(lái)GPT大模型商業(yè)化所需的GPU芯片數(shù)量甚至?xí)^(guò)3萬(wàn)顆。

僅在算力門檻上,很多創(chuàng)業(yè)企業(yè)便無(wú)力與大廠抗衡。

因此,表面上熱火朝天的大模型賽道,風(fēng)大“魚”貴,但實(shí)際投資人們心里也知道,僅靠幾張PPT創(chuàng)新的時(shí)代過(guò)去了,投資既是要投靠譜的人,也要考慮賽道與具體的商業(yè)路徑,畢竟,錢也一定要投在刀刃上。

云啟資本合伙人陳昱在接受《甲子光年》采訪時(shí)就表示:“做大模型創(chuàng)業(yè)的公司要融到大錢不容易了?!?/p>

英諾天使基金合伙人王晟曾表示,“我們也經(jīng)常‘刷論文’,看到AI領(lǐng)域里很棒的論文,直接就去找作者了,看他是一個(gè)學(xué)霸,還是有創(chuàng)業(yè)潛質(zhì)、業(yè)務(wù)沒(méi)有商業(yè)化的潛力,如果合適,我們也會(huì)建議他創(chuàng)業(yè)并考慮投資?!?/p>

比起AI1.0時(shí)代的純科學(xué)家創(chuàng)業(yè),AI2.0時(shí)代更像是一場(chǎng)互聯(lián)網(wǎng)大佬與科學(xué)家們的“集體二次創(chuàng)業(yè)”。

能夠融到“大錢”的要么是有創(chuàng)始人經(jīng)歷或個(gè)人魅力背書,要么就是此前長(zhǎng)期跟蹤孵化,雙方一直保持著良好的合作關(guān)系。

比如,目前融資總額已達(dá)數(shù)億元的瀾舟科技是創(chuàng)新工場(chǎng)從0到1孵化出的企業(yè),而由前京東技術(shù)委員會(huì)主席周伯文創(chuàng)立的銜遠(yuǎn)科技,背后的參投方啟明創(chuàng)投等均是AI領(lǐng)域的長(zhǎng)期捕手。

其次,找到合適的人也并不容易,在這一點(diǎn)上,科技巨頭與創(chuàng)業(yè)公司面臨相同的處境。在一檔播客節(jié)目中,已宣布加入光年之外的北京智源人工智能研究院副院長(zhǎng)劉江曾發(fā)出呼吁:“所有的同學(xué),如果你是AI的頂級(jí)人才,或者有這樣的人,歡迎來(lái)到光年之外?!?/p>

“大數(shù)據(jù)+強(qiáng)算法+大算力”被視為支撐大模型落地的重要公式,大廠有算力,也有數(shù)據(jù),能夠提供標(biāo)準(zhǔn)化的產(chǎn)品,但算法背后對(duì)應(yīng)的則是人才。大廠很難留住強(qiáng)算法人才的原因在于,大模型投入是一件長(zhǎng)期主義的事,必定會(huì)面臨與既有業(yè)務(wù)之間的沖突,從大廠出走的諸多大模型創(chuàng)業(yè)者的經(jīng)歷已然說(shuō)明了這一點(diǎn)。

而對(duì)創(chuàng)業(yè)公司而言,即便有首席科學(xué)家的支撐,找到合適的人也并不容易。

聆心智能創(chuàng)始人、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授黃民烈認(rèn)為,如OpenAI這種技術(shù)見(jiàn)長(zhǎng)的公司需要很多特別牛的工程技術(shù)人才。

對(duì)創(chuàng)業(yè)企業(yè)而言,回到前述的融資環(huán)境下,無(wú)論是基于創(chuàng)始人的背景背書,抑或是資源合作,都需要長(zhǎng)期積淀。

同時(shí),在強(qiáng)調(diào)生態(tài)的大模型賽道,創(chuàng)業(yè)型企業(yè)勢(shì)必要面臨來(lái)自投資方、合作方乃至競(jìng)對(duì)間的博弈,一個(gè)合適的伙伴不僅要在自己的細(xì)分領(lǐng)域內(nèi)做到頂尖(懂技術(shù)+懂產(chǎn)品),還有隨時(shí)保持戰(zhàn)略的獨(dú)立性,不輕易站隊(duì)。

最后,能否找到合適的應(yīng)用場(chǎng)景,另辟賽道,并迅速建立護(hù)城河壁壘,這一問(wèn)題也同樣拷問(wèn)著入局者。

百度李彥宏將當(dāng)前的大模型生態(tài)分為三類,他最看好應(yīng)用層的市場(chǎng)機(jī)遇。

第一類是新型云計(jì)算公司,云計(jì)算主流商業(yè)模式將會(huì)從IaaS變?yōu)镸aaS(模型即服務(wù))。

第二類是進(jìn)行行業(yè)模型精調(diào)的公司,介于通用大模型和企業(yè)之間的中間,這類企業(yè)可以基于對(duì)行業(yè)的洞察,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。

第三類是應(yīng)用層的企業(yè),基于通用大語(yǔ)言模型開(kāi)發(fā)應(yīng)用服務(wù),這可能才是真正的機(jī)會(huì)。

區(qū)別于國(guó)外專業(yè)化的分工,當(dāng)前,國(guó)內(nèi)的大模型賽道的創(chuàng)業(yè)模式主要分類是三類:一類是聚焦基礎(chǔ)層,對(duì)標(biāo)OpenAI,發(fā)揮基礎(chǔ)設(shè)施的作用。一類是錨定中間層,不需要如OpenAI一樣花大錢做底層,掌握通用化能力,可以通過(guò)開(kāi)源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。還有一類就是調(diào)用大模型API的企業(yè),專注開(kāi)發(fā)大模型具體場(chǎng)景的應(yīng)用,如Jasper。

如果將大模型比喻成AI時(shí)代的電,那么基礎(chǔ)層與中間層擔(dān)任的都是“發(fā)電廠”的角色,需要極高的門檻,對(duì)資金、技術(shù)以及資源有嚴(yán)格的準(zhǔn)入壁壘,大多也是大公司間的競(jìng)逐。

百度、阿里、華為頭部企業(yè)均采取“模型+工具平臺(tái)+生態(tài)”三層共建模式的模式,推動(dòng)業(yè)務(wù)的正向循環(huán)。

大廠的競(jìng)逐中,也涌現(xiàn)出一些創(chuàng)業(yè)公司,既做大模型,又將其能力輸出至垂直行業(yè),形成定制化模型,雖然避開(kāi)了與有錢有勢(shì)的大廠們的直接競(jìng)爭(zhēng),但也面臨三大難題。

一是數(shù)據(jù)如何才能做專做細(xì),很多行業(yè)定制化模型依舊難以形成數(shù)據(jù)飛輪與場(chǎng)景飛輪。二是大廠極容易摘低垂的果實(shí),垂直大模型實(shí)現(xiàn)復(fù)用的前提是必須要在該行業(yè)建立壁壘與護(hù)城河,即“人無(wú)我有”的競(jìng)爭(zhēng)優(yōu)勢(shì)。三是通用化往往是歷史的趨勢(shì),因此“未來(lái)垂直大模型是否會(huì)最終被通用大模型取代”這一問(wèn)題也值得思考。

大船票or小船票?

人工智能專家侯世達(dá)的學(xué)生梅拉妮·米歇爾在《AI 3.0時(shí)代》里認(rèn)為,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過(guò)度的承諾和媒體炒作,接下來(lái)便是“人工智能的寒冬”。從某種程度上來(lái)說(shuō),這種模式以5~10年為周期在不斷上演。

正在興起的“大模型熱”也必定會(huì)經(jīng)歷從繁榮到擠去泡沫的過(guò)程。

對(duì)中國(guó)的科技公司而言,“能不能做出一個(gè)中國(guó)版GPT”“中國(guó)創(chuàng)業(yè)公司里是否會(huì)出現(xiàn)一個(gè)OpenAI”。對(duì)上述大模型行業(yè)的叩問(wèn),從業(yè)者們看法不一。

李彥宏在被問(wèn)到“中國(guó)創(chuàng)業(yè)公司里會(huì)不會(huì)再出一個(gè)OpenAI?”時(shí),他直接回答“基本不會(huì)了”,“沒(méi)有必要再重新發(fā)明一遍輪子。”

但另一種觀點(diǎn)也認(rèn)為,中國(guó)攻堅(jiān)大模型依舊難以繞開(kāi)OpenAI,這種危機(jī)感越發(fā)強(qiáng)烈。曠視科技聯(lián)合創(chuàng)始人印奇在接受鈦媒體采訪時(shí)表示,中國(guó)攻堅(jiān) AI 大模型要先把GPT-3.5復(fù)現(xiàn)出來(lái),但面臨長(zhǎng)期技術(shù)創(chuàng)新與短周期商業(yè)化兩重壓力:

“未來(lái)的一段時(shí)間,能不能有一個(gè)公司首先把大模型真的做出來(lái),且性能真的是達(dá)到GPT-3.5,這是所有事情的起點(diǎn)。就像菜你沒(méi)有炒過(guò),不知道鹽和味精怎么放,而且GPT所消耗的資源、門檻都非常高。”

是崇尚“大算力+大數(shù)據(jù)+強(qiáng)算法”的暴力美學(xué),還是專注將一個(gè)垂直模型做透做專?中國(guó)企業(yè)的機(jī)會(huì)又在哪里?又可以在哪些方面深耕與挖掘?

這些問(wèn)題的答案都亟待解決。

與此同時(shí),人們也關(guān)注大模型行業(yè)未來(lái)的市場(chǎng)格局演進(jìn)。未來(lái)究竟是兩三家企業(yè)間的競(jìng)爭(zhēng),還是百花齊放?“大船票”和“小船票”或牽引企業(yè)走向不一樣的結(jié)局。

在關(guān)于大模型的這場(chǎng)游戲中,盡管尚未看到終局,但對(duì)入局者而言,有兩大方向是確定的:

一個(gè)是應(yīng)用與場(chǎng)景先行的邏輯。國(guó)產(chǎn)大模型極為強(qiáng)調(diào)產(chǎn)業(yè)側(cè)的價(jià)值,一方面當(dāng)前中國(guó)智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化實(shí)踐本就有廣闊的市場(chǎng)需求,另一方面在2B生態(tài)下,基于垂直應(yīng)用的實(shí)踐本身也有利于形成數(shù)據(jù)飛輪與場(chǎng)景飛輪。

以金融業(yè)為例,BloombergGPT的誕生已說(shuō)明了這一領(lǐng)域既有數(shù)據(jù)基礎(chǔ),也有多元化場(chǎng)景需求。但在此前的實(shí)踐中,存在的問(wèn)題一是數(shù)據(jù)量龐大,AI專家培養(yǎng)成本高,因此只有頭部銀行機(jī)構(gòu)愿意嘗試。二是金融機(jī)構(gòu)對(duì)業(yè)務(wù)的連續(xù)性與數(shù)據(jù)的準(zhǔn)確性有著嚴(yán)苛要求,因此也對(duì)大模型廠商對(duì)行業(yè)的理解能力提出了高要求。

換言之,回到業(yè)務(wù)本質(zhì),需要什么就用什么。

通用意味著泛化,這為能夠輸出精準(zhǔn)能力的企業(yè)提供了機(jī)會(huì)窗口。如果能將一個(gè)垂直領(lǐng)域做專做透,用高質(zhì)量的數(shù)據(jù)持續(xù)優(yōu)化模型,將價(jià)值鏈做長(zhǎng)。對(duì)創(chuàng)企而言,金融、醫(yī)療、教育等領(lǐng)域都有市場(chǎng)空間。

二是先行者已提供了路線參照。如周鴻祎所言,差距并非是天壤之別,路線已經(jīng)明確。周鴻祎指出:“發(fā)展大語(yǔ)言模型,別人已經(jīng)指明了技術(shù)路線,剩下的就是長(zhǎng)期主義指導(dǎo)下的時(shí)間問(wèn)題?!?/p>

很難回答,此輪的大模型競(jìng)逐是否是人工智能競(jìng)賽浪潮最后的哨聲,但幾乎每個(gè)從業(yè)者都害怕自己會(huì)成為“最后的一個(gè)”??萍即蠊緜兛謶直活嵏?,創(chuàng)業(yè)公司恐懼被大公司們顛覆,更大的恐懼則來(lái)自于大模型超越摩爾定律的技術(shù)迭代速度。

而在商業(yè)世界里,危機(jī)與恐懼往往是最好的原動(dòng)力。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。