文|深眸財(cái)經(jīng) 張未
AI大模型的戰(zhàn)場(chǎng)正在分化。
Chatgpt作為導(dǎo)火索,打開了AI2.0時(shí)代的大門,而AI2.0的特征便是“產(chǎn)業(yè)智能化、數(shù)字化”,能夠高效地替代人工,廣泛地運(yùn)用到各行各業(yè),所以比起還在探索落地、已過了狂奔期的元宇宙,AI大模型的落地來得更實(shí)在些。
最典型的表現(xiàn)就是,AI大模型的出圈更廣泛,不止步于B端。比如,即便chatGPT發(fā)布半年有余,筆者在上海CBD樓下的咖啡廳還能聽到打工人談?wù)揷hatGPT的聲音;據(jù)媒體報(bào)道,也有部分企業(yè)將AIGC作為生產(chǎn)力工具。
正如阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇所說:面向AI時(shí)代,所有產(chǎn)品都值得用大模型重做一次。
大廠、科研機(jī)構(gòu)和創(chuàng)業(yè)者,紛紛下場(chǎng)。
大廠有百度文心一言、華為盤古、360智腦、商湯日日新、阿里通義千問、京東靈犀、昆侖萬維天工等大模型先后登場(chǎng),后續(xù)還有騰訊混元、科大訊飛星火等大模型排隊(duì)等著上線。
創(chuàng)業(yè)者也不乏名人,搜狗創(chuàng)始人王小川、美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場(chǎng)董事長(zhǎng)李開復(fù)等人高調(diào)入場(chǎng)AI大模型。
持續(xù)了幾月有余的AI大模型熱,衍生出了兩條道路。
01 AI軍備競(jìng)賽,大模型分化
AI大模型已經(jīng)進(jìn)入了競(jìng)賽階段,并且路徑逐漸分化。
隨著AI大模型逐漸加熱,有媒體統(tǒng)計(jì),2月初,東方財(cái)富上“ChatGPT”板塊還只有29只股票,如今已經(jīng)達(dá)到61支,數(shù)量還在不斷攀升中。 據(jù)不完全統(tǒng)計(jì),截至目前,我國(guó)已有超過40家公司、機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。
在其中,參與AI大模型這場(chǎng)“軍備競(jìng)賽”的玩家們也發(fā)展出了兩個(gè)發(fā)展方向。垂直大模型和通用大模型,正成為目前人工智能領(lǐng)域的兩個(gè)主要發(fā)展方向。
垂直大模型是指針對(duì)特定領(lǐng)域或任務(wù)進(jìn)行優(yōu)化設(shè)計(jì)的模型,例如語音識(shí)別、自然語言處理、圖像分類等。
當(dāng)前有越來越多的企業(yè)加入垂直大模型的賽道。學(xué)而思宣布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),命名為MathGPT,面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu);5月6日,淘云科技宣布推出兒童認(rèn)知大模型——阿爾法蛋兒童認(rèn)知大模型,為孩子在練表達(dá)、塑情商、啟創(chuàng)造、助學(xué)習(xí)等方面帶來全新交互體驗(yàn)。
通用大模型是指能夠處理多種任務(wù)和領(lǐng)域的模型,例如BERT、GPT等。
由于資金、人才等優(yōu)勢(shì),大廠主要瞄準(zhǔn)通用大模型這個(gè)賽道。
大廠瞄準(zhǔn)通用大模型一方面是能夠?qū)I的能力與自身產(chǎn)品結(jié)合,比較有代表性的就是阿里、華為、百度等互聯(lián)網(wǎng)大廠和科技巨頭。
比如,繼微軟把GPT-4整合進(jìn)Office全家桶后,阿里“通義千問”也開始接入釘釘,用戶可以在文檔生成內(nèi)容,在視頻會(huì)議中能以參會(huì)者為單位,生成每個(gè)人的觀點(diǎn)和內(nèi)容。
像是百度的大模型也能結(jié)合自身業(yè)務(wù),“文心一言”在對(duì)搜索引擎的迭代上能夠有質(zhì)的蛻變,能夠從用戶尋找答案,轉(zhuǎn)換為回答用戶問題,包括騰訊“混元”、網(wǎng)易“玉言”、京東“ChatJD”均能夠優(yōu)先應(yīng)用于自身產(chǎn)業(yè)。
另一方面,通用性大模型的適用性較廣,先跑贏者能夠建立起先發(fā)優(yōu)勢(shì),成為AI2.0時(shí)代的領(lǐng)路人。畢竟,“跑得快的有肉吃,跑得慢的只能吃剩下的邊角料”,這個(gè)道理誰都懂。
垂直應(yīng)用大模型可謂是一股“清流”,由于垂直應(yīng)用大模型更符合垂類場(chǎng)景的需求、質(zhì)量比通用大模型更高,也讓眾多企業(yè)看到了其中的機(jī)會(huì)。比如深蘭、出門問問、有道等聚焦AI具體賽道的企業(yè)。
垂直大模型的發(fā)展主要體現(xiàn)在各個(gè)領(lǐng)域的模型性能持續(xù)提升,例如語音識(shí)別的錯(cuò)誤率逐年下降,自然語言處理的語義理解能力不斷提升等。通用大模型則在多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)等方面取得了顯著進(jìn)展,已經(jīng)成為自然語言處理領(lǐng)域的重要研究方向。
比如,生物大模型能夠提高AI制藥效率。國(guó)外的研究報(bào)告顯示,ai可以將新藥研發(fā)的成功率提高16.7%,ai輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費(fèi)用,并在研發(fā)主要環(huán)節(jié)節(jié)約40%至60%的時(shí)間成本。根據(jù)英偉達(dá)公開資料,使用ai技術(shù)可使藥物早期發(fā)現(xiàn)所需時(shí)間縮短至三分之一,成本節(jié)省至兩百分之一。
在產(chǎn)業(yè)角度來看,通用模型就是“百科全書”,能夠有問必答,能夠適用不同的產(chǎn)業(yè)土壤,而垂直模型類似于單領(lǐng)域的專家,雖然專業(yè),但受眾注定是少數(shù)人。
02 數(shù)據(jù)是致命傷
垂直大模型的優(yōu)勢(shì)在于不夠“大”:算力不夠大、算法難度低。
王小川在入局大模型賽道后,就一直強(qiáng)調(diào)未來發(fā)力的方向并不是像OpenAI一樣去做AGI(通用人工智能),而是垂直在某些特定的領(lǐng)域去做大模型,并實(shí)現(xiàn)落地應(yīng)用。
廣義上的大模型實(shí)際上是形容通用大模型,正如“大”模型之稱,大模型之所以“大”,就是因?yàn)閰?shù)眾多和數(shù)據(jù)量龐大,對(duì)算法、算力、數(shù)據(jù)存儲(chǔ)空間都有極大的要求,而這些不只是人才可以彌補(bǔ)的,還需要大量的資金。要知道,Open AI的成功也是微軟當(dāng)初用數(shù)十億美金堆出來的。巨大的資金需求,對(duì)大廠的研發(fā)決心也是一種考驗(yàn)。
過去5年,AI大模型的參數(shù)量幾乎每年提升一個(gè)數(shù)量級(jí),例如GPT-4參數(shù)量是GPT-3的16倍,達(dá)到1.6萬億個(gè);而隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入,大模型的數(shù)據(jù)量也在飛速膨脹。這意味著想要玩轉(zhuǎn)大模型,必須擁有大算力。
做垂直大模型的企業(yè),對(duì)比大廠來說,資金、算力、數(shù)據(jù)較為匱乏,所以實(shí)際上和通用大模型玩家不在同一條起跑線上。
正如新能源車離不開電機(jī)、電池、電控這三大件,AI大模型則離不開算力、算法和數(shù)據(jù)的支持。
在算力、算法和數(shù)據(jù)中,數(shù)據(jù)是垂直大模型的難點(diǎn)。
三要素中,算法的研發(fā)難度相對(duì)較低,當(dāng)前的公司都有自己實(shí)現(xiàn)大模型的路徑算法,且有眾多開源項(xiàng)目可參考。
芯片決定算力,AI大模型整體需要較高性能的芯片完成對(duì)整體模型神經(jīng)網(wǎng)絡(luò)的訓(xùn)練建構(gòu),而當(dāng)前的芯片自研較少,還是以外采為主,像當(dāng)前最適應(yīng)ChatGPT的芯片就來自英偉達(dá)的旗艦芯片H100和次旗艦芯片A100。
難點(diǎn)在于數(shù)據(jù)。高質(zhì)量的數(shù)據(jù)是助力AI訓(xùn)練與調(diào)優(yōu)的關(guān)鍵,足夠多、足夠豐富的數(shù)據(jù),是生成式AI大模型的根基。
據(jù)OpenAI此前披露,僅ChatGPT3參數(shù)數(shù)量已達(dá)到1750億,訓(xùn)練資料達(dá)到45TB。
由于中國(guó)移動(dòng)互聯(lián)網(wǎng)發(fā)展較為成熟,大量中文數(shù)據(jù)資源被存于各家企業(yè)或機(jī)構(gòu)里,較難共享。
“由于企業(yè)的很多業(yè)務(wù)數(shù)據(jù)、物流數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)等都是非常核心的私域數(shù)據(jù),很難想象華星光電或者是中石油會(huì)把數(shù)據(jù)拿給人家去訓(xùn)練?!眲?chuàng)新奇智CEO徐輝近日受證券時(shí)報(bào)采訪時(shí)也曾直言。
以AI制藥行業(yè)為例,生物大模型就面對(duì)被技術(shù)“卡脖子”的問題。藥物研發(fā)對(duì)高精度實(shí)驗(yàn)數(shù)據(jù)獲取成本較高,且公開數(shù)據(jù)庫(kù)中有大量無標(biāo)注數(shù)據(jù),既要利用好大量無標(biāo)注數(shù)據(jù),又要利用好少量高精度數(shù)據(jù),所以對(duì)模型建構(gòu)提出了較高要求。
03 誰先賺到第一桶金?
無論何種模式,商業(yè)化都是核心問題。從目前擁有大模型的AI玩家來看,都在快速推進(jìn)賦能和商業(yè)化。
通用大模型和垂類大模型,雖走的路不同,但本質(zhì)還是“一家人”,處于同一個(gè)賽道中,所以避免不了競(jìng)爭(zhēng)這個(gè)問題。
對(duì)于通用大模型而言,垂直大模型先落地,通用大模型的路會(huì)更窄。同樣,通用大模型先快速搶占市場(chǎng)后,業(yè)務(wù)線較窄的垂直大模型,要想賺錢就更為艱難。
在理想階段中,通用大模型無論是經(jīng)濟(jì)模型,還是普世價(jià)值,都是要優(yōu)于垂直大模型的。可是,現(xiàn)實(shí)生活不是烏托邦,通用大模型和垂類大模型誰跑得更快,還得看各企業(yè)之間的比拼。
從去年大熱的AIGC來看。相比在C端讓用戶以較低的門檻使用AI生成內(nèi)容,B端被部分市場(chǎng)人士認(rèn)為將是AIGC更主要的商業(yè)模式。
華為也更注重于自己的ToB業(yè)務(wù)。在發(fā)布會(huì)上,華為表示,華為盤古大模型主要以AI賦能產(chǎn)業(yè),運(yùn)用在電力、金融、農(nóng)業(yè)等多個(gè)行業(yè),其中CV大模型落地礦山,NLP大模型落地智能文檔檢索。
像是以搜索引擎為所長(zhǎng)的百度,推出了類似GPT-3這樣具備搜索屬性的文心一言。
除了ChatGPT,實(shí)際上在AI大模型這陣風(fēng)吹起來之前就已有落地的場(chǎng)景了,這些“大”模型,實(shí)際以垂直大模型為主。
語言模型:如GPT、BERT等,主要應(yīng)用于自然語言處理領(lǐng)域,如機(jī)器翻譯、文本生成、情感分析等。
圖像模型:如ResNet、Inception等,主要應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域,如圖像分類、目標(biāo)檢測(cè)、圖像分割等。
推薦模型:如DNN、RNN等,主要應(yīng)用于推薦系統(tǒng)領(lǐng)域,如商品推薦、廣告推薦等。
聊天機(jī)器人:如Seq2Seq、Transformer等,主要應(yīng)用于智能客服、智能助手等場(chǎng)景。
金融風(fēng)控:如XGBoost、LightGBM等,主要應(yīng)用于銀行、證券等金融機(jī)構(gòu)的風(fēng)控場(chǎng)景,如信用評(píng)分、反欺詐等。
醫(yī)療影像診斷:如DeepLung、DeepLesion等,主要應(yīng)用于醫(yī)療影像診斷領(lǐng)域,如肺癌診斷、病理學(xué)分析等。
比起落地,更重要的是賺錢。
據(jù)國(guó)盛證券報(bào)告《ChatGPT 需要多少算力》估算,GPT-3 訓(xùn)練一次的成本約為 140 萬美元,對(duì)于一些更大的 LLM(大型語言模型),訓(xùn)練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT 在 1 月的獨(dú)立訪客平均數(shù) 1300 萬計(jì)算,其對(duì)應(yīng)芯片需求為 3 萬多片英偉達(dá)A100 GPU,初始投入成本約為 8 億美元,每日電費(fèi)在 5 萬美元左右。
通用大模型在落地場(chǎng)景更廣泛毋庸置疑,對(duì)于有底氣地通用大模型的玩家來說,商業(yè)化是其次,垂直類大模型,需要更快的商業(yè)化來兜底,所以垂直大模型的落地有更高的可能性和更快地普及速度。
誰能先形成絕對(duì)優(yōu)勢(shì)還沒有肯定的答案。AI大模型的這場(chǎng)“軍備競(jìng)賽”,正如web1向web2的蝶變,企業(yè)爭(zhēng)分奪秒地向前跑,誰先抓住了機(jī)會(huì),就抓住了市場(chǎng)。