文|明晰野望
4月以來,市場(chǎng)幾乎每天都有各種國產(chǎn)大模型的新信息,一眾科技大廠、創(chuàng)業(yè)公司陸續(xù)公布相關(guān)進(jìn)展,加速入場(chǎng)。
爭(zhēng)相涌現(xiàn)的國產(chǎn)大模型,特別是科技大廠基于投入、算力、大數(shù)據(jù)等方面的優(yōu)勢(shì),為中國自主大模型的發(fā)展帶來了廣泛的可能性。
事實(shí)上,BTA、華為等大廠在該領(lǐng)域早有研發(fā),并非新入局者。之所以在ChatGPT“教育全社會(huì)”前“隱而不發(fā)”,一是各家的核心業(yè)務(wù)不同,AI研發(fā)的側(cè)重點(diǎn)也有所不同。二是正如阿里云周靖人所言,在ChatGPT出現(xiàn)前講“預(yù)訓(xùn)練大模型”,沒有人會(huì)感興趣。
當(dāng)下,有人在琢磨如何快速推出自己的國產(chǎn)大模型搶占市場(chǎng),也有人在以算力為代表的底層基礎(chǔ)設(shè)施層發(fā)力。更有人直言,相比于“神仙打架”,更關(guān)心國產(chǎn)大模型怎么落地應(yīng)用,看看這個(gè)先進(jìn)生產(chǎn)力工具究竟如何改變產(chǎn)業(yè)與生活方式,以及能否實(shí)現(xiàn)超越,由追隨到引領(lǐng)?
關(guān)于“與OpenAI差距”的討論也從未停止,如李彥宏的“2、3個(gè)月”,王小川的“不會(huì)低于兩年”,時(shí)間定義雖不同,但均表明了其并沒有領(lǐng)先到難以追趕的程度。
大戲,才剛剛啟幕。
01、“iPhone時(shí)刻”與增量市場(chǎng)
“超越”不是偽命題,在中美科技競(jìng)爭(zhēng)、市場(chǎng)隔離的背景下,中國科技產(chǎn)業(yè)需要自己的“iPhone時(shí)刻”。
人工智能則是最有希望誕生這一時(shí)刻的領(lǐng)域:在過去十余年間,AI進(jìn)步由中美主導(dǎo),投入也最巨大,因此機(jī)會(huì)主要也在中美之間。
Open AI的成功,無疑強(qiáng)化了這一觀點(diǎn),并給所有中國科技企業(yè)帶來了一劑強(qiáng)心針,照著這個(gè)路徑去做生成式AI,是能夠走通的——這樣即能保證“革命性技術(shù)”誕生時(shí)離其最近,也能率先進(jìn)入“增量”市場(chǎng)。
這是在科技行業(yè)低迷的當(dāng)下,一個(gè)難得的增量空間。如果能取得先發(fā)優(yōu)勢(shì),就有可能開辟巨大的新市場(chǎng),或給已有業(yè)務(wù),如云計(jì)算、電商、游戲、社交、搜索乃至B端的千行百業(yè)加上“放大器”。
大模型不僅是聊天軟件,更是生產(chǎn)力工具,已是共識(shí)。
在阿里云峰會(huì)上,張勇稱所有產(chǎn)品未來都將接入通義千問大模型,進(jìn)行全面改造;劉熾平在騰訊財(cái)報(bào)會(huì)上強(qiáng)調(diào),生成式AI可成為已有業(yè)務(wù)的 “倍增器”,也可幫助開拓新增長線;任正非更是認(rèn)為,ChatGPT 把計(jì)算、管道流量撐大,華為產(chǎn)品就有了機(jī)會(huì)。
其中的邏輯是,AI是數(shù)字化時(shí)代的“操作系統(tǒng)”,就像移動(dòng)互聯(lián)網(wǎng)時(shí)代的IOS和安卓,加速促進(jìn)了產(chǎn)業(yè)數(shù)字化的發(fā)展,對(duì)生產(chǎn)、生活方式進(jìn)行下一次重塑,帶來更大空間的新領(lǐng)域,而大模型是整個(gè)AI產(chǎn)業(yè)鏈中,核心中的核心。
從長遠(yuǎn)看,如果不能取得先機(jī),未來就有可能會(huì)影響現(xiàn)有的整個(gè)商業(yè)模式,甚至被顛覆。
如周鴻祎在4月21日發(fā)出內(nèi)部信,要求360全員擁抱人工智能,稱“已領(lǐng)先一個(gè)身位”。近期接受采訪時(shí)也表示,國內(nèi)“搜索引擎百度市占率60%,公司30%”,強(qiáng)調(diào)“在戰(zhàn)略上對(duì)標(biāo)微軟,搜索上踐行必應(yīng)”,改寫格局的企圖心強(qiáng)烈。
百度反應(yīng)更為激進(jìn),做出了全球第一個(gè)對(duì)標(biāo)ChatGPT的文心一言。另據(jù)晚點(diǎn)財(cái)經(jīng)報(bào)道,在文心一言內(nèi)測(cè)前,李彥宏每晚和項(xiàng)目團(tuán)隊(duì)開會(huì),他們?yōu)榛I備產(chǎn)品甚至一度睡在公司。
中信建投的一份“會(huì)議紀(jì)要”也顯示,過去幾個(gè)月他們調(diào)研了很多一線互聯(lián)網(wǎng)公司,得到一個(gè)非常一致的結(jié)論:這次是全面的一把手工程,不管是BAT還是字節(jié)、華為,均是創(chuàng)始人親自督戰(zhàn),對(duì)大模型團(tuán)隊(duì)全力支持。上一次出現(xiàn)如此情景,還是2009年移動(dòng)互聯(lián)網(wǎng)來臨的時(shí)候。
中信建投因此認(rèn)為:未來6-12個(gè)月的AI行業(yè)會(huì)很卷,但也很精彩,各家模型的登場(chǎng)才剛剛開始。
但僅是“開始”,當(dāng)下國內(nèi)大模型超過萬億參數(shù)的,就有阿里的M6、騰訊的混元、智源研究院的悟道2.0,華為的盤古Σ,千億以上的也有近十個(gè)。
從發(fā)布時(shí)間看,百度、阿里、騰訊、華為等一線科技大廠,在ChatGPT熱潮前均已推出過大模型。
百度的ERNIE 1.0于2019年推出,即后來的文心大模型,目前更新到 3.0 版本;阿里在2021年發(fā)布語言大模型 AliceMind和多模態(tài)大模型 M6,去年9月合并為通義大模型。
騰訊在2022年6月發(fā)布混元大模型,目前更新至 2.0 版本。微信去年 10 月也發(fā)布了大模型 WeML;華為盤古大模型于2021年4月發(fā)布,后續(xù)發(fā)布了NLP、CV、多模態(tài)等多個(gè)大模型。
這些都說明,中國科技企業(yè)有技術(shù)和能力推動(dòng)一場(chǎng)大模型的變局,當(dāng)然,差距和阻力也依然客觀存在。
02、國產(chǎn)大模型需要“新想法”
李彥宏在文心一言發(fā)布后曾說,百度有信心在綜合能力上,迅速追上甚至超過 ChatGPT。
這可能不是百度盲目自信,今天的大模型就像一場(chǎng)剛剛開跑的馬拉松,“你追我趕”是必然階段。 現(xiàn)在Open AI領(lǐng)跑,也許明天谷歌就會(huì)趕上來,但也有可能是阿里、騰訊、華為實(shí)現(xiàn)彎道超車。
科技行業(yè)不同于其他行業(yè)的魅力所在之處在于,每一輪科技創(chuàng)新都是由大的確定性和小的不確定性構(gòu)成,帶有偶然性,并不是簡單的強(qiáng)因果關(guān)系。
但略顯遺憾的是,目前多數(shù)中國科技公司在做的大模型,包括百度和阿里在算法方面和GPT-3架構(gòu)基本類似,都是基于谷歌的Transformer,其他方面也是追隨OpenAI的腳步實(shí)踐,在迭代速度不如人的情況下,反而差距越拉越大。
李彥宏曾明言,百度“文心一言”在研發(fā)階段時(shí)曾與ChatGPT進(jìn)行對(duì)比測(cè)試,當(dāng)時(shí)差距是一個(gè)月能追得上??蛇^了一個(gè)月再次測(cè)試后,發(fā)現(xiàn)差距反而拉大了。
阿里云周靖人也坦承,目前通義千問與ChatGPT仍有差距,“GPT還是屬于各方面都領(lǐng)先的地位”。
更為關(guān)鍵的是,ChatGPT“暴力美學(xué)”式大模型路徑可能走到了盡頭。
近日OpenAI首席執(zhí)行官山姆·奧特曼公開表示,“大語言模型規(guī)模已接近極限”,“我認(rèn)為我們正處于巨型模型時(shí)代的末尾,目前尚不清楚未來的進(jìn)步究竟來自何處”。他同時(shí)否認(rèn)了GPT-5的存在,“而且一段時(shí)間內(nèi)也不會(huì)有”。
自ChatGPT推出以來,競(jìng)爭(zhēng)對(duì)手眾多。
如馬斯克已經(jīng)確認(rèn)自建 AI 聊天機(jī)器人TruthGPT與之硬杠,亞馬遜也大力投資生成式AI,谷歌大腦合并DeepMind聯(lián)手追趕等等,還有大批初創(chuàng)公司正在構(gòu)建更大算法。此外,歐洲各國正在禁用或擬禁用ChatGPT。
因此尚不清楚山姆·奧特曼出于何種考量做此表態(tài),但也不排除巨型AI模型時(shí)代可能正在結(jié)束。這意味著大模型進(jìn)化的“下一步”需要再次“另辟蹊徑”,尤其是國產(chǎn)大模型更需要有“新想法”。
目前生成式AI的應(yīng)用在文本領(lǐng)域相對(duì)成熟,從海外已落地或處于 Demo階段的應(yīng)用案例來看,在代碼、圖片、視頻、游戲等領(lǐng)域,海外均有所創(chuàng)新。
但中國顯然有更廣闊的市場(chǎng)及更豐富的應(yīng)用場(chǎng)景,這也是中國科技公司天然的本土優(yōu)勢(shì):從toC走向toB。
有很多科技公司的從業(yè)人士認(rèn)為,中國的大模型之路應(yīng)該與美國市場(chǎng)不同。他們更認(rèn)可一種“兩條腿走路”的方式,即一邊做大模型基礎(chǔ)平臺(tái)開發(fā),一邊直接瞄準(zhǔn)垂直的行業(yè)場(chǎng)景落地,實(shí)現(xiàn)大模型與場(chǎng)景化的兩翼齊飛。
這樣既能持續(xù)獲得更多更豐富的各個(gè)行業(yè)里“好的原材料”(數(shù)據(jù)),也使更多的研發(fā)人員有機(jī)會(huì)深入到一線,用大模型去解決實(shí)際問題(應(yīng)用場(chǎng)景),從而在工程化、產(chǎn)品化、場(chǎng)景化上不斷迭代,最終與技術(shù)底座形成飛輪效應(yīng),走向商業(yè)化的正循環(huán)。
如華為盤古大模型強(qiáng)調(diào)在礦山、電力等場(chǎng)景的應(yīng)用,騰訊CV(計(jì)算機(jī)視覺)大模型在工業(yè)質(zhì)檢、醫(yī)療影像等領(lǐng)域的落地,及諸多AI創(chuàng)業(yè)公司深耕垂直行業(yè),都是出于此等考量。
從中長期來看,AI大模型也一定會(huì)加速滲透到更多toB的場(chǎng)景,比如汽車、工業(yè)(制造業(yè))、航天航空衛(wèi)星、能源、生物制藥等領(lǐng)域,這也是中國數(shù)字化發(fā)展的主線。
03、“AI+一切”之?dāng)?shù)字經(jīng)濟(jì)
2018年時(shí),華為有個(gè)“達(dá)芬奇”計(jì)劃,旨在將AI添加到一切產(chǎn)品和服務(wù)中,也可以理解為“AI+一切”。其中最首要的一步,就是開發(fā)AI芯片,挑戰(zhàn)英偉達(dá)。
那一年,從產(chǎn)業(yè)革命,技術(shù)創(chuàng)新的周期視角下來看,應(yīng)該是數(shù)字化和智能化的開端,數(shù)據(jù)、算力、算法都迎來大爆發(fā),更是新一輪硬件終端智能化趨勢(shì)的起點(diǎn),比如汽車、穿戴設(shè)備、智能家居等等物聯(lián)網(wǎng)終端,至今全球已經(jīng)有接近1000億的Iot智能終端實(shí)時(shí)在線。
但是,并沒有數(shù)字化時(shí)代現(xiàn)象級(jí)的應(yīng)用誕生,不管是自動(dòng)駕駛還是VR、AR、智能家居、工業(yè)互聯(lián)網(wǎng)乃至元宇宙,過去幾年落地都不及預(yù)期。
中國也沒有誕生自己的英偉達(dá),美國卻又增加了OpenAI這個(gè)AI新標(biāo)桿。這說明,科技領(lǐng)域永遠(yuǎn)沒有屬于追隨者的時(shí)代。
而大模型之所以形成全球共振效應(yīng),因?yàn)樗赡苁侨婕铀贁?shù)字化應(yīng)用落地的超級(jí)工具,這是一個(gè)全新的節(jié)點(diǎn):大模型更多是一個(gè)工程上的突破而非技術(shù)突破,一旦商業(yè)模式確認(rèn),各行各業(yè)的落地速度會(huì)比過往快很多,這也是越來越多的企業(yè)急速涌入的根本性原因。
所以在全新節(jié)點(diǎn)下,4月18日釘釘全面接入“通義千問”,這意味著阿里大模型正式面向B端客戶。此前在阿里云峰會(huì)上,張勇曾強(qiáng)調(diào),“面對(duì)AI時(shí)代,所有產(chǎn)品都值得用大模型重做一次”。
“AI+一切”的野望始終都在,這為國產(chǎn)大模型的未來帶來了何止100種的可能性。而釘釘最想實(shí)現(xiàn)的一個(gè)可能“是成為超級(jí)APP”,釘釘總裁葉軍如此說。
但在理論上,百度、阿里、騰訊、華為、字節(jié)憑借各自的歷史積累,都有可能成為“AI+一切”的贏家,而不是先做的就一定比后做的好。
目前從不同渠道流出的消息顯示,4月份華為會(huì)發(fā)布自己的模型,8月份騰訊大模型要出來;字節(jié)版的ChatGPT已在內(nèi)測(cè),但內(nèi)測(cè)之后體驗(yàn)效果不好預(yù)計(jì)在9月上線。
不過決定最終誰能跑出來,一定是先“卷”一輪。
從中國經(jīng)濟(jì)發(fā)展的歷史來看,無論是家電、新能源車還是電商、短視頻直播行業(yè),“內(nèi)戰(zhàn)必先于外戰(zhàn)”,但“外戰(zhàn)優(yōu)于內(nèi)戰(zhàn)”。
大模型之戰(zhàn)應(yīng)該也遵循這個(gè)路徑,很多小模型或者小場(chǎng)景的商業(yè)閉環(huán)會(huì)被大模型“吃”掉。而大模型一旦成功,會(huì)是萬億市值規(guī)模的巨大空間,當(dāng)然最后跑出來的也可能是兩、三個(gè)大模型。
屆時(shí),不但會(huì)產(chǎn)生中國的“OpenAI”,中國的“英偉達(dá)”也會(huì)有,底層框架更會(huì)有。
因?yàn)橹袊竽P椭挥袠?gòu)建在國產(chǎn)技術(shù)底座上,每一層都實(shí)現(xiàn)自主可控,才有可能縱深地做持續(xù)閉環(huán)優(yōu)化,這就跟芯片及再上層的芯片先進(jìn)制程都要實(shí)現(xiàn)“自主”是一個(gè)道理。
那時(shí)國產(chǎn)大模型實(shí)現(xiàn)超越,切實(shí)可期。
但AI從來不只是技術(shù)、算力、人才的角逐,更是國家戰(zhàn)略的角力。4月份以來,網(wǎng)信辦發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,科技部發(fā)起成立“國家超算互聯(lián)網(wǎng)聯(lián)合體”,及從去年到現(xiàn)在出臺(tái)的一系列有關(guān)數(shù)字經(jīng)濟(jì)、數(shù)據(jù)要素相關(guān)政策,都表明了國家的關(guān)切與肯定。
也就是說,相對(duì)海外對(duì)大模型發(fā)展的矛盾態(tài)度,中國對(duì)整個(gè)數(shù)字經(jīng)濟(jì)及人工智能的發(fā)展,是持一貫的支持態(tài)度,這為中國大模型的未來,加上了一個(gè)至關(guān)重要的確定性。