文|正見TrueView koorvoa
編輯|TV.
校對(duì):莽夫
ChatGPT持續(xù)狂飆,國(guó)內(nèi)大模型諸神之戰(zhàn)同樣愈演愈烈。
百度、阿里、360等大科技公司相繼推出大模型產(chǎn)品并高速迭代,加快應(yīng)用落地;智譜AI、瀾舟科技等創(chuàng)新創(chuàng)業(yè)公司也進(jìn)一步拓展在大模型上的布局,加速百億、千億級(jí)別大模型自研進(jìn)度。
中國(guó)版ChatGPT之爭(zhēng)的背后,事實(shí)上是技術(shù)(大模型數(shù)據(jù)、算力、算法)、資金、人才各個(gè)方面的長(zhǎng)期較量。誰(shuí)能在大模型能力上領(lǐng)先,率先應(yīng)用落地,布局商業(yè)化,誰(shuí)就有可能在AI 2.0時(shí)代掌握話語(yǔ)權(quán)。
Part.1、創(chuàng)業(yè)者們的三大難關(guān):錢、技術(shù)、人才
大模型燒錢是賽道參與者的共識(shí)。啟明創(chuàng)投合伙人周志峰在媒體采訪時(shí)表示,一家大模型創(chuàng)業(yè)公司從起步到發(fā)布到第一個(gè)較成熟的的模型,完成商業(yè)化驗(yàn)證,至少需要2億美元。
曠視CEO印奇也曾透露,訓(xùn)練出GPT-3.5至少需要1萬(wàn)張A100的芯片集群,硬件投入需要20億元。
入局者先備錢。王慧文個(gè)人投資5000萬(wàn)美元成立公司,李開復(fù)圈宣布籌組中國(guó)版ChatGPT公司“Project AI 2.0”之前,資金就已先到位。此前,李開復(fù)相繼減持知乎、美圖套現(xiàn)近1.5億。創(chuàng)業(yè)公司瀾舟科技也在今年完成Pre-A+輪融資,融資額達(dá)數(shù)億元。
融到錢才能活下去。資金成為依靠風(fēng)險(xiǎn)投資的大模型創(chuàng)業(yè)者們首先要解決的問題。盡管在ChatGPT的帶動(dòng)下,資本機(jī)構(gòu)當(dāng)前看好這一賽道,但主要以明星項(xiàng)目、明星團(tuán)隊(duì)為主。當(dāng)創(chuàng)業(yè)者短期內(nèi)不能明確營(yíng)利模式和研發(fā)成果轉(zhuǎn)化,市場(chǎng)對(duì)于創(chuàng)業(yè)公司不會(huì)有太多的耐心。
頭部科技公司同樣面臨相似問題。在眾多大廠正在或即將迎來(lái)組織架構(gòu)調(diào)整和改革的背景下,除百度將大模型上升為核心戰(zhàn)略外,其余“淺嘗”中的大廠,集團(tuán)對(duì)于大模型的長(zhǎng)期投入、業(yè)務(wù)場(chǎng)景落地和戰(zhàn)略定位也會(huì)有更嚴(yán)苛的考核。
這種情緒上的急迫,主要來(lái)自于時(shí)間窗口期的壓縮。海外科技巨頭在大模型技術(shù)和應(yīng)用上的不斷突破,留給國(guó)內(nèi)廠商的追趕時(shí)間不會(huì)太久。
技術(shù)能力是影響大模型競(jìng)爭(zhēng)格局的核心。大模型對(duì)于算法、算力和數(shù)據(jù)的要求都格外高,而互聯(lián)網(wǎng)大廠擁有更為深厚的技術(shù)儲(chǔ)備。人才資源上的爭(zhēng)奪也同樣如此。作為大模型競(jìng)爭(zhēng)中的重要一環(huán),大廠和資金實(shí)力豐厚的企業(yè)對(duì)于人才擁有更強(qiáng)的吸引力。
杭州未來(lái)科技城曾有一家公司招聘AIGC方向算法工程師,年薪最高可達(dá)320萬(wàn)的消息引起熱議。AIGC人才站上高薪風(fēng)口,AI企業(yè)展開新一輪搶人大戰(zhàn)。脈脈高聘人才智庫(kù)最新調(diào)研數(shù)據(jù)顯示,今年1-2月AIGC人才需求逆勢(shì)上漲,崗位數(shù)量同比增長(zhǎng)31.3%,創(chuàng)下歷史新高。
AI公司對(duì)頂級(jí)人才的渴望可見一斑。王慧文表示要拿出新公司光年之外75%的股份用于邀請(qǐng)頂級(jí)研發(fā)人才;王小川通過公開信呼喚中國(guó)領(lǐng)軍人物、行業(yè)產(chǎn)品經(jīng)理和遠(yuǎn)在美國(guó)的同仁加入;李開復(fù)邀請(qǐng)全球世界范圍內(nèi)的人才一起打造世界級(jí)的公司…
大模型瘋狂搶人的背后,是AI公司對(duì)于當(dāng)下轉(zhuǎn)瞬即逝的機(jī)會(huì)窗口的急迫把握。畢竟在全球經(jīng)濟(jì)周期性下滑的今天,下一個(gè)像AI大模型這么具有想象力的科技商業(yè)機(jī)會(huì),不知能在何時(shí)又會(huì)以何種形式出現(xiàn)。
Part.2、AI新機(jī)會(huì):通用大模型or應(yīng)用層垂直模型
擺在國(guó)產(chǎn)大模型入局者的機(jī)會(huì)和選擇有兩個(gè):通用大模型與應(yīng)用層垂直模型。
大廠更具有開發(fā)通用大模型的野心和能力。當(dāng)前模式主要是以通過提供底層通用平臺(tái),吸引更多開發(fā)者和合作伙伴一起發(fā)展,打造全新AI生態(tài)為主。不僅惠及云計(jì)算業(yè)務(wù),主流商業(yè)模式也從IaaS(基礎(chǔ)設(shè)施即服務(wù))轉(zhuǎn)向MaaS(模型即服務(wù))。
在具體應(yīng)用上,阿里云通義千問大模型將全面接入阿里辦公、購(gòu)物、語(yǔ)音助手等場(chǎng)景,中興通訊、吉利汽車、波司登、掌閱科技等多家企業(yè)表示將與阿里云在大模型場(chǎng)景展開技術(shù)合作。
百度文心一言已經(jīng)覆蓋政務(wù)、金融、媒體、電商零售等場(chǎng)景,在醫(yī)藥領(lǐng)域,百度發(fā)布GBI-Bot,成首個(gè)落地醫(yī)藥行業(yè)的產(chǎn)品。在汽車領(lǐng)域,長(zhǎng)安汽車官宣逸達(dá)將成為國(guó)內(nèi)首款搭載文心一言的量產(chǎn)車型,后續(xù)將通過軟件升級(jí)的形式搭載至新車。
相比通用大模型,垂直大模型對(duì)于算力、算法的要求會(huì)低一些。作為一種全新的生產(chǎn)力,隨著垂直大模型底層能力的不斷突破,必然能實(shí)現(xiàn)企業(yè)的降本增效,帶來(lái)上層應(yīng)用的迭代和變革。
李彥宏曾直言,“中國(guó)的OpenAI不是創(chuàng)業(yè)公司的機(jī)會(huì),沒有必要再重新發(fā)明一遍輪子?!薄坝辛溯喿又螅銎?、飛機(jī),價(jià)值可能比輪子大多了?!?/p>
一些不具備技術(shù)、資金競(jìng)爭(zhēng)實(shí)力的中小型企業(yè)和創(chuàng)業(yè)者們,在垂直領(lǐng)域積累了大量數(shù)據(jù)和know-how,選擇以開源或合作大模型+外掛領(lǐng)域知識(shí)庫(kù)的方式,瞄準(zhǔn)應(yīng)用層垂直模型機(jī)會(huì),從細(xì)分行業(yè)切入解決特定場(chǎng)景的市場(chǎng)需求。
例如深蘭科技已經(jīng)開發(fā)出面向個(gè)人數(shù)字化的硅基知識(shí)大模型,主要用于進(jìn)行知識(shí)的個(gè)性化和專業(yè)化預(yù)訓(xùn)練。
面向教育領(lǐng)域,學(xué)而思正在自研數(shù)學(xué)大模型,有道發(fā)布了基于“子曰”大模型研發(fā)的AI口語(yǔ)劇透視頻。面向生物領(lǐng)域,上海人工智能研究院、祥符實(shí)驗(yàn)室、轉(zhuǎn)化醫(yī)學(xué)國(guó)家科學(xué)中心(上海)聯(lián)合發(fā)布全國(guó)首個(gè)DNA存儲(chǔ)領(lǐng)域預(yù)訓(xùn)練大模型“ChatDNA”…
通用大模型和垂直模型將構(gòu)成新的AI行業(yè)格局。通用模型大而全,能適應(yīng)千行百業(yè),擁有更多的商業(yè)場(chǎng)景和更大的商業(yè)市場(chǎng)。垂直領(lǐng)域模型小而專,可以更精準(zhǔn)地服務(wù)特定行業(yè)和特定人群,更易落地且進(jìn)行商業(yè)化。
但無(wú)論是通用大模型還是應(yīng)用層垂直模型,AI企業(yè)都有機(jī)會(huì)跑出來(lái),在“每個(gè)行業(yè)都值得用AI重構(gòu)一遍”的時(shí)代變局中。
Part.3、信心之外:無(wú)法回避的殘酷追趕現(xiàn)實(shí)
盡管國(guó)產(chǎn)大模型研發(fā)全面加速,但無(wú)論是百度、阿里這樣的國(guó)內(nèi)科技巨頭,還是信心滿滿的創(chuàng)業(yè)者都無(wú)法回避的殘酷現(xiàn)實(shí)是,自家產(chǎn)品與快速成長(zhǎng)和落地OpenAI存在不小差距,即便沒有王小川認(rèn)為的OpenAI比國(guó)內(nèi)領(lǐng)先三年之久,但也遠(yuǎn)不到“上來(lái)就說(shuō)能超越”,周鴻祎直言不諱,“那才叫吹?!?。
與海外科技巨頭相比,中國(guó)大模型廠商在數(shù)字基建上面臨著硬件條件的“先天不足”,在數(shù)據(jù)和算力等方面存在明顯短板。
在算力層面,英偉達(dá)A100芯片構(gòu)成了ChatGPT訓(xùn)練大模型的算力底座,目前市面上幾乎沒有英偉達(dá)GPU產(chǎn)品在AI大模型訓(xùn)練上的替代品。但由于GPU出口限令,死死卡住了中國(guó)AI算力的脖子,中國(guó)企業(yè)只能使用存量的A100和傳輸速率只有A100三分之二的A800。
大模型實(shí)現(xiàn)數(shù)量級(jí)飛躍離不開GPU算力加持,如果算力跟不上,會(huì)導(dǎo)致大模型的差距進(jìn)一步拉大。
在數(shù)據(jù)層面,大模型的發(fā)展依賴于高質(zhì)量的訓(xùn)練數(shù)據(jù)集,而國(guó)外數(shù)據(jù)集要領(lǐng)先中國(guó)很多。目前國(guó)內(nèi)基于中文語(yǔ)義的大模型訓(xùn)練所需要的中文數(shù)據(jù)總量不夠,而且質(zhì)量不高。國(guó)外企業(yè)可以直接使用各類整理好的公開數(shù)據(jù)訓(xùn)練AI,但國(guó)內(nèi)企業(yè)還需要付出額外的人力和資金成本來(lái)采集、清洗、標(biāo)注獲得的數(shù)據(jù)。
不久前,騰訊云曾聯(lián)合上海大學(xué)舉辦的人工智能數(shù)據(jù)標(biāo)注大賽,被網(wǎng)友調(diào)侃“思路清奇”,“1.8萬(wàn)元買到了120位大學(xué)生的40個(gè)小時(shí)用來(lái)做數(shù)據(jù)標(biāo)注”,雖在網(wǎng)絡(luò)上引起不小爭(zhēng)議,但活動(dòng)發(fā)出短短數(shù)小時(shí)后便顯示“名額已滿”。
此外,優(yōu)質(zhì)中文大模型訓(xùn)練語(yǔ)料的稀缺也會(huì)加大中國(guó)大模型和國(guó)外大模型的差距。技術(shù)差距下,中國(guó)大模型廠商正在通過后天努力,奮力追趕,以期“大力出奇跡”。
一方面,中國(guó)科技公司加速自研AI訓(xùn)練芯片,尋找國(guó)產(chǎn)替代化方案,以此來(lái)解決算力之困。例如超過英偉達(dá)A100八成能力的百度昆侖芯片,目前已經(jīng)更新到第二代,量產(chǎn)幾萬(wàn)片;第三代則預(yù)計(jì)于2024年實(shí)現(xiàn)量產(chǎn)。
此外,據(jù)華為透露,目前昇騰AI基礎(chǔ)軟硬件平臺(tái)已孵化和適配了30多個(gè)主流大模型,超過一半的中國(guó)原生大模型基于昇騰AI孵化。有消息稱,華為即將推出的昇騰920性能可以達(dá)到英偉達(dá)H100水平。此消息如果成真,將大大緩解國(guó)內(nèi)日益增長(zhǎng)的AI算力需求壓力。
另一方面,政府和企業(yè)都在積極尋找破解數(shù)據(jù)之困的方法。政府層面,數(shù)據(jù)要素政策頻出,通過建立國(guó)家數(shù)據(jù)局來(lái)協(xié)調(diào)推進(jìn)數(shù)據(jù)基礎(chǔ)制度建設(shè),統(tǒng)籌數(shù)據(jù)資源整合共享和開發(fā)利用。同時(shí),各地積極推動(dòng)數(shù)據(jù)交易所建設(shè),加速數(shù)據(jù)自由流通,緩解國(guó)內(nèi)優(yōu)質(zhì)數(shù)據(jù)集不足的問題。
產(chǎn)業(yè)層面,越來(lái)越多的數(shù)據(jù)服務(wù)商將數(shù)據(jù)加工處理、數(shù)據(jù)分析服務(wù)等方面幫助企業(yè)構(gòu)建高質(zhì)量數(shù)據(jù)集,提高數(shù)據(jù)質(zhì)量的同時(shí),加快大模型的研發(fā)效率。
國(guó)產(chǎn)大模型競(jìng)賽才剛剛開始,面對(duì)這個(gè)比移動(dòng)互聯(lián)網(wǎng)還龐大多倍的AI機(jī)會(huì),所有參與者都全情投入,盡銳出戰(zhàn),緊抓來(lái)之不易、稍縱即逝的窗口期。
即便競(jìng)爭(zhēng)異常激烈,即便難關(guān)重重,但都在朝著更創(chuàng)新的技術(shù)、更易落地的應(yīng)用、更明晰的商業(yè)化路徑方向走去。