文|趣解商業(yè) 周佟
2022年底,OpenAI發(fā)布ChatGPT掀起了人工智能熱浪,時(shí)隔一年后,谷歌終于“殺回”人工智能賽道。
當(dāng)?shù)貢r(shí)間,12月6日,谷歌正式發(fā)布了Gemini大模型。谷歌CEO桑達(dá)爾·皮查伊稱,Gemini的發(fā)布,是谷歌新時(shí)代的開始;但人們最關(guān)注的問題還是Gemini和GPT-4相比水平誰(shuí)更高。
谷歌公司高管稱,三種不同版本的套件中的Gemini Pro,表現(xiàn)優(yōu)于GPT-3.5,但暫未直接回應(yīng)Gemini與GPT-4相比表現(xiàn)如何的問題。不過外界有測(cè)評(píng)認(rèn)為,它們已經(jīng)超過了GPT-4。
圖片來(lái)源:微博截圖
不管是否超過,作為大模型的“風(fēng)向標(biāo)”,由一年前推出的ChatGPT引發(fā)的“生成式人工智能”革命,仍在不斷地改寫著每個(gè)人的認(rèn)知。如今巨頭谷歌已“上線”,過去一年,在ChatGPT的引領(lǐng)下,國(guó)內(nèi)的大模型企業(yè)也從摸索和嘗試,逐漸步入深水區(qū)。
01 “百模大戰(zhàn)”,從震驚到追趕
ChatGPT的出現(xiàn)并非毫無(wú)征兆。
創(chuàng)造它的OpenAI早在2015年便已成立,并在2018年就推出了初代生成式預(yù)訓(xùn)練模型GPT-1,這也是ChatGPT最初的原型。
公開資料顯示,在GPT-1之前,業(yè)內(nèi)的NLP模型(Neuro logic level自然語(yǔ)言處理)主要是基于針對(duì)特定任務(wù)的大量標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,能力有限。
GPT是第一個(gè)結(jié)合Transformer(多層變換器)結(jié)構(gòu)和自監(jiān)督預(yù)訓(xùn)練目標(biāo)的模型,在自然語(yǔ)言推理、問答任務(wù)和常識(shí)推理等方面取得了突破,為此它們也獲得了微軟10億美元投資。隨后,從GPT-1到GPT-2,到GPT-3,短短2年時(shí)間里GPT的能力不斷提高。
圖片來(lái)源:OpenAI官網(wǎng)截圖
2022年11月27日,隨著由GPT-3.5修改而來(lái)的人工智能對(duì)話聊天機(jī)器人ChatGPT的推出,這個(gè)一直在小圈子走紅的研究成果,才第一次為大眾所認(rèn)識(shí)。能聊天、畫畫、寫文案、編代碼,強(qiáng)大的功能,使得ChatGPT一經(jīng)發(fā)布迅速走紅,5天時(shí)間注冊(cè)用戶數(shù)超過百萬(wàn),兩個(gè)月時(shí)間月活突破1億,成為史上增長(zhǎng)最快的消費(fèi)者應(yīng)用。
消息傳至國(guó)內(nèi),一石激起千層浪。人工智能竟然已經(jīng)發(fā)展到如此地步了?震驚之下,淘寶上售賣ChatGPT賬號(hào)甚至都成了一門生意。與此同時(shí),看到巨大商機(jī)的各界大佬們,也紛紛下場(chǎng),表態(tài)要盡快推出自己的大模型。率先落地的是百度。2023年3月16日,國(guó)內(nèi)首個(gè)大語(yǔ)言模型“文心一言”問世,發(fā)布會(huì)上,百度CEO李彥宏直言,“生成式AI是任何企業(yè)都不應(yīng)錯(cuò)過的大機(jī)會(huì)”。
而百度之所以能夠拔得國(guó)內(nèi)大語(yǔ)言模型的“頭籌”,源自其過去10多年中,在AI研發(fā)上的堅(jiān)持投入。按李彥宏的說(shuō)法,文心大模型的第一個(gè)版本早在2019年就發(fā)布了,此后每年都有更新,文心一言的發(fā)布只是百度多年努力的“自然延續(xù)”。
圖片來(lái)源:百度公眾號(hào)
緊接著,3月29日,360集團(tuán)發(fā)布人工智能戰(zhàn)略及360智腦大模型1.0版本,創(chuàng)始人周鴻祎現(xiàn)場(chǎng)演示了大模型在搜索場(chǎng)景的應(yīng)用。4月11日,阿里巴巴的“通義千問”大模型在阿里云峰會(huì)上揭曉,CEO張勇宣布未來(lái)阿里巴巴所有產(chǎn)品都將接入“通義千問”。5月6日,科大訊飛星火大模型發(fā)布,董事長(zhǎng)劉慶峰表態(tài)要在10月24日實(shí)現(xiàn)中文超過ChatGPT,英文趕上ChatGPT。9月7日,騰訊混元大模型上線。
至此,國(guó)內(nèi)傳統(tǒng)的三大互聯(lián)網(wǎng)巨頭“BAT”全部下場(chǎng)。
此外,華為、京東、字節(jié)跳動(dòng)、商湯科技、昆侖萬(wàn)維等等都陸續(xù)推出了大模型產(chǎn)品,甚至連移動(dòng)、聯(lián)通、電信三大運(yùn)營(yíng)商,長(zhǎng)虹等家電生產(chǎn)企業(yè),清華、復(fù)旦、中科院等科研院所和高校,都發(fā)布了各自的大模型。
圖片來(lái)源:華為云AI公眾號(hào)
5月底舉行的中關(guān)村論壇上,有專家披露,中國(guó)10億級(jí)參數(shù)規(guī)模以上大模型已發(fā)布了79個(gè);在7月初的2023世界人工智能大會(huì)中有信息表明,中國(guó)已有130家研發(fā)大模型的公司。此時(shí),ChatGPT引起的大模型研發(fā)熱,已經(jīng)帶動(dòng)國(guó)內(nèi)形成“百模大戰(zhàn)”的格局。
不過相比當(dāng)初外賣界的“百團(tuán)大戰(zhàn)”,“百模大戰(zhàn)”對(duì)資金的需求更為苛刻。
根據(jù)NVIDIA官方信息,在訓(xùn)練底層模型階段,訓(xùn)練一次1750億參數(shù)的GPT-3需要34天、使用1024張A100 GPU芯片,而為了維持日常推理,OpenAI至少需要3.24萬(wàn)張A100,以此推算,ChatGPT僅硬件成本就超過了8億美元。
昆侖萬(wàn)維集團(tuán)CEO方漢更是公開表示,“沒有2000張A100的卡,實(shí)驗(yàn)都做不了”。為此,海天瑞聲、因賽集團(tuán)等“AI概念股”甚至接連發(fā)布定增預(yù)案,募集資金用于訓(xùn)練大模型。
此時(shí) ,如何在縮小與ChatGPT差距的同時(shí),盡快找到應(yīng)用落地的方向,實(shí)現(xiàn)自我造血,成為了“百模大戰(zhàn)”中,每一位參與者都要面對(duì)的問題。
02 人工智能+將所有行業(yè)做一遍?
從商業(yè)角度分析,大模型帶來(lái)的機(jī)遇,可以概括為成本減少效率提升、原有市場(chǎng)需求再擴(kuò)大、創(chuàng)造新的市場(chǎng)需求三大類。
在今年8月31日、11月4日,根據(jù)網(wǎng)信辦《生成式人工智能服務(wù)管理辦法(征求意見稿)》的要求,國(guó)內(nèi)先后有兩批涉及26家公司的AI大模型和151個(gè)深度合成服務(wù)算法通過備案,陸續(xù)向全社會(huì)開放服務(wù),其中的商業(yè)化嘗試,也基本是圍繞這三類展開的。
圖片來(lái)源:網(wǎng)信辦截圖
大模型超強(qiáng)的人機(jī)對(duì)話、圖文及音視頻生成能力,不但讓其在傳統(tǒng)客服場(chǎng)景中獲得了廣泛應(yīng)用,對(duì)于游戲、影視制作等也產(chǎn)生了深遠(yuǎn)影響。
阿里、美團(tuán)的在線智能客服算法,以及中國(guó)移動(dòng)的“九天大模型”、中國(guó)電信的TeleChat大模型等,都屬于此類產(chǎn)品,將應(yīng)用場(chǎng)景直接鎖定在了智能客服、智慧政務(wù)等方面。在今年的亞運(yùn)會(huì)上,科大訊飛與中國(guó)移動(dòng)聯(lián)合推出了基于星火大模型的5G新通話,接完電話之后,申請(qǐng)服務(wù),會(huì)即刻轉(zhuǎn)成文字、生成紀(jì)要、生成待辦事項(xiàng)。
游戲、影視制作方面,導(dǎo)演陸川曾在采訪時(shí)表示,“用AI畫電影海報(bào),15秒出來(lái)的效果比專業(yè)海報(bào)公司做一個(gè)月的還要好。”光線傳媒、華策影視等率先嘗試將大模型應(yīng)用在影視創(chuàng)作中的公司,股價(jià)在年中都收獲了一波大漲。原有市場(chǎng)需求再擴(kuò)大,則體現(xiàn)在對(duì)于傳統(tǒng)業(yè)務(wù)的升級(jí)上,這也是大模型應(yīng)用最廣泛的領(lǐng)域。以傳統(tǒng)的搜索引擎為例,接入文心一言后,在百度搜索框里輸入問題,給出的可以不再是鏈接,而是一個(gè)更準(zhǔn)確的答案。
10月17日,文心一言4.0發(fā)布,根據(jù)李彥宏現(xiàn)場(chǎng)的演示,除了搜索外,百度地圖、網(wǎng)盤、文庫(kù)等十余款應(yīng)用,都接入文心一言完成了重構(gòu)。
旗下業(yè)務(wù)眾多的騰訊,對(duì)騰訊云、騰訊廣告、騰訊游戲、騰訊會(huì)議等多個(gè)業(yè)務(wù)和產(chǎn)品,也已完成了接入騰訊混元大模型的測(cè)試,并取得了初步效果。
圖片來(lái)源:騰訊混元官網(wǎng)截圖
此外,在傳統(tǒng)的教育、醫(yī)療、汽車等領(lǐng)域,大模型也獲得了廣泛的應(yīng)用。接入訊飛星火大模型后,科大訊飛的學(xué)習(xí)機(jī)實(shí)現(xiàn)了AI一對(duì)一輔助教學(xué)、中英文作文批改、口語(yǔ)陪練等功能;百度推出了產(chǎn)業(yè)級(jí)的醫(yī)療行業(yè)大模型“靈醫(yī)”,有超過1000家企業(yè)級(jí)機(jī)構(gòu)先行體驗(yàn);華為云盤古大模型的賦能,則讓問界新M7在智能駕駛領(lǐng)域“遙遙領(lǐng)先”,兩個(gè)月大定突破10萬(wàn)臺(tái)。在創(chuàng)造新的市場(chǎng)需求方面,AI超級(jí)助理、AI機(jī)器人等需求也被不斷創(chuàng)造出來(lái)。前者,包括文心一言、訊飛星火、360智腦、通義千問等在內(nèi)的各家通用大模型都有相應(yīng)產(chǎn)品提供,它們大都能理解用戶的語(yǔ)言語(yǔ)義,并具備圖像理解能力,可以通過調(diào)用軟件API,使用各種各樣的工具來(lái)幫助用戶完成任務(wù);而后者,在今年8月16日舉行的2023世界機(jī)器人大會(huì)上,包括優(yōu)必選、追覓、宇樹在內(nèi)的不少于 10 家機(jī)器人企業(yè),展出了相關(guān)產(chǎn)品,賽道也正呈現(xiàn)井噴態(tài)勢(shì)。
圖片來(lái)源:通義官網(wǎng)截圖
不過,在一片欣欣向榮背后,也存在隱憂。比照各家大模型的應(yīng)用不難發(fā)現(xiàn),不管是提高效率還是擴(kuò)大需求,市場(chǎng)上絕大多數(shù)的應(yīng)用,實(shí)現(xiàn)的功能都較為雷同。
以AI學(xué)習(xí)機(jī)為例,除了科大訊飛有相關(guān)產(chǎn)品外,接入子曰大模型的網(wǎng)易有道、接入MathGPT的好未來(lái)、接入銀河大模型的作業(yè)幫,以及接入文心一言的百度、接入360智腦的360,都有類似的產(chǎn)品在售。功能方面,各自宣傳的也都大同小異,AI一對(duì)一輔導(dǎo)、全科AI作業(yè)助手、虛擬人口語(yǔ)教練等,站在消費(fèi)者的角度,幾乎很難體會(huì)到其中的差別。
盡管各家都能拿出一堆的排名榜單來(lái)論證,自己的大模型得分更高、能力更強(qiáng),但體現(xiàn)在實(shí)際應(yīng)用中時(shí),那百分之幾甚至是千分之幾的差別,還是讓人不得不產(chǎn)生疑惑:我們真的需要這么多大模型嗎?
03 AI原生應(yīng)用至上,亟待“安卓”出現(xiàn)
對(duì)于大模型步入“深水區(qū)”將會(huì)遇到的挑戰(zhàn),百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏提出了自己的看法。
近期,在深圳2023西麗湖論壇開幕式上,李彥宏就直言,擁抱AI時(shí)代,是“一把手工程”。因?yàn)镃TO、IT負(fù)責(zé)人更關(guān)注技術(shù)本身,認(rèn)為自己做大模型是交作業(yè),結(jié)果不僅資源浪費(fèi),而且用不起來(lái),最后一地雞毛;只有一把手才會(huì)真的關(guān)注,新技術(shù)如何提升自己業(yè)務(wù)的關(guān)鍵指標(biāo),一把手上陣,才能讓新技術(shù)真正為企業(yè)所用。
不斷地重復(fù)開發(fā)基礎(chǔ)大模型是對(duì)社會(huì)資源的極大浪費(fèi)。在李彥宏看來(lái),國(guó)內(nèi)如今的大模型實(shí)在是太多了。根據(jù)統(tǒng)計(jì),截止10月份,國(guó)內(nèi)已經(jīng)發(fā)布的大模型達(dá)到了238個(gè),比5月科技部統(tǒng)計(jì)時(shí)的79個(gè),翻了三倍,但與此同時(shí),市場(chǎng)上真正的AI原生應(yīng)用卻很難找出幾個(gè)。一把手應(yīng)該主導(dǎo)做AI原生應(yīng)用,而不是大模型。
圖片來(lái)源:微博截圖
“人類進(jìn)入AI時(shí)代的標(biāo)志,不是產(chǎn)生很多的大模型,而是產(chǎn)生很多的AI原生應(yīng)用?!崩顝┖暾J(rèn)為,大模型時(shí)代其實(shí)和PC時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代極為類似。PC時(shí)代,主流的操作系統(tǒng)只有Windows一個(gè),移動(dòng)互聯(lián)網(wǎng)時(shí)代,也基本只有安卓和iOS兩家,然而圍繞著它們,誕生了無(wú)數(shù)的應(yīng)用軟件。
大模型本身也屬于基礎(chǔ)底座,類似操作系統(tǒng),最終開發(fā)者要依賴為數(shù)不多的大模型來(lái)開發(fā)出各種各樣的原生應(yīng)用?!癆I原生時(shí)代,我們需要100萬(wàn)量級(jí)的AI原生應(yīng)用,但是不需要100個(gè)大模型?!?/p>
這確實(shí)是國(guó)內(nèi)的大模型玩家們不得不面對(duì)的難題。盡管市場(chǎng)上大模型產(chǎn)品有幾百個(gè),但細(xì)究起來(lái)都是在各玩各的,360智腦只為自家搜索賦能,訊飛星火此前主要是為科大訊飛的學(xué)習(xí)機(jī)產(chǎn)品服務(wù)。
相比大模型訓(xùn)練的高額花費(fèi),如果不能夠有效擴(kuò)大“朋友圈”,讓自家的大模型為更多人所用,只是一味投入,顯然難以為繼。
上半年大漲的AI概念股們,下半年幾乎集體熄火,與此不無(wú)關(guān)系??拼笥嶏w(002230.SZ)10月19日發(fā)布的三季報(bào)顯示,前三季度實(shí)現(xiàn)營(yíng)業(yè)收入126億元,同比下滑0.27%,凈利潤(rùn)9936萬(wàn)元,同比跌了76%。根據(jù)公告,其利潤(rùn)下滑的主要原因,就是源自對(duì)大模型的“堅(jiān)定投入”。
圖片來(lái)源:財(cái)報(bào)截圖
三六零(601360.SH)的情況也沒有好多少,上半年盡管新興業(yè)務(wù)“360智腦”創(chuàng)造了近2000萬(wàn)元營(yíng)收,但在9.1億元的總收入中,占比不過2.1%。在“百模大戰(zhàn)”進(jìn)入深水區(qū)后,如何圍繞各自的大模型,“擴(kuò)大朋友圈”創(chuàng)造生態(tài),爭(zhēng)取更多的開發(fā)者,成了國(guó)內(nèi)通用大模型玩家們不約而同的選擇。
在1024開發(fā)者節(jié)上,科大訊飛董事長(zhǎng)劉慶峰透露,除了聯(lián)合相關(guān)企業(yè)發(fā)布了包含金融、汽車、住建、法律等在內(nèi)的12個(gè)行業(yè)大模型外,在訊飛星火上,已有1.5萬(wàn)助手開發(fā)者,開發(fā)了超過2.9萬(wàn)個(gè)助手應(yīng)用。
圖片來(lái)源:訊飛開放平臺(tái)公眾號(hào)
百度則先后推出了“百度智能云千帆大模型平臺(tái)”、“靈境矩陣”,幫助企業(yè)開發(fā)自己的專屬大模型,目前平臺(tái)月活企業(yè)數(shù)已近萬(wàn)家。
阿里巴巴旗下的通義千問,從18億、70億、140億到720億參數(shù)規(guī)模,率先成為業(yè)界首個(gè)“全尺寸開源”的大模型,以吸引更多合作伙伴加入,共促通義千問生態(tài)建設(shè)。
去年11月,阿里巴巴發(fā)布AI開源社區(qū)“魔搭”,中國(guó)80%的大模型研發(fā)機(jī)構(gòu)把魔搭作為模型開源的首發(fā)平臺(tái)。短短一年時(shí)間,魔搭匯聚了280萬(wàn)開發(fā)者、2300多個(gè)優(yōu)質(zhì)模型,模型下載量超過1億。
正如中國(guó)科學(xué)院院士、中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)開源發(fā)展委員會(huì)主任王懷民所說(shuō),開源是AI發(fā)展的重要驅(qū)動(dòng)力,AI開源社區(qū)不僅將有力推動(dòng)AI邁向廣泛的落地應(yīng)用,還將助力中國(guó)從開源世界的參與者逐步成長(zhǎng)為引領(lǐng)者。
大模型行業(yè)的未來(lái),如智能手機(jī)系統(tǒng)的迭代。曾經(jīng),除了蘋果的iOS外,手機(jī)操作系統(tǒng)中還有諾基亞的Symbian、微軟的Windows Phone、黑莓的BlackBerry,但是最終它們無(wú)一例外都敗給了“在2012年,就擁有10萬(wàn)開發(fā)者,超過40萬(wàn)活躍應(yīng)用”的Android。
期待國(guó)產(chǎn)大模型們,早日跑出本賽道的“Android”。