文|億邦動(dòng)力網(wǎng) 胡鏷心
編輯|張睿
2023年,沒有比大模型更熱鬧的行業(yè)。在通往AGI(通用人工智能)的道路上,大廠隔空過招、應(yīng)用遍地開花,各種會(huì)議只要標(biāo)上“AI”字樣,就能座無虛席。
10月4日在東京舉行的軟銀世界企業(yè)大會(huì)上,軟銀集團(tuán)(SBG)董事長兼社長孫正義預(yù)測,能夠處理所有類型問題的通用人工智能將在未來10年成為現(xiàn)實(shí),按照技術(shù)發(fā)展的速度,AGI能比所有人類智慧的總和高出10倍,這大概是人類與猴子之間的區(qū)別。
此前,陸奇預(yù)判,OpenAI未來肯定比Google大,只不過是大1倍、5倍還是10倍;馬斯克預(yù)計(jì)2029年有望實(shí)現(xiàn)AGI。
IDC預(yù)測,全球AI計(jì)算市場規(guī)模將從2022年的195.0億美元增長到2026年的346.6億美元。其中,生成式AI計(jì)算市場規(guī)模將從2022年的8.2億美元增長到2026年的109.9億美元。至于中國市場,IDC預(yù)計(jì)中國人工智能市場規(guī)模在2023年將超過147億美元,到2026年這一規(guī)模將超過264億美元。
計(jì)算機(jī)行業(yè)是強(qiáng)β行業(yè),受技術(shù)變革與政策驅(qū)動(dòng)影響,每一輪技術(shù)周期,都會(huì)有創(chuàng)業(yè)者蜂擁而上,各領(lǐng)風(fēng)騷一兩年,進(jìn)而行業(yè)洗牌、贏家通吃。但在大模型行業(yè),“各領(lǐng)風(fēng)騷”的時(shí)間被縮短到幾個(gè)月,鮮花著錦,烈火烹油,大模型時(shí)代的從業(yè)者既要保有遠(yuǎn)大愿景,又要接地氣活下去。
01 120個(gè)大模型,誰領(lǐng)風(fēng)騷?
上半年,百度和阿里在各自的發(fā)布會(huì)上爭搶“MaaS”提法的首發(fā)權(quán),飛書和釘釘在同一天發(fā)布生成式應(yīng)用(魔法棒與My AI );下半年,華為、京東、騰訊不約而同調(diào)轉(zhuǎn)口徑從“通用”轉(zhuǎn)向“產(chǎn)業(yè)”,場景化、行業(yè)化、產(chǎn)品化成了常見字眼。
不到一年的時(shí)間,國內(nèi)大模型已經(jīng)超過了120個(gè),10億參數(shù)規(guī)模以上的大模型就已經(jīng)有79個(gè),通用大模型至少20個(gè),基本來自互聯(lián)網(wǎng)大廠和科研院所,其余均為垂直領(lǐng)域的產(chǎn)業(yè)應(yīng)用大模型。
中國部分大模型產(chǎn)品
都說是“百模大戰(zhàn)”,其實(shí)還反映了另一層信息:至少對(duì)國內(nèi)企業(yè)來說,大模型不再是稀缺資源。
民生證券在研報(bào)中指出,“單純發(fā)布一個(gè)大模型的門檻沒有市場想象中的那么高”,難的是“有一個(gè)能持續(xù)迭代,性能不斷提升的優(yōu)質(zhì)大模型”,優(yōu)質(zhì)的、獨(dú)特的數(shù)據(jù)價(jià)值更大。
Meta開源大模型Llama2的上線,讓不少人意識(shí)到,原來不需要那么多的大模型技術(shù)團(tuán)隊(duì),大部分工作可以通過開源大模型或私有化部署就可以實(shí)現(xiàn)。
隨著大廠相繼推出各自的基礎(chǔ)模型,應(yīng)用層洗牌也在加速。比如在營銷領(lǐng)域,阿里媽媽推出“萬象實(shí)驗(yàn)室”,京東推出“云鼎權(quán)益”,早期應(yīng)用AIGC搶跑的營銷公司,正在電商營銷領(lǐng)域直面巨頭競爭。
360集團(tuán)總裁周鴻祎認(rèn)為,科技巨頭、互聯(lián)網(wǎng)平臺(tái)公司,會(huì)在已有的業(yè)務(wù)上,用 AI 把握住現(xiàn)有的存量市場,這一塊不會(huì)有創(chuàng)業(yè)者大多的機(jī)會(huì)?!拔矣X得巨頭一定會(huì)用全家桶的思路,把自己的全家桶產(chǎn)品裝上它們的大模型。用戶又很懶,很多用戶會(huì)就近使用。所以這個(gè)存量市場,或者叫中心化市場,我預(yù)估在未來在大模型市場里,很難有大的改變?!?/p>
在模型層,微軟系和清華系各占國內(nèi)大模型的半壁江山;中間件層,向量數(shù)據(jù)庫異軍突起,成了2023國內(nèi)的最大贏家;而應(yīng)用層則率先爆發(fā)又率先洗牌,從搶跑到碰壁,不過一兩個(gè)月。
7月18日,微軟公布了Office 365 Copliot的企業(yè)版價(jià)格,30美元/月,適用于Microsoft 365 E3、E5、商業(yè)標(biāo)準(zhǔn)版和商業(yè)高級(jí)版客戶,相較于 Office 主線產(chǎn)品 15-30 美元/月的定價(jià),最高提升了 2 倍以上。
7月19日,Saleforce宣布Sales GPT、Service GPT和Einstein GPT Trust Layer全面上市,Sales Cloud Einstein 中包含 Sales GPT,價(jià)格為每用戶50 美元/月, Service Cloud Einstein中包含Service GPT ,價(jià)格為每用戶 50 美元/月,兩者均只有有限的GPT使用量。
8月22日,釘釘發(fā)布釘釘魔法棒收費(fèi)標(biāo)準(zhǔn),在釘釘專業(yè)版年費(fèi)9800元基礎(chǔ)上,增加10000元可獲得20萬次大模型調(diào)用額度;在專屬釘釘年費(fèi)基礎(chǔ)上,增加20000元即可獲得45萬次大模型調(diào)用額度。一次調(diào)用平均只需不到5分錢,釘釘總裁葉軍稱之為“成本定價(jià)。”
隨著微軟、Saleforce、釘釘宣布大模型產(chǎn)品定價(jià),AI應(yīng)用落地的時(shí)代已經(jīng)到來,而且相當(dāng)賣得上價(jià)。
02 255億美元資金涌入,如何變現(xiàn)?
大模型之家給出測算,2023 年,全球大模型市場規(guī)模將達(dá)到210億美元,到2028 年,其規(guī)模將達(dá)到1095億美元。而中國大模型產(chǎn)業(yè)市場規(guī)模將達(dá)到147億元人民幣,并在2028年達(dá)到1179億元。
據(jù)國外風(fēng)投數(shù)據(jù)分析公司 PitchBook 的數(shù)據(jù),2023 上半年,全球人工智能領(lǐng)域共計(jì)發(fā)生融資 1387 件,籌集融資金額255億美元,平均融資金額達(dá) 2605萬美元。
據(jù)鈦媒體數(shù)據(jù),2023 年上半年,國內(nèi)披露獲得投資的大模型公司大約 20 家,融資額普遍在千萬到數(shù)億元之間。其中,獲得融資金額最多的是大模型初創(chuàng)公司 MiniMax,6 月 1 日完成了超 2.5 億美元的新一輪融資,估值超 12 億美元。
當(dāng)下,國內(nèi)的大模型應(yīng)用主要側(cè)重行業(yè)應(yīng)用,也就是從通用大模型轉(zhuǎn)向行業(yè)大模型。
在客服領(lǐng)域,大模型大幅提升客服機(jī)器人的對(duì)話能力,也提升用戶滿意度;
在招聘領(lǐng)域,畢業(yè)生用AIGC寫簡歷、模擬面試、推薦崗位;HR們也通過大模型發(fā)JD、篩建立、組織面試;
在設(shè)計(jì)領(lǐng)域,服裝設(shè)計(jì)師通過AIGC一分鐘生成海量服裝設(shè)計(jì)圖,家居設(shè)計(jì)師也通過AIGC為業(yè)主提供無限靈感圖;
在智能制造領(lǐng)域,大模型可以降低工業(yè)質(zhì)檢的訓(xùn)練成本,提升上線時(shí)間,解決跨型號(hào)多類別缺陷生成和自動(dòng)標(biāo)注問題,提升AI的批量化復(fù)制。
7月大模型備案要求的出臺(tái),表明國家對(duì)于數(shù)據(jù)安全的重視,僅靠API接口獲取境外大模型能力的模式受到挑戰(zhàn)。
“就我所知,年初開始做To C的大模型APP都在不同程度上陷入了困境,包括接入ChatGPT API的創(chuàng)業(yè)團(tuán)隊(duì)?!本зY本王明輝在媒體采訪中指出,“To C大模型創(chuàng)業(yè)公司必須高度重視監(jiān)管和合規(guī)問題,這里既包括數(shù)據(jù)的安全也包括AI的安全,企業(yè)發(fā)展路徑的設(shè)計(jì)要具備前瞻視角,匹配新興技術(shù)行業(yè)監(jiān)管逐步完善的節(jié)奏。當(dāng)前大模型備案制管理思路下,先獲得備案通過的產(chǎn)品自然具備先發(fā)優(yōu)勢?!薄斑@時(shí)候投資方向轉(zhuǎn)為一些垂直行業(yè)大模型,或者有特殊數(shù)據(jù)場景的大模型調(diào)優(yōu)?!?/p>
“以為看到一個(gè)比互聯(lián)網(wǎng)更大的結(jié)構(gòu)性機(jī)會(huì)時(shí),本以為可以一戰(zhàn)成名,沒想到率先成了炮灰?!边@是上半年不少應(yīng)用層創(chuàng)業(yè)者的想法。
目前,大模型的B端應(yīng)用已經(jīng)出現(xiàn)四種商業(yè)模式,包括交易量收費(fèi)、定制開發(fā)費(fèi)用、服務(wù)費(fèi)用和訂閱收費(fèi)。
交易量收費(fèi)——根據(jù)客戶每月使用的 API 調(diào)用或交易量收取費(fèi)用。定價(jià)標(biāo)準(zhǔn)通常是按交易量計(jì)算,例如每千個(gè) API 調(diào)用收取一定的費(fèi)用。
定制開發(fā)費(fèi)用——如果客戶需要特定領(lǐng)域的 AI 模型,公司通常會(huì)收取定制開發(fā)費(fèi)用。定價(jià)標(biāo)準(zhǔn)通常取決于開發(fā)的難度和時(shí)間成本。
服務(wù)費(fèi)用——根據(jù)提供數(shù)據(jù)處理、標(biāo)注和質(zhì)量控制服務(wù)等來收取費(fèi)用。
訂閱費(fèi)用——客戶可以根據(jù)需要選擇不同的訂閱級(jí)別,如基本、標(biāo)準(zhǔn)或高級(jí)。訂閱費(fèi)用通常按月或按年收取,并根據(jù)所需服務(wù)的數(shù)量和類型進(jìn)行定價(jià)。
此外,文生圖領(lǐng)域率先出現(xiàn)三種成熟商業(yè)模式,代表了三種企業(yè)發(fā)展路徑。
Stability.AI打造開源生態(tài);
Midjourney打造SaaS及MaaS生態(tài);
Adobe Firefly打造的傳統(tǒng)生態(tài)工具,將所有AIGC功能集成到工具里。
對(duì)于圖片質(zhì)量一馬當(dāng)先的Midjourney,是大多C端用戶的首選。Stability.AI適合創(chuàng)業(yè)中的中小企業(yè),通過私有化部署與調(diào)優(yōu),解決各種長尾問題。Firefly則通過Adobe全家桶,進(jìn)入大B客戶的工具箱。
三種路徑有望在文生圖、文生視頻、文生音樂、文生小說等領(lǐng)域長期存在,互為補(bǔ)充。
03 AI時(shí)代的Killer App,何處誕生?
在阿里云組織的“西溪論劍”上,創(chuàng)新工場創(chuàng)始人李開復(fù)提出,AI時(shí)代的Killer App(殺手級(jí)應(yīng)用)可能有這樣的特征:完全的AI Native,放棄 Compatibility(兼容性)。
比如移動(dòng)互聯(lián)網(wǎng)最成功的產(chǎn)品之一微信,早期專注在移動(dòng)互聯(lián)網(wǎng)的特質(zhì)上,百分百押注到新技術(shù)平臺(tái)上,不要 PC版。如果拿掉AI,應(yīng)用還能用,那么AI只是錦上添花,比如Office 軟件。
妙鴨相機(jī)產(chǎn)品負(fù)責(zé)任張?jiān)鹿庹J(rèn)為,可控性是Killer App(殺手級(jí)應(yīng)用)的誕生條件之一。妙鴨團(tuán)隊(duì)一開始沒有想做底層模型的工作,更關(guān)注怎么才能用現(xiàn)存生態(tài)上開源愛好者開發(fā)的各種插件和小模型做可控性。妙鴨相機(jī)就是錨定了可控性,把照片質(zhì)量做到平均分 90 分以上,迎來了快速成功。
百度AGC總裁沈抖則在文心一言App上線時(shí)指出,現(xiàn)在講大模型的產(chǎn)品形態(tài)還太早了,OpenAI 是技術(shù)驅(qū)動(dòng)的公司,用戶體驗(yàn)其實(shí)不是它的強(qiáng)項(xiàng),接下來,大模型產(chǎn)品的迭代速度會(huì)非???、形態(tài)也會(huì)劇烈變化。
“當(dāng)年移動(dòng)互聯(lián)網(wǎng)起來的時(shí)候,我們可以用幾個(gè)關(guān)鍵詞講清楚它的定義,比如 SoLoMo(Social、Local、Mobile,利用社交媒體、地理定位服務(wù)和移動(dòng)終端設(shè)備提供更好的用戶體驗(yàn))。但現(xiàn)在大模型還無法用幾個(gè)明確的詞定義。它的能力更強(qiáng)大,但邊界也更寬泛,還遠(yuǎn)沒到收斂產(chǎn)品形態(tài)的時(shí)候。”沈抖分析。
在一場梅花創(chuàng)投主辦的投資人交流活動(dòng)上,朱嘯虎提出兩條投資AIGC應(yīng)用的標(biāo)準(zhǔn):第一,至少要取得1000萬人民幣收入。這代表產(chǎn)品得到了市場驗(yàn)證。第二,月環(huán)比增長20%以上,代表項(xiàng)目具有爆發(fā)性增長的潛質(zhì)。
AI Agent(人工智能代理)與具身智能被認(rèn)為是誕生Killer App的最好土壤。
AI Agent指AI通過獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)。比如大模型需要給予提示,也就是輸入prompt ,prompt 是否清晰會(huì)影響大模型回答的效果。而 AI Agent的工作僅需給定一個(gè)目標(biāo),它就能夠針對(duì)目標(biāo)獨(dú)立思考并做出行動(dòng)。
圖片來源:論文
AI Agent 的基礎(chǔ)架構(gòu)可以簡單劃分為 Agent = LLM + 規(guī)劃技能 + 記憶 + 工具使用,其中LLM 扮演了Agent 的“大腦”,在這個(gè)系統(tǒng)中提供推理、規(guī)劃等能力。
AI與人類的協(xié)作程度可以和自動(dòng)駕駛等級(jí)進(jìn)行類比:
ChatGP T類似 L2級(jí)別自動(dòng)駕駛,人向AI 尋求意見,AI 不直接參與工作;
Copilot 類似L3 級(jí)別自動(dòng)駕駛,人和 AI共同協(xié)作完成工作,AI生成初稿,人來調(diào)整;
Agent 相當(dāng)于 L4級(jí)別自動(dòng)駕駛,人設(shè)定目標(biāo),Agent 完成任務(wù)。
目前AI Agent的代表公司及產(chǎn)品包括:
具身智能是在為大模型加上“四肢”,指擁有身體并支持物理交互的智能體,具備感知、思考、學(xué)習(xí)、決策等能力,可以通過自然語言指令,實(shí)現(xiàn)產(chǎn)品和環(huán)境的交互,主要代表產(chǎn)品包括機(jī)器人和自動(dòng)駕駛汽車。目前的具身智能還處于初期,正在解決自然語言和機(jī)器人動(dòng)作之間的互通問題。
7 月12 日,斯坦福大學(xué)李飛飛教授研究團(tuán)隊(duì)推出VoxPoser,通過大語言模型加視覺語言模型指導(dǎo)機(jī)器人行動(dòng);7 月28 日,谷歌DeepMind 推出全球首個(gè)控制機(jī)器人的視覺-語言-動(dòng)作(VLA)模型RT-2;特斯拉推出的人形機(jī)器人Optimus、波士頓動(dòng)力的Atlas和Spot就具備接近具身智能的能力,它們可以通過機(jī)器人的身軀來模擬人類或動(dòng)物的行為和動(dòng)作,更加逼真地與人類進(jìn)行互動(dòng)。
大模型行業(yè)的發(fā)展一日千里,智源研究院院長黃鐵軍提醒所有人,我們依舊處于一個(gè)偉大時(shí)代的早期?!叭绻惐入娏r(shí)代,今天這樣一個(gè)智力時(shí)代,其實(shí)就是當(dāng)年法拉第搞發(fā)電機(jī),一旋轉(zhuǎn),電流產(chǎn)生了;現(xiàn)在是用大數(shù)據(jù)訓(xùn)模型把智力訓(xùn)練出來了,這是一個(gè)階段。后邊我們還需要一個(gè)人——麥克斯韋,因?yàn)楹筮呺姶艑W(xué)的確立,才是電力在人類社會(huì)開始靠譜可用、并推動(dòng)工業(yè)革命的前提?!?/p>
每一次技術(shù)革命帶來的沖擊是全方位的,從宏觀經(jīng)濟(jì)到微觀管理、從社會(huì)組織到個(gè)人就業(yè)。從3月文心一言發(fā)布至今,國內(nèi)大模型行業(yè)從內(nèi)測走向開放,從拼參數(shù)到拼應(yīng)用。2023年Q4到2024年Q1,國內(nèi)大模型企業(yè)也要開始證明自己的商業(yè)化能力,至于誰是大模型時(shí)代的超級(jí)應(yīng)用,一切還未揭曉。