正在閱讀:

投資人逃離大模型

掃一掃下載界面新聞APP

投資人逃離大模型

逐鹿AI大舞臺(tái),誰將脫穎而出,引領(lǐng)風(fēng)騷?

圖片來源:界面圖庫(kù)

文 | 融中財(cái)經(jīng)

人工智能浪潮的掀起,世界正迎來一場(chǎng)前所未有的技術(shù)革命。

從20世紀(jì)50年代開始人工智能技術(shù)誕生至今,已經(jīng)先后四次引起大規(guī)模的關(guān)注。而如今正處在第四次的大模型時(shí)代,前三次分別為專家系統(tǒng)時(shí)代、機(jī)器學(xué)習(xí)時(shí)代和深度學(xué)習(xí)時(shí)代。

后世之人如果要回顧這次的大模型時(shí)代,ChatGPT一定是一個(gè)繞不開的名字。2022年時(shí),Open AI研發(fā)的ChatGPT-3.5橫空出世,技驚四座,無論是寫代碼論文還是寫詩(shī)作畫,吹拉彈唱樣樣精通。

由于ChatGPT帶起了一股技術(shù)熱潮,全國(guó)各大科技公司開始紛紛投入資源和人力,開發(fā)自己的大模型產(chǎn)品,并在不同的場(chǎng)合進(jìn)行展示和推廣,百模大戰(zhàn)也就此揭開帷幕,標(biāo)志AI技術(shù)開始邁入新紀(jì)元。

時(shí)至今日,AI技術(shù)的迭代速度和應(yīng)用廣度均達(dá)到了前所未有的高度,每次技術(shù)的突破,都為人類的生活帶來了翻天覆地的變化。如果回溯中國(guó)大模型的發(fā)展歷程,融中財(cái)經(jīng)認(rèn)為起始點(diǎn)為2022年年底,彼時(shí)國(guó)內(nèi)高校率先發(fā)布大模型產(chǎn)品,比如復(fù)旦MOSS、北大ChatExcel測(cè)試版、清華大學(xué)“chatglm-6B”大模型、上海交通大學(xué)研發(fā)的“兆言”大模型、東北大學(xué)的“TechGPT”……高校的涌入打響了這場(chǎng)百模大戰(zhàn)的前奏。

各大高校打響第一槍后,一場(chǎng)關(guān)于AI的創(chuàng)業(yè)浪潮爆發(fā)。一時(shí)之間,優(yōu)秀創(chuàng)業(yè)者和科技大廠共同涌入此賽道,百模大戰(zhàn)正式打響。

最先的響應(yīng)者包括百度的文心一言、360智能大模型1.0、智譜AI ChatGLM,后續(xù)跟進(jìn)者包括商湯日日新、阿里巴巴通義千問、昆侖萬維天工、訊飛星火認(rèn)知、百川智能Baichuan-7B……根據(jù)彼時(shí)發(fā)布的算法備案,10億級(jí)參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),境內(nèi)累計(jì)41款算法完成深度合成服務(wù)算法備案。

值得一提的是,在此期間一系列地方政策開始落地,比如《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干趨勢(shì)》、《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案》等。一系列支持政策的落地也為這場(chǎng)百模大戰(zhàn)再添一把烈火。

眾所周知,競(jìng)爭(zhēng)會(huì)推動(dòng)高質(zhì)量發(fā)展,在這場(chǎng)百模大戰(zhàn)中,AI產(chǎn)品更新迭代涌入快車道。大廠在持續(xù)加碼,像“月之暗面”這樣的新玩家也在持續(xù)入局。

到今天,這場(chǎng)百模大戰(zhàn)已經(jīng)持續(xù)一年有余,激進(jìn)期向穩(wěn)定發(fā)展期轉(zhuǎn)化,目前百模大戰(zhàn)中通用大模型呈現(xiàn)寡頭競(jìng)爭(zhēng)格局?!八凝埩ⅰ币约按髲S加持下的大模型脫穎而出。

但是,這也意味著涌入決賽圈玩家們之間的廝殺會(huì)更加激烈。

目前,百模大戰(zhàn)朝新方向轉(zhuǎn)變,此前拼技術(shù)的玩家們必須直面落地商業(yè)化的難題。最近,AI圈就有傳聞,由于融資降溫,估值卻又在不斷推高的背景之下。大模型公司開始變得舉步維艱,大模型六虎開始有人放棄大模型研發(fā)轉(zhuǎn)向應(yīng)用。浪漫的技術(shù)遇上現(xiàn)實(shí)的求生難題,而是事實(shí)上 ,根據(jù)數(shù)據(jù),國(guó)內(nèi)外都已經(jīng)出現(xiàn)了不少宣布破產(chǎn)的AI企業(yè)。這其中也不乏有一些研發(fā)實(shí)力強(qiáng)勁的,但最終倒在了沒有后續(xù)資金的困難上,畢竟大模型是個(gè)極度燒錢的賽道。

滾滾長(zhǎng)江東逝水,浪花淘盡英雄。這條大模型賽道每天都有優(yōu)秀的企業(yè)在萌芽,也每天都有企業(yè)在敗退邊緣求生。對(duì)于大模型企業(yè)來說,變,則生,不變,則死。

百模大戰(zhàn)進(jìn)入新局勢(shì),放眼如今的競(jìng)爭(zhēng)者們,誰又將成為贏家,獨(dú)領(lǐng)風(fēng)騷呢?

百花齊放,百家爭(zhēng)鳴

截至目前,國(guó)內(nèi)至少已有200多家大模型廠商推出了各自的產(chǎn)品。

這其中包括有互聯(lián)網(wǎng)大廠,如百度、阿里、騰訊、華為等;還有垂直于AI領(lǐng)域的老牌廠商,如以四小龍為代表的商湯科技、曠視科技、云從科技、依圖科技等;還有一批有出色實(shí)力的新秀選手,比如六小虎智譜 AI、百川智能、月之暗面、零一萬物、Minimax和階躍星辰。

互聯(lián)網(wǎng)大廠:

騰訊混元大模型是由騰訊公司研發(fā)的大語言模型,其智元體平臺(tái)為騰訊元器。作為騰訊全鏈路自研的通用大語言模型,其參數(shù)規(guī)模超過萬億,目前提供hunyuan-pro:萬億參數(shù)版本、hunyuan-standard:千億參數(shù)版本、hunyuan-lite:百億參數(shù)版本等 3 個(gè)版本。

?通義千問大模型是由阿里云自主研發(fā)的大語言模型,智元體平臺(tái)包括阿里云、ModelScopeGPT、釘釘AI助理等。通義千問具備強(qiáng)大的語言理解、生成和推理能力,支持多語言對(duì)話和圖片文本識(shí)別,廣泛應(yīng)用于智能搜索引擎、問答系統(tǒng)和智能對(duì)話系統(tǒng)等領(lǐng)域,參數(shù)規(guī)模從18億到720億不等。

?字節(jié)跳動(dòng)的云雀大模型是一款基于注意力機(jī)制的深度學(xué)習(xí)語言模型,適用于處理自然語言處理任務(wù)。具有良好的并行性和效率,能夠在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練。云雀大模型的參數(shù)規(guī)模為1300億,是目前國(guó)內(nèi)最大的中文預(yù)訓(xùn)練模型之一?。云雀大模型的智能體平臺(tái)包括Coze、豆包、飛書智能伙伴。

老牌廠商:

商湯科技:日日新SenseNova大模型是AI四小龍中的商湯科技所推出的大模型。該大模型體系以低成本、高效率打通了各類AI應(yīng)用,提供包括:面向辦公場(chǎng)景的商湯日日新·商量語言大模型-數(shù)據(jù)分析版本、面向醫(yī)療場(chǎng)景的日日新·商量語言大模型-醫(yī)療版本“大醫(yī)”……商湯“日日新·商量大語言模型”已在金融、手機(jī)、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè),已與超過500家客戶建立深度合作,加速行業(yè)企業(yè)的智能化轉(zhuǎn)型。

曠視科技:“曠視太乙”是曠視科技推出的一款生成式人工智能大模型,具備深度學(xué)習(xí)和推理能力。該模型的應(yīng)用場(chǎng)景包括城市治理、智慧物流、智慧金融等多個(gè)領(lǐng)域,能夠提供高效、智能的解決方案,幫助企業(yè)和城市實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和智能化升級(jí)。

云從科技:云從科技推出的從容大模型包含但不限于語言大模型、視覺大模型、語音大模型、代碼生成大模型以及圖像生成大模型等,它通過實(shí)時(shí)學(xué)習(xí)并同步反饋結(jié)果,可以解決諸多AI應(yīng)用的痛點(diǎn),從而有利于快速普及個(gè)性化應(yīng)用。同時(shí),其具備上下文學(xué)習(xí)能力,能夠以更好的交互性能,應(yīng)用于金融、安防、政務(wù)、交通、能源、教育、醫(yī)療、文娛等行業(yè)領(lǐng)域。

依圖科技:“天問”大模型是上海依圖網(wǎng)絡(luò)科技有限公司在2023年底首發(fā)的一款多模態(tài)大模型,是視頻監(jiān)控領(lǐng)域內(nèi)第一個(gè)商用發(fā)布的大模型產(chǎn)品,基于先進(jìn)的Transformer架構(gòu),具有會(huì)思考、可對(duì)話、能進(jìn)化的三大特點(diǎn)

實(shí)力新秀:

月之暗面:Kimi 是大模型初創(chuàng)企業(yè)月之暗面科推出的智能助手產(chǎn)品,在自然語言處理、長(zhǎng)文本處理、多語言對(duì)話支持等方面占據(jù)優(yōu)勢(shì)。后續(xù)通過社交媒體平臺(tái),在用戶爭(zhēng)奪戰(zhàn)中占據(jù)了先機(jī)。

百川智能:百小應(yīng)是百川智能于 2024 年 5 月 22 日推出的首款 AI 助手,它基于百川智能最新發(fā)布的基座大模型 Baichuan 4,具備多輪搜索與定向搜索、文件閱讀與資料整理、智能交互、多模態(tài)能力、語音交互、Web 端和移動(dòng)端應(yīng)用等能力。此外,百川智能以醫(yī)療AI為核心業(yè)務(wù)。近期發(fā)行的AI健康顧問證明公司正在圍繞醫(yī)療應(yīng)用場(chǎng)景發(fā)力,探索醫(yī)療增強(qiáng)大模型的用戶價(jià)值和產(chǎn)業(yè)價(jià)值

智譜AI:被稱為國(guó)內(nèi)最有Open AI氣質(zhì)的大模型企業(yè)。智譜清言是北京智譜華章科技有限公司推出的一款生成式 AI 助手,基于智譜 AI 自主研發(fā)的中英雙語對(duì)話模型 ChatGLM2,經(jīng)過萬億字符的文本與代碼預(yù)訓(xùn)練,并采用有監(jiān)督微調(diào)技術(shù)。

Minimax:Minimax專注于圖像識(shí)別和計(jì)算機(jī)視覺技術(shù),旗下出品的海螺AI基于?MiniMax自研的多模態(tài)大模型,融合了?自然語言處理、?知識(shí)圖譜、?語音識(shí)別等多種AI技術(shù),賦予了海螺AI強(qiáng)大的語義理解和知識(shí)推理能力。此外,Minimax還有AI陪伴產(chǎn)品“星野”。

零一萬物:科技圈大佬李開復(fù)博士創(chuàng)立的AI企業(yè)。旗下大模型產(chǎn)品包括?Yi-34B、?Yi-Lightning、?Yi-Large等。應(yīng)用場(chǎng)景包括但不限于?智能問答?、?智能讀文檔、自動(dòng)分析和理解文檔內(nèi)容、?PPT自動(dòng)化生?復(fù)雜推理和預(yù)測(cè)。

階躍星辰:此前的大模型格局是四龍五虎,近期開始變成四龍六虎。多出來的第六只老虎,是在今年6月,由前微軟全球副總裁姜大昕創(chuàng)辦的階躍星辰。該企業(yè)是目前資本市場(chǎng)的新寵兒,以一輪估值20億美元的融資躋身進(jìn)AI獨(dú)角獸的寶座,由此奠定他第六只小虎的地位。其推出的“Step系列”通用大模型,讓業(yè)內(nèi)人士眼前一亮,其Step-2萬億參數(shù)MoE語言大模型,更是國(guó)內(nèi)首家發(fā)布。

國(guó)外AI主流玩家們

過去的兩年里,國(guó)內(nèi)外的AI大模型領(lǐng)域都迎來了迅猛的發(fā)展和創(chuàng)新。國(guó)內(nèi)有百家爭(zhēng)鳴,百花齊放的盛狀;而美國(guó)也有如OpenAI、Anthropic、Meta、Google等企業(yè)紛紛推出了新一代的大模型產(chǎn)品。

OpenAI:由山姆·奧爾特曼等人創(chuàng)立,科技巨頭微軟作為最大投資者,Open AI也是目前全球范圍內(nèi)公認(rèn)的最強(qiáng)AI企業(yè)。旗下產(chǎn)品包括GPT-3.5、GPT-4、GPT-4o等。其中GPT-4o作為 OpenAI最新產(chǎn)品也被業(yè)界稱作Open AI有史以來最好的模型,支持跨文本、音頻和視頻進(jìn)行實(shí)時(shí)推理——能聽、能說、能看、零延時(shí)、可打斷等功能

Anthropic:由OpenAI前研究副總裁達(dá)里奧·阿莫迪、大語言模型GPT-3論文的第一作者湯姆·布朗等人共同創(chuàng)立。前世界首富貝佐斯的亞馬遜已對(duì)其投資40億美元,并持有少數(shù)股權(quán)。旗下產(chǎn)品包括Claude 1、Claude 2 、Claude 3以及Claude 3.5 Sonnet。最新產(chǎn)品Claude 3.5 Sonne在2024年6月發(fā)布,該產(chǎn)品在基準(zhǔn)測(cè)試中超越了GPT-4o,同時(shí)推出了Artifacts功能,增強(qiáng)了用戶與模型的交互,使用戶能夠?qū)崟r(shí)查看、編輯并基于Claude的創(chuàng)作進(jìn)行構(gòu)建。

Meta:美國(guó)知名互聯(lián)網(wǎng)公司,創(chuàng)建者為扎克伯格,旗下AI產(chǎn)品為L(zhǎng)LaMA系列,特別適用于學(xué)術(shù)研究和開發(fā)者社區(qū)。2024年7月發(fā)布的最新產(chǎn)品LLaMA 3.1是目前最大的開源模型之一,支持128K的上下文長(zhǎng)度。LLaMA 3.1 在多模態(tài)處理、數(shù)學(xué)推理等方面表現(xiàn)出色,進(jìn)一步鞏固了其在開源社區(qū)中的領(lǐng)先地位。

Google:作為頂級(jí)科技公司的谷歌,早在2006就提出了構(gòu)建人工智能專用基礎(chǔ)設(shè)施的想法,并組建了Google X實(shí)驗(yàn)室人工智能開發(fā)團(tuán)隊(duì)。算是最早入局AI的企業(yè),目前旗下產(chǎn)品為Gemini 系列。此外,Google還推出了專為設(shè)備端優(yōu)化的Gemini Nano版本,能夠在Android設(shè)備上高效運(yùn)行,進(jìn)一步拓展了模型的應(yīng)用場(chǎng)景。2024年5月,Google在其開發(fā)者大會(huì)上展示了即將發(fā)布的Gemini 2系列。這一系列模型通過使用更強(qiáng)大的TPU v5p芯片進(jìn)行訓(xùn)練,大幅提升了計(jì)算速度和能效比。Gemini 2不僅在多模態(tài)任務(wù)上表現(xiàn)出色,還進(jìn)一步擴(kuò)展了支持的語言和應(yīng)用場(chǎng)景,預(yù)示著Google在大模型領(lǐng)域的持續(xù)發(fā)展。

在技術(shù)成熟度方面,美國(guó)AI人工智能的發(fā)展起步較早,技術(shù)積累深厚。以O(shè)penAI的GPT系列模型為例,其在自然語言處理領(lǐng)域的突破,引領(lǐng)了全球AI技術(shù)的發(fā)展潮流。相比之下,國(guó)內(nèi)雖然在大模型領(lǐng)域取得了顯著進(jìn)展,但與國(guó)際領(lǐng)先水平仍有一定差距。尤其是在大模型的訓(xùn)練、優(yōu)化和應(yīng)用方面,國(guó)內(nèi)尚需進(jìn)一步提升。而在應(yīng)用落地方面,國(guó)外AI人工智能的應(yīng)用范圍廣泛,涉及醫(yī)療、金融、教育、辦公等多個(gè)領(lǐng)域。比如,美國(guó)開發(fā)的BloombergGPT大模型在金融領(lǐng)域得到深入應(yīng)用,微軟的Office 365 Copilot則開啟了辦公生產(chǎn)力革命。而在國(guó)內(nèi),AI人工智能的應(yīng)用主要集中在互聯(lián)網(wǎng)等少數(shù)領(lǐng)域,缺乏具有廣泛影響力的商業(yè)化應(yīng)用。

截至目前為止,中美都孕育了眾多表現(xiàn)出色的大模型獨(dú)角獸。這些企業(yè)都在本土市場(chǎng)展現(xiàn)出了強(qiáng)大的創(chuàng)新能力和市場(chǎng)活力,成為全球AI技術(shù)發(fā)展的領(lǐng)頭羊。而跳出中美,盡管獨(dú)角獸的出現(xiàn)并不頻繁,但它們依然如一顆顆閃耀的珍珠,在各自地區(qū)發(fā)光發(fā)亮。

Mistral AI于2023年4月在發(fā)過巴黎成立,由前DeepMind和Meta的科學(xué)家共同組建,主要聚焦開源模型及企業(yè)級(jí)服務(wù)。Mistral AI開源的Mistral系列大模型受到了業(yè)界的廣泛贊譽(yù)。2024年4月,Mistral AI推出了全新專家混合(MoE)大模型Mixtral8x22B磁力鏈接。該模型在文本生成、問答理解等方面表現(xiàn)出色。Mixtral8x22B的具體特點(diǎn)包括對(duì)64K超長(zhǎng)上下文的支持,多語言能力,尤其在法語、德語、西班牙語等語言上表現(xiàn)流暢,以及采用Apache2.0開源協(xié)議等。據(jù)悉,Mistral AI與微軟也建立了長(zhǎng)期合作伙伴關(guān)系,利用Azure AI的超級(jí)計(jì)算基礎(chǔ)設(shè)施進(jìn)行模型訓(xùn)練,共同為客戶提供MIstral AI的模型服務(wù),成為繼OpenAI后第二家在微軟Azure云平臺(tái)上提供商業(yè)語言模型的公司。

歐洲大陸的另一個(gè)工業(yè)大國(guó)德國(guó),同樣也有自己的“Open AI”。成立于2019年的人工智能初創(chuàng)公司Aleph Alpha,將自身定位為歐洲本地AI技術(shù)的領(lǐng)導(dǎo)者。2023年,Aleph Alpha在資本市場(chǎng)上取得了顯著成就,當(dāng)年6月,Aleph Alpha獲得1億歐元A+輪融資,晉級(jí)德國(guó)AI獨(dú)角獸。2023年底,Aleph Alpha宣布完成超5億美元規(guī)模的B輪融資。該輪融資的投資方主要來自于德國(guó)本土,由創(chuàng)新園人工智能(Ipai)、博世風(fēng)險(xiǎn)投資(BoschVentures)和施瓦茨集團(tuán)(SchwarzGroup)的公司領(lǐng)投。Aleph Alpha主打“數(shù)據(jù)主權(quán)”的概念,即存儲(chǔ)在某個(gè)國(guó)家的數(shù)據(jù)受該國(guó)法律的約束,以確保數(shù)據(jù)的安全性。其生成式人工智能解決方案致力于為企業(yè)和政府提供突破性的人工智能技術(shù)。技術(shù)層面上,Aleph Alpha自研的Luminous系列大語言模型,與ChatGPT的功能類似,提供生成文本/代碼、總結(jié)內(nèi)容、翻譯等服務(wù)。

除上述之外,估值50億美元的加拿大多倫多企業(yè)Cohere、由印度知名企業(yè)家巴維什?阿加瓦爾創(chuàng)建的Krutrim、以色列AI大模型公司AI21 Labs……這些都是知名的AI獨(dú)角獸企業(yè)。

閉源與開源之爭(zhēng)

在目前千萬計(jì)的大模型報(bào)道中,閉源與開源一次被廣泛使用。而這二者究竟是什么?又究竟有何區(qū)別呢?

開源大模型和閉源大模型都作為大模型的兩種主要技術(shù)形態(tài),其各自擁有獨(dú)特魅力和應(yīng)用場(chǎng)景。

開源大模型是指由開源社區(qū)或組織開發(fā)、維護(hù)和共享的大型軟件模型。其最大的特點(diǎn)在于開放性和可擴(kuò)展性,即代碼和模型結(jié)構(gòu)公開可用,任何人都可以訪問、修改和使用。

而閉源大模型與開源大模型相反,其代碼和結(jié)構(gòu)是私有的,僅由特定的組織或個(gè)人擁有并維護(hù)。這種模型通常用于保護(hù)知識(shí)產(chǎn)權(quán)、商業(yè)機(jī)密和競(jìng)爭(zhēng)優(yōu)勢(shì),因此其定制和修改的程度可能受到一定限制。

乍一看,似乎開源大模型的優(yōu)勢(shì)遠(yuǎn)遠(yuǎn)強(qiáng)于閉源大模型。但目前市場(chǎng)觀點(diǎn)認(rèn)為,在AI最難且最重要的商業(yè)化領(lǐng)域上,閉源大模型更有優(yōu)勢(shì)。

市場(chǎng)觀點(diǎn)認(rèn)為,閉源模型是商業(yè)化模型。開源模型效率不行,無法解決算力問題;開源模型成本反而更高;開源模型對(duì)技術(shù)要求更高……

開源模型因其并未開放訓(xùn)練源代碼、預(yù)訓(xùn)練和精調(diào)數(shù)據(jù)等影響模型效果的關(guān)鍵信息,所以無法像開源軟件一樣,靠社區(qū)開發(fā)者一起參與來提升效果和性能,而基座模型的訓(xùn)練只能掌握在廠商自己手里。

百度的CEO李彥宏就是閉源大模型的資深支持者。今年七月的2024年人工智能大會(huì)期間,李彥宏發(fā)表“開源模型是智商稅的言論。”他認(rèn)為,在同樣參數(shù)規(guī)模下,開源模型的能力不如閉源,“如果開源模型想要在能力上追平閉源模型,就需要更大的參數(shù)規(guī)模,這將導(dǎo)致更高的推理成本和更慢的反應(yīng)速度。”

而這也并不是這位大佬第一次發(fā)出這樣的聲明。在此前,他就提出開源大模型會(huì)越來越落后的觀點(diǎn)。而這在不久后就立刻遭到紅衣教主,360CEO周鴻祎的強(qiáng)烈反對(duì)。

而事實(shí)上,大佬們對(duì)于開源還是閉源的爭(zhēng)論還有很多案例,也有像王小川“開源和閉源并非像手機(jī)中IOS和安卓必須二選一情況”的中立觀點(diǎn)。這些路線之爭(zhēng),背后往往是商業(yè)路線的分歧。

但就目前來講,似乎閉源模型的產(chǎn)業(yè)化和商業(yè)化能力似乎更強(qiáng)。大模型與業(yè)務(wù)結(jié)合,需要產(chǎn)品、運(yùn)營(yíng)、測(cè)試工程師等多種角色共同參與,同時(shí)大模型的長(zhǎng)期應(yīng)用所需的算力、存儲(chǔ)、網(wǎng)絡(luò)等配套都要跟上,開源社區(qū)無法幫助用戶“一站式”解決這些細(xì)節(jié)問題。

此外,閉源大模型的整體能力似乎強(qiáng)于開源。OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra都是閉源。

而回到國(guó)內(nèi)百模大戰(zhàn)中去看,大多數(shù)都是以開源和閉源雙向發(fā)展的路徑。比如百川智能、零一萬物、阿里商湯、智譜……但也有像百度和月之暗面這樣專攻閉源大模型的存在。

百度一直是主攻閉源大模型的選手,目前為止,雖然百度文心一言仍堅(jiān)持閉源路線,但百度智能云部門在其平臺(tái)上提供了大量性能很強(qiáng)的第三方開源大模型。百度通過閉源文心一言,也通過開源大模型使用的算力、工具和服務(wù),來實(shí)現(xiàn)商業(yè)上的收益。

而與百度相反,阿里云則正在大力推廣開源,一方面是為了加快市場(chǎng)份額的爭(zhēng)奪;另一方面作為云計(jì)算企業(yè),它可以在算力、工具和服務(wù)上獲得收益。

華為云2023年在推出盤古大模型3.0時(shí),就表態(tài)采用閉源路線。過去一年,它的重心是在各行業(yè)進(jìn)行聯(lián)創(chuàng),落地大模型,并將技術(shù)回饋盤古,不斷迭代,未參與業(yè)界開閉源討論。華為云在上周也剛剛官宣盤古5.0多模態(tài)大模型,發(fā)布期間也未涉及開源問題。

實(shí)力新秀智譜,也是國(guó)內(nèi)最早開源大模型的企業(yè)。由于旗下研究的GLM開源大模型而獲得大量關(guān)注,也讓這家2019年才成立的公司,在融資和商業(yè)化上受益頗多。因?yàn)橹亲V由清華技術(shù)成果轉(zhuǎn)化而來,2022年,它就將開發(fā)的雙語千億模型GLM-130B開源,“當(dāng)時(shí)全國(guó)懂大模型的研究員加起來也不過百來人”。智譜CEO張鵬稱,開源讓大家知道智譜在做什么,同時(shí)可以讓更多人參與推動(dòng)大模型。此后在2023年3月,智譜將GLM6b開源,該模型在Hugging Face上的下載量超過1600萬。

另一位新秀月之暗面,則是閉源大模型的擁護(hù)者。掌門人楊植麟堅(jiān)定表示將專注 ToC,并會(huì)以長(zhǎng)文本輸入為核心構(gòu)建其底座大模型的差異化競(jìng)爭(zhēng)力。他認(rèn)為這是行業(yè)現(xiàn)在最需要解決的問題,也是通往下一步產(chǎn)品化路上的最大卡點(diǎn)。

而對(duì)于開源和閉源,楊植麟認(rèn)為像 OpenAI 一樣的閉源是通往Super APP(超級(jí)應(yīng)用)的唯一通路,而開源只是 ToB 的獲客手段?!胺惨?C 端超級(jí) APP 的,都是閉源。”

從楊植麟的回答中,或許可以得出閉源與開源的選擇或許是基于大模型企業(yè)頂下的商業(yè)路線是主To C還是Tp B。

百舸爭(zhēng)流,奮楫者先

在數(shù)字化浪潮的推動(dòng)下,百模大戰(zhàn)堪稱人工智能領(lǐng)域一場(chǎng)前所未有的盛事。這場(chǎng)賽事匯聚了全國(guó)頂尖的人工智能研發(fā)團(tuán)隊(duì),他們攜帶著各自精心打造的模型,準(zhǔn)備在這場(chǎng)科技盛宴中一展身手。這些模型,如百余艘船只,在算法的海洋上展開激烈的角逐,展示它們?cè)趫D像識(shí)別、自然語言處理、機(jī)器學(xué)習(xí)等眾多領(lǐng)域的卓越能力。

大模型時(shí)代并不同于前三個(gè)時(shí)代,由于大模型通用性的特征,其發(fā)展十分有望實(shí)現(xiàn)商業(yè)閉環(huán)。也因此,在這個(gè)大模型時(shí)代,吸引了眾多玩家涌入賽道競(jìng)爭(zhēng),形成百花齊開,百舸爭(zhēng)流的現(xiàn)象。

另一方面,大模型的市場(chǎng)規(guī)模也在持續(xù)擴(kuò)大,資本熱度攀升。在2023年時(shí),國(guó)內(nèi)語言大模型的市場(chǎng)規(guī)模就突破了100億元,并還在繼續(xù)上升中。市場(chǎng)規(guī)模的擴(kuò)大為這場(chǎng)激烈的百模大戰(zhàn)再添一把火。

目前整個(gè)大模型賽道處于高擁擠的狀態(tài),而對(duì)于大模型來說至關(guān)重要的算力等其他資源卻是有限的。隨著市場(chǎng)競(jìng)爭(zhēng)的日益激烈,算力等資源會(huì)呈現(xiàn)供需失衡的狀態(tài)并出現(xiàn)資源配置傾斜。再加上算力成本的不斷上漲,導(dǎo)致大模型玩家們必須積極競(jìng)爭(zhēng)來構(gòu)建優(yōu)勢(shì),以此來獲得資源的長(zhǎng)期發(fā)展和支持。

這也是為什么業(yè)界有了“百模大戰(zhàn),必有一戰(zhàn)”的說法。

如今,這場(chǎng)百模大戰(zhàn)已持續(xù)一年有余,戰(zhàn)事正逐漸往新的階段升級(jí)。

有一個(gè)十分明顯的預(yù)兆,大模型融資已經(jīng)在開始慢慢降溫了。

今年伊始,Open AI推出Sora掀起國(guó)內(nèi)外視頻大模型的鏖戰(zhàn)。在那段時(shí)間,幾乎沒多久就會(huì)有大模型企業(yè)融資的消息傳出。而到了6月,似乎一切都改變了。資本的眼球被具身智能等賽道吸引,大模型的融資數(shù)量較去年略有下降,開始有降溫跡象的出現(xiàn)。

大模型的發(fā)展需要大量資源和算力的消耗,在這種邏輯下,金錢就成了唯一入場(chǎng)券??墒乾F(xiàn)在大模型技術(shù)的進(jìn)展卻與預(yù)期差距很大。投資人投入入巨額資金后,何時(shí)見效尚未可知,這也引起大多數(shù)投資人的焦慮心理。種種之下,如今的降溫現(xiàn)象似乎順理成章。

這樣的境地也迫使大模型人士開始繼續(xù)思考未來的商業(yè)化問題,浪漫的技術(shù)研發(fā)逐漸向艱苦的落地求生轉(zhuǎn)化。由此,引發(fā)了一系列新的競(jìng)爭(zhēng)。

據(jù)融中財(cái)經(jīng)不完全梳理,目前為止已有超過7家大模型企業(yè)參戰(zhàn)。包括字節(jié)跳動(dòng)、阿里云、百度、騰訊、智譜AI、科大訊飛等。

據(jù)梳理,今年5月11日,大模型獨(dú)角獸智譜AI宣布其入門級(jí)模型GLM-3 Turbo的API降價(jià)為1元/百萬tokens。5月15日,字節(jié)宣布旗下通用模型豆包pro-128k版模型推理輸入價(jià)格降至比行業(yè)價(jià)格低95.8%,豆包pro-32k模型推理輸入降至比行業(yè)價(jià)格低99.3%。5月21日,阿里云宣布旗下9款大模型全面降價(jià),降幅最高達(dá)到97%,兩款開源模型更是開啟七天限免。幾個(gè)小時(shí)后,百度直接宣布兩款輕量級(jí)模型ERNIE Speed、ERNIE Lite免費(fèi)開放。隨后,又有兩位玩家入局。先是科大訊飛宣布輕量級(jí)模型API永久免費(fèi)開放。后又有騰訊云宣布混元-lite即日起免費(fèi),其他模型降幅最高達(dá)到87.5%。

一大基本現(xiàn)實(shí)是:當(dāng)前,國(guó)內(nèi)并沒有出現(xiàn)真正的殺手級(jí)大模型應(yīng)用。國(guó)內(nèi)頭部大模型玩家們?cè)谡w能力差異上,可能并不存在絕對(duì)領(lǐng)先的情況,大家都是處于趨同的存在,有的只是在能力上的各有特點(diǎn)與側(cè)重。

這樣的現(xiàn)實(shí)之下,如果其他大模型廠商們不跟進(jìn)阿里、百度、字節(jié)、騰訊的這一波價(jià)格戰(zhàn),最終的結(jié)局就可能是被市場(chǎng)淘汰。畢竟在當(dāng)前現(xiàn)實(shí)下,想要維持原本價(jià)格本已是一件難事兒,更何況當(dāng)前這幾大大模型廠商已經(jīng)開始讓用戶嘗到了更便宜乃至免費(fèi)的滋味了。當(dāng)你走進(jìn)這歡樂場(chǎng),悲傷所有的夢(mèng)與想,各色的臉上各色的妝,沒人記得你的摸樣。

另外,在新時(shí)代下,大模型正在從拼參數(shù)到卷應(yīng)用上。

百度的“文心一言”專注于內(nèi)容創(chuàng)作和教育服務(wù),為媒體和廣告行業(yè)提供高效的文案支持,并在教育領(lǐng)域成為學(xué)生的智能學(xué)習(xí)伙伴??拼笥嶏w的“星火”大模型在教育和醫(yī)療領(lǐng)域展現(xiàn)出其獨(dú)特的價(jià)值,為學(xué)生提供定制化的學(xué)習(xí)方案,并輔助醫(yī)生進(jìn)行精確的醫(yī)療決策。昆侖萬維的“天工”大模型則專注于游戲產(chǎn)業(yè),能夠自動(dòng)生成游戲內(nèi)容并進(jìn)行智能運(yùn)營(yíng)。智譜AI在構(gòu)建與Open AI相匹敵的模型產(chǎn)品的同時(shí),通過提供API和云服務(wù)私有化部署等方案,在科研領(lǐng)域?yàn)檠芯咳藛T提供文獻(xiàn)檢索和分析服務(wù);并與金融機(jī)構(gòu)合作,進(jìn)行風(fēng)險(xiǎn)評(píng)估和投資決策分析。此外,智譜AI還與國(guó)際科研機(jī)構(gòu)和企業(yè)共同探索大模型的應(yīng)用。MiniMax通過面向消費(fèi)者和企業(yè)兩端的策略,推出了多種類型的應(yīng)用。在消費(fèi)者端,推出了智能聊天助手;在企業(yè)端,與企業(yè)合作開發(fā)智能客服系統(tǒng)和辦公自動(dòng)化軟件。

隨著大模型技術(shù)的日益成熟,其在實(shí)際應(yīng)用中的落地成為了衡量技術(shù)價(jià)值的關(guān)鍵,也是技術(shù)商業(yè)化的重要途徑。目前,大模型行業(yè)的關(guān)注點(diǎn)已經(jīng)從模型的開發(fā)轉(zhuǎn)向了應(yīng)用的實(shí)際落地。無論是擁有強(qiáng)大背景的大模型公司,還是新興的初創(chuàng)企業(yè),都在努力推動(dòng)應(yīng)用的發(fā)展,目標(biāo)是打造具有廣泛影響力的應(yīng)用。

不同的廠商采取了不同的策略。一些廠商通過大量的廣告宣傳來吸引用戶,利用流量?jī)?yōu)勢(shì);一些則不斷進(jìn)行產(chǎn)品迭代和優(yōu)化,以提升產(chǎn)品性能和用戶體驗(yàn);還有一些采取了面向消費(fèi)者和企業(yè)兩端的策略,以擴(kuò)大市場(chǎng)份額。

落地,是任何技術(shù)商業(yè)化的必要途徑,因?yàn)樗軌蚪o企業(yè)帶來直接的經(jīng)濟(jì)回報(bào)。這也是為什么現(xiàn)在的百模大戰(zhàn)從曾經(jīng)的拼參數(shù)逐漸轉(zhuǎn)向到卷應(yīng)用上去。

說到底,如今的百模大戰(zhàn)不論是打價(jià)格戰(zhàn)還是卷到應(yīng)用層,這些都是企業(yè)們追求盈利的手段。任何浪漫的技術(shù),都需要先活下來,吃飽飯?jiān)偃プ非罄硐胫械臑跬邪睢?/p>

而在這樣的路徑上,大模型企業(yè)怎么才能夠闖出成功之路?唯有努力前進(jìn),探索更多大模型落地的可能性。正所謂,百舸爭(zhēng)流,奮楫者先。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

投資人逃離大模型

逐鹿AI大舞臺(tái),誰將脫穎而出,引領(lǐng)風(fēng)騷?

圖片來源:界面圖庫(kù)

文 | 融中財(cái)經(jīng)

人工智能浪潮的掀起,世界正迎來一場(chǎng)前所未有的技術(shù)革命。

從20世紀(jì)50年代開始人工智能技術(shù)誕生至今,已經(jīng)先后四次引起大規(guī)模的關(guān)注。而如今正處在第四次的大模型時(shí)代,前三次分別為專家系統(tǒng)時(shí)代、機(jī)器學(xué)習(xí)時(shí)代和深度學(xué)習(xí)時(shí)代。

后世之人如果要回顧這次的大模型時(shí)代,ChatGPT一定是一個(gè)繞不開的名字。2022年時(shí),Open AI研發(fā)的ChatGPT-3.5橫空出世,技驚四座,無論是寫代碼論文還是寫詩(shī)作畫,吹拉彈唱樣樣精通。

由于ChatGPT帶起了一股技術(shù)熱潮,全國(guó)各大科技公司開始紛紛投入資源和人力,開發(fā)自己的大模型產(chǎn)品,并在不同的場(chǎng)合進(jìn)行展示和推廣,百模大戰(zhàn)也就此揭開帷幕,標(biāo)志AI技術(shù)開始邁入新紀(jì)元。

時(shí)至今日,AI技術(shù)的迭代速度和應(yīng)用廣度均達(dá)到了前所未有的高度,每次技術(shù)的突破,都為人類的生活帶來了翻天覆地的變化。如果回溯中國(guó)大模型的發(fā)展歷程,融中財(cái)經(jīng)認(rèn)為起始點(diǎn)為2022年年底,彼時(shí)國(guó)內(nèi)高校率先發(fā)布大模型產(chǎn)品,比如復(fù)旦MOSS、北大ChatExcel測(cè)試版、清華大學(xué)“chatglm-6B”大模型、上海交通大學(xué)研發(fā)的“兆言”大模型、東北大學(xué)的“TechGPT”……高校的涌入打響了這場(chǎng)百模大戰(zhàn)的前奏。

各大高校打響第一槍后,一場(chǎng)關(guān)于AI的創(chuàng)業(yè)浪潮爆發(fā)。一時(shí)之間,優(yōu)秀創(chuàng)業(yè)者和科技大廠共同涌入此賽道,百模大戰(zhàn)正式打響。

最先的響應(yīng)者包括百度的文心一言、360智能大模型1.0、智譜AI ChatGLM,后續(xù)跟進(jìn)者包括商湯日日新、阿里巴巴通義千問、昆侖萬維天工、訊飛星火認(rèn)知、百川智能Baichuan-7B……根據(jù)彼時(shí)發(fā)布的算法備案,10億級(jí)參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),境內(nèi)累計(jì)41款算法完成深度合成服務(wù)算法備案。

值得一提的是,在此期間一系列地方政策開始落地,比如《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干趨勢(shì)》、《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案》等。一系列支持政策的落地也為這場(chǎng)百模大戰(zhàn)再添一把烈火。

眾所周知,競(jìng)爭(zhēng)會(huì)推動(dòng)高質(zhì)量發(fā)展,在這場(chǎng)百模大戰(zhàn)中,AI產(chǎn)品更新迭代涌入快車道。大廠在持續(xù)加碼,像“月之暗面”這樣的新玩家也在持續(xù)入局。

到今天,這場(chǎng)百模大戰(zhàn)已經(jīng)持續(xù)一年有余,激進(jìn)期向穩(wěn)定發(fā)展期轉(zhuǎn)化,目前百模大戰(zhàn)中通用大模型呈現(xiàn)寡頭競(jìng)爭(zhēng)格局?!八凝埩ⅰ币约按髲S加持下的大模型脫穎而出。

但是,這也意味著涌入決賽圈玩家們之間的廝殺會(huì)更加激烈。

目前,百模大戰(zhàn)朝新方向轉(zhuǎn)變,此前拼技術(shù)的玩家們必須直面落地商業(yè)化的難題。最近,AI圈就有傳聞,由于融資降溫,估值卻又在不斷推高的背景之下。大模型公司開始變得舉步維艱,大模型六虎開始有人放棄大模型研發(fā)轉(zhuǎn)向應(yīng)用。浪漫的技術(shù)遇上現(xiàn)實(shí)的求生難題,而是事實(shí)上 ,根據(jù)數(shù)據(jù),國(guó)內(nèi)外都已經(jīng)出現(xiàn)了不少宣布破產(chǎn)的AI企業(yè)。這其中也不乏有一些研發(fā)實(shí)力強(qiáng)勁的,但最終倒在了沒有后續(xù)資金的困難上,畢竟大模型是個(gè)極度燒錢的賽道。

滾滾長(zhǎng)江東逝水,浪花淘盡英雄。這條大模型賽道每天都有優(yōu)秀的企業(yè)在萌芽,也每天都有企業(yè)在敗退邊緣求生。對(duì)于大模型企業(yè)來說,變,則生,不變,則死。

百模大戰(zhàn)進(jìn)入新局勢(shì),放眼如今的競(jìng)爭(zhēng)者們,誰又將成為贏家,獨(dú)領(lǐng)風(fēng)騷呢?

百花齊放,百家爭(zhēng)鳴

截至目前,國(guó)內(nèi)至少已有200多家大模型廠商推出了各自的產(chǎn)品。

這其中包括有互聯(lián)網(wǎng)大廠,如百度、阿里、騰訊、華為等;還有垂直于AI領(lǐng)域的老牌廠商,如以四小龍為代表的商湯科技、曠視科技、云從科技、依圖科技等;還有一批有出色實(shí)力的新秀選手,比如六小虎智譜 AI、百川智能、月之暗面、零一萬物、Minimax和階躍星辰。

互聯(lián)網(wǎng)大廠:

騰訊混元大模型是由騰訊公司研發(fā)的大語言模型,其智元體平臺(tái)為騰訊元器。作為騰訊全鏈路自研的通用大語言模型,其參數(shù)規(guī)模超過萬億,目前提供hunyuan-pro:萬億參數(shù)版本、hunyuan-standard:千億參數(shù)版本、hunyuan-lite:百億參數(shù)版本等 3 個(gè)版本。

?通義千問大模型是由阿里云自主研發(fā)的大語言模型,智元體平臺(tái)包括阿里云、ModelScopeGPT、釘釘AI助理等。通義千問具備強(qiáng)大的語言理解、生成和推理能力,支持多語言對(duì)話和圖片文本識(shí)別,廣泛應(yīng)用于智能搜索引擎、問答系統(tǒng)和智能對(duì)話系統(tǒng)等領(lǐng)域,參數(shù)規(guī)模從18億到720億不等。

?字節(jié)跳動(dòng)的云雀大模型是一款基于注意力機(jī)制的深度學(xué)習(xí)語言模型,適用于處理自然語言處理任務(wù)。具有良好的并行性和效率,能夠在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練。云雀大模型的參數(shù)規(guī)模為1300億,是目前國(guó)內(nèi)最大的中文預(yù)訓(xùn)練模型之一?。云雀大模型的智能體平臺(tái)包括Coze、豆包、飛書智能伙伴。

老牌廠商:

商湯科技:日日新SenseNova大模型是AI四小龍中的商湯科技所推出的大模型。該大模型體系以低成本、高效率打通了各類AI應(yīng)用,提供包括:面向辦公場(chǎng)景的商湯日日新·商量語言大模型-數(shù)據(jù)分析版本、面向醫(yī)療場(chǎng)景的日日新·商量語言大模型-醫(yī)療版本“大醫(yī)”……商湯“日日新·商量大語言模型”已在金融、手機(jī)、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè),已與超過500家客戶建立深度合作,加速行業(yè)企業(yè)的智能化轉(zhuǎn)型。

曠視科技:“曠視太乙”是曠視科技推出的一款生成式人工智能大模型,具備深度學(xué)習(xí)和推理能力。該模型的應(yīng)用場(chǎng)景包括城市治理、智慧物流、智慧金融等多個(gè)領(lǐng)域,能夠提供高效、智能的解決方案,幫助企業(yè)和城市實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和智能化升級(jí)。

云從科技:云從科技推出的從容大模型包含但不限于語言大模型、視覺大模型、語音大模型、代碼生成大模型以及圖像生成大模型等,它通過實(shí)時(shí)學(xué)習(xí)并同步反饋結(jié)果,可以解決諸多AI應(yīng)用的痛點(diǎn),從而有利于快速普及個(gè)性化應(yīng)用。同時(shí),其具備上下文學(xué)習(xí)能力,能夠以更好的交互性能,應(yīng)用于金融、安防、政務(wù)、交通、能源、教育、醫(yī)療、文娛等行業(yè)領(lǐng)域。

依圖科技:“天問”大模型是上海依圖網(wǎng)絡(luò)科技有限公司在2023年底首發(fā)的一款多模態(tài)大模型,是視頻監(jiān)控領(lǐng)域內(nèi)第一個(gè)商用發(fā)布的大模型產(chǎn)品,基于先進(jìn)的Transformer架構(gòu),具有會(huì)思考、可對(duì)話、能進(jìn)化的三大特點(diǎn)

實(shí)力新秀:

月之暗面:Kimi 是大模型初創(chuàng)企業(yè)月之暗面科推出的智能助手產(chǎn)品,在自然語言處理、長(zhǎng)文本處理、多語言對(duì)話支持等方面占據(jù)優(yōu)勢(shì)。后續(xù)通過社交媒體平臺(tái),在用戶爭(zhēng)奪戰(zhàn)中占據(jù)了先機(jī)。

百川智能:百小應(yīng)是百川智能于 2024 年 5 月 22 日推出的首款 AI 助手,它基于百川智能最新發(fā)布的基座大模型 Baichuan 4,具備多輪搜索與定向搜索、文件閱讀與資料整理、智能交互、多模態(tài)能力、語音交互、Web 端和移動(dòng)端應(yīng)用等能力。此外,百川智能以醫(yī)療AI為核心業(yè)務(wù)。近期發(fā)行的AI健康顧問證明公司正在圍繞醫(yī)療應(yīng)用場(chǎng)景發(fā)力,探索醫(yī)療增強(qiáng)大模型的用戶價(jià)值和產(chǎn)業(yè)價(jià)值

智譜AI:被稱為國(guó)內(nèi)最有Open AI氣質(zhì)的大模型企業(yè)。智譜清言是北京智譜華章科技有限公司推出的一款生成式 AI 助手,基于智譜 AI 自主研發(fā)的中英雙語對(duì)話模型 ChatGLM2,經(jīng)過萬億字符的文本與代碼預(yù)訓(xùn)練,并采用有監(jiān)督微調(diào)技術(shù)。

Minimax:Minimax專注于圖像識(shí)別和計(jì)算機(jī)視覺技術(shù),旗下出品的海螺AI基于?MiniMax自研的多模態(tài)大模型,融合了?自然語言處理、?知識(shí)圖譜、?語音識(shí)別等多種AI技術(shù),賦予了海螺AI強(qiáng)大的語義理解和知識(shí)推理能力。此外,Minimax還有AI陪伴產(chǎn)品“星野”。

零一萬物:科技圈大佬李開復(fù)博士創(chuàng)立的AI企業(yè)。旗下大模型產(chǎn)品包括?Yi-34B、?Yi-Lightning、?Yi-Large等。應(yīng)用場(chǎng)景包括但不限于?智能問答?、?智能讀文檔、自動(dòng)分析和理解文檔內(nèi)容、?PPT自動(dòng)化生?復(fù)雜推理和預(yù)測(cè)。

階躍星辰:此前的大模型格局是四龍五虎,近期開始變成四龍六虎。多出來的第六只老虎,是在今年6月,由前微軟全球副總裁姜大昕創(chuàng)辦的階躍星辰。該企業(yè)是目前資本市場(chǎng)的新寵兒,以一輪估值20億美元的融資躋身進(jìn)AI獨(dú)角獸的寶座,由此奠定他第六只小虎的地位。其推出的“Step系列”通用大模型,讓業(yè)內(nèi)人士眼前一亮,其Step-2萬億參數(shù)MoE語言大模型,更是國(guó)內(nèi)首家發(fā)布。

國(guó)外AI主流玩家們

過去的兩年里,國(guó)內(nèi)外的AI大模型領(lǐng)域都迎來了迅猛的發(fā)展和創(chuàng)新。國(guó)內(nèi)有百家爭(zhēng)鳴,百花齊放的盛狀;而美國(guó)也有如OpenAI、Anthropic、Meta、Google等企業(yè)紛紛推出了新一代的大模型產(chǎn)品。

OpenAI:由山姆·奧爾特曼等人創(chuàng)立,科技巨頭微軟作為最大投資者,Open AI也是目前全球范圍內(nèi)公認(rèn)的最強(qiáng)AI企業(yè)。旗下產(chǎn)品包括GPT-3.5、GPT-4、GPT-4o等。其中GPT-4o作為 OpenAI最新產(chǎn)品也被業(yè)界稱作Open AI有史以來最好的模型,支持跨文本、音頻和視頻進(jìn)行實(shí)時(shí)推理——能聽、能說、能看、零延時(shí)、可打斷等功能

Anthropic:由OpenAI前研究副總裁達(dá)里奧·阿莫迪、大語言模型GPT-3論文的第一作者湯姆·布朗等人共同創(chuàng)立。前世界首富貝佐斯的亞馬遜已對(duì)其投資40億美元,并持有少數(shù)股權(quán)。旗下產(chǎn)品包括Claude 1、Claude 2 、Claude 3以及Claude 3.5 Sonnet。最新產(chǎn)品Claude 3.5 Sonne在2024年6月發(fā)布,該產(chǎn)品在基準(zhǔn)測(cè)試中超越了GPT-4o,同時(shí)推出了Artifacts功能,增強(qiáng)了用戶與模型的交互,使用戶能夠?qū)崟r(shí)查看、編輯并基于Claude的創(chuàng)作進(jìn)行構(gòu)建。

Meta:美國(guó)知名互聯(lián)網(wǎng)公司,創(chuàng)建者為扎克伯格,旗下AI產(chǎn)品為L(zhǎng)LaMA系列,特別適用于學(xué)術(shù)研究和開發(fā)者社區(qū)。2024年7月發(fā)布的最新產(chǎn)品LLaMA 3.1是目前最大的開源模型之一,支持128K的上下文長(zhǎng)度。LLaMA 3.1 在多模態(tài)處理、數(shù)學(xué)推理等方面表現(xiàn)出色,進(jìn)一步鞏固了其在開源社區(qū)中的領(lǐng)先地位。

Google:作為頂級(jí)科技公司的谷歌,早在2006就提出了構(gòu)建人工智能專用基礎(chǔ)設(shè)施的想法,并組建了Google X實(shí)驗(yàn)室人工智能開發(fā)團(tuán)隊(duì)。算是最早入局AI的企業(yè),目前旗下產(chǎn)品為Gemini 系列。此外,Google還推出了專為設(shè)備端優(yōu)化的Gemini Nano版本,能夠在Android設(shè)備上高效運(yùn)行,進(jìn)一步拓展了模型的應(yīng)用場(chǎng)景。2024年5月,Google在其開發(fā)者大會(huì)上展示了即將發(fā)布的Gemini 2系列。這一系列模型通過使用更強(qiáng)大的TPU v5p芯片進(jìn)行訓(xùn)練,大幅提升了計(jì)算速度和能效比。Gemini 2不僅在多模態(tài)任務(wù)上表現(xiàn)出色,還進(jìn)一步擴(kuò)展了支持的語言和應(yīng)用場(chǎng)景,預(yù)示著Google在大模型領(lǐng)域的持續(xù)發(fā)展。

在技術(shù)成熟度方面,美國(guó)AI人工智能的發(fā)展起步較早,技術(shù)積累深厚。以O(shè)penAI的GPT系列模型為例,其在自然語言處理領(lǐng)域的突破,引領(lǐng)了全球AI技術(shù)的發(fā)展潮流。相比之下,國(guó)內(nèi)雖然在大模型領(lǐng)域取得了顯著進(jìn)展,但與國(guó)際領(lǐng)先水平仍有一定差距。尤其是在大模型的訓(xùn)練、優(yōu)化和應(yīng)用方面,國(guó)內(nèi)尚需進(jìn)一步提升。而在應(yīng)用落地方面,國(guó)外AI人工智能的應(yīng)用范圍廣泛,涉及醫(yī)療、金融、教育、辦公等多個(gè)領(lǐng)域。比如,美國(guó)開發(fā)的BloombergGPT大模型在金融領(lǐng)域得到深入應(yīng)用,微軟的Office 365 Copilot則開啟了辦公生產(chǎn)力革命。而在國(guó)內(nèi),AI人工智能的應(yīng)用主要集中在互聯(lián)網(wǎng)等少數(shù)領(lǐng)域,缺乏具有廣泛影響力的商業(yè)化應(yīng)用。

截至目前為止,中美都孕育了眾多表現(xiàn)出色的大模型獨(dú)角獸。這些企業(yè)都在本土市場(chǎng)展現(xiàn)出了強(qiáng)大的創(chuàng)新能力和市場(chǎng)活力,成為全球AI技術(shù)發(fā)展的領(lǐng)頭羊。而跳出中美,盡管獨(dú)角獸的出現(xiàn)并不頻繁,但它們依然如一顆顆閃耀的珍珠,在各自地區(qū)發(fā)光發(fā)亮。

Mistral AI于2023年4月在發(fā)過巴黎成立,由前DeepMind和Meta的科學(xué)家共同組建,主要聚焦開源模型及企業(yè)級(jí)服務(wù)。Mistral AI開源的Mistral系列大模型受到了業(yè)界的廣泛贊譽(yù)。2024年4月,Mistral AI推出了全新專家混合(MoE)大模型Mixtral8x22B磁力鏈接。該模型在文本生成、問答理解等方面表現(xiàn)出色。Mixtral8x22B的具體特點(diǎn)包括對(duì)64K超長(zhǎng)上下文的支持,多語言能力,尤其在法語、德語、西班牙語等語言上表現(xiàn)流暢,以及采用Apache2.0開源協(xié)議等。據(jù)悉,Mistral AI與微軟也建立了長(zhǎng)期合作伙伴關(guān)系,利用Azure AI的超級(jí)計(jì)算基礎(chǔ)設(shè)施進(jìn)行模型訓(xùn)練,共同為客戶提供MIstral AI的模型服務(wù),成為繼OpenAI后第二家在微軟Azure云平臺(tái)上提供商業(yè)語言模型的公司。

歐洲大陸的另一個(gè)工業(yè)大國(guó)德國(guó),同樣也有自己的“Open AI”。成立于2019年的人工智能初創(chuàng)公司Aleph Alpha,將自身定位為歐洲本地AI技術(shù)的領(lǐng)導(dǎo)者。2023年,Aleph Alpha在資本市場(chǎng)上取得了顯著成就,當(dāng)年6月,Aleph Alpha獲得1億歐元A+輪融資,晉級(jí)德國(guó)AI獨(dú)角獸。2023年底,Aleph Alpha宣布完成超5億美元規(guī)模的B輪融資。該輪融資的投資方主要來自于德國(guó)本土,由創(chuàng)新園人工智能(Ipai)、博世風(fēng)險(xiǎn)投資(BoschVentures)和施瓦茨集團(tuán)(SchwarzGroup)的公司領(lǐng)投。Aleph Alpha主打“數(shù)據(jù)主權(quán)”的概念,即存儲(chǔ)在某個(gè)國(guó)家的數(shù)據(jù)受該國(guó)法律的約束,以確保數(shù)據(jù)的安全性。其生成式人工智能解決方案致力于為企業(yè)和政府提供突破性的人工智能技術(shù)。技術(shù)層面上,Aleph Alpha自研的Luminous系列大語言模型,與ChatGPT的功能類似,提供生成文本/代碼、總結(jié)內(nèi)容、翻譯等服務(wù)。

除上述之外,估值50億美元的加拿大多倫多企業(yè)Cohere、由印度知名企業(yè)家巴維什?阿加瓦爾創(chuàng)建的Krutrim、以色列AI大模型公司AI21 Labs……這些都是知名的AI獨(dú)角獸企業(yè)。

閉源與開源之爭(zhēng)

在目前千萬計(jì)的大模型報(bào)道中,閉源與開源一次被廣泛使用。而這二者究竟是什么?又究竟有何區(qū)別呢?

開源大模型和閉源大模型都作為大模型的兩種主要技術(shù)形態(tài),其各自擁有獨(dú)特魅力和應(yīng)用場(chǎng)景。

開源大模型是指由開源社區(qū)或組織開發(fā)、維護(hù)和共享的大型軟件模型。其最大的特點(diǎn)在于開放性和可擴(kuò)展性,即代碼和模型結(jié)構(gòu)公開可用,任何人都可以訪問、修改和使用。

而閉源大模型與開源大模型相反,其代碼和結(jié)構(gòu)是私有的,僅由特定的組織或個(gè)人擁有并維護(hù)。這種模型通常用于保護(hù)知識(shí)產(chǎn)權(quán)、商業(yè)機(jī)密和競(jìng)爭(zhēng)優(yōu)勢(shì),因此其定制和修改的程度可能受到一定限制。

乍一看,似乎開源大模型的優(yōu)勢(shì)遠(yuǎn)遠(yuǎn)強(qiáng)于閉源大模型。但目前市場(chǎng)觀點(diǎn)認(rèn)為,在AI最難且最重要的商業(yè)化領(lǐng)域上,閉源大模型更有優(yōu)勢(shì)。

市場(chǎng)觀點(diǎn)認(rèn)為,閉源模型是商業(yè)化模型。開源模型效率不行,無法解決算力問題;開源模型成本反而更高;開源模型對(duì)技術(shù)要求更高……

開源模型因其并未開放訓(xùn)練源代碼、預(yù)訓(xùn)練和精調(diào)數(shù)據(jù)等影響模型效果的關(guān)鍵信息,所以無法像開源軟件一樣,靠社區(qū)開發(fā)者一起參與來提升效果和性能,而基座模型的訓(xùn)練只能掌握在廠商自己手里。

百度的CEO李彥宏就是閉源大模型的資深支持者。今年七月的2024年人工智能大會(huì)期間,李彥宏發(fā)表“開源模型是智商稅的言論。”他認(rèn)為,在同樣參數(shù)規(guī)模下,開源模型的能力不如閉源,“如果開源模型想要在能力上追平閉源模型,就需要更大的參數(shù)規(guī)模,這將導(dǎo)致更高的推理成本和更慢的反應(yīng)速度?!?/p>

而這也并不是這位大佬第一次發(fā)出這樣的聲明。在此前,他就提出開源大模型會(huì)越來越落后的觀點(diǎn)。而這在不久后就立刻遭到紅衣教主,360CEO周鴻祎的強(qiáng)烈反對(duì)。

而事實(shí)上,大佬們對(duì)于開源還是閉源的爭(zhēng)論還有很多案例,也有像王小川“開源和閉源并非像手機(jī)中IOS和安卓必須二選一情況”的中立觀點(diǎn)。這些路線之爭(zhēng),背后往往是商業(yè)路線的分歧。

但就目前來講,似乎閉源模型的產(chǎn)業(yè)化和商業(yè)化能力似乎更強(qiáng)。大模型與業(yè)務(wù)結(jié)合,需要產(chǎn)品、運(yùn)營(yíng)、測(cè)試工程師等多種角色共同參與,同時(shí)大模型的長(zhǎng)期應(yīng)用所需的算力、存儲(chǔ)、網(wǎng)絡(luò)等配套都要跟上,開源社區(qū)無法幫助用戶“一站式”解決這些細(xì)節(jié)問題。

此外,閉源大模型的整體能力似乎強(qiáng)于開源。OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra都是閉源。

而回到國(guó)內(nèi)百模大戰(zhàn)中去看,大多數(shù)都是以開源和閉源雙向發(fā)展的路徑。比如百川智能、零一萬物、阿里商湯、智譜……但也有像百度和月之暗面這樣專攻閉源大模型的存在。

百度一直是主攻閉源大模型的選手,目前為止,雖然百度文心一言仍堅(jiān)持閉源路線,但百度智能云部門在其平臺(tái)上提供了大量性能很強(qiáng)的第三方開源大模型。百度通過閉源文心一言,也通過開源大模型使用的算力、工具和服務(wù),來實(shí)現(xiàn)商業(yè)上的收益。

而與百度相反,阿里云則正在大力推廣開源,一方面是為了加快市場(chǎng)份額的爭(zhēng)奪;另一方面作為云計(jì)算企業(yè),它可以在算力、工具和服務(wù)上獲得收益。

華為云2023年在推出盤古大模型3.0時(shí),就表態(tài)采用閉源路線。過去一年,它的重心是在各行業(yè)進(jìn)行聯(lián)創(chuàng),落地大模型,并將技術(shù)回饋盤古,不斷迭代,未參與業(yè)界開閉源討論。華為云在上周也剛剛官宣盤古5.0多模態(tài)大模型,發(fā)布期間也未涉及開源問題。

實(shí)力新秀智譜,也是國(guó)內(nèi)最早開源大模型的企業(yè)。由于旗下研究的GLM開源大模型而獲得大量關(guān)注,也讓這家2019年才成立的公司,在融資和商業(yè)化上受益頗多。因?yàn)橹亲V由清華技術(shù)成果轉(zhuǎn)化而來,2022年,它就將開發(fā)的雙語千億模型GLM-130B開源,“當(dāng)時(shí)全國(guó)懂大模型的研究員加起來也不過百來人”。智譜CEO張鵬稱,開源讓大家知道智譜在做什么,同時(shí)可以讓更多人參與推動(dòng)大模型。此后在2023年3月,智譜將GLM6b開源,該模型在Hugging Face上的下載量超過1600萬。

另一位新秀月之暗面,則是閉源大模型的擁護(hù)者。掌門人楊植麟堅(jiān)定表示將專注 ToC,并會(huì)以長(zhǎng)文本輸入為核心構(gòu)建其底座大模型的差異化競(jìng)爭(zhēng)力。他認(rèn)為這是行業(yè)現(xiàn)在最需要解決的問題,也是通往下一步產(chǎn)品化路上的最大卡點(diǎn)。

而對(duì)于開源和閉源,楊植麟認(rèn)為像 OpenAI 一樣的閉源是通往Super APP(超級(jí)應(yīng)用)的唯一通路,而開源只是 ToB 的獲客手段?!胺惨?C 端超級(jí) APP 的,都是閉源?!?/p>

從楊植麟的回答中,或許可以得出閉源與開源的選擇或許是基于大模型企業(yè)頂下的商業(yè)路線是主To C還是Tp B。

百舸爭(zhēng)流,奮楫者先

在數(shù)字化浪潮的推動(dòng)下,百模大戰(zhàn)堪稱人工智能領(lǐng)域一場(chǎng)前所未有的盛事。這場(chǎng)賽事匯聚了全國(guó)頂尖的人工智能研發(fā)團(tuán)隊(duì),他們攜帶著各自精心打造的模型,準(zhǔn)備在這場(chǎng)科技盛宴中一展身手。這些模型,如百余艘船只,在算法的海洋上展開激烈的角逐,展示它們?cè)趫D像識(shí)別、自然語言處理、機(jī)器學(xué)習(xí)等眾多領(lǐng)域的卓越能力。

大模型時(shí)代并不同于前三個(gè)時(shí)代,由于大模型通用性的特征,其發(fā)展十分有望實(shí)現(xiàn)商業(yè)閉環(huán)。也因此,在這個(gè)大模型時(shí)代,吸引了眾多玩家涌入賽道競(jìng)爭(zhēng),形成百花齊開,百舸爭(zhēng)流的現(xiàn)象。

另一方面,大模型的市場(chǎng)規(guī)模也在持續(xù)擴(kuò)大,資本熱度攀升。在2023年時(shí),國(guó)內(nèi)語言大模型的市場(chǎng)規(guī)模就突破了100億元,并還在繼續(xù)上升中。市場(chǎng)規(guī)模的擴(kuò)大為這場(chǎng)激烈的百模大戰(zhàn)再添一把火。

目前整個(gè)大模型賽道處于高擁擠的狀態(tài),而對(duì)于大模型來說至關(guān)重要的算力等其他資源卻是有限的。隨著市場(chǎng)競(jìng)爭(zhēng)的日益激烈,算力等資源會(huì)呈現(xiàn)供需失衡的狀態(tài)并出現(xiàn)資源配置傾斜。再加上算力成本的不斷上漲,導(dǎo)致大模型玩家們必須積極競(jìng)爭(zhēng)來構(gòu)建優(yōu)勢(shì),以此來獲得資源的長(zhǎng)期發(fā)展和支持。

這也是為什么業(yè)界有了“百模大戰(zhàn),必有一戰(zhàn)”的說法。

如今,這場(chǎng)百模大戰(zhàn)已持續(xù)一年有余,戰(zhàn)事正逐漸往新的階段升級(jí)。

有一個(gè)十分明顯的預(yù)兆,大模型融資已經(jīng)在開始慢慢降溫了。

今年伊始,Open AI推出Sora掀起國(guó)內(nèi)外視頻大模型的鏖戰(zhàn)。在那段時(shí)間,幾乎沒多久就會(huì)有大模型企業(yè)融資的消息傳出。而到了6月,似乎一切都改變了。資本的眼球被具身智能等賽道吸引,大模型的融資數(shù)量較去年略有下降,開始有降溫跡象的出現(xiàn)。

大模型的發(fā)展需要大量資源和算力的消耗,在這種邏輯下,金錢就成了唯一入場(chǎng)券??墒乾F(xiàn)在大模型技術(shù)的進(jìn)展卻與預(yù)期差距很大。投資人投入入巨額資金后,何時(shí)見效尚未可知,這也引起大多數(shù)投資人的焦慮心理。種種之下,如今的降溫現(xiàn)象似乎順理成章。

這樣的境地也迫使大模型人士開始繼續(xù)思考未來的商業(yè)化問題,浪漫的技術(shù)研發(fā)逐漸向艱苦的落地求生轉(zhuǎn)化。由此,引發(fā)了一系列新的競(jìng)爭(zhēng)。

據(jù)融中財(cái)經(jīng)不完全梳理,目前為止已有超過7家大模型企業(yè)參戰(zhàn)。包括字節(jié)跳動(dòng)、阿里云、百度、騰訊、智譜AI、科大訊飛等。

據(jù)梳理,今年5月11日,大模型獨(dú)角獸智譜AI宣布其入門級(jí)模型GLM-3 Turbo的API降價(jià)為1元/百萬tokens。5月15日,字節(jié)宣布旗下通用模型豆包pro-128k版模型推理輸入價(jià)格降至比行業(yè)價(jià)格低95.8%,豆包pro-32k模型推理輸入降至比行業(yè)價(jià)格低99.3%。5月21日,阿里云宣布旗下9款大模型全面降價(jià),降幅最高達(dá)到97%,兩款開源模型更是開啟七天限免。幾個(gè)小時(shí)后,百度直接宣布兩款輕量級(jí)模型ERNIE Speed、ERNIE Lite免費(fèi)開放。隨后,又有兩位玩家入局。先是科大訊飛宣布輕量級(jí)模型API永久免費(fèi)開放。后又有騰訊云宣布混元-lite即日起免費(fèi),其他模型降幅最高達(dá)到87.5%。

一大基本現(xiàn)實(shí)是:當(dāng)前,國(guó)內(nèi)并沒有出現(xiàn)真正的殺手級(jí)大模型應(yīng)用。國(guó)內(nèi)頭部大模型玩家們?cè)谡w能力差異上,可能并不存在絕對(duì)領(lǐng)先的情況,大家都是處于趨同的存在,有的只是在能力上的各有特點(diǎn)與側(cè)重。

這樣的現(xiàn)實(shí)之下,如果其他大模型廠商們不跟進(jìn)阿里、百度、字節(jié)、騰訊的這一波價(jià)格戰(zhàn),最終的結(jié)局就可能是被市場(chǎng)淘汰。畢竟在當(dāng)前現(xiàn)實(shí)下,想要維持原本價(jià)格本已是一件難事兒,更何況當(dāng)前這幾大大模型廠商已經(jīng)開始讓用戶嘗到了更便宜乃至免費(fèi)的滋味了。當(dāng)你走進(jìn)這歡樂場(chǎng),悲傷所有的夢(mèng)與想,各色的臉上各色的妝,沒人記得你的摸樣。

另外,在新時(shí)代下,大模型正在從拼參數(shù)到卷應(yīng)用上。

百度的“文心一言”專注于內(nèi)容創(chuàng)作和教育服務(wù),為媒體和廣告行業(yè)提供高效的文案支持,并在教育領(lǐng)域成為學(xué)生的智能學(xué)習(xí)伙伴??拼笥嶏w的“星火”大模型在教育和醫(yī)療領(lǐng)域展現(xiàn)出其獨(dú)特的價(jià)值,為學(xué)生提供定制化的學(xué)習(xí)方案,并輔助醫(yī)生進(jìn)行精確的醫(yī)療決策。昆侖萬維的“天工”大模型則專注于游戲產(chǎn)業(yè),能夠自動(dòng)生成游戲內(nèi)容并進(jìn)行智能運(yùn)營(yíng)。智譜AI在構(gòu)建與Open AI相匹敵的模型產(chǎn)品的同時(shí),通過提供API和云服務(wù)私有化部署等方案,在科研領(lǐng)域?yàn)檠芯咳藛T提供文獻(xiàn)檢索和分析服務(wù);并與金融機(jī)構(gòu)合作,進(jìn)行風(fēng)險(xiǎn)評(píng)估和投資決策分析。此外,智譜AI還與國(guó)際科研機(jī)構(gòu)和企業(yè)共同探索大模型的應(yīng)用。MiniMax通過面向消費(fèi)者和企業(yè)兩端的策略,推出了多種類型的應(yīng)用。在消費(fèi)者端,推出了智能聊天助手;在企業(yè)端,與企業(yè)合作開發(fā)智能客服系統(tǒng)和辦公自動(dòng)化軟件。

隨著大模型技術(shù)的日益成熟,其在實(shí)際應(yīng)用中的落地成為了衡量技術(shù)價(jià)值的關(guān)鍵,也是技術(shù)商業(yè)化的重要途徑。目前,大模型行業(yè)的關(guān)注點(diǎn)已經(jīng)從模型的開發(fā)轉(zhuǎn)向了應(yīng)用的實(shí)際落地。無論是擁有強(qiáng)大背景的大模型公司,還是新興的初創(chuàng)企業(yè),都在努力推動(dòng)應(yīng)用的發(fā)展,目標(biāo)是打造具有廣泛影響力的應(yīng)用。

不同的廠商采取了不同的策略。一些廠商通過大量的廣告宣傳來吸引用戶,利用流量?jī)?yōu)勢(shì);一些則不斷進(jìn)行產(chǎn)品迭代和優(yōu)化,以提升產(chǎn)品性能和用戶體驗(yàn);還有一些采取了面向消費(fèi)者和企業(yè)兩端的策略,以擴(kuò)大市場(chǎng)份額。

落地,是任何技術(shù)商業(yè)化的必要途徑,因?yàn)樗軌蚪o企業(yè)帶來直接的經(jīng)濟(jì)回報(bào)。這也是為什么現(xiàn)在的百模大戰(zhàn)從曾經(jīng)的拼參數(shù)逐漸轉(zhuǎn)向到卷應(yīng)用上去。

說到底,如今的百模大戰(zhàn)不論是打價(jià)格戰(zhàn)還是卷到應(yīng)用層,這些都是企業(yè)們追求盈利的手段。任何浪漫的技術(shù),都需要先活下來,吃飽飯?jiān)偃プ非罄硐胫械臑跬邪睢?/p>

而在這樣的路徑上,大模型企業(yè)怎么才能夠闖出成功之路?唯有努力前進(jìn),探索更多大模型落地的可能性。正所謂,百舸爭(zhēng)流,奮楫者先。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。