正在閱讀:

大模型狂飆半年,“群模亂舞”誰能勝出?

掃一掃下載界面新聞APP

大模型狂飆半年,“群模亂舞”誰能勝出?

“軍備賽”開始了。

文|壹DU財經(jīng)

毫無疑問,當(dāng)前的科技圈已進(jìn)入“大模型”時代。含“?!绷看蟮绞裁闯潭??但凡科技企業(yè),基本都在做“大模型”。

“從去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,幾乎所有行業(yè)玩家都想抓住這根救命稻草。因?yàn)樽龀闪司鸵馕吨プ∥磥韼资甑内厔荨!毙袠I(yè)創(chuàng)業(yè)者夏先生對壹DU財經(jīng)說道:“ChatGPT是生成式AI,是大模型的落地場景之一。理論上講,這條路的走通,加速了大模型在短期內(nèi)的爆發(fā)。”

的確,ChatGPT的爆發(fā),讓更多人看到了語言模型的魅力。微軟、谷歌、百度、阿里等

國內(nèi)外科技巨頭快速響應(yīng),相繼推出自家的AI聊天機(jī)器人,試圖以To C作為切入口,搶占市場。

風(fēng)口在哪里,資金和人才就在哪里。隨后,先是廠商陸續(xù)宣布推出大模型,如百度的文心大模型、阿里的通義大模型、騰訊的行業(yè)大模型,后有科技圈曾經(jīng)的風(fēng)云人物也開始陸續(xù)入場,李開復(fù)、王小川、周伯文、王慧文等。出行、認(rèn)知、辦公等一些垂直領(lǐng)域的大模型也相繼推出。

半年時間,國內(nèi)呈現(xiàn)出“群模亂舞”盛況。而在經(jīng)歷喧囂后,大模型或許是時候回歸現(xiàn)實(shí)了。

玩家們開始意識到,最初的熱鬧僅僅是熱鬧,他們最終的戰(zhàn)場在B端市場。此時,多家有著人工智能積累和云計算大廠登臺,相繼推出了AI大模型服務(wù)。

行業(yè)老炮和新手創(chuàng)業(yè)者的對決,也就此開始了。

01 熱情高漲,玩家們跑步入場

進(jìn)入2023年,大模型技術(shù)讓科技圈沸騰起來。看到ChatGPT爆發(fā)后,不少大廠抓緊時間推出相應(yīng)產(chǎn)品,新老創(chuàng)業(yè)者們著急招兵買馬,生怕慢一步就錯過了這難得的風(fēng)口。一級市場關(guān)于大模型的投融資熱度也在攀升,不少FA開始瘋狂補(bǔ)課。

一時間,整個行業(yè)熱鬧非常。

在OpenAI發(fā)布GPT4大模型后,第一個采取行動的是百度,在3月16日用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,已經(jīng)沉寂許多的周鴻祎推出大模型產(chǎn)品,甚至連名字都沒來得及取。

在此之后,科技巨頭、創(chuàng)業(yè)公司和高校研究院們展開了一場關(guān)于“大模型”的競速賽。整個4月,都成了“大模型的發(fā)布月”,華為、商湯、阿里都在4月份亮出了自己的大模型產(chǎn)品。

到了5月,訊飛推出了自己的星火大模型,并公布了大模型在自己優(yōu)勢領(lǐng)域的諸多應(yīng)用場景。

創(chuàng)業(yè)者們也在火速入場。原美團(tuán)聯(lián)合創(chuàng)始人王惠文(目前已退出)、創(chuàng)新工場CEO李開復(fù)、前京東AI掌門人周伯文、前阿里技術(shù)副總裁賈揚(yáng)清等開始招兵買馬。前搜狗CEO王小川的百川智能拿到5000萬美元融資后,甚至揚(yáng)言:“今年年底做到國內(nèi)最好的”。

“這波創(chuàng)業(yè)熱潮有點(diǎn)2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮的意思?!币晃粯I(yè)內(nèi)人士說道:“似乎每個創(chuàng)業(yè)者都想在這個時代找到第二春。”

總體來看,今年上半年,大模型幾乎成為所有科技企業(yè)的必選項(xiàng)。對于普通人而言,大模型或許是件很遙遠(yuǎn)的事。畢竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行業(yè)。

但事實(shí)上,大模型的應(yīng)用更多在B端市場。那么,在行業(yè)烈火烹油過后,擺在這些玩家眼前的,理應(yīng)是他們對市場更多的理性思考。比如市場是否真的需要大模型?大模型真正走向成熟,需要越過哪些重要關(guān)卡?能否真正意義上實(shí)現(xiàn)商業(yè)化。

02 “軍備賽”開打

大模型軍備賽的沖鋒號吹響后,整個行業(yè)開始“卷”起來。更多玩家已經(jīng)將視線移至應(yīng)用層面。因?yàn)樾袠I(yè)“退燒”后,最終考驗(yàn)的還是玩家們的“硬實(shí)力”。

此時,一些在人工智能、云計算上有積累的玩家則占據(jù)的先發(fā)優(yōu)勢。尤其是模型的參數(shù)量。

就目前市場上發(fā)布的AI模型來看,雖然大家都自稱為“大模型“,但參數(shù)量實(shí)質(zhì)是大模型和小模型的界定因素之一。

此前,百度集團(tuán)副總裁侯震宇在接受媒體采訪時曾表示,2022年,10億參數(shù)的模型就叫大模型。但到了眼下,千億參數(shù)以上才會出現(xiàn)“智能涌現(xiàn)”,才會形成泛化能力,才能在各個場景下具備通用能力。

何為“智能涌現(xiàn)”?簡單地講,當(dāng)模型規(guī)模、算力水平超過某個參數(shù)閾值后,AI效果將不再是隨機(jī)概率事件。比如初期語言大模型出現(xiàn)“圖不對文”“答非所問”等現(xiàn)象。

并且在通用領(lǐng)域,參數(shù)量越大,智能通常涌現(xiàn)的可能性就越大,AI準(zhǔn)確率就越高。在垂直領(lǐng)域則更容易獲得精確的效果。

今年5月,科技部下屬的中國科學(xué)技術(shù)信息研究所發(fā)布的《中國人工智能大模型地圖研究報告》統(tǒng)計,截至5月28日,國內(nèi)10億級參數(shù)規(guī)模以上基礎(chǔ)大模型至少已發(fā)布79個。

但可以看到,10億級參數(shù)這個量級,很可能不是真正的“分界線”。因?yàn)楝F(xiàn)實(shí)的情況是,一些未能達(dá)到千億規(guī)模的模型,很難在當(dāng)前市場的競爭具有競爭力。不過,也不排除一些在垂直領(lǐng)域深耕的玩家,最終能跑出來。

“大模型需要算力、算法和數(shù)據(jù)積累,絕對不是玩概念的事情,最終還是要市場買單?!毕南壬J(rèn)為,目前來看諸如百度、騰訊、阿里無論是在資源還是積累上,都有一定的優(yōu)勢,“他們在云市場深耕,并在自己擅長的領(lǐng)域積累多年,無論技術(shù)層面還是行業(yè)積累上,實(shí)質(zhì)已經(jīng)完成了搶跑,未來就看這些頭部玩家如何落地。”

而在投入層面,這會是一個天文數(shù)字。

以百度為例。據(jù)透露,過去10年,百度在AI方向的投入已超過1000億元。但大模型不是投一筆錢、做一個模型那么簡單,它需要有算力、有數(shù)據(jù)、有經(jīng)驗(yàn)豐富的AI工程師在好的研發(fā)平臺上長期積累。

而創(chuàng)業(yè)公司如果直接去做基礎(chǔ)大模型,除了上述投入之外,還需要能夠把模型、算力管理好的AI開發(fā)平臺。

這意味著,創(chuàng)業(yè)公司不論是自建開發(fā)平臺,還是采購?fù)獍脚_,其投入都不會是小數(shù)目。并且,大模型不是預(yù)訓(xùn)練出來就好,更需要后續(xù)持續(xù)敏捷迭代。從這一點(diǎn)看,創(chuàng)業(yè)公司所受的限制明顯要高于大公司。

但大廠很難留住強(qiáng)算法人才的弊端也比較突出,因?yàn)榇竽P屯度胧且患L期主義的事,必定會面臨與既有業(yè)務(wù)之間的沖突。這一點(diǎn),從大廠出走的大模型創(chuàng)業(yè)者的經(jīng)歷,就說明了一點(diǎn)。長期主義對創(chuàng)業(yè)公司同樣重要,無論是創(chuàng)始人的背景背書,還是資源合作,抑或是客戶的拓展,都需要長期積淀。

03 行業(yè)競賽即將鳴槍

人工智能專家侯世達(dá)的學(xué)生梅拉妮·米歇爾《AI 3.0時代》一書中提到,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。并且,他認(rèn)為這一模式將以五到十年為周期不斷上演。

具體到2023年上半年的大模型賽道,顯然其正處于第二個階段——行業(yè)很火,市場很熱。這一周期往往是最短的,也通常意味著如此去泡沫化后,賽道競爭即將正式開始。

大模型比拼的不僅僅是技術(shù),還應(yīng)該將重點(diǎn)放在大模型應(yīng)用、產(chǎn)業(yè)生態(tài)中去評估。

目前,市場上大模型的玩家主要分三類。

一是聚焦基礎(chǔ)層,主要對標(biāo)OpenAI,發(fā)揮基礎(chǔ)設(shè)施的作用。

第二類是錨定中間層,不需要像OpenAI一樣花大錢做底層,只需要掌握通用化能力,就可以通過開源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。

第三類是調(diào)用大模型API的企業(yè),專注開發(fā)大模型具體場景的應(yīng)用,如Jasper。

相對而言,前兩類又是大模型的“基礎(chǔ)設(shè)施”,因?yàn)橛袠O高的門檻,對技術(shù)、資金以及資源有嚴(yán)格的準(zhǔn)入壁壘,往往是大公司布局的主要方向。

目前來看,百度、阿里和華為在大模型的構(gòu)建上,不約而同地采用了“模型+工具平臺+生態(tài)”的三層共建模式。騰訊云則更專注于應(yīng)用層而,6月19日公布的騰訊云MaaS服務(wù)解決方案即覆蓋了金融、文旅、政務(wù)、教育等10個行業(yè)、超50個解決方案。

雖然巨頭們參與競爭的姿勢不同,但目標(biāo)實(shí)質(zhì)上只有一個,那就是打通應(yīng)用層。在百度創(chuàng)始人李彥宏看來,應(yīng)用層最具想象空間。

商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為,AI 基礎(chǔ)設(shè)施本質(zhì)上還是算力、數(shù)據(jù)、基礎(chǔ)算法,包括算法相關(guān)的工具,本質(zhì)上還是三位一體的東西。最后誰能把這三者的整合能力提供的好,提供更低成本、更低門檻的能力是決定整個競爭最重要的點(diǎn)。

結(jié)語

AI大模型是人工智能邁向通用智能的里程碑式技術(shù),因?yàn)槠淇蔀楦餍懈鳂I(yè)的智能化升級提供強(qiáng)勁的生產(chǎn)力工具。在千行百業(yè)數(shù)字化轉(zhuǎn)型升級的當(dāng)下,大模型的重要意義不言而喻。也因此,在當(dāng)下,誰能率先在賽道里搶到更多籌碼,就非常關(guān)鍵了??梢灶A(yù)料,未來,拋開“基礎(chǔ)設(shè)施”層面的較量外,真正的戰(zhàn)場大概率是各行各業(yè)的切實(shí)落地上。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型狂飆半年,“群模亂舞”誰能勝出?

“軍備賽”開始了。

文|壹DU財經(jīng)

毫無疑問,當(dāng)前的科技圈已進(jìn)入“大模型”時代。含“?!绷看蟮绞裁闯潭龋康部萍计髽I(yè),基本都在做“大模型”。

“從去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,幾乎所有行業(yè)玩家都想抓住這根救命稻草。因?yàn)樽龀闪司鸵馕吨プ∥磥韼资甑内厔??!毙袠I(yè)創(chuàng)業(yè)者夏先生對壹DU財經(jīng)說道:“ChatGPT是生成式AI,是大模型的落地場景之一。理論上講,這條路的走通,加速了大模型在短期內(nèi)的爆發(fā)。”

的確,ChatGPT的爆發(fā),讓更多人看到了語言模型的魅力。微軟、谷歌、百度、阿里等

國內(nèi)外科技巨頭快速響應(yīng),相繼推出自家的AI聊天機(jī)器人,試圖以To C作為切入口,搶占市場。

風(fēng)口在哪里,資金和人才就在哪里。隨后,先是廠商陸續(xù)宣布推出大模型,如百度的文心大模型、阿里的通義大模型、騰訊的行業(yè)大模型,后有科技圈曾經(jīng)的風(fēng)云人物也開始陸續(xù)入場,李開復(fù)、王小川、周伯文、王慧文等。出行、認(rèn)知、辦公等一些垂直領(lǐng)域的大模型也相繼推出。

半年時間,國內(nèi)呈現(xiàn)出“群模亂舞”盛況。而在經(jīng)歷喧囂后,大模型或許是時候回歸現(xiàn)實(shí)了。

玩家們開始意識到,最初的熱鬧僅僅是熱鬧,他們最終的戰(zhàn)場在B端市場。此時,多家有著人工智能積累和云計算大廠登臺,相繼推出了AI大模型服務(wù)。

行業(yè)老炮和新手創(chuàng)業(yè)者的對決,也就此開始了。

01 熱情高漲,玩家們跑步入場

進(jìn)入2023年,大模型技術(shù)讓科技圈沸騰起來。看到ChatGPT爆發(fā)后,不少大廠抓緊時間推出相應(yīng)產(chǎn)品,新老創(chuàng)業(yè)者們著急招兵買馬,生怕慢一步就錯過了這難得的風(fēng)口。一級市場關(guān)于大模型的投融資熱度也在攀升,不少FA開始瘋狂補(bǔ)課。

一時間,整個行業(yè)熱鬧非常。

在OpenAI發(fā)布GPT4大模型后,第一個采取行動的是百度,在3月16日用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,已經(jīng)沉寂許多的周鴻祎推出大模型產(chǎn)品,甚至連名字都沒來得及取。

在此之后,科技巨頭、創(chuàng)業(yè)公司和高校研究院們展開了一場關(guān)于“大模型”的競速賽。整個4月,都成了“大模型的發(fā)布月”,華為、商湯、阿里都在4月份亮出了自己的大模型產(chǎn)品。

到了5月,訊飛推出了自己的星火大模型,并公布了大模型在自己優(yōu)勢領(lǐng)域的諸多應(yīng)用場景。

創(chuàng)業(yè)者們也在火速入場。原美團(tuán)聯(lián)合創(chuàng)始人王惠文(目前已退出)、創(chuàng)新工場CEO李開復(fù)、前京東AI掌門人周伯文、前阿里技術(shù)副總裁賈揚(yáng)清等開始招兵買馬。前搜狗CEO王小川的百川智能拿到5000萬美元融資后,甚至揚(yáng)言:“今年年底做到國內(nèi)最好的”。

“這波創(chuàng)業(yè)熱潮有點(diǎn)2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮的意思?!币晃粯I(yè)內(nèi)人士說道:“似乎每個創(chuàng)業(yè)者都想在這個時代找到第二春。”

總體來看,今年上半年,大模型幾乎成為所有科技企業(yè)的必選項(xiàng)。對于普通人而言,大模型或許是件很遙遠(yuǎn)的事。畢竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行業(yè)。

但事實(shí)上,大模型的應(yīng)用更多在B端市場。那么,在行業(yè)烈火烹油過后,擺在這些玩家眼前的,理應(yīng)是他們對市場更多的理性思考。比如市場是否真的需要大模型?大模型真正走向成熟,需要越過哪些重要關(guān)卡?能否真正意義上實(shí)現(xiàn)商業(yè)化。

02 “軍備賽”開打

大模型軍備賽的沖鋒號吹響后,整個行業(yè)開始“卷”起來。更多玩家已經(jīng)將視線移至應(yīng)用層面。因?yàn)樾袠I(yè)“退燒”后,最終考驗(yàn)的還是玩家們的“硬實(shí)力”。

此時,一些在人工智能、云計算上有積累的玩家則占據(jù)的先發(fā)優(yōu)勢。尤其是模型的參數(shù)量。

就目前市場上發(fā)布的AI模型來看,雖然大家都自稱為“大模型“,但參數(shù)量實(shí)質(zhì)是大模型和小模型的界定因素之一。

此前,百度集團(tuán)副總裁侯震宇在接受媒體采訪時曾表示,2022年,10億參數(shù)的模型就叫大模型。但到了眼下,千億參數(shù)以上才會出現(xiàn)“智能涌現(xiàn)”,才會形成泛化能力,才能在各個場景下具備通用能力。

何為“智能涌現(xiàn)”?簡單地講,當(dāng)模型規(guī)模、算力水平超過某個參數(shù)閾值后,AI效果將不再是隨機(jī)概率事件。比如初期語言大模型出現(xiàn)“圖不對文”“答非所問”等現(xiàn)象。

并且在通用領(lǐng)域,參數(shù)量越大,智能通常涌現(xiàn)的可能性就越大,AI準(zhǔn)確率就越高。在垂直領(lǐng)域則更容易獲得精確的效果。

今年5月,科技部下屬的中國科學(xué)技術(shù)信息研究所發(fā)布的《中國人工智能大模型地圖研究報告》統(tǒng)計,截至5月28日,國內(nèi)10億級參數(shù)規(guī)模以上基礎(chǔ)大模型至少已發(fā)布79個。

但可以看到,10億級參數(shù)這個量級,很可能不是真正的“分界線”。因?yàn)楝F(xiàn)實(shí)的情況是,一些未能達(dá)到千億規(guī)模的模型,很難在當(dāng)前市場的競爭具有競爭力。不過,也不排除一些在垂直領(lǐng)域深耕的玩家,最終能跑出來。

“大模型需要算力、算法和數(shù)據(jù)積累,絕對不是玩概念的事情,最終還是要市場買單?!毕南壬J(rèn)為,目前來看諸如百度、騰訊、阿里無論是在資源還是積累上,都有一定的優(yōu)勢,“他們在云市場深耕,并在自己擅長的領(lǐng)域積累多年,無論技術(shù)層面還是行業(yè)積累上,實(shí)質(zhì)已經(jīng)完成了搶跑,未來就看這些頭部玩家如何落地?!?/p>

而在投入層面,這會是一個天文數(shù)字。

以百度為例。據(jù)透露,過去10年,百度在AI方向的投入已超過1000億元。但大模型不是投一筆錢、做一個模型那么簡單,它需要有算力、有數(shù)據(jù)、有經(jīng)驗(yàn)豐富的AI工程師在好的研發(fā)平臺上長期積累。

而創(chuàng)業(yè)公司如果直接去做基礎(chǔ)大模型,除了上述投入之外,還需要能夠把模型、算力管理好的AI開發(fā)平臺。

這意味著,創(chuàng)業(yè)公司不論是自建開發(fā)平臺,還是采購?fù)獍脚_,其投入都不會是小數(shù)目。并且,大模型不是預(yù)訓(xùn)練出來就好,更需要后續(xù)持續(xù)敏捷迭代。從這一點(diǎn)看,創(chuàng)業(yè)公司所受的限制明顯要高于大公司。

但大廠很難留住強(qiáng)算法人才的弊端也比較突出,因?yàn)榇竽P屯度胧且患L期主義的事,必定會面臨與既有業(yè)務(wù)之間的沖突。這一點(diǎn),從大廠出走的大模型創(chuàng)業(yè)者的經(jīng)歷,就說明了一點(diǎn)。長期主義對創(chuàng)業(yè)公司同樣重要,無論是創(chuàng)始人的背景背書,還是資源合作,抑或是客戶的拓展,都需要長期積淀。

03 行業(yè)競賽即將鳴槍

人工智能專家侯世達(dá)的學(xué)生梅拉妮·米歇爾《AI 3.0時代》一書中提到,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。并且,他認(rèn)為這一模式將以五到十年為周期不斷上演。

具體到2023年上半年的大模型賽道,顯然其正處于第二個階段——行業(yè)很火,市場很熱。這一周期往往是最短的,也通常意味著如此去泡沫化后,賽道競爭即將正式開始。

大模型比拼的不僅僅是技術(shù),還應(yīng)該將重點(diǎn)放在大模型應(yīng)用、產(chǎn)業(yè)生態(tài)中去評估。

目前,市場上大模型的玩家主要分三類。

一是聚焦基礎(chǔ)層,主要對標(biāo)OpenAI,發(fā)揮基礎(chǔ)設(shè)施的作用。

第二類是錨定中間層,不需要像OpenAI一樣花大錢做底層,只需要掌握通用化能力,就可以通過開源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。

第三類是調(diào)用大模型API的企業(yè),專注開發(fā)大模型具體場景的應(yīng)用,如Jasper。

相對而言,前兩類又是大模型的“基礎(chǔ)設(shè)施”,因?yàn)橛袠O高的門檻,對技術(shù)、資金以及資源有嚴(yán)格的準(zhǔn)入壁壘,往往是大公司布局的主要方向。

目前來看,百度、阿里和華為在大模型的構(gòu)建上,不約而同地采用了“模型+工具平臺+生態(tài)”的三層共建模式。騰訊云則更專注于應(yīng)用層而,6月19日公布的騰訊云MaaS服務(wù)解決方案即覆蓋了金融、文旅、政務(wù)、教育等10個行業(yè)、超50個解決方案。

雖然巨頭們參與競爭的姿勢不同,但目標(biāo)實(shí)質(zhì)上只有一個,那就是打通應(yīng)用層。在百度創(chuàng)始人李彥宏看來,應(yīng)用層最具想象空間。

商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為,AI 基礎(chǔ)設(shè)施本質(zhì)上還是算力、數(shù)據(jù)、基礎(chǔ)算法,包括算法相關(guān)的工具,本質(zhì)上還是三位一體的東西。最后誰能把這三者的整合能力提供的好,提供更低成本、更低門檻的能力是決定整個競爭最重要的點(diǎn)。

結(jié)語

AI大模型是人工智能邁向通用智能的里程碑式技術(shù),因?yàn)槠淇蔀楦餍懈鳂I(yè)的智能化升級提供強(qiáng)勁的生產(chǎn)力工具。在千行百業(yè)數(shù)字化轉(zhuǎn)型升級的當(dāng)下,大模型的重要意義不言而喻。也因此,在當(dāng)下,誰能率先在賽道里搶到更多籌碼,就非常關(guān)鍵了。可以預(yù)料,未來,拋開“基礎(chǔ)設(shè)施”層面的較量外,真正的戰(zhàn)場大概率是各行各業(yè)的切實(shí)落地上。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。