文 | DoNews 雁 秋
編輯 | 李信馬
大模型的橫空出世,帶來了一場智能革命,席卷并重組了所有行業(yè),影響遠超互聯(lián)網(wǎng)過去30年的發(fā)展。
把視角放在國內(nèi),2024年政府工作報告首次提出“人工智能+”,要求“大力推進現(xiàn)代化產(chǎn)業(yè)體系建設,加快發(fā)展新質(zhì)生產(chǎn)力”“深化大數(shù)據(jù)、人工智能等研發(fā)應用”。
相較于2023年一片混沌的“百模大戰(zhàn)”,2024年AI大模型開始呈現(xiàn)出更清晰的市場格局——
技術領域,底層架構、多模態(tài)融合、端云協(xié)同持續(xù)優(yōu)化;資本層面,經(jīng)歷多元化轉(zhuǎn)變,投資熱度有所趨緩;市場生態(tài),從長文本處理、多模態(tài)融合、價格競爭以及智能體發(fā)展,大模型落地應用以及商業(yè)化的探索還在繼續(xù)。
我們從技術、應用、市場幾方面,整理總結了AI的幾大關鍵詞,以此回顧這高速發(fā)展的一年。
01、務實、聚焦、小
2023年,創(chuàng)投圈面對生成式AI洋溢著久違的亢奮,幾乎所有人都加碼投資,擔心錯過這次難得的技術浪潮。然而到2024年,亢奮的情緒開始退潮,整個行業(yè)吹起更多務實之風。
初期階段,模型需要吞吐更多數(shù)據(jù),各研究機構和巨頭都致力于開發(fā)更大更強的模型,展示技術實力和領先地位。
以ChatGPT為代表的通用大模型,對算力高度依賴,迭代到“萬億(訓練參數(shù)規(guī)模)萬卡(訓練消耗的算力卡數(shù)量)”級,之下則是“千億千卡”的行業(yè)大模型、“百億百卡”的企業(yè)大模型。
大模型對算力需求飆升,英偉達憑借芯片壟斷地位,成為AI時代的“賣鏟人”。依靠具備AI能力的Blackwell GPU芯片,該公司在2024年6月市值突破3.3萬億美元,超越微軟和蘋果登頂全球市值榜首。
然而,大模型在部署和運行時面臨著高昂的成本和資源消耗,包括計算資源、存儲資源以及能源消耗。從實際應用的角度來看,豪擲千金的玩家更期待回本的一天,投入、產(chǎn)出、效益成為行業(yè)更關心的話題。
據(jù)桔子IT數(shù)據(jù),2024年以來(1月1日~12月5日),國內(nèi)AI領域發(fā)生439起融資案例,總融資金額超564億元,大概是2023年的80%。據(jù)清科研究中心不完全統(tǒng)計,2024年上半年國內(nèi)對外投資活動的早期投資、VC、PE機構數(shù)量同比分別減少23.9%、19.2%、25.2%。
減投是必然趨勢,但在務實的水面下,暗流也在涌動。
國內(nèi)模型廠商掀起了一輪的大模型降價潮,廠商們試圖通過降低成本搶占市場。技術層面也出現(xiàn)一個契機,o1通過在推理階段注入強化學習和思維鏈,打開了大模型在推理端的“能力上限”,后續(xù)企業(yè)相繼模仿,投入更多的精力和資源在強化學習上。
行業(yè)打法發(fā)生變化,從卷參數(shù)、卷排行,轉(zhuǎn)向強調(diào)邏輯學習、知識計算推理等新路徑,尤其是金融、醫(yī)療、教育等高信息密度、專業(yè)嚴謹?shù)念I域。
例如,自2023年7月發(fā)布盤古大模型3.0版后,華為盤古大模型已迭代至5.0版。除了3.0版包含的礦山、政務、氣象、金融、醫(yī)學等行業(yè)大模型以外,5.0版還新增了鋼鐵、高鐵、具身智能、工業(yè)設計大模型、安全及媒體等行業(yè)。
大模型從“通用”朝著“有用”發(fā)展,與此同時,「麻雀雖小,五臟俱全」的小模型不斷涌現(xiàn),其可以在保持大模型同等性能甚至更優(yōu)性能的前提下,降低規(guī)模和成本。
例如,根據(jù)信通院《大模型基準測試體系研究報告(2024年)》,阿里巴巴集團推出的Qwen-7B在評測中的得分為25.8分,而更小規(guī)模的Qwen1.5-7B得分顯著提升至51.8分。這表明通過改進訓練技術和使用更高質(zhì)量的數(shù)據(jù),也能顯著提升模型性能。
vivo公司發(fā)布藍心端側模型3B,參數(shù)量僅為30億,相比藍心7B,性能提升了300%、功耗優(yōu)化率達46%、內(nèi)存占用僅1.4GB;微軟公司發(fā)布Phi系列模型,38億參數(shù)的Phi-3-mini模型允許針對不同用例提高模型的性能;英偉達公司推出參數(shù)版本為40億和80億的Minitron小語言模型,在保持相當性能水平的同時,將模型大小縮小了2-4倍,訓練成本降低1.8倍。
不過,大、小模型更多是協(xié)作而非競爭。普遍的做法是,先訓練出通用能力足夠強的大模型,再基于此篩選處理構建小模型,用質(zhì)量更高、數(shù)量更少的數(shù)據(jù)完成訓練,以更低成本實現(xiàn)不輸大模型的應用效果。
02、應用、AI Agent
進入2024年中下半場,應用層面,大模型不再單一聚焦于文字生成,逐漸滲透至視覺理解、視頻生成、智能搜索、AI Agent(智能體)等新興應用,“AI Agent”被搬到各個領域。
AI Agent,也叫智能體。比起通用型大模型,智能體更加專注于特定細分領域,在特定任務上具備更強的優(yōu)勢與潛力。
比如說,如果你想要辦一場家庭聚餐,LLM(大模型)可以提供就餐地點和店鋪相關信息提示,而AI Agent不僅能夠提供擇店鋪建議,還能基于預算搜索菜系和店鋪,執(zhí)行預訂操作,并將行程添加到日歷,還可以發(fā)送行程提醒。
這種服務于普通大眾的“智能體”,成為AI商業(yè)化進程中普遍看好的應用方向。而落地的過程中,大廠仍舊是主要玩家。
手機廠商將AI能力融入手機系統(tǒng),從蘋果的「Apple Intelligence」到榮耀的「AI智能體」,從vivo的「PhoneGPT」到OPPO的「AIOS」,智能體的競爭開始成為衡量手機廠商技術能力的關鍵所在。
螞蟻集團基于螞蟻百靈大模型推出國內(nèi)首個服務型的AI獨立App“支小寶”;騰訊基于混元大模型,推出一站式AI智能體創(chuàng)作與分發(fā)平臺“騰訊元器”;阿里云的“通義for everyone”則集成通義大模型全棧能力,整合文生圖、智能編碼、音視頻理解、視覺生成等能力,形成一個All in one的全能AI助手......
玩家眾多,但也各有側重。
大廠比較重視生態(tài),以此為智能體提供強大的數(shù)據(jù)支持和應用場景,加速市場推廣和用戶接受度。比如百度文心有Agent Builder,阿里巴巴有百煉智能體和釘釘智能體,騰訊微信有云開發(fā)AI智能體。
螞蟻集團董事長兼CEO井賢棟在演講中表示,從實踐來看,專業(yè)智能體是大模型落地嚴謹產(chǎn)業(yè)的有效路徑。百度創(chuàng)始人李彥宏更是明確表示,智能體是百度最看好的人工智能應用發(fā)展方向。
而以智譜AI、面壁智能等為代表創(chuàng)企,則更聚焦垂直場景的應用。比如月之暗面推出了擅長多語言對話、長文本處理的Kimi;面向B端市場的面壁智能瞄準手機、汽車等智能終端推出MiniCPM;針對金融行業(yè)打造智能體開發(fā)平臺的深擎科技等。
“離用戶近些、再近些”是應用層面的目標,但推動到實際落地過程,商業(yè)化普遍艱難。
從現(xiàn)有的體驗和應用來看,智能體還處于一個初級階段。在普通消費者眼中,AI的實際價值還不夠剛需,甚至有人直言:“如果AI不能幫我做更實用的事,它就只是個燒錢的噱頭?!弊屩悄荏w真正「用起來」,是未來一大重要挑戰(zhàn)。
03、手機、PC、眼鏡、機器人
2024年,關于“誰是AI落地的最好載體”,行業(yè)歷經(jīng)多番討論實踐。
手機無疑沖在了最前面,在這場AI技術的浪潮中,國產(chǎn)廠商密集宣告AI操作系統(tǒng)的升級,AI不再是OS的附屬品,而是和系統(tǒng)進一步深度融合,從底層應用去重構原有的體驗。從華為原生鴻蒙,到榮耀的MagicOS 9.0,再到vivo的「PhoneGPT」,各家都在生成式AI功能上進行迭代。
從市場反饋來看,AI手機的確激發(fā)了行業(yè)回暖的速度。2024年第一季度就迎來了爆發(fā),比上個季度大幅增長了131%,截止到同年第三季度,一直保持著健康穩(wěn)定的正比例增長。
除了手機外,PC也是大模型落地終端的關鍵產(chǎn)品。PC和手機一樣有著高頻的交互屬性,但作為全場景生產(chǎn)力工具,AI大模型對于效率上的提升,在PC上的感知會更明顯。
不過AI PC遠沒有AI手機市場表現(xiàn)得精彩,上游把具備AI能力的芯片放在PC端,但本質(zhì)上還是常規(guī)迭代的PC產(chǎn)品。端側不成熟的應用加上有限的算力,讓AI PC多少有些名不副實。
與此同時,具身智能機器人賽道火爆、智能汽車領域的AI應用落地也是“卷”到飛起。2024世界人工智能大會上,國創(chuàng)中心首秀青龍人形機器人、復旦大學研發(fā)的“光華一號”人形機器人、特斯拉的賽博越野旅行車均十分搶眼值得一提的是,大模型的出現(xiàn)讓機器人“大腦”顯著“進化”,大大提升了機器人的通用性和泛化性。
優(yōu)必選人形機器人Walker聚焦汽車、消費電子等制造業(yè)重點領域,已進入多家車廠實訓;宇樹科技的機器人實現(xiàn)了完全仿人的自然行走;特斯拉人形機器人“擎天柱”計劃2025年開始量產(chǎn)……
“百鏡大戰(zhàn)”是2024下半年的主旋律,在大模型的加持下,沒有鍵盤、沒有鼠標、沒有觸屏,自然地以語音、圖像方式與硬件設備交互,為AR設備帶來了新的想象空間。
Ray-Ban Meta引爆了AI眼鏡市場,一副看起來與普通墨鏡無異的眼鏡,卻能在旅行時實時翻譯路牌,運動時播放適配的音樂,甚至能通過AI助手找到不記得放在哪兒的遙控器。
從2024年4月開始,國內(nèi)各大廠商陸續(xù)發(fā)布/發(fā)售了AI眼鏡,試圖在這一新興市場中占據(jù)領先地位。“李未可”發(fā)布了AI智能眼鏡Meta Lens Chat;百度和Rokid陸續(xù)發(fā)布了搭載AI的智能眼鏡;小米被曝將在2025年第二季度發(fā)布新一代AI眼鏡,或全面對標Ray-Ban Meta。
據(jù)Wellsenn XR數(shù)據(jù)預測,2025年開始,AI智能眼鏡將在傳統(tǒng)眼鏡銷量保持穩(wěn)定增長的大背景下快速滲透,到2029年,AI智能眼鏡年銷量有望達到5500萬副,而到2035年,這一數(shù)字將攀升至14億副。
不過,AI眼鏡這條賽道目前雖然熱鬧,但實現(xiàn)交付的廠商較少,線下鋪貨率也不及預期,未來落地情況仍有待觀望。
展望2025
整個2024年,AI不斷被推動前進,無論是技術的“瘦身”還是應用的“聚焦”,人類走向AGI(通用人工智能)的步伐更加沉穩(wěn)有序。
毫無疑問的是,AI仍將是2025年最受關注的技術。在此過程中,資本支出整體或?qū)②呌诜€(wěn)定,專業(yè)精細化領域的投資比重繼續(xù)加強;各公司出現(xiàn)差異化和競爭的等級秩序;“殺手級”應用進入倒計時;全球人工智能標準進一步健全,為人工智能系統(tǒng)的安全性、透明度和問責制設定基準......
祝愿2025年,世界將利用AI創(chuàng)造出令人難以置信的新能力,融入我們的生活,以至于我們甚至不會注意到它的存在。