文|IT時報記者 賈天榮
編輯|郝俊慧 孫妍
12月6日,當ChatGPT低調地慶祝它的“一周歲”生日之際,谷歌推出Gemini大模型,引發(fā)科技圈“地震”。Gemini將大模型帶入原生多模態(tài)時代,不僅可以處理文本內容,還可以處理代碼、音頻、圖像和視頻等多種模態(tài)信息,是谷歌目前規(guī)模最大、能力最強的大模型。
一年前,ChatGPT的問世,掀起人工智能的巨浪。如今,不斷“涌現(xiàn)”的AI能力,正讓未來變得更加未知。
誰都不想錯過一個時代的來臨。
一面是科技巨頭紛紛加入,另一面是眾多初創(chuàng)公司積極參與,試圖以技術創(chuàng)新和市場占領贏得先機。然而隨著大模型創(chuàng)業(yè)的逐漸升溫,競爭的火焰也變得愈發(fā)熾熱。在這場角逐中,資源投入巨大,無論是研發(fā)、硬件基建還是人才爭奪,都成為創(chuàng)業(yè)公司需要克服的巨大困境。
01 奔騰的浪潮
一年以來,各行各業(yè)的公司都在爭先恐后推出自己的“大模型”,大模型創(chuàng)業(yè)潮如同一場狂風驟雨,讓整個科技產業(yè)陷入了一片熱潮,百度、阿里、華為、京東等互聯(lián)網大廠重金押注,無一缺席。他們不僅投入大量的資金和資源,還積極招募人才,加強技術研發(fā),以保持自己在人工智能領域的領先地位。在這之中,也有無數(shù)創(chuàng)業(yè)者奔涌而至,希望能在這個新興的市場中搶占先機。
最新發(fā)布的《北京市人工智能行業(yè)大模型創(chuàng)新應用白皮書(2023年)》顯示,僅國內而言,截至2023年10月,我國擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所共計254家,分布于20多個省市/地區(qū),國內大模型總數(shù)達238個,“百模大戰(zhàn)”再次升級。
面對持續(xù)火爆的“百模大戰(zhàn)”,業(yè)內也開始出現(xiàn)一些“冷”思考。“中國的大模型很多,但是基于大模型開發(fā)出來的AI原生應用卻非常少?!?1月15日,在深圳2023西麗湖論壇上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏談及國內AI行業(yè)現(xiàn)狀時表示。
國內目前大模型創(chuàng)業(yè)企業(yè)的現(xiàn)狀如何?《IT時報》記者了解到,目前的大模型可分為通用大模型和垂類行業(yè)大模型。通用大模型具有強大泛化能力,可在不進行微調或少量微調的情況下完成多場景任務,相當于完成了“通識教育”的AI,ChatGPT、百度的文心一言、阿里的通義千問等都是通用大模型。
行業(yè)大模型則是利用行業(yè)知識對大模型進行微調,讓AI完成“專業(yè)教育”,以滿足在能源、金融、醫(yī)療、制造、傳媒等不同領域的需求。
基礎大模型的技術創(chuàng)新,更多是大公司的角斗場,對于大多數(shù)創(chuàng)業(yè)公司而言,不管是算力、資金還是數(shù)據,有限的創(chuàng)業(yè)資源都決定了垂直行業(yè)大模型是創(chuàng)業(yè)者們的主戰(zhàn)場。
02 旋渦中的競爭與困境
多位接受《IT時報》采訪的業(yè)內人士認為,“數(shù)據”和“人才”是如今大模型創(chuàng)業(yè)公司的競爭中最重要的核心資源。
數(shù)據是推動大模型能力演進的核心“能源”,浦因科技(上海)有限公司首席科學家秦興虎告訴《IT時報》記者,不管是模型的訓練還是后續(xù)對模型的進一步更新以滿足其實際應用,都需要大量的數(shù)據來支撐,在模型開發(fā)的成本中,數(shù)據成本也占據了很大的比重。
從事醫(yī)學垂直AI模型研究的英國鄧迪大學博士研究員王宸禹也表示,AI醫(yī)療行業(yè)的數(shù)據獲取難度較高,成本也更大。
北京醫(yī)者信息科技有限公司(以下簡稱“醫(yī)者AI”)CEO劉呈輝認為,即使早期各大公司之間技術有所差距,但隨著競爭到后期,技術的鴻溝被抹平,數(shù)據會成為最重要的戰(zhàn)略資源,尤其是專業(yè)領域里的高質量私域數(shù)據,更是稀缺資源,還涉及數(shù)據資產的采集、產權、安全隱私等問題。
在秦興虎看來,從事醫(yī)療行業(yè)大模型的開發(fā)需要既懂人工智能技術,又懂相關生物信息技術,專業(yè)性要求極高,人才爭奪成了創(chuàng)業(yè)公司需要克服的另一個困境,“一方面是要求高,另一方面,初創(chuàng)公司對于人工智能人才的吸引力很多時候是不如大廠的。”
“現(xiàn)在國內做基座類模型的人才90%都出自清華,國內真正會調模型、訓練模型的甚至不超過200個人?!眲⒊瘦x也表示,由于行業(yè)本身的人才儲備有限,加上大模型的突然“火爆”,人才短缺問題顯得尤為突出,如果不在高校具備一定的人才資源,創(chuàng)業(yè)公司連招人都會變得很困難。
脈脈高聘人才智庫發(fā)布的《2023泛人工智能人才洞察》顯示,今年1月到8月,新發(fā)AI崗位平均月薪超4.6萬元,人才供需比僅為0.39,相當于5個崗位爭奪2個人才。
vivo副總裁周圍接受媒體采訪時曾表示,“vivo大模型現(xiàn)在每年20億~30億元的投入成本,總投入成本已經超過200億元,人才和數(shù)據算力各占一半,人才成本平均每人稅后100萬元?!?/p>
03 日漸“降溫”的投資潮
創(chuàng)業(yè)公司們不斷崛起的另一面,是投資人對于大模型賽道初創(chuàng)公司的熱情肉眼可見“降溫”了。今年以來,幾家大模型初創(chuàng)公司拿到融資,數(shù)據顯示,今年中國AI領域融資214億元,百川智能、Minimax和智譜AI三家公司在資本市場尤為受歡迎,融資額占比超過30%。
但除了頭部三家,其他初創(chuàng)公司的融資情況可能并非那么樂觀。據《財經十一人》報道,第三方數(shù)據機構企名片數(shù)據顯示,今年國內共有26家大模型初創(chuàng)公司拿到融資,基本是種子輪或天使輪。與此相對應的是,截至目前,共有超過130家公司發(fā)布大模型相關產品。
“市場上的投資人正越來越謹慎,資金也在逐漸減少?!鼻嘏d虎注意到,相比“井噴期”投資者的“一擲千金”,如今的他們對大模型項目的市場需求、技術實力、商業(yè)模式以及團隊能力等方面的情況會有更多考量。于是他選擇先在一些醫(yī)院開展試點項目,以證明自己的技術實力和市場潛力,從而吸引更多的投資。
“現(xiàn)在吸引投資人的核心就是能實際產生經濟效益,你只有掙錢了,才能證明是有價值的?!眱H僅幾個月間,劉呈輝的明顯感受是,投資人對于“投概念”和“產生收入”的包容周期正越來越短。
《IT時報》記者了解到,目前大模型商業(yè)模式分為to B和to C兩類,其中像ChatGPT這樣靠訂閱付費實現(xiàn)盈利的爆款App走的是面向C端的模式,而國內面向C端的人工智能應用則多為免費。
關于國內的大模型創(chuàng)業(yè)公司商業(yè)化,王宸禹指出了目前的兩個主要路徑:首先是將國產大模型作為云端API服務,提供給開發(fā)者和企業(yè),通過訂閱或按計時計費的方式進行商業(yè)化運營。
其次是垂直領域的解決方案,即開發(fā)專門針對特定垂直領域的解決方案,比如醫(yī)療、金融、法律等,為不同行業(yè)提供定制化的大模型服務,降低門檻,提高行業(yè)滿足度。
在兩個路徑中,定制化的解決方案似乎成為未來大模型創(chuàng)業(yè)的一大趨勢。
如浦因科技自主研發(fā)的“以眼識病”人工智能模型,可以識別幾乎所有的眼科疾病,同時還能識別人體系統(tǒng)性疾病,包括糖尿病、缺血性中風、心肌梗死、心衰和帕金森病等。秦興虎表示,公司另一項基于人工智能的技術,通過訓練之后,建立的模型可以提供超過50多種常見慢性病和復雜性疾病的風險預測。
大模型創(chuàng)業(yè)公司們掙到錢了嗎?“目前的環(huán)境是雷聲大雨點小,公司多收入少?!眲⒊瘦x認為,如今國內在應用層能產生實際應用和實際收入的場景和公司還非常少,相比之下,有自己垂直模型、場景能掙到錢的公司,才能真正獲得投資者青睞。
劉呈輝舉例,如醫(yī)者AI專注“大模型+大健康”的領域,以自研的MoE架構健康大模型,賦能“大健康”賽道公司,以AI Agents方式為消費者提供健康管理服務,“我們和體檢機構合作,提供SARS、健康問題解答和報告解讀,干的是健康產業(yè)鏈中人力密集度特別高的事情,大模型在這個場景下解決了之前技術無法解決的問題,為企業(yè)節(jié)約了大量人工成本,企業(yè)才愿意為此買單。”
排版/ 季嘉穎