文|劉曠
AI大模型從概念提出到應(yīng)用落地成效顯著,目前逐漸從C端“對話作詩”走向各行各業(yè)。
近期,騰訊云公布行業(yè)大模型研發(fā)進展,其立足不同企業(yè)的需求場景,依托騰訊云TI平臺打造了行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),助力客戶構(gòu)建專屬大模型及智能應(yīng)用。
無獨有偶,在華為開發(fā)者大會2023(Cloud)上,華為云盤古大模型3.0正式對外發(fā)布,這是一個面向行業(yè)的大模型系列,其將圍繞“行業(yè)重塑”“技術(shù)扎根”“開放同飛”三大創(chuàng)新方向,為行業(yè)客戶、伙伴及開發(fā)者提供更好的服務(wù)。
騰訊云、華為云等頭部云服務(wù)廠商領(lǐng)路,各行各業(yè)的龍頭企業(yè)和創(chuàng)業(yè)公司跟隨,行業(yè)大模型一時間熱鬧起來。不出意外,近幾個月行業(yè)大模型會迎來一波密集發(fā)布的小高潮,大模型產(chǎn)業(yè)的垂直化、企業(yè)化也將更深入。
轉(zhuǎn)戰(zhàn)行業(yè)大模型
從市場現(xiàn)狀來看,大模型的戰(zhàn)爭從通用大模型轉(zhuǎn)向行業(yè)大模型是大勢所趨。
正如騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生所說的:“通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業(yè)某個場景的需求”,通用大模型在解決特定場景的專業(yè)問題時存在一定的局限性。
一來,通用大模型有廣泛的適用性但缺乏行業(yè)深度,在專業(yè)和更加細(xì)分的垂直領(lǐng)域幾乎提供不了高價值的服務(wù)。
眾所周知,通用大模型需要三大支柱支撐即算法、數(shù)據(jù)、算力,其中數(shù)據(jù)決定智能范圍,影響數(shù)據(jù)分析的精準(zhǔn)度和全面性,而通用大模型數(shù)據(jù)大多來自于公開文獻與網(wǎng)絡(luò)信息,專業(yè)行業(yè)數(shù)據(jù)積累不足,在醫(yī)療、金融等專業(yè)性較強的產(chǎn)業(yè),通用大模型提供的服務(wù)價值有限。
二來,使用通用大模型需要上傳數(shù)據(jù)到大模型方提供的服務(wù)器,存在數(shù)據(jù)泄露的風(fēng)險和安全問題。
普通通用大模型并非本地部署也沒有用戶權(quán)限管控,對數(shù)據(jù)安全敏感的金融行業(yè)、G端客戶在運用大模型時很難保證數(shù)據(jù)的安全,采取有效的控制措施提高通用大模型的安全性和數(shù)據(jù)保護迫在眉睫。
三來,通用大模型需要處理海量的數(shù)據(jù)與計算資源對算力、算法要求高,意味著更高的運營成本。據(jù)網(wǎng)絡(luò)公開數(shù)據(jù),以GPT-3的AI大模型為例,OpenAI使用了近1萬億個單詞和45TB的數(shù)據(jù)量來訓(xùn)練它,單次訓(xùn)練成本達到140萬美元。
相比通用大模型,垂直大模型在控制成本方面有很大優(yōu)勢,因為模型參數(shù)少,訓(xùn)練調(diào)試、優(yōu)化和實施的成本更低,這對于追求“降本增效”的中小型企業(yè)更加友好。
通用大模型數(shù)據(jù)安全、算力成本、行業(yè)深度等多方面的不足,騰訊云、華為云等云服務(wù)廠商積極研發(fā)低門檻、低成本、高效率且安全,又適合落地的行業(yè)大模型。
騰訊云整合生態(tài)資源
在其他云服務(wù)廠商還在C端市場火拼的時候,騰訊云早早的瞄準(zhǔn)了TOB 場景。
6月19日,針對通用大模型高成本、安全性低等問題,騰訊云推出了MaaS服務(wù)全景圖,為客戶提供一站式模型服務(wù),涵蓋完善的模型工具、成熟的流程方法、全面的配套服務(wù)以及領(lǐng)先的安全保障能力。
與此同時,騰訊云圍繞自身產(chǎn)業(yè)生態(tài)優(yōu)勢去發(fā)展和壯大行業(yè)大模型業(yè)務(wù),取得了一定的成果和反饋。
據(jù)了解,騰訊云行業(yè)大模型能力已經(jīng)在騰訊企點、騰訊會議、騰訊云AI代碼助手等多款產(chǎn)品中落地使用。此外,騰訊云聯(lián)合行業(yè)頭部企業(yè),已為文旅、政務(wù)、金融等 10 余個行業(yè),提供了 50 多個大模型行業(yè)解決方案。
不得不說,龐大的產(chǎn)業(yè)生態(tài)是推動行業(yè)大模型落地的重要資源。騰訊投資的業(yè)務(wù)大而廣,而無論是社交、文娛、大健康,還是金融、汽車等產(chǎn)業(yè)都需要走向數(shù)字化,大模型又是產(chǎn)業(yè)數(shù)字化發(fā)展的標(biāo)配,在應(yīng)用行業(yè)大模型方面,騰訊云有先天優(yōu)勢。
除了產(chǎn)業(yè)生態(tài)資源之外,騰訊云發(fā)展行業(yè)大模型的競爭力還在于技術(shù)的積累和創(chuàng)新。
在技術(shù)方面,騰訊云背靠騰訊優(yōu)圖實驗室、騰訊 AI Lab 等頂級實驗室,底層算力、算法開發(fā)、AI 應(yīng)用等技術(shù)能力不言而喻,而且騰訊云算力、算法等方面的實力不是一成不變而是一直在進步。
值得一提的有,騰訊云自研的星脈高性能計算網(wǎng)絡(luò)、向量數(shù)據(jù)庫,能提升40%的GPU利用率,節(jié)省30%~60%的模型訓(xùn)練成本,為AI大模型帶來10倍通信性能提升,可為行業(yè)大模型的應(yīng)用提供更堅實的算力底座。
據(jù)財報透露,騰訊還在自研數(shù)據(jù)庫TDSQL、安全平臺EdgeOne和大數(shù)據(jù)處理套件TBDS之類的技術(shù),以及研究AI開發(fā)相關(guān)的TI平臺等。騰訊2023年第一季度研發(fā)投入為151.81億元,而且自2018年來5年累計超過2200億元,研發(fā)投入只多不少。
在生態(tài)方面,騰訊云秉承開放共贏的理念將技術(shù)開放給更多合作伙伴,打造可持續(xù)創(chuàng)新發(fā)展的大模型生態(tài)。
對此,騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實驗室負(fù)責(zé)人吳運聲表示:“AI大模型技術(shù)發(fā)展和產(chǎn)業(yè)探索,離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建,騰訊希望與行業(yè)伙伴攜手,共同推進大模型在產(chǎn)業(yè)領(lǐng)域的創(chuàng)新和落地。”
總而言之,騰訊云基于自身生態(tài)資源優(yōu)勢、堅實的技術(shù)底座還有開放的技術(shù)平臺,率先在行業(yè)大模型領(lǐng)域“落位”,隨著技術(shù)的進一步精進和應(yīng)用場景的擴大,騰訊云有望在行業(yè)大模型領(lǐng)域保持領(lǐng)先地位。
華為云深耕垂直產(chǎn)業(yè)
時間車輪滾滾,自2019年以來華為一直致力于研發(fā)和升級迭代盤古大模型,通過不斷投入資金、人力和資源,提升了自己在行業(yè)大模型領(lǐng)域的技術(shù)實力。
2019年-2020年,華為內(nèi)部投入AI大模型研發(fā),立項做盤古大模型;2021年4月,華為云盤古大模型正式面世;2022年,盤古大模型升級2.0版本,落地行業(yè)應(yīng)用;2023年,盤古大模型 3.0 正式發(fā)布,繼續(xù)深入產(chǎn)業(yè)鏈。
盤古大模型3.0三層架構(gòu)可以快速調(diào)整方向,快速適配客戶的多變需求,為不斷變化的產(chǎn)業(yè)數(shù)字化趨勢提供可靠的解決方案。華為云這種兼顧通用大模型、行業(yè)大模型以及更細(xì)化場景大模型服務(wù)的能力背后,依仗的是多年來持續(xù)的技術(shù)研發(fā)。
一方面,華為云大模型技術(shù)實力強勁,體現(xiàn)在人工智能技術(shù)的持續(xù)投入和創(chuàng)新能力上。財報數(shù)據(jù)顯示,華為2022年研發(fā)投入達到1615億人民幣,占全年收入的25.1%,十年累計投入的研發(fā)費用超過9773億人民幣。
這種投入力度和創(chuàng)新速度使得華為云能夠在人工智能領(lǐng)域取得突破,為大模型的全面落地奠定了堅實的基礎(chǔ)。財報數(shù)據(jù)顯示,2022年華為提交了8440份專利申請,其中90%以上為發(fā)明專利,涉及電子通信、光技術(shù)、鴻蒙操作系統(tǒng)、計算存儲、智能汽車等多個領(lǐng)域。
另一方面,華為云繼續(xù)深耕政務(wù)、鐵路、制造、藥物等垂直行業(yè)的數(shù)字化,通過在這些垂直行業(yè)中提供安全、可靠、高效的AI大模型解決方案,樹立自身良好形象,也彰顯盤古大模型的價值。
在煤礦領(lǐng)域,盤古礦山大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務(wù)流程下的1000多個細(xì)分場景,已在全國8個礦井規(guī)模使用;在鐵路領(lǐng)域,盤古鐵路大模型能精準(zhǔn)識別現(xiàn)網(wǎng)運行的67種貨車、430多種故障,無故障圖片篩除率高達95%……
不得不說,華為云盤古大模型3.0高度可定制化的能力,使其可以根據(jù)不同行業(yè)、企業(yè)和用戶的需求進行定制,能夠滿足千行百業(yè)各種復(fù)雜的場景,這種靈活性和可拓展性讓華為云盤古大模型在垂直領(lǐng)域收獲“累累戰(zhàn)績”。
關(guān)于未來,華為輪值董事長胡厚崑表示,華為在人工智能發(fā)展上有兩個著力點:“第一,打造強有力的算力底座,支撐中國人工智能產(chǎn)業(yè)的發(fā)展。第二,從通用大模型到行業(yè)大模型,讓人工智能服務(wù)好千行百業(yè)、服務(wù)好科研創(chuàng)新。”
這樣意味著,華為云要不斷深化行業(yè)大模型技術(shù)研究與生態(tài)拓展,加速占領(lǐng)更大的市場份額,而這一過程也會遇到更多的技術(shù)挑戰(zhàn)和場景競爭。
加速搶占B端“著陸點”
騰訊云、華為云之外,越來越多大廠投入到行業(yè)大模型的開發(fā)和訓(xùn)練以及商業(yè)化中,他們寄希望于采用更精準(zhǔn)的行業(yè)數(shù)據(jù)、更低成本解決某些產(chǎn)業(yè)核心技術(shù)“卡脖子”問題,這也意味著一場行業(yè)大模型的“著陸之爭”悄然到來。
首先,自動駕駛、醫(yī)療、教育、金融等領(lǐng)域的行業(yè)大模型層出不窮,一系列行業(yè)大模型的集中爆發(fā),將推動行業(yè)大型模型的發(fā)展和應(yīng)用,也必然會加劇市場競爭。
3月,網(wǎng)易有道推出國內(nèi)首個教育場景下類ChatGPT模型“子曰”;4月,毫末智行發(fā)布全球首個自動駕駛生成式大模型DriveGPT;5月,我愛我家推出行業(yè)首個房產(chǎn)經(jīng)紀(jì)大模型1.0版本;6月,東軟面向醫(yī)療領(lǐng)域推出添翼醫(yī)療領(lǐng)域大模型;7月,中國移動宣布發(fā)布九天人工智能行業(yè)大模型……
其次,百度云、阿里云、騰訊云、華為云高喊大模型落的口號,并推出相關(guān)的行業(yè)大模型,在不同的行業(yè)、產(chǎn)業(yè)中落地已成為頭部云服務(wù)廠商的新戰(zhàn)場。
有人說,AI大模型只有大企業(yè)和資金充足的企業(yè)才能玩得轉(zhuǎn),確實如此。AI大模型的研發(fā)和訓(xùn)練需要海量的數(shù)據(jù)、高額的費用、優(yōu)秀的科技人才,而具備這些條件的企業(yè)基本是互聯(lián)網(wǎng)巨頭或行業(yè)龍頭企業(yè),它們深入到產(chǎn)業(yè)中去的發(fā)展共識,亦是行業(yè)競爭風(fēng)向標(biāo)。
最后,國內(nèi)各行各業(yè)的數(shù)字化轉(zhuǎn)型需求是多元而豐富的,行業(yè)大模型廠商正在探索多種行業(yè)大模型落地的可行性。IDC對基于大模型的AI市場規(guī)模進行了預(yù)測,預(yù)計中國人工智能市場規(guī)模在2023年將超過147億美元,到2026年這一規(guī)模將超過263億美元。
綜上所述,行業(yè)大模型是當(dāng)下云服務(wù)廠商絕對不能錯過的風(fēng)口,騰訊云、華為云已經(jīng)憑借其產(chǎn)業(yè)生態(tài)基因和擅長的AI技術(shù),提供差異化的行業(yè)大模型服務(wù),行業(yè)大模型落地將成為云廠商們的下一個競爭的主場。