正在閱讀:

大模型落地,痛并堅持著

掃一掃下載界面新聞APP

大模型落地,痛并堅持著

當下國內(nèi)業(yè)界對大模型態(tài)度發(fā)生轉(zhuǎn)變,落地預期回歸理性,左手閉源,右手開源。兩手都要抓,兩手都要硬。

文|數(shù)智前線 趙艷秋 周享玥

編輯|?;?/p>

在經(jīng)歷數(shù)個月的探索后,國內(nèi)首批大模型的行業(yè)落地進展浮出水面,而這些代表性企業(yè)的動作引發(fā)業(yè)界關(guān)注。

大模型已給一些行業(yè)帶去質(zhì)變,但也并不像當初憧憬的那樣豐富多彩,而開源大模型給市場界格局帶來變數(shù),產(chǎn)業(yè)界暗流涌動。

01、浮出水面的行業(yè)實踐

8月15日,在北京舉辦的百度WAVE SUMMIT 2023峰會期間,國家電網(wǎng)智研院知識計算技術(shù)主管張強分享了大模型在國網(wǎng)電力設備運檢上的落地探索。

“整個電網(wǎng)的設備規(guī)模超過了4萬億,而與設備相關(guān)的標準、產(chǎn)品資料、故障案例等,是國網(wǎng)公司重要的數(shù)據(jù)資產(chǎn)和生產(chǎn)要素?!睆垙娬f。目前大模型實踐以設備為核心切入點。會后,張強打開手機上的工作App為數(shù)智前線演示,相關(guān)業(yè)務模塊已接入大模型,基層班組可獲得設備運檢中的相關(guān)判據(jù)和依據(jù)來源。

區(qū)別于互聯(lián)網(wǎng)行業(yè),工業(yè)的專業(yè)知識樣本稀缺,積累困難,大模型的訓練過程,也是對這些數(shù)字資產(chǎn)的系統(tǒng)化梳理和重構(gòu)過程,這期間有很多挑戰(zhàn)?,F(xiàn)在,國網(wǎng)智研院的行業(yè)預訓練語言模型參數(shù)超過70億,正在進行150億參數(shù)的電力認知大模型全量精調(diào)訓練。

一位物聯(lián)網(wǎng)技術(shù)專家告訴數(shù)智前線,類似國網(wǎng),他們落地中進度較好的也是面向內(nèi)部員工的文檔知識問答。此前,員工檢索企業(yè)內(nèi)部文獻文檔很費勁。原先知識圖譜技術(shù)手段,成本高,需要標注很多數(shù)據(jù),訓練很多小模型,而回答問題的覆蓋度還較低。有了大模型,只要把文檔做簡單預處理,“丟給”大模型,大模型學習后就能直接回答問題,還能提供知識溯源出處,回答的覆蓋度也較高,“這是對原來知識管理賽道很大的顛覆”。

除了能源企業(yè),在7月華為開發(fā)者大會HDC期間,工商銀行人工智能和大數(shù)據(jù)實驗室副總經(jīng)理黃炳也介紹了大模型的初步實踐,例如輔助客服人員,能將專業(yè)知識轉(zhuǎn)化為“大白話”的知識運營助手,為投研團隊提供晨報的生成服務,以及工行辦公系統(tǒng)中的文案創(chuàng)作、網(wǎng)訊編寫、會議摘要等。有趣的是,網(wǎng)訊編寫經(jīng)過模型訓練,會有“工行文風”。

黃炳介紹,這些場景都是人機協(xié)作,對員工和管理層有感知。比如,投研團隊用的晨報生成服務,過去雇傭?qū)嵙暽ㄙM1個小時,現(xiàn)在只需5分鐘。

在能源、金融之外,上市公司中康科技首席技術(shù)官唐珂軻在WAVE SUMMIT期間告訴數(shù)智前線,基于通用大模型訓練的行業(yè)模型,在三類醫(yī)藥相關(guān)場景中最先落地。

其中一類是與幾家連鎖藥店做的藥事服務,可提升店員的專業(yè)度;一類是輔助醫(yī)生的臨床科研,比如文獻整理和自動總結(jié)、醫(yī)療領域?qū)I(yè)的Meta分析?!耙郧白鲆黄狹eta分析至少3~6個月,現(xiàn)在只需花10分鐘。”唐珂軻說,自己之前做過科研,能感知到大模型對臨床科研效率上質(zhì)的改變。第三類是患者出院后的健康管理,這部分此前基本是缺失的。他們目前在廣東、湖南等地,與不同醫(yī)院落地了針對不同腫瘤的模型,支撐乳腺癌、肝癌、肺癌等患者出院后的服務,這是腫瘤患者非常需要的。

唐珂軻稱,醫(yī)療數(shù)據(jù)相對的封閉性,會給行業(yè)模型訓練帶來挑戰(zhàn)。但他看好大模型對行業(yè)的前景改變?!叭ツ暝诖罱ɑ颊呋卦L系統(tǒng)時,技術(shù)實施復雜度“令人頭疼”,但今年在大模型基礎上投喂幾千條數(shù)據(jù),效果就不錯”。

上海南洋萬邦智能物聯(lián)部經(jīng)理曾佑軒告訴數(shù)智前線,在落地實踐中,大模型在AI助手、知識管理兩大方向上落地較多。該公司是上海儀電下屬的數(shù)科公司。談到大模型成本,曾佑軒介紹,目前AI助手的費用已做到每月每人10元。這并不像大家想象中那么高昂。

大模型已在為企業(yè)降本增效。一位云計算資深人士告訴數(shù)智前線,他了解原來某大型家具企業(yè),外包客服要請數(shù)百人,現(xiàn)在已縮減到小幾十人?!跋襁@種項目,企業(yè)幾十萬可以搞定,又能節(jié)約成本,是比較好的落地?!?/p>

02、“大家都冷靜理性了”

在大模型的落地實踐中,行業(yè)對大模型有了更深入的認知,很多企業(yè)調(diào)整了預期,“大家冷靜理性了?!?/p>

“我們從今年初開始重點關(guān)注大模型,當時的想法是要把大模型更好地用起來。”一位能源大企業(yè)人工智能專家近日告訴數(shù)智前線,“但在逐漸用的過程中,我們發(fā)現(xiàn)不是那么理想,也不會那么快?!?/p>

他們現(xiàn)在偏向于先支撐內(nèi)部人員,因為“大模型的回答,尤其是事實類的還不是太好”,直接開放給客戶還有一定風險。而面向內(nèi)部,會經(jīng)過大家的過濾、判斷和把關(guān)。內(nèi)部人員再結(jié)合他們的理解,對外來服務?!拔覀儠叶鹊厝ミ^渡,逐步開放一些功能。”

無獨有偶,工行目前的應用也先從內(nèi)部開始,優(yōu)先面向金融文本和金融圖像分析創(chuàng)作,且“場景肯定有錯誤容忍度”。

實際上,大模型的實際落地與當初的預期存在一定落差?!按竽P湍芙鉀Q的問題,比一開始想象的要少很多?!币晃恍袠I(yè)資深人士告訴數(shù)智前線。

造成這個落差的原因有多方面。從場景上說,ChatGPT剛出來時,大家對大模型有很多憧憬,一位云計算人士舉例,曾有企業(yè)找他咨詢,AI能不能替代采購,因為采購環(huán)節(jié)最易滋生腐敗,老板都想把這塊監(jiān)管或考慮用技術(shù)取代。但采購不是一個簡單決策,需要綜合考量。

“很多企業(yè)要么完全不知道怎么用,要么就是天馬行空,但因為提出的場景復雜、決策鏈太長,實際做不到?!彼f。而另一些人士認為,大家可能把大模型與通用人工智能混為一談。

從技術(shù)角度看,在醫(yī)療、教育等一些專業(yè)度、準確度要求高的客服場景,大語言模型的幻覺是個問題。當他們把行業(yè)數(shù)據(jù)注入到基礎大模型時,不管是微調(diào),還是其他手段,模型能吸納并能轉(zhuǎn)化成正確輸出的,大概有70%到80%。這就要求不得不用更多辦法,去處理那20%到30%的錯誤率。

“但目前沒有特別低成本和快速的辦法?!鄙鲜鋈耸糠答?,很多東西需要去做強化學習和復雜的人工標定,所花的成本可能是現(xiàn)在成本基礎再乘以10甚至更多,這讓很多企業(yè)難以接受。

針對上述兩個問題,聚焦領域大模型開發(fā)的中關(guān)村科金技術(shù)副總裁張杰告訴數(shù)智前線,在場景選擇上,他覺得接下來適合大模型進一步落地的較好賽道,是專業(yè)性較高,且容錯性較高的場景,如企業(yè)知識問答、營銷機器人、坐席助手。而通用性太高或容錯性又比較低的場景,如自動駕駛,不是特別好的商業(yè)賽道。

從技術(shù)層面,張杰認為不是某一套大模型的應用技術(shù)路線,就可以非常完美地解決問題,他介紹了三種由淺入深的應用技術(shù)路線。

從落地實踐看,目前,前兩種接受度高?!斑@三種方法不是3選1,在具體場景下,肯定是一套組合拳?!彼a充道。

“大家其實看到iPhone在2006就出來了,但整個移動互聯(lián)網(wǎng)時代的開啟是在2012年?!敝行沤ㄍ蹲C券研究所所長、武超則在不久前的行業(yè)會議上稱,“這個過程才剛剛開始”。

她認為大模型有幾個階段的演進,從能聽會說、能看會認開始,到能夠像人一樣去組合使用工具,從而讓每個人配一個“斯坦福畢業(yè)的助理”,再到通用人工智能中的會規(guī)劃、會決策。

行業(yè)在不斷深入探索。一位行業(yè)資深人士告訴數(shù)智前線,他們在做教育等行業(yè),客戶數(shù)量較大,在將大模型融入業(yè)務工作流的過程中,遇到很多問題,“還在去尋找有沒有更能解決問題的方式”。

03、企業(yè)紛紛涌向開源大模型

在大模型落地的過程中,越來越多的國內(nèi)企業(yè)開始采用開源大模型。

一位南方電網(wǎng)人士告訴數(shù)智前線,內(nèi)部現(xiàn)在進行大模型嘗試時,“都是基于Llama吧”。Meta公司在今年7月發(fā)布了開源可商用大模型Llama 2,包含了70億、130億和700億參數(shù)3個版本。另一位南方電網(wǎng)人士稱,內(nèi)部對不同開閉源模型正進行測試賽馬。

8月,金蝶發(fā)布的財務大模型,也基于開源大模型訓練而來。金蝶CTO趙燕錫告訴數(shù)智前線,就像手機操作系統(tǒng)有iOS、安卓一樣,開源模型要打造生成式AI的安卓系統(tǒng),國內(nèi)有像清華ChatGLM,國際上有MPT、Llama,未來是一個多模型合作的想法。

在金融領域落地中,有資深人士告訴數(shù)智前線,開源、閉源大模型都有,因為各金融機構(gòu)體量不一,策略也不一樣。很多公司先在一個具體場景下用開源模型做出實際效果,再考慮復制推廣,也有幾個大行對平臺做一些戰(zhàn)略性投入,在閉源基礎大模型上,建了一個類似于中臺的平臺,期望將來同時對接多個場景。

“之前我們自己訓練了兩個不同參數(shù)的模型,最近我們也在用開源?!敝锌粕钪荂TO宋健告訴數(shù)智前線。他認為,目前絕大部分文本寫作、上下文匹配,130億參數(shù)的模型已夠用,而三四百億參數(shù)的模型,在解決很多垂類問題上已經(jīng)足夠,無論國內(nèi)百川,還是國外的Llama,效果都不錯。

一家物聯(lián)網(wǎng)公司技術(shù)高管告訴數(shù)智前線,目前開源大模型發(fā)展較快,開源社區(qū)也發(fā)布了很多模型,大部分基于Llama 2微調(diào)而來?!拔覀円矞y試過很多開源和閉源模型,由于我們的目標市場需要多語言支持,會更多考慮Llama 2。如果是面向國內(nèi)市場,一些國內(nèi)的模型也很優(yōu)秀?!?/p>

“選擇開源和閉源,實際上各有優(yōu)缺點。使用開源模型的好處主要是較為自由,包括部署、微調(diào)、升級和免費。閉源的好處是有質(zhì)量保證,免自己部署和應用門檻較低?!鄙鲜鲑Y深人士介紹。

他選擇開源的一個重要原因是認為,目前開源模型的繁榮和水平提高呈現(xiàn)一個明顯趨勢。他打了一個比喻,開源大模型的水平就好比海平面,閉源大模型相當于一個個島嶼。目前這些島嶼上漲的速度,跟不上海平面上漲的速度,大部分島嶼將會被海水淹沒,可能世界上最后就剩下幾座上漲比較快的島嶼。

模型本身現(xiàn)在可選的很多,多位業(yè)內(nèi)人士也贊同,開源和閉源不是客戶會關(guān)心的問題,“極少客戶會去指定用哪一款模型”。因為客戶并不直接使用基礎大模型,最終客戶是沒有感知的。“客戶更關(guān)心的是精度、速度和價格。當然最終保證無害性、合法性,這是應用開發(fā)商必須解決的問題?!鄙鲜鑫锫?lián)網(wǎng)行業(yè)專家說。

張杰告訴數(shù)智前線,因為開源可商用大模型,每一款可能都有自己的優(yōu)缺點,比如說有些適合做一些分類型的任務,有些性能比較好,有些可能就生成式的任務表現(xiàn)比較好,還是要根據(jù)具體場景,一些ROI的需求,選擇不同的模型。

“總體來講,我們覺得接下來大模型非常重要的趨勢,就是開源。”中信建投證券武超則稱,非標準化的場景,非標準化的算力,這種架構(gòu)決定開源可能會是一個比較趨同的方向。

04、大廠態(tài)度發(fā)生變化

開源世界的迅速繁榮,也正導致大模型生態(tài)鏈企業(yè)甚至底層芯片廠商的態(tài)度和策略發(fā)生一些微妙變化。

一家國內(nèi)主流AI芯片企業(yè)人士告訴數(shù)智前線,Meta推出Llama 2開源模型后,呈現(xiàn)出的效果較好,這對目前市場上一些大模型來說是個絕殺。為此,他們已暫緩了對一些大模型的適配工作,觀望一下再說。

國內(nèi)外大模型大廠也已迅速在策略上做出改變,普遍朝著“左手閉源,右手開源”的方向走。

在國外,微軟除了投資OpenAI閉源大模型,也和Meta實現(xiàn)牽手,宣布在其Azure云和Windows內(nèi)上線開源的Llama 2。亞馬遜AWS、谷歌云也都在自研大模型基礎上,支持第三方和開源模型。

在國內(nèi),8月初,百度先宣布升級千帆大模型平臺,接入Llama2全系列、清華ChatGLM2、RWKV等33個大模型,并對這些模型進行性能增強、推理優(yōu)化等工作;之后,阿里開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,稱“開源、免費、可商用”;而在8月16日,騰訊亦亮出新動作,宣布騰訊云TI平臺已接入Llama 2、Falcon、Dolly等20多個主流模型,旨在打造行業(yè)大模型精選商店。

大廠們何以會有如此“整齊劃一”的動作?

市場需求變化是一個因素。百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理忻舟告訴數(shù)智前線,他們發(fā)現(xiàn)市場需求已逐漸進入深水區(qū),僅文心一言一個模型,不能滿足客戶多樣化需求,而如果能把一個平臺做好,“會有更多的流量”。

業(yè)界觀察,7月下旬,百度在對外表述中,已將原來的“文心千帆大模型平臺”轉(zhuǎn)變?yōu)椤扒Х竽P推脚_”,在做“去文心化”。

另一個現(xiàn)實因素是,大廠們單個項目報價普遍在千萬元級別,閉源大模型暫時還沒能有足夠多的大項目落地。

此外,清華ChatGLM建立了有策略的、組合的商業(yè)模式,把小模型開源出去,吸引商機和生態(tài),它的閉源大模型也可以為企業(yè)提供定制化服務。大模型廠商提供一個開源的但規(guī)模較小的大模型供大家使用,也是一種營銷模式。

一位熟悉阿里云的資深人士也表示,他猜測,上述這些因素也是阿里開源兩款大模型的重要原因之一?!白吡硗庖粭l路試試看?!?/p>

而大模型變現(xiàn)的通路,并不只是模型本身。

數(shù)智前線獲悉,華為在大模型上的考量,算力是重頭之一。7月底到8月初,任正非就大模型有兩次講話,均與算力相關(guān)。

先是成立AI算力先遣隊,由原煤礦軍團團長鄒志磊負責。任正非說,有4000個客戶想要用華為昇騰平臺去訓練大模型。華為也將可能在10月成立15個小組去分別服務15個客戶。之后,針對華為在《自然》雜志上發(fā)表的華為云盤古氣象大模型的論文,任正非也談及要“在新的淘金時代賣鏟子”。

無獨有偶,忻舟介紹,百度在大模型上的商業(yè)模式可分為兩個層面。從文心一言這個大模型的角度講,百度賺的是AI的錢。但千帆同時還是一個支持其他第三方模型的平臺,本質(zhì)上“還是云的思路,賺云的錢”。

此外,開源對生態(tài)建設也是百利而無一害。畢竟大模型被認為是智能時代的操作系統(tǒng),而操作系統(tǒng)比拼的是生態(tài),百度智能云AI平臺副總經(jīng)理李景秋認為,好的開源模型會極大吸引市場上創(chuàng)新公司關(guān)注大模型并參與其中,進而帶來整個上下游服務生態(tài)的完善。

今年7月,阿里云也對外喊出“將促進中國大模型生態(tài)的繁榮作為首要目標”的口號?!斑@就類似于原來開源軟件的模式,通過開源來吸引客戶,建立產(chǎn)品的社區(qū)。”一位大模型領域資深人士表示。

該人士認為,無論國內(nèi)國外、開源閉源,大模型的發(fā)布可能還會更多,具有通用基礎能力的大模型,可能會集中到少數(shù)幾個廠商,但具有行業(yè)細分的大模型,比較典型的像醫(yī)療、法律、教育,會有更多廠商去做。另外,基于大模型的能力做出來的應用級產(chǎn)品,會逐漸繁榮,形成一個新的生態(tài)和軟件開發(fā)模式,“比如最近比較火的MetaGPT和ToolLLM”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

百度

6k
  • 李彥宏堅稱不做視頻生成模型,中國版Sora到底值不值得做?
  • 百度智能云海東數(shù)據(jù)標注基地正式啟動

騰訊

6.8k
  • “騰訊2萬多名員工將搬遷”系謠言
  • 埃利奧特管理公司據(jù)悉將和西南航空公司達成和解

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型落地,痛并堅持著

當下國內(nèi)業(yè)界對大模型態(tài)度發(fā)生轉(zhuǎn)變,落地預期回歸理性,左手閉源,右手開源。兩手都要抓,兩手都要硬。

文|數(shù)智前線 趙艷秋 周享玥

編輯|?;?/p>

在經(jīng)歷數(shù)個月的探索后,國內(nèi)首批大模型的行業(yè)落地進展浮出水面,而這些代表性企業(yè)的動作引發(fā)業(yè)界關(guān)注。

大模型已給一些行業(yè)帶去質(zhì)變,但也并不像當初憧憬的那樣豐富多彩,而開源大模型給市場界格局帶來變數(shù),產(chǎn)業(yè)界暗流涌動。

01、浮出水面的行業(yè)實踐

8月15日,在北京舉辦的百度WAVE SUMMIT 2023峰會期間,國家電網(wǎng)智研院知識計算技術(shù)主管張強分享了大模型在國網(wǎng)電力設備運檢上的落地探索。

“整個電網(wǎng)的設備規(guī)模超過了4萬億,而與設備相關(guān)的標準、產(chǎn)品資料、故障案例等,是國網(wǎng)公司重要的數(shù)據(jù)資產(chǎn)和生產(chǎn)要素。”張強說。目前大模型實踐以設備為核心切入點。會后,張強打開手機上的工作App為數(shù)智前線演示,相關(guān)業(yè)務模塊已接入大模型,基層班組可獲得設備運檢中的相關(guān)判據(jù)和依據(jù)來源。

區(qū)別于互聯(lián)網(wǎng)行業(yè),工業(yè)的專業(yè)知識樣本稀缺,積累困難,大模型的訓練過程,也是對這些數(shù)字資產(chǎn)的系統(tǒng)化梳理和重構(gòu)過程,這期間有很多挑戰(zhàn)。現(xiàn)在,國網(wǎng)智研院的行業(yè)預訓練語言模型參數(shù)超過70億,正在進行150億參數(shù)的電力認知大模型全量精調(diào)訓練。

一位物聯(lián)網(wǎng)技術(shù)專家告訴數(shù)智前線,類似國網(wǎng),他們落地中進度較好的也是面向內(nèi)部員工的文檔知識問答。此前,員工檢索企業(yè)內(nèi)部文獻文檔很費勁。原先知識圖譜技術(shù)手段,成本高,需要標注很多數(shù)據(jù),訓練很多小模型,而回答問題的覆蓋度還較低。有了大模型,只要把文檔做簡單預處理,“丟給”大模型,大模型學習后就能直接回答問題,還能提供知識溯源出處,回答的覆蓋度也較高,“這是對原來知識管理賽道很大的顛覆”。

除了能源企業(yè),在7月華為開發(fā)者大會HDC期間,工商銀行人工智能和大數(shù)據(jù)實驗室副總經(jīng)理黃炳也介紹了大模型的初步實踐,例如輔助客服人員,能將專業(yè)知識轉(zhuǎn)化為“大白話”的知識運營助手,為投研團隊提供晨報的生成服務,以及工行辦公系統(tǒng)中的文案創(chuàng)作、網(wǎng)訊編寫、會議摘要等。有趣的是,網(wǎng)訊編寫經(jīng)過模型訓練,會有“工行文風”。

黃炳介紹,這些場景都是人機協(xié)作,對員工和管理層有感知。比如,投研團隊用的晨報生成服務,過去雇傭?qū)嵙暽ㄙM1個小時,現(xiàn)在只需5分鐘。

在能源、金融之外,上市公司中康科技首席技術(shù)官唐珂軻在WAVE SUMMIT期間告訴數(shù)智前線,基于通用大模型訓練的行業(yè)模型,在三類醫(yī)藥相關(guān)場景中最先落地。

其中一類是與幾家連鎖藥店做的藥事服務,可提升店員的專業(yè)度;一類是輔助醫(yī)生的臨床科研,比如文獻整理和自動總結(jié)、醫(yī)療領域?qū)I(yè)的Meta分析?!耙郧白鲆黄狹eta分析至少3~6個月,現(xiàn)在只需花10分鐘。”唐珂軻說,自己之前做過科研,能感知到大模型對臨床科研效率上質(zhì)的改變。第三類是患者出院后的健康管理,這部分此前基本是缺失的。他們目前在廣東、湖南等地,與不同醫(yī)院落地了針對不同腫瘤的模型,支撐乳腺癌、肝癌、肺癌等患者出院后的服務,這是腫瘤患者非常需要的。

唐珂軻稱,醫(yī)療數(shù)據(jù)相對的封閉性,會給行業(yè)模型訓練帶來挑戰(zhàn)。但他看好大模型對行業(yè)的前景改變。“去年在搭建患者回訪系統(tǒng)時,技術(shù)實施復雜度“令人頭疼”,但今年在大模型基礎上投喂幾千條數(shù)據(jù),效果就不錯”。

上海南洋萬邦智能物聯(lián)部經(jīng)理曾佑軒告訴數(shù)智前線,在落地實踐中,大模型在AI助手、知識管理兩大方向上落地較多。該公司是上海儀電下屬的數(shù)科公司。談到大模型成本,曾佑軒介紹,目前AI助手的費用已做到每月每人10元。這并不像大家想象中那么高昂。

大模型已在為企業(yè)降本增效。一位云計算資深人士告訴數(shù)智前線,他了解原來某大型家具企業(yè),外包客服要請數(shù)百人,現(xiàn)在已縮減到小幾十人?!跋襁@種項目,企業(yè)幾十萬可以搞定,又能節(jié)約成本,是比較好的落地?!?/p>

02、“大家都冷靜理性了”

在大模型的落地實踐中,行業(yè)對大模型有了更深入的認知,很多企業(yè)調(diào)整了預期,“大家冷靜理性了?!?/p>

“我們從今年初開始重點關(guān)注大模型,當時的想法是要把大模型更好地用起來。”一位能源大企業(yè)人工智能專家近日告訴數(shù)智前線,“但在逐漸用的過程中,我們發(fā)現(xiàn)不是那么理想,也不會那么快?!?/p>

他們現(xiàn)在偏向于先支撐內(nèi)部人員,因為“大模型的回答,尤其是事實類的還不是太好”,直接開放給客戶還有一定風險。而面向內(nèi)部,會經(jīng)過大家的過濾、判斷和把關(guān)。內(nèi)部人員再結(jié)合他們的理解,對外來服務?!拔覀儠叶鹊厝ミ^渡,逐步開放一些功能。”

無獨有偶,工行目前的應用也先從內(nèi)部開始,優(yōu)先面向金融文本和金融圖像分析創(chuàng)作,且“場景肯定有錯誤容忍度”。

實際上,大模型的實際落地與當初的預期存在一定落差?!按竽P湍芙鉀Q的問題,比一開始想象的要少很多?!币晃恍袠I(yè)資深人士告訴數(shù)智前線。

造成這個落差的原因有多方面。從場景上說,ChatGPT剛出來時,大家對大模型有很多憧憬,一位云計算人士舉例,曾有企業(yè)找他咨詢,AI能不能替代采購,因為采購環(huán)節(jié)最易滋生腐敗,老板都想把這塊監(jiān)管或考慮用技術(shù)取代。但采購不是一個簡單決策,需要綜合考量。

“很多企業(yè)要么完全不知道怎么用,要么就是天馬行空,但因為提出的場景復雜、決策鏈太長,實際做不到?!彼f。而另一些人士認為,大家可能把大模型與通用人工智能混為一談。

從技術(shù)角度看,在醫(yī)療、教育等一些專業(yè)度、準確度要求高的客服場景,大語言模型的幻覺是個問題。當他們把行業(yè)數(shù)據(jù)注入到基礎大模型時,不管是微調(diào),還是其他手段,模型能吸納并能轉(zhuǎn)化成正確輸出的,大概有70%到80%。這就要求不得不用更多辦法,去處理那20%到30%的錯誤率。

“但目前沒有特別低成本和快速的辦法?!鄙鲜鋈耸糠答?,很多東西需要去做強化學習和復雜的人工標定,所花的成本可能是現(xiàn)在成本基礎再乘以10甚至更多,這讓很多企業(yè)難以接受。

針對上述兩個問題,聚焦領域大模型開發(fā)的中關(guān)村科金技術(shù)副總裁張杰告訴數(shù)智前線,在場景選擇上,他覺得接下來適合大模型進一步落地的較好賽道,是專業(yè)性較高,且容錯性較高的場景,如企業(yè)知識問答、營銷機器人、坐席助手。而通用性太高或容錯性又比較低的場景,如自動駕駛,不是特別好的商業(yè)賽道。

從技術(shù)層面,張杰認為不是某一套大模型的應用技術(shù)路線,就可以非常完美地解決問題,他介紹了三種由淺入深的應用技術(shù)路線。

從落地實踐看,目前,前兩種接受度高?!斑@三種方法不是3選1,在具體場景下,肯定是一套組合拳?!彼a充道。

“大家其實看到iPhone在2006就出來了,但整個移動互聯(lián)網(wǎng)時代的開啟是在2012年。”中信建投證券研究所所長、武超則在不久前的行業(yè)會議上稱,“這個過程才剛剛開始”。

她認為大模型有幾個階段的演進,從能聽會說、能看會認開始,到能夠像人一樣去組合使用工具,從而讓每個人配一個“斯坦福畢業(yè)的助理”,再到通用人工智能中的會規(guī)劃、會決策。

行業(yè)在不斷深入探索。一位行業(yè)資深人士告訴數(shù)智前線,他們在做教育等行業(yè),客戶數(shù)量較大,在將大模型融入業(yè)務工作流的過程中,遇到很多問題,“還在去尋找有沒有更能解決問題的方式”。

03、企業(yè)紛紛涌向開源大模型

在大模型落地的過程中,越來越多的國內(nèi)企業(yè)開始采用開源大模型。

一位南方電網(wǎng)人士告訴數(shù)智前線,內(nèi)部現(xiàn)在進行大模型嘗試時,“都是基于Llama吧”。Meta公司在今年7月發(fā)布了開源可商用大模型Llama 2,包含了70億、130億和700億參數(shù)3個版本。另一位南方電網(wǎng)人士稱,內(nèi)部對不同開閉源模型正進行測試賽馬。

8月,金蝶發(fā)布的財務大模型,也基于開源大模型訓練而來。金蝶CTO趙燕錫告訴數(shù)智前線,就像手機操作系統(tǒng)有iOS、安卓一樣,開源模型要打造生成式AI的安卓系統(tǒng),國內(nèi)有像清華ChatGLM,國際上有MPT、Llama,未來是一個多模型合作的想法。

在金融領域落地中,有資深人士告訴數(shù)智前線,開源、閉源大模型都有,因為各金融機構(gòu)體量不一,策略也不一樣。很多公司先在一個具體場景下用開源模型做出實際效果,再考慮復制推廣,也有幾個大行對平臺做一些戰(zhàn)略性投入,在閉源基礎大模型上,建了一個類似于中臺的平臺,期望將來同時對接多個場景。

“之前我們自己訓練了兩個不同參數(shù)的模型,最近我們也在用開源?!敝锌粕钪荂TO宋健告訴數(shù)智前線。他認為,目前絕大部分文本寫作、上下文匹配,130億參數(shù)的模型已夠用,而三四百億參數(shù)的模型,在解決很多垂類問題上已經(jīng)足夠,無論國內(nèi)百川,還是國外的Llama,效果都不錯。

一家物聯(lián)網(wǎng)公司技術(shù)高管告訴數(shù)智前線,目前開源大模型發(fā)展較快,開源社區(qū)也發(fā)布了很多模型,大部分基于Llama 2微調(diào)而來。“我們也測試過很多開源和閉源模型,由于我們的目標市場需要多語言支持,會更多考慮Llama 2。如果是面向國內(nèi)市場,一些國內(nèi)的模型也很優(yōu)秀。”

“選擇開源和閉源,實際上各有優(yōu)缺點。使用開源模型的好處主要是較為自由,包括部署、微調(diào)、升級和免費。閉源的好處是有質(zhì)量保證,免自己部署和應用門檻較低?!鄙鲜鲑Y深人士介紹。

他選擇開源的一個重要原因是認為,目前開源模型的繁榮和水平提高呈現(xiàn)一個明顯趨勢。他打了一個比喻,開源大模型的水平就好比海平面,閉源大模型相當于一個個島嶼。目前這些島嶼上漲的速度,跟不上海平面上漲的速度,大部分島嶼將會被海水淹沒,可能世界上最后就剩下幾座上漲比較快的島嶼。

模型本身現(xiàn)在可選的很多,多位業(yè)內(nèi)人士也贊同,開源和閉源不是客戶會關(guān)心的問題,“極少客戶會去指定用哪一款模型”。因為客戶并不直接使用基礎大模型,最終客戶是沒有感知的?!翱蛻舾P(guān)心的是精度、速度和價格。當然最終保證無害性、合法性,這是應用開發(fā)商必須解決的問題?!鄙鲜鑫锫?lián)網(wǎng)行業(yè)專家說。

張杰告訴數(shù)智前線,因為開源可商用大模型,每一款可能都有自己的優(yōu)缺點,比如說有些適合做一些分類型的任務,有些性能比較好,有些可能就生成式的任務表現(xiàn)比較好,還是要根據(jù)具體場景,一些ROI的需求,選擇不同的模型。

“總體來講,我們覺得接下來大模型非常重要的趨勢,就是開源?!敝行沤ㄍ蹲C券武超則稱,非標準化的場景,非標準化的算力,這種架構(gòu)決定開源可能會是一個比較趨同的方向。

04、大廠態(tài)度發(fā)生變化

開源世界的迅速繁榮,也正導致大模型生態(tài)鏈企業(yè)甚至底層芯片廠商的態(tài)度和策略發(fā)生一些微妙變化。

一家國內(nèi)主流AI芯片企業(yè)人士告訴數(shù)智前線,Meta推出Llama 2開源模型后,呈現(xiàn)出的效果較好,這對目前市場上一些大模型來說是個絕殺。為此,他們已暫緩了對一些大模型的適配工作,觀望一下再說。

國內(nèi)外大模型大廠也已迅速在策略上做出改變,普遍朝著“左手閉源,右手開源”的方向走。

在國外,微軟除了投資OpenAI閉源大模型,也和Meta實現(xiàn)牽手,宣布在其Azure云和Windows內(nèi)上線開源的Llama 2。亞馬遜AWS、谷歌云也都在自研大模型基礎上,支持第三方和開源模型。

在國內(nèi),8月初,百度先宣布升級千帆大模型平臺,接入Llama2全系列、清華ChatGLM2、RWKV等33個大模型,并對這些模型進行性能增強、推理優(yōu)化等工作;之后,阿里開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,稱“開源、免費、可商用”;而在8月16日,騰訊亦亮出新動作,宣布騰訊云TI平臺已接入Llama 2、Falcon、Dolly等20多個主流模型,旨在打造行業(yè)大模型精選商店。

大廠們何以會有如此“整齊劃一”的動作?

市場需求變化是一個因素。百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理忻舟告訴數(shù)智前線,他們發(fā)現(xiàn)市場需求已逐漸進入深水區(qū),僅文心一言一個模型,不能滿足客戶多樣化需求,而如果能把一個平臺做好,“會有更多的流量”。

業(yè)界觀察,7月下旬,百度在對外表述中,已將原來的“文心千帆大模型平臺”轉(zhuǎn)變?yōu)椤扒Х竽P推脚_”,在做“去文心化”。

另一個現(xiàn)實因素是,大廠們單個項目報價普遍在千萬元級別,閉源大模型暫時還沒能有足夠多的大項目落地。

此外,清華ChatGLM建立了有策略的、組合的商業(yè)模式,把小模型開源出去,吸引商機和生態(tài),它的閉源大模型也可以為企業(yè)提供定制化服務。大模型廠商提供一個開源的但規(guī)模較小的大模型供大家使用,也是一種營銷模式。

一位熟悉阿里云的資深人士也表示,他猜測,上述這些因素也是阿里開源兩款大模型的重要原因之一。“走另外一條路試試看?!?/p>

而大模型變現(xiàn)的通路,并不只是模型本身。

數(shù)智前線獲悉,華為在大模型上的考量,算力是重頭之一。7月底到8月初,任正非就大模型有兩次講話,均與算力相關(guān)。

先是成立AI算力先遣隊,由原煤礦軍團團長鄒志磊負責。任正非說,有4000個客戶想要用華為昇騰平臺去訓練大模型。華為也將可能在10月成立15個小組去分別服務15個客戶。之后,針對華為在《自然》雜志上發(fā)表的華為云盤古氣象大模型的論文,任正非也談及要“在新的淘金時代賣鏟子”。

無獨有偶,忻舟介紹,百度在大模型上的商業(yè)模式可分為兩個層面。從文心一言這個大模型的角度講,百度賺的是AI的錢。但千帆同時還是一個支持其他第三方模型的平臺,本質(zhì)上“還是云的思路,賺云的錢”。

此外,開源對生態(tài)建設也是百利而無一害。畢竟大模型被認為是智能時代的操作系統(tǒng),而操作系統(tǒng)比拼的是生態(tài),百度智能云AI平臺副總經(jīng)理李景秋認為,好的開源模型會極大吸引市場上創(chuàng)新公司關(guān)注大模型并參與其中,進而帶來整個上下游服務生態(tài)的完善。

今年7月,阿里云也對外喊出“將促進中國大模型生態(tài)的繁榮作為首要目標”的口號。“這就類似于原來開源軟件的模式,通過開源來吸引客戶,建立產(chǎn)品的社區(qū)?!币晃淮竽P皖I域資深人士表示。

該人士認為,無論國內(nèi)國外、開源閉源,大模型的發(fā)布可能還會更多,具有通用基礎能力的大模型,可能會集中到少數(shù)幾個廠商,但具有行業(yè)細分的大模型,比較典型的像醫(yī)療、法律、教育,會有更多廠商去做。另外,基于大模型的能力做出來的應用級產(chǎn)品,會逐漸繁榮,形成一個新的生態(tài)和軟件開發(fā)模式,“比如最近比較火的MetaGPT和ToolLLM”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。