文|腦極體
寫下這篇的起因,是前不久的一件事。
我們參與了一個大模型與行業(yè)結(jié)合的主題論壇?;顒咏Y(jié)束之后,來自行業(yè)主辦方的一位代表跟我們交流時卻說:“你們一直在說大模型。到底什么是大模型?多大才算大?為什么不能用小模型?”
這一系列問題又一次讓我們意識到,智能化的供需雙方很多時候根本處在兩套話語體系。你這邊Transfomer、Agent的說了半天,那邊可能還在好奇大模型這三個字到底是怎么來的。
這種隔膜,在AI時代尤為嚴(yán)重。因?yàn)锳I技術(shù)涉及的鏈條更長,做算法的、做云的、做硬件的、做IT解決方案的,以及最后買單的,大家可能在各說各的,誰也沒打算真正理解誰。
今天,各家都在說產(chǎn)業(yè)大模型、行業(yè)大模型。確實(shí)從技術(shù)邏輯上看,很容易發(fā)現(xiàn)大模型能夠給很多行業(yè)帶來巨大的生產(chǎn)力釋放,而從技術(shù)路線上看,中國企業(yè)對智能化的接受度更高、需求更強(qiáng)烈。大模型走向產(chǎn)業(yè)實(shí)現(xiàn)數(shù)實(shí)融合,是中國AI最具特色的一條脈絡(luò),在數(shù)字中國的大背景下具有極強(qiáng)的宏觀戰(zhàn)略意義。
但在實(shí)踐中,這條路卻充滿了挑戰(zhàn)與誤解。
畢竟AI算法公司做toB,十家有九家做不成。在大模型toB的新機(jī)會窗口前,我們首先要確定產(chǎn)業(yè)究竟需要怎樣的大模型?
產(chǎn)業(yè)大模型,就不是一種模型
AI公司做大模型結(jié)合行業(yè),最大的誤區(qū)在于搞不清供需關(guān)系。
誠然,目前行業(yè)對大模型的認(rèn)可與接納程度已經(jīng)比較好,但智能化項(xiàng)目依舊是一個絕對的買方市場。技術(shù)供應(yīng)商需要去適配最終用戶的需求、能力、背景,甚至溝通話術(shù)和商業(yè)習(xí)慣。
但由于做AI大模型的公司,涌入了大量互聯(lián)網(wǎng)領(lǐng)域的人才和資金。互聯(lián)網(wǎng)的供需邏輯是單點(diǎn)供應(yīng)對大量需求,我有一招鮮天下涌進(jìn)來。而大模型在很多行業(yè)的適配又是很容易就能想到的。比如工廠需求配料分析,銀行需要投資分析,那我的大模型不是都能分析嗎?
于是,在這樣的“風(fēng)口思維”下,很多AI公司陷入了一個巨大的誤區(qū):他們認(rèn)為我有大模型,各行業(yè)的客戶都應(yīng)該來找我。我推出兩三個行業(yè)的案例,其他行業(yè)都應(yīng)該認(rèn)可。我的這個大模型哪里都能用,所以它就叫產(chǎn)業(yè)大模型。
無論這些AI從業(yè)者是真的相信大模型等于產(chǎn)業(yè)萬金油,還是僅僅是故意吹成這樣。在產(chǎn)業(yè)客戶看來,這一幕就等于胡說八道。他們會覺得,金融業(yè)用的技術(shù),關(guān)我煤礦什么事?如果有一種食品,說是貓能吃牛能吃人也能吃,你敢吃嗎?
產(chǎn)業(yè)需要大模型做的第一件事,就是不要籠統(tǒng)的天差地別的各個行業(yè)歸納為“產(chǎn)業(yè)”兩個字就結(jié)束了。即使在某個行業(yè)內(nèi),大模型都僅僅能解決行業(yè)的一個或幾個問題,更不可能有一種模型能夠“包治百業(yè)”。
做IT的都知道,有產(chǎn)品更要有服務(wù),懂技術(shù)更要懂行業(yè)。但做AI的企業(yè),尤其是拿著熱錢涌入大模型賽場的企業(yè),普遍對產(chǎn)業(yè)需求的差異性缺乏了解和尊重。
當(dāng)然,不同行業(yè)對大模型的需求也有共通之處。比如對基礎(chǔ)的對話、CV、多模態(tài)能力。但更多的情況下,每個行業(yè)的只能用意愿、基礎(chǔ)數(shù)字能力,乃至安全需求、時延需求、運(yùn)維需求都不相同。在今天的階段,一種大模型能夠在具體行業(yè)內(nèi)復(fù)制推廣已經(jīng)非常不容易,更別想一口吃下幾個甚至幾十個行業(yè)。
產(chǎn)業(yè)智能化,優(yōu)先級永遠(yuǎn)是產(chǎn)業(yè)大于智能化。
不提硬件和工程化,約等于瞎耽誤功夫
很多做數(shù)字化、智能化的企業(yè),在看了客戶環(huán)境之后會奇怪這么一件事:客戶花了大錢買回來的東西,其實(shí)就是很簡單的軟件封在一個盒子里,然后按照行業(yè)要求做了點(diǎn)按鈕、UI之類的東西。甚至這些軟件很多都是國外很古早的開源軟件進(jìn)行再封裝,技術(shù)上早就落后了。這時他們會感嘆,行業(yè)客戶的錢可真好騙啊。
可是問題來了,如果我們換個角度思考這個問題,要是沒有這層封裝,企業(yè)要怎么用呢?難道一家工廠、一座礦山、一片林場,要招來和培養(yǎng)一大堆云計(jì)算、AI算法層面的人才?而且要讓這些數(shù)字化人才指導(dǎo)整個企業(yè)的生產(chǎn)、運(yùn)營和銷售?這顯然是不靠譜的。
所以,一個有點(diǎn)反常識的事實(shí)是,相比于天花亂墜的先進(jìn)技術(shù),行業(yè)用戶往往更在乎那層“殼”。那層殼就說硬件化和工程化,是將技術(shù)能力按照最終的使用需求進(jìn)行封裝、管理和維護(hù)。雖然最后組裝出來的東西可能很難用,可能不先進(jìn),但對于行業(yè)用戶來說,有的用,員工能學(xué)會,才是智能化的最重要條件。
在討論行業(yè)大模型時,今天也經(jīng)常會陷入這個誤區(qū)。從業(yè)者往往過分關(guān)注算法層的領(lǐng)先性、國際性,跟參數(shù)規(guī)模和測試紀(jì)錄較勁,把目光聚焦在軟件上。但行業(yè)需要大模型做的,是跟此前的數(shù)字系統(tǒng)較勁,跟使用成本較勁,跟操作門檻較勁。這就需要大模型考慮硬件環(huán)境、網(wǎng)絡(luò)環(huán)境、存算資源、操作系統(tǒng),甚至考慮部署環(huán)境的電力供應(yīng)、濕度、溫度。
產(chǎn)業(yè)大模型要做的第二件事,是必須兼顧硬件適配和工程化問題。
大模型能否落地,都在說要找準(zhǔn)場景。但什么是場景?最后能起作用的那個地方才叫場景。
絕大部分企業(yè),都不是IT為導(dǎo)向。甚至大部分企業(yè)根本無法派專人去仔細(xì)了解什么是大模型。這個事情在漫長的時間里都無法改變。
山不會過來看你,所以你要去看山。
很多人把大模型比作一座金礦,那么訓(xùn)練大模型僅僅是挖到金礦,通過工程化方法,講大模型融入到行業(yè)已有的數(shù)字化基礎(chǔ)設(shè)施,才是把金礦運(yùn)出山。
專家下工廠,終究要不得
很多AI廠商無論是在給客戶講故事,還是面向公眾做傳播,總是會提起這么一段:你們不要擔(dān)心,我們有專家有博士后扎根行業(yè)。下工廠,下農(nóng)田,一駐守就是幾個月。
如果你是大模型的潛在行業(yè)用戶,那么這個故事聽聽就算了。專家駐廠確實(shí)是真的,但那個廠極大概率不是你的廠。
事實(shí)上,AI專家親臨產(chǎn)業(yè)一線,是縮短行業(yè)需求與大模型供給之間的有效路徑。這也是一個產(chǎn)業(yè)智能化必經(jīng)的發(fā)展過程。
但這個過程必然也只能是暫時性的,不可能長久。試想一下,如今大模型正在風(fēng)口浪尖,專家們都是什么身價?一個專家組入駐現(xiàn)場,就這個薪資成本哪家實(shí)體企業(yè)能撐得住?
AI企業(yè)所宣稱的專家駐廠,其實(shí)是在做案例、做測試。一般都是和行業(yè)內(nèi)的頭部客戶合作,廠商愿意以虧損為代價把模型跑通,觀察有哪些具體問題。
專家可以下廠,但專家肯定不能經(jīng)年累月駐守一家又一家工廠。這是AI廠商進(jìn)入某行業(yè)時的標(biāo)準(zhǔn)動作,但往往會有意無意被理解為一個常規(guī)動作,可真要只能依賴專家下廠來推廣大模型,那么AI永遠(yuǎn)也無法落地,因?yàn)檫@個成本誰也承受不起。
產(chǎn)業(yè)大模型要做的第三件事,是技術(shù)具有行業(yè)內(nèi)的低門檻可復(fù)制性,不能大量依賴人工進(jìn)行訂制化合作。
尤其需要注意的是,目前階段大中型企業(yè)在智能化上的投資愈發(fā)謹(jǐn)慎,試錯成本不能過高。實(shí)驗(yàn)性與不確定性太強(qiáng)的大模型落地方案,在目前階段已經(jīng)很難得到大客戶認(rèn)同,更遑論成千上萬的中小客戶,更是不可能依賴重人工投入的方式來推動。
總結(jié)一下,產(chǎn)業(yè)大模型目前階段的落地挑戰(zhàn)有三點(diǎn):
1.AI廠商總把大模型想象為萬金油,但行業(yè)需要的是理解和專注。
2.AI廠商總是關(guān)注算法創(chuàng)新,但行業(yè)需要的是工程化和可操作。
3.AI廠商大量宣傳依靠人才能力跑通的個案,但行業(yè)需要的是低成本和可復(fù)制。
大模型落地產(chǎn)業(yè),正是旭日東升時,但也要有意識去清掃一些積雪,而回到用戶界面,往往就能找到更多問題的答案。