文|正見TrueView koorvoa
編輯|TV
“十倍于移動(dòng)互聯(lián)網(wǎng)的平臺(tái)革命”,不僅吸引著國(guó)內(nèi)眾多科技大廠投身AI新浪潮,或自研通用大模型,或推出相關(guān)產(chǎn)品和解決方案,向企業(yè)服務(wù)、金融、工業(yè)等行業(yè)加速滲透,同時(shí)也引發(fā)細(xì)分領(lǐng)域的諸多垂直廠商積極占位,深耕領(lǐng)域內(nèi)的“一畝三分地”。
某種程度上而言,大模型是垂直廠商們“不得不為之”的“跟風(fēng)”選擇,即便在資金、技術(shù)、人才等硬件條件上與科技大廠相比不具優(yōu)勢(shì),但面對(duì)新興技術(shù)浪潮的沖擊,不進(jìn)則退,且極容易被新進(jìn)入者顛覆。
這個(gè)新進(jìn)入者,既包括新興的大模型創(chuàng)業(yè)公司,也指向“借機(jī)”扎根產(chǎn)業(yè)深處的科技巨頭。
01 以小博大,在夾縫中找機(jī)會(huì)
繼百度、阿里、華為等第一梯度玩家陸續(xù)發(fā)布大模型相關(guān)產(chǎn)品、方案,騰訊云也于近日正式公布行業(yè)大模型技術(shù)方案,加之今日發(fā)布大模型服務(wù)平臺(tái)“火山方舟”的火山引擎,國(guó)內(nèi)“頭號(hào)玩家”們的大模型技術(shù)方案和商業(yè)路徑終于全部“浮”于臺(tái)面之上。
“基本可以判斷,所有行業(yè)都值得用大模型重做一遍。當(dāng)然重做的方式可能有很大的差異,有些行業(yè)只需要用通用大模型做finetune或者對(duì)齊,但有些行業(yè)可能需要從頭開始訓(xùn)練,有些行業(yè)甚至連模型結(jié)構(gòu)都要換掉?!焙聊┲切袛?shù)據(jù)智能科學(xué)家賀翔對(duì)大模型的商業(yè)前景判斷,與當(dāng)前市場(chǎng)上的主流聲音一致,認(rèn)為大模型正成為人工智能浪潮的重要拐點(diǎn)。
盡管大模型是片藍(lán)海,蘊(yùn)藏著“萬(wàn)億級(jí)商業(yè)價(jià)值”,但“百模大戰(zhàn)”、“千模競(jìng)帆”并非戲言,產(chǎn)業(yè)側(cè)則是更具確定性的商業(yè)標(biāo)的,競(jìng)爭(zhēng)激烈程度不言而喻。
百度、阿里、騰訊等具有技術(shù)積累、團(tuán)隊(duì)優(yōu)勢(shì)和資金支持的科技大廠率先搶跑,并加速應(yīng)用落地,開啟新一輪行業(yè)客戶之爭(zhēng)。
百度曾宣稱與超過(guò)300家企業(yè)成為生態(tài)伙伴;4月阿里云也宣布與七家企業(yè)推動(dòng)大模型在油氣、電力、交通等行業(yè)落地;華為早前就已發(fā)布盤古金融、電力、藥物分子三個(gè)垂直領(lǐng)域大模型;而剛剛公布MaaS解決方案的騰訊已和數(shù)十個(gè)行業(yè)的22家企業(yè)達(dá)成大模型共建合作;火山引擎則透露抖音集團(tuán)內(nèi)部已有十多個(gè)業(yè)務(wù)團(tuán)隊(duì)試用“火山方舟”,首批邀測(cè)企業(yè)包括金融、汽車、消費(fèi)等眾多行業(yè)客戶。
而剛剛發(fā)布私域大模型的傳統(tǒng)ICT廠商新華三、將于7月發(fā)布大模型的京東等等,都關(guān)注大模型與產(chǎn)業(yè)融合,直接瞄準(zhǔn)垂直賽道。
大廠綜合實(shí)力更強(qiáng),一旦模型與場(chǎng)景“飛輪”轉(zhuǎn)起來(lái),更快的掌握優(yōu)質(zhì)數(shù)據(jù)并搭建起服務(wù)生態(tài),垂直行業(yè)廠商們想再要追趕只會(huì)難上加難。
但并非沒(méi)有一搏的資本。綜合了專家經(jīng)驗(yàn)、組織能力、工程能力的產(chǎn)業(yè)knowhow,是業(yè)界普遍認(rèn)為垂直行業(yè)廠商構(gòu)建大模型的資源壁壘與護(hù)城河。長(zhǎng)期根植于一線客戶,深入的需求理解和豐富的落地場(chǎng)景優(yōu)勢(shì),也是垂直行業(yè)廠商可貴的“籌碼”。
02 押注專業(yè)化,行業(yè)數(shù)據(jù)大比拼
“大模型這個(gè)賽道還是太早期了,如果說(shuō)GPT-4和Bard、LLaMA、Claude(編者注:分別是谷歌、Meta、OpenAI前員工創(chuàng)立的Anthropic發(fā)布的大模型)等國(guó)外不同技術(shù)棧的大模型還存在比拼的話,那么國(guó)內(nèi)的大模型還沒(méi)有進(jìn)入賽場(chǎng)(過(guò)于早期,沒(méi)有商用,無(wú)法比較),所以目前不存在國(guó)內(nèi)通用大模型之間的比拼。而在作為基石的國(guó)內(nèi)通用大模型還沒(méi)有真正進(jìn)入賽場(chǎng)的情況下,垂直大模型也不存在太多的可比性,一切都還在早期?!被锇樵贫麻L(zhǎng)兼 CEO戴志康對(duì)正見TrueView表示。
他進(jìn)一步舉例補(bǔ)充,“某個(gè)用于Text2SQL(編者注:將自然語(yǔ)言文本Text轉(zhuǎn)換成結(jié)構(gòu)化查詢語(yǔ)言SQL的過(guò)程)的垂直模型,可能還比不上LLaMA通用開源模型的Text2SQL能力?!?/p>
目前大模型開展雖轟烈,卻還處于初級(jí)階段。百度、阿里等較早公布大模型技術(shù)路徑和架構(gòu)全景的頭部公司,產(chǎn)品也均未進(jìn)入公測(cè),屬于垂直行業(yè)廠商的時(shí)間窗口尚未關(guān)閉。
“垂類行業(yè)只要緊跟潮流,精準(zhǔn)解決用戶需求,不會(huì)脫離AI大模型?!蹦彻蓹?quán)投資機(jī)構(gòu)副總裁史松坡向正見TrueView分析了垂直行業(yè)廠商在大模型時(shí)代的機(jī)會(huì)點(diǎn),“大模型的落地和應(yīng)用離不開掌握著流量和用戶的垂類廠商,它們需要解決的是如何緊跟大模型,并利用相關(guān)技術(shù)解決尚未滿足的行業(yè)客戶需求?!?/p>
加快大模型項(xiàng)目共創(chuàng),由單點(diǎn)測(cè)試擴(kuò)散至規(guī)?;逃?,積累垂直領(lǐng)域數(shù)據(jù)和業(yè)務(wù)know-how,進(jìn)而優(yōu)化大模型訓(xùn)練和調(diào)優(yōu)能力,挖掘和解決行業(yè)客戶尚未被顧及,或被充分改造的痛點(diǎn),將數(shù)字化延伸至產(chǎn)業(yè)的“神經(jīng)末梢”處,這也許是當(dāng)前窗口期內(nèi)垂直行業(yè)廠商們的機(jī)會(huì)所在。
當(dāng)前越是傳統(tǒng)的行業(yè),對(duì)大模型產(chǎn)品和解決方案越是有針對(duì)性、專業(yè)性和精準(zhǔn)度的高要求。專業(yè)的訓(xùn)練數(shù)據(jù)和行業(yè)知識(shí)庫(kù)是領(lǐng)域大模型的難點(diǎn),也是垂直行業(yè)廠商的優(yōu)勢(shì)。
“假定大家訓(xùn)練和調(diào)優(yōu)能力都差不多,那么誰(shuí)有最大量、最高質(zhì)量的垂直領(lǐng)域數(shù)據(jù)集,誰(shuí)就擁有了產(chǎn)出更優(yōu)質(zhì)垂直模型的能力。即便現(xiàn)在訓(xùn)練和調(diào)優(yōu)能力稍弱,但長(zhǎng)期來(lái)講技術(shù)能力是能夠被追平的,而數(shù)據(jù)集的鴻溝則不一定能被追平。”在戴志康看來(lái),“真正影響垂直廠商的差距點(diǎn)只有一個(gè),即用于訓(xùn)練垂直模型的數(shù)據(jù)集。”
賀翔同樣認(rèn)為垂直與通用大模型“隔行如隔山”?!霸诩冋Z(yǔ)言相關(guān)的垂直領(lǐng)域,可能存在垂直大模型與通用大模型的競(jìng)爭(zhēng)。但是在自動(dòng)駕駛這種獨(dú)特的垂直領(lǐng)域,不管是語(yǔ)料、任務(wù)、還是測(cè)評(píng)標(biāo)準(zhǔn),都與通用大模型完全不一致,只能夠用自動(dòng)駕駛大模型來(lái)解決。”
03 新的馬拉松賽跑,在嘗試中找出路
目前大模型技術(shù)和產(chǎn)品密集發(fā)布,卻尚未有成熟案例和成功路徑借鑒,垂直廠商們只能摸著石頭過(guò)河,是MaaS(Model-as-a-Service,模型即服務(wù)),還是“完全沒(méi)有必要去卷大模型,而是應(yīng)該投身到應(yīng)用層創(chuàng)新”,標(biāo)準(zhǔn)答案尚未生成。
火山引擎總裁譚待判斷,“企業(yè)使用大模型,未來(lái)可能會(huì)呈現(xiàn)“1+N”的模式:“1”是通過(guò)自研或深度合作,形成1個(gè)主力模型;由于成本和場(chǎng)景復(fù)雜多元等原因,在這個(gè)主力模型之外,還會(huì)有N個(gè)模型同時(shí)應(yīng)用?!?/p>
“企業(yè)所需的并非僅僅是一個(gè)大模型,而是多個(gè)大模型?!敝耖g智能創(chuàng)始人兼CEO簡(jiǎn)仁賢持相同觀點(diǎn),“坦率來(lái)說(shuō),目前絕大多數(shù)的生成式AI都是基于谷歌開發(fā)的Transformer開發(fā)出來(lái)的模型”,他認(rèn)為大模型是不是自研已經(jīng)不重要了,“真正重要的是,最后用大模型驅(qū)動(dòng)做出的產(chǎn)品是否有實(shí)際應(yīng)用價(jià)值。”竹間智能提供的是MaaS服務(wù)模式,并設(shè)定目標(biāo)要讓企業(yè)在99萬(wàn)的預(yù)算內(nèi)即可打造一個(gè)企業(yè)自有的大模型。
“中國(guó)不太注重生態(tài),一般都是把別人全‘滅’了、全‘殺’了,其實(shí)自己也沒(méi)有發(fā)展起來(lái)?!弊匝写竽P偷腜re-A+輪企業(yè)瀾舟科技創(chuàng)始人兼CEO周明號(hào)召行業(yè)廠商應(yīng)該有一種平和的心態(tài),“To B存在很多新的創(chuàng)業(yè)機(jī)會(huì),包括對(duì)客戶、行業(yè)的理解,客戶與大模型團(tuán)隊(duì)的互動(dòng),形成某種意義上的戰(zhàn)略合作伙伴,或者形成所謂數(shù)據(jù)飛輪、功能飛輪,做得越深,相應(yīng)的壁壘就越高。任何一個(gè)公司進(jìn)入到該領(lǐng)域,包括巨頭公司,都要花同樣的功夫進(jìn)行積累?!?/p>
雖路徑不一,垂直行業(yè)廠商卻目標(biāo)一致。皆是用好大模型這一新的生產(chǎn)力工具,升級(jí)原有的生產(chǎn)方式,建立新的生產(chǎn)關(guān)系。而這也將是垂直廠商和在互聯(lián)網(wǎng)及兩次AI浪潮期間崛起的明星企業(yè)間,一場(chǎng)新的馬拉松賽跑。
“垂直模型的底座仍然是通用模型,最終決定市場(chǎng)格局的,是底座通用模型的能力和上層垂直模型的優(yōu)化。而現(xiàn)在通用模型的發(fā)展日新月異,所以垂直模型也面臨剛發(fā)布不久就需要升級(jí)底座的情況?!贝髦究到忉屨f(shuō),“基于ChatGLM-6B研發(fā)的垂直模型,即便當(dāng)下效果不錯(cuò),但當(dāng)三個(gè)月后ChatGLM-6B被xxx-6B超越,垂直模型也面臨重新洗牌的局面?!彼毖?,“如果認(rèn)為現(xiàn)在憑借垂直模型就能構(gòu)成拐點(diǎn),可能只是一種市場(chǎng)營(yíng)銷手段?!?/p>
在長(zhǎng)期競(jìng)爭(zhēng)中,沒(méi)有穩(wěn)固不變和一蹴而就的市場(chǎng)格局。這場(chǎng)新的馬拉松賽跑,匆忙開局,終點(diǎn)未知。