正在閱讀:

爭搶垂直大模型機遇,創(chuàng)業(yè)公司們拼了

掃一掃下載界面新聞APP

爭搶垂直大模型機遇,創(chuàng)業(yè)公司們拼了

時代的大幕已然拉開,燦若繁星。

圖片來源:界面新聞 范劍磊

文|獵云網(wǎng) 盛佳瑩

“盡管在泡沫期,貼上大模型標簽的公司都很貴,沖上十幾億甚至數(shù)十億估值,但這依然是出手的窗口期。”常年看AI賽道的天堂硅谷高級合伙人王偉興奮地說道,他堅信,將大模型的思想和技術(shù)武裝到牙齒,必然會建立起一個全新的商業(yè)帝國。

由ChatGPT掀起的這一波大模型浪潮中, 百度、阿里等大廠相繼下場,王慧文、王小川、李開復等大佬也紛紛入場,而創(chuàng)業(yè)公司在這波浪潮里的最大機會在哪里?

大多數(shù)人都并不看好創(chuàng)業(yè)公司入局通用大模型,遠望資本創(chuàng)始合伙人程浩就曾公開表示,大廠肯定比創(chuàng)業(yè)公司有流量、有錢,而重要的是大廠的核心優(yōu)勢是自帶場景,不論是百度的問答和搜索,還是騰訊的微信、阿里的天貓精靈和釘釘,都具備成熟的落地場景。

既然通用大模型機會鮮少,不少創(chuàng)業(yè)公司瞄準了垂直大模型。

如今,通用大模型數(shù)據(jù)來源于公開互聯(lián)網(wǎng)場景,但互聯(lián)網(wǎng)數(shù)據(jù)并不等同于全世界的數(shù)據(jù),尤其在垂直賽道,依然有很多私有數(shù)據(jù)。

而深耕垂直領域的創(chuàng)業(yè)公司已經(jīng)積累大量數(shù)據(jù)和know-how,具備核心優(yōu)勢,而大廠的基因并不在垂直領域。范特科技CTO郭長柱表示,大模型對于大廠而言在通用和垂直領域之間是魚和熊掌不可兼得,“做通用大模型的大廠,它要的是生態(tài),讓眾多的企業(yè)接入它的大模型,以它的大模型作為底座去賦能百業(yè),這個時候它自己也下場踢球就和它的身份不符,所以它們一般不會輕易這樣做?!?/p>

如果在互聯(lián)網(wǎng)時代,每個行業(yè)都值得用互聯(lián)網(wǎng)重做一次,那么在大模型時代,每個行業(yè)依然如此,甚至此前在互聯(lián)網(wǎng)時代依然保守的賽道,極有可能被大模型重塑。

這讓投資人足夠興奮,在奇績創(chuàng)壇2022年11月舉辦的秋季路演日中,陸奇投了55個項目,其中有16個是“預訓練大模型”方向,而彼時ChatGPT還未發(fā)布。

而到今年,前四個月國內(nèi)AI領域就已經(jīng)完成融資243起。面對越來越熱的風口,創(chuàng)業(yè)公司們都拿出渾身解數(shù),捕捉這輪機遇。

垂直大模型:變革的生產(chǎn)力

在ChatGPT爆火前,大模型已經(jīng)默默發(fā)展了數(shù)年,極驗AI實驗室負責人曹佳豪坦言,多模態(tài)大模型的核心技術(shù)本質(zhì)并沒有發(fā)生大的改變。但是在訓練規(guī)模大到一個量級以后確實出現(xiàn)了一些感受上是質(zhì)變的效果。最終大模型能否走到通用人工智能,還是一個未知數(shù)。

三維家CEO蔡志森也表示,大模型是AI從量變到了質(zhì)變的階段性里程碑,最大價值在于通過千億數(shù)據(jù)訓練,其生成的內(nèi)容超出想象,驗證了這條路徑是正確的。

可以說,這波熱浪更多得益于ChatGPT商業(yè)和營銷方面的成功,而不是技術(shù)迭代。

但不可否認的是,大模型會改變很多垂直行業(yè)的業(yè)務和商業(yè)模式。

對于驗證碼這個行業(yè)而言,垂直大模型可以幫助驗證碼廠商管理圖集,也可以誕生新的驗證形式,甚至基于文生圖和圖生圖模式,可以與客戶共創(chuàng)圖集,增強交互體驗。

但對于這樣一個需要人機對抗的領域,大模型也極有可能被用于驗證識別,為黑產(chǎn)所用,這也更推動極驗在垂直大模型領域進行投入,從防御角度而言,只有了解黑產(chǎn)的工作模式,才能精準研發(fā)破解手段。

從目前的情況而言,極驗已小規(guī)模上線一批由垂直大模型自動生成的圖集,用于驗證碼圖形,極驗發(fā)現(xiàn),雖然大模型對防御黑產(chǎn)程度有限,但卻可以縮小對抗領域,進而優(yōu)化對抗資源,從被動防御轉(zhuǎn)變?yōu)橹鲃臃烙?/p>

而像金融行業(yè)而言,過去長尾算法數(shù)據(jù)收集難、標注時間長、數(shù)據(jù)不均衡導致落地效果差,即便一些擁有算法自訓練平臺的AI基礎設施供應商,像范特科技,其長尾算法的落地難度依然大且周期長。

郭長柱告訴獵云網(wǎng),主要是因為其中包含了大量的人工工作。而如今結(jié)合CV大模型的能力之后,對于常見物體的檢測和分割可以實現(xiàn)全自動訓練,對于特殊物品也可以借助CV大模型把人工作業(yè)降到最低。

“不僅工作量降低了,工作難度也降低了?!?郭長柱表示:“原來做分割時需要沿著物體邊緣仔細描邊,現(xiàn)在只需要點一下就能自動分割,這樣我們把系統(tǒng)私有化部署到客戶那里,打通內(nèi)部網(wǎng)絡的云邊兩端,客戶自己坐在辦公室里就可以對模型進行升級和維護,而我們專注做基礎算法和底層平臺能力建設,這樣實際上分工也產(chǎn)生了變化?!?/p>

這意味著,垂直大模型將作為基礎能力對外標準輸出,端到端的解決用戶需求。目前,范特科技已完成語言類大模型、視覺大模型以及多模態(tài)大模型的技術(shù)預研,將于近期推出相關產(chǎn)品進行落地。

而像家居和電商內(nèi)容這樣的行業(yè),垂直大模型可以賦能全流程。

聚焦電商內(nèi)容解決方案的極??萍紕?chuàng)始人武彬告訴獵云網(wǎng),在電商內(nèi)容生成全領域,從拍攝-場景圖-種草-直播切片-短視頻,過去的AI解決方案只能賦能部分流程,而垂直大模型可以全流程自動生成,這可以極大地降本增效。

專注家居行業(yè)的三維家CEO蔡志森也表示,不論在設計場景、營銷場景還是制造場景,垂直大模型可以生產(chǎn)3D矢量化的內(nèi)容,做到“所想即所見”、 “所見即所得”,甚至在生產(chǎn)制造端,垂直大模型將取代規(guī)則驅(qū)動,生產(chǎn)自動化提效,優(yōu)化人員結(jié)構(gòu)和人機交互模式。

目前三維家已構(gòu)建起室內(nèi)空間大模型、定制家居大模型等垂類模型,應用于戶型識別、智能樣板間、智能柜體、智能硬裝、智能水電、智能家居布置等多種設計環(huán)節(jié)。

基于室內(nèi)空間大模型通過可配置的AI知識圖譜和大規(guī)模神經(jīng)網(wǎng)絡,深度學習海量家居家裝方案,可以自動完成智能設計。

而基于真實柜體數(shù)據(jù)的定制家居大模型,則可根據(jù)尺寸輸入、對話文本生成參數(shù)化的定制衣柜、櫥柜設計,生產(chǎn)合理的柜體方案,可直接對接生產(chǎn),將大大縮減復雜易出錯的柜體設計時間。

對于各行各業(yè)來說,垂直大模型是一種全新的生產(chǎn)力,底層能力的突破不僅可以降本增效,長期來看必然帶來上層應用的躍遷和變革。

如蔡志森所說,一方面,在當前中國的智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化革新本就有廣闊的市場需求;另一方面,在toB生態(tài)下,基于垂直大模型的應用實踐也有利于形成數(shù)據(jù)飛輪與場景飛輪。

天堂硅谷高級合伙人王偉也表示,大模型最大的價值在于建立新的商業(yè)模式和新的經(jīng)營思想,重新改造商業(yè)組織的每一個環(huán)節(jié)。

這也是為什么創(chuàng)業(yè)公司紛紛擁抱大模型的原因。

創(chuàng)業(yè)公司垂直大模型第一仗:控本增效

雖然大模型“很香”,但眾所周知,過去大模型的一次性投入成本極高。此前,有市場消息稱GPT3單次訓練的成本為400萬美元,因此,不少聲音認為訓練大模型門檻至少在數(shù)千萬元。

但在垂直行業(yè),盲目追求“大”規(guī)模沒有意義,OpenCSG創(chuàng)始人& CEO陳冉將大模型比作一塊“玉”,“如何用好大模型能力,也就是說雕琢這塊玉更為重要?!?/p>

郭長柱也提到,大模型的標準并不能以參數(shù)規(guī)模一概而論,核心在于其是否具備“涌現(xiàn)”能力,即其準確率是否達到突然躍升的階段。“在垂直領域,同樣的效果,通用大模型要千億甚至萬億參數(shù),垂直大模型百億數(shù)據(jù)也可以達到?!?/p>

參數(shù)規(guī)模的指數(shù)級下降,疊加這段時間涌現(xiàn)的眾多開源模型和蒸餾法等變革性技術(shù),過去千萬級的訓練大模型“門票”已降至百萬級。

但這對于創(chuàng)業(yè)公司們而言,這仍然是一筆不大不小的開支,控制成本和提升效率成為各家公司在百模大戰(zhàn)中的第一仗。

極驗在優(yōu)化投入產(chǎn)出比方面,采取彈性計算環(huán)境,以按量計算完成前期零碎的探索任務。在明確方向后,再轉(zhuǎn)化為周期性訓練。

極??萍紕t聯(lián)合清華大學人工智能研究院,由學術(shù)團隊提供算力支持,優(yōu)化投入產(chǎn)出比。

而三維家則打造了一套多服務器、多GPU并行的計算網(wǎng)絡,優(yōu)化算力調(diào)配和運行機制,同時,三維家作為英偉達的高級初創(chuàng)會員,得到高效利用GPU的技術(shù)支持,這也加速了三維家垂直大模型的迭代速度。

范特科技在成本和生成效率方面,一方面,通過在現(xiàn)有的產(chǎn)品中整合大模型能力,大幅提升了內(nèi)部創(chuàng)新效率;另一方面,通過自研的推理引擎優(yōu)化技術(shù)和并行計算技術(shù)最大限度的提升大模型推理速度和硬件利用效率,通過自研業(yè)務流編排引擎解決最后一公里的業(yè)務流自定義問題,完成基于大模型的端到端的解決問題完整閉環(huán)。

事實上,控制成本不僅僅是為了控制投入,小苗朗程合伙人俞佳偉坦言,對于用戶側(cè)而言,成本太高也難以被接受,尤其是在算力低、功耗低的終端場景。

垂直大模型:數(shù)據(jù)和know-how為王

訓練大模型的成本下降,對于創(chuàng)業(yè)公司而言,只是拿到了入場券。對于垂直大模型而言,核心和關鍵離不開算力、算法和數(shù)據(jù)。

在一定程度上,錢可以解決算力和算法,但卻很難買到數(shù)據(jù),尤其是在垂直領域,很多都是私有數(shù)據(jù),能買到的數(shù)據(jù)意義并不大。

這對一直深耕在垂直行業(yè)的公司而言,是天然的優(yōu)勢。

蔡志森告訴獵云網(wǎng),依托其在線的3D設計軟件和3D制造軟件,三維家已經(jīng)具備2800萬+覆蓋全國小區(qū)的戶型數(shù)據(jù)、8100萬+軟硬裝、家具家電、材質(zhì)飾品素材庫、16.3億+風格種類多樣的設計方案庫,此外,還擁有數(shù)千萬參數(shù)數(shù)據(jù)的真實定制柜體數(shù)據(jù)集。

與此同時,用戶不斷使用,這些數(shù)據(jù)集仍按照三維家定義的方向在自動實時生成。

和三維家一樣,深耕電商內(nèi)容領域的極??萍济磕甓荚诋a(chǎn)生數(shù)百萬乃至數(shù)千萬的電商內(nèi)容數(shù)據(jù)。

除了數(shù)據(jù)壁壘,定位清晰的應用場景、掌握垂直大模型落地的全流程也是核心競爭力,這對了解行業(yè)know-how提出了極高的要求。

實際上,大模型提供的是基礎能力,具體業(yè)務則是專有能力的組合。

在郭長柱看來,目前基于大模型的模型即服務(MaaS)是一種創(chuàng)新的模式,即把大模型作為基礎能力對外標準輸出,端到端的解決用戶需求。但直接使用大模型端到端的解決問題相對較少,尤其是在CV領域,更多的是在基礎能力之上針對垂直領域做定制。

“比如使用大模型自動標注訓練垂直領域小模型,使用大模型更加general的特征做VQA、檢測、分割和識別等二次開發(fā)。除此之外,部分業(yè)務可能涉及多項大模型能力的組合,甚至需要語言和視覺特征對齊的多模態(tài)能力。這就要求我們在實際的業(yè)務中必須支持多種大模型的自定義業(yè)務流,實現(xiàn)大模型的自由組合和業(yè)務的深度定制?!?/p>

OpenCSG也從實踐中積累了大量大模型落地通用行業(yè)的實踐,包括垂直行業(yè)語料產(chǎn)生,大模型微調(diào),業(yè)務結(jié)合等方面。

王偉也表示,投資大模型他看好在核心行業(yè)有海量行業(yè)數(shù)據(jù),懂行業(yè)know-how的企業(yè)。

俞佳偉則看好有實際落地場景的企業(yè),尤其是需求強、專業(yè)性強的場景,例如醫(yī)療、金融、法律等行業(yè)。

在陳冉看來,大模型具備了推演、舉一反三的能力,在一定程度上,具備類似人類的腦神經(jīng),可以替代不少人類的工作?!斑^去最大的創(chuàng)業(yè)成本是人,而利用好大模型,重塑工作流,可以極大降低創(chuàng)業(yè)成本,這對創(chuàng)業(yè)公司來說是極大的利好。”

王偉也持相同觀點:“將大模型的思想和技術(shù)武裝到牙齒,必然會建立起一個全新的商業(yè)帝國?!?/p>

時代的大幕已然拉開,燦若繁星。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

爭搶垂直大模型機遇,創(chuàng)業(yè)公司們拼了

時代的大幕已然拉開,燦若繁星。

圖片來源:界面新聞 范劍磊

文|獵云網(wǎng) 盛佳瑩

“盡管在泡沫期,貼上大模型標簽的公司都很貴,沖上十幾億甚至數(shù)十億估值,但這依然是出手的窗口期?!背D昕碅I賽道的天堂硅谷高級合伙人王偉興奮地說道,他堅信,將大模型的思想和技術(shù)武裝到牙齒,必然會建立起一個全新的商業(yè)帝國。

由ChatGPT掀起的這一波大模型浪潮中, 百度、阿里等大廠相繼下場,王慧文、王小川、李開復等大佬也紛紛入場,而創(chuàng)業(yè)公司在這波浪潮里的最大機會在哪里?

大多數(shù)人都并不看好創(chuàng)業(yè)公司入局通用大模型,遠望資本創(chuàng)始合伙人程浩就曾公開表示,大廠肯定比創(chuàng)業(yè)公司有流量、有錢,而重要的是大廠的核心優(yōu)勢是自帶場景,不論是百度的問答和搜索,還是騰訊的微信、阿里的天貓精靈和釘釘,都具備成熟的落地場景。

既然通用大模型機會鮮少,不少創(chuàng)業(yè)公司瞄準了垂直大模型。

如今,通用大模型數(shù)據(jù)來源于公開互聯(lián)網(wǎng)場景,但互聯(lián)網(wǎng)數(shù)據(jù)并不等同于全世界的數(shù)據(jù),尤其在垂直賽道,依然有很多私有數(shù)據(jù)。

而深耕垂直領域的創(chuàng)業(yè)公司已經(jīng)積累大量數(shù)據(jù)和know-how,具備核心優(yōu)勢,而大廠的基因并不在垂直領域。范特科技CTO郭長柱表示,大模型對于大廠而言在通用和垂直領域之間是魚和熊掌不可兼得,“做通用大模型的大廠,它要的是生態(tài),讓眾多的企業(yè)接入它的大模型,以它的大模型作為底座去賦能百業(yè),這個時候它自己也下場踢球就和它的身份不符,所以它們一般不會輕易這樣做?!?/p>

如果在互聯(lián)網(wǎng)時代,每個行業(yè)都值得用互聯(lián)網(wǎng)重做一次,那么在大模型時代,每個行業(yè)依然如此,甚至此前在互聯(lián)網(wǎng)時代依然保守的賽道,極有可能被大模型重塑。

這讓投資人足夠興奮,在奇績創(chuàng)壇2022年11月舉辦的秋季路演日中,陸奇投了55個項目,其中有16個是“預訓練大模型”方向,而彼時ChatGPT還未發(fā)布。

而到今年,前四個月國內(nèi)AI領域就已經(jīng)完成融資243起。面對越來越熱的風口,創(chuàng)業(yè)公司們都拿出渾身解數(shù),捕捉這輪機遇。

垂直大模型:變革的生產(chǎn)力

在ChatGPT爆火前,大模型已經(jīng)默默發(fā)展了數(shù)年,極驗AI實驗室負責人曹佳豪坦言,多模態(tài)大模型的核心技術(shù)本質(zhì)并沒有發(fā)生大的改變。但是在訓練規(guī)模大到一個量級以后確實出現(xiàn)了一些感受上是質(zhì)變的效果。最終大模型能否走到通用人工智能,還是一個未知數(shù)。

三維家CEO蔡志森也表示,大模型是AI從量變到了質(zhì)變的階段性里程碑,最大價值在于通過千億數(shù)據(jù)訓練,其生成的內(nèi)容超出想象,驗證了這條路徑是正確的。

可以說,這波熱浪更多得益于ChatGPT商業(yè)和營銷方面的成功,而不是技術(shù)迭代。

但不可否認的是,大模型會改變很多垂直行業(yè)的業(yè)務和商業(yè)模式。

對于驗證碼這個行業(yè)而言,垂直大模型可以幫助驗證碼廠商管理圖集,也可以誕生新的驗證形式,甚至基于文生圖和圖生圖模式,可以與客戶共創(chuàng)圖集,增強交互體驗。

但對于這樣一個需要人機對抗的領域,大模型也極有可能被用于驗證識別,為黑產(chǎn)所用,這也更推動極驗在垂直大模型領域進行投入,從防御角度而言,只有了解黑產(chǎn)的工作模式,才能精準研發(fā)破解手段。

從目前的情況而言,極驗已小規(guī)模上線一批由垂直大模型自動生成的圖集,用于驗證碼圖形,極驗發(fā)現(xiàn),雖然大模型對防御黑產(chǎn)程度有限,但卻可以縮小對抗領域,進而優(yōu)化對抗資源,從被動防御轉(zhuǎn)變?yōu)橹鲃臃烙?/p>

而像金融行業(yè)而言,過去長尾算法數(shù)據(jù)收集難、標注時間長、數(shù)據(jù)不均衡導致落地效果差,即便一些擁有算法自訓練平臺的AI基礎設施供應商,像范特科技,其長尾算法的落地難度依然大且周期長。

郭長柱告訴獵云網(wǎng),主要是因為其中包含了大量的人工工作。而如今結(jié)合CV大模型的能力之后,對于常見物體的檢測和分割可以實現(xiàn)全自動訓練,對于特殊物品也可以借助CV大模型把人工作業(yè)降到最低。

“不僅工作量降低了,工作難度也降低了?!?郭長柱表示:“原來做分割時需要沿著物體邊緣仔細描邊,現(xiàn)在只需要點一下就能自動分割,這樣我們把系統(tǒng)私有化部署到客戶那里,打通內(nèi)部網(wǎng)絡的云邊兩端,客戶自己坐在辦公室里就可以對模型進行升級和維護,而我們專注做基礎算法和底層平臺能力建設,這樣實際上分工也產(chǎn)生了變化?!?/p>

這意味著,垂直大模型將作為基礎能力對外標準輸出,端到端的解決用戶需求。目前,范特科技已完成語言類大模型、視覺大模型以及多模態(tài)大模型的技術(shù)預研,將于近期推出相關產(chǎn)品進行落地。

而像家居和電商內(nèi)容這樣的行業(yè),垂直大模型可以賦能全流程。

聚焦電商內(nèi)容解決方案的極??萍紕?chuàng)始人武彬告訴獵云網(wǎng),在電商內(nèi)容生成全領域,從拍攝-場景圖-種草-直播切片-短視頻,過去的AI解決方案只能賦能部分流程,而垂直大模型可以全流程自動生成,這可以極大地降本增效。

專注家居行業(yè)的三維家CEO蔡志森也表示,不論在設計場景、營銷場景還是制造場景,垂直大模型可以生產(chǎn)3D矢量化的內(nèi)容,做到“所想即所見”、 “所見即所得”,甚至在生產(chǎn)制造端,垂直大模型將取代規(guī)則驅(qū)動,生產(chǎn)自動化提效,優(yōu)化人員結(jié)構(gòu)和人機交互模式。

目前三維家已構(gòu)建起室內(nèi)空間大模型、定制家居大模型等垂類模型,應用于戶型識別、智能樣板間、智能柜體、智能硬裝、智能水電、智能家居布置等多種設計環(huán)節(jié)。

基于室內(nèi)空間大模型通過可配置的AI知識圖譜和大規(guī)模神經(jīng)網(wǎng)絡,深度學習海量家居家裝方案,可以自動完成智能設計。

而基于真實柜體數(shù)據(jù)的定制家居大模型,則可根據(jù)尺寸輸入、對話文本生成參數(shù)化的定制衣柜、櫥柜設計,生產(chǎn)合理的柜體方案,可直接對接生產(chǎn),將大大縮減復雜易出錯的柜體設計時間。

對于各行各業(yè)來說,垂直大模型是一種全新的生產(chǎn)力,底層能力的突破不僅可以降本增效,長期來看必然帶來上層應用的躍遷和變革。

如蔡志森所說,一方面,在當前中國的智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化革新本就有廣闊的市場需求;另一方面,在toB生態(tài)下,基于垂直大模型的應用實踐也有利于形成數(shù)據(jù)飛輪與場景飛輪。

天堂硅谷高級合伙人王偉也表示,大模型最大的價值在于建立新的商業(yè)模式和新的經(jīng)營思想,重新改造商業(yè)組織的每一個環(huán)節(jié)。

這也是為什么創(chuàng)業(yè)公司紛紛擁抱大模型的原因。

創(chuàng)業(yè)公司垂直大模型第一仗:控本增效

雖然大模型“很香”,但眾所周知,過去大模型的一次性投入成本極高。此前,有市場消息稱GPT3單次訓練的成本為400萬美元,因此,不少聲音認為訓練大模型門檻至少在數(shù)千萬元。

但在垂直行業(yè),盲目追求“大”規(guī)模沒有意義,OpenCSG創(chuàng)始人& CEO陳冉將大模型比作一塊“玉”,“如何用好大模型能力,也就是說雕琢這塊玉更為重要?!?/p>

郭長柱也提到,大模型的標準并不能以參數(shù)規(guī)模一概而論,核心在于其是否具備“涌現(xiàn)”能力,即其準確率是否達到突然躍升的階段。“在垂直領域,同樣的效果,通用大模型要千億甚至萬億參數(shù),垂直大模型百億數(shù)據(jù)也可以達到?!?/p>

參數(shù)規(guī)模的指數(shù)級下降,疊加這段時間涌現(xiàn)的眾多開源模型和蒸餾法等變革性技術(shù),過去千萬級的訓練大模型“門票”已降至百萬級。

但這對于創(chuàng)業(yè)公司們而言,這仍然是一筆不大不小的開支,控制成本和提升效率成為各家公司在百模大戰(zhàn)中的第一仗。

極驗在優(yōu)化投入產(chǎn)出比方面,采取彈性計算環(huán)境,以按量計算完成前期零碎的探索任務。在明確方向后,再轉(zhuǎn)化為周期性訓練。

極??萍紕t聯(lián)合清華大學人工智能研究院,由學術(shù)團隊提供算力支持,優(yōu)化投入產(chǎn)出比。

而三維家則打造了一套多服務器、多GPU并行的計算網(wǎng)絡,優(yōu)化算力調(diào)配和運行機制,同時,三維家作為英偉達的高級初創(chuàng)會員,得到高效利用GPU的技術(shù)支持,這也加速了三維家垂直大模型的迭代速度。

范特科技在成本和生成效率方面,一方面,通過在現(xiàn)有的產(chǎn)品中整合大模型能力,大幅提升了內(nèi)部創(chuàng)新效率;另一方面,通過自研的推理引擎優(yōu)化技術(shù)和并行計算技術(shù)最大限度的提升大模型推理速度和硬件利用效率,通過自研業(yè)務流編排引擎解決最后一公里的業(yè)務流自定義問題,完成基于大模型的端到端的解決問題完整閉環(huán)。

事實上,控制成本不僅僅是為了控制投入,小苗朗程合伙人俞佳偉坦言,對于用戶側(cè)而言,成本太高也難以被接受,尤其是在算力低、功耗低的終端場景。

垂直大模型:數(shù)據(jù)和know-how為王

訓練大模型的成本下降,對于創(chuàng)業(yè)公司而言,只是拿到了入場券。對于垂直大模型而言,核心和關鍵離不開算力、算法和數(shù)據(jù)。

在一定程度上,錢可以解決算力和算法,但卻很難買到數(shù)據(jù),尤其是在垂直領域,很多都是私有數(shù)據(jù),能買到的數(shù)據(jù)意義并不大。

這對一直深耕在垂直行業(yè)的公司而言,是天然的優(yōu)勢。

蔡志森告訴獵云網(wǎng),依托其在線的3D設計軟件和3D制造軟件,三維家已經(jīng)具備2800萬+覆蓋全國小區(qū)的戶型數(shù)據(jù)、8100萬+軟硬裝、家具家電、材質(zhì)飾品素材庫、16.3億+風格種類多樣的設計方案庫,此外,還擁有數(shù)千萬參數(shù)數(shù)據(jù)的真實定制柜體數(shù)據(jù)集。

與此同時,用戶不斷使用,這些數(shù)據(jù)集仍按照三維家定義的方向在自動實時生成。

和三維家一樣,深耕電商內(nèi)容領域的極??萍济磕甓荚诋a(chǎn)生數(shù)百萬乃至數(shù)千萬的電商內(nèi)容數(shù)據(jù)。

除了數(shù)據(jù)壁壘,定位清晰的應用場景、掌握垂直大模型落地的全流程也是核心競爭力,這對了解行業(yè)know-how提出了極高的要求。

實際上,大模型提供的是基礎能力,具體業(yè)務則是專有能力的組合。

在郭長柱看來,目前基于大模型的模型即服務(MaaS)是一種創(chuàng)新的模式,即把大模型作為基礎能力對外標準輸出,端到端的解決用戶需求。但直接使用大模型端到端的解決問題相對較少,尤其是在CV領域,更多的是在基礎能力之上針對垂直領域做定制。

“比如使用大模型自動標注訓練垂直領域小模型,使用大模型更加general的特征做VQA、檢測、分割和識別等二次開發(fā)。除此之外,部分業(yè)務可能涉及多項大模型能力的組合,甚至需要語言和視覺特征對齊的多模態(tài)能力。這就要求我們在實際的業(yè)務中必須支持多種大模型的自定義業(yè)務流,實現(xiàn)大模型的自由組合和業(yè)務的深度定制。”

OpenCSG也從實踐中積累了大量大模型落地通用行業(yè)的實踐,包括垂直行業(yè)語料產(chǎn)生,大模型微調(diào),業(yè)務結(jié)合等方面。

王偉也表示,投資大模型他看好在核心行業(yè)有海量行業(yè)數(shù)據(jù),懂行業(yè)know-how的企業(yè)。

俞佳偉則看好有實際落地場景的企業(yè),尤其是需求強、專業(yè)性強的場景,例如醫(yī)療、金融、法律等行業(yè)。

在陳冉看來,大模型具備了推演、舉一反三的能力,在一定程度上,具備類似人類的腦神經(jīng),可以替代不少人類的工作?!斑^去最大的創(chuàng)業(yè)成本是人,而利用好大模型,重塑工作流,可以極大降低創(chuàng)業(yè)成本,這對創(chuàng)業(yè)公司來說是極大的利好?!?/p>

王偉也持相同觀點:“將大模型的思想和技術(shù)武裝到牙齒,必然會建立起一個全新的商業(yè)帝國?!?/p>

時代的大幕已然拉開,燦若繁星。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。