正在閱讀:

這屆VC,對AI大模型“望而生畏”

掃一掃下載界面新聞APP

這屆VC,對AI大模型“望而生畏”

太貴,讓VC更理性了。

文|獵云網 孫媛

2023年,大模型狂飆;但一級市場卻略顯十動然拒。

一邊,大廠跟大佬all in大模型的規(guī)劃掀起賽道的狂熱,有VC搶做一個吃螃蟹的人,數(shù)億元融資成大模型投早標配。

譬如,啟明攜手經緯,數(shù)億元天使輪投向周伯文創(chuàng)辦的銜遠科技;創(chuàng)新工場孵化的AI 2.0 大模型瀾舟科技,也續(xù)上一筆數(shù)億元Pre-A輪,斯道資本和創(chuàng)新工場持續(xù)加碼。

但到了另一邊,卻仿佛現(xiàn)實照進理想,大模型自研所需的“鈔能力”讓不少VC望而生畏。

一次運算450萬美元(約合3000萬元)的開銷,以及月薪2萬至10萬/人的重金求賢爭奪賽,讓某家美元基金相關人員直接表示,“不關注AI大模型,太貴了?!?/p>

更有投資人直言,真實情況是項目根本搶不起來。一是估值體系還不成熟,幾億一輪融資,釋放10到20個點的股權,估值馬上超10億,而這估值還是按照一個大模型燒GPU消耗的成本去計算,而不是以其真正的商業(yè)價值去評估;二是國內存在商業(yè)化落地以及時機的不確定性。

“大家看好宏觀趨勢,也更愿意做跟投,但到具體項目,要領投可太需要勇氣了。而且一起進場投,很可能會追高?!?/p>

但有VC放棄,就會有VC勇往直前。

有幾家機構跟獵云網表示目前仍在持續(xù)學習中,但還未形成投資邏輯,處于想投但是多觀望的狀態(tài)。而這樣的狀態(tài)反應到項目端,卻也引發(fā)了部分創(chuàng)業(yè)者的吐槽,有創(chuàng)業(yè)者表示,很多基金與其說是投資溝通,不如說是找他們學習。

“有VC還在問一些很基礎的問題,譬如大模型跟原來小模型有什么不同。天天給人教育,相當于變成了一個免費的老師,后面的盡調也一直在問偏學術上的問題,商業(yè)上的考量都還沒有聊到?!?/p>

顯然,在一級市場投“真香”大模型上,多看少投甚至不投成為了大部分VC的日常。

國內大模型“冷飯熱吃”

說起大模型,其實也不算什么新鮮概念。

國外超大規(guī)模預訓練模型始于2018年谷歌提出BERT大規(guī)模預訓練語言模型,并在2021年進入“軍備競賽”階段。

2020年,OpenAI推出GPT-3超大規(guī)模語言訓練模型,參數(shù)達到1750億,用了大約兩年的時間,實現(xiàn)了模型規(guī)模從1億到上千億級的突破,并能實現(xiàn)作詩、聊天、生成代碼等功能。

再到2021年,谷歌推出的Switch Transformer模型成為歷史上首個萬億級語言模型多達 1.6 萬億個參數(shù),并在12月提出了具有 1.2 萬億參數(shù)的 GLaM 通用稀疏語言模型,在7項小樣本學習領域的性能優(yōu)于 GPT-3。

同期,國內超大模型的研發(fā)發(fā)展也很迅速,2021年成為中國AI大模型爆發(fā)的一年。

商湯科技的計算機視覺模型、華為云聯(lián)合發(fā)布的盤古NLP超大規(guī)模預訓練語言模型和盤古α超大規(guī)模預訓練模型、阿里達摩院PLUG中文預訓練模型以及聯(lián)合發(fā)布的M6中文多模態(tài)預訓練模型以及百度的ERNIE 3.0 Titan模型陸續(xù)面世,其中達摩院M6模型的參數(shù)達到10萬億,直接將大模型的參數(shù)提升了一個量級。

雖然當時國內院校跟大廠都在做大模型,但在銀杏谷資本高級投資經理鐘偉成看來,這更多是科研上的效果復現(xiàn),對國外較為前沿的AI模型的跟進。直到2022年年底StableDiffusion、ChatGPT的出現(xiàn),才開始讓更多業(yè)內人士從觀望走向下場。

“之前產品的商用價值并沒有完全體現(xiàn)出來,大部分比較好的落地場景是心理慰藉的對話,或者文檔的改寫生成,以及此前的AI繪畫。ChatGPT出來后,大家發(fā)現(xiàn)說可以通過多輪對話去做不斷微調、上下文學習,然后去生成更好的內容?!?/p>

從技術和戰(zhàn)略層面上看,ChatGPT讓更多人意識到這不單只是一個應用工具,甚至會成為一個新的PaaS層基礎設施。從技術和戰(zhàn)略層面上,群雄爭霸,都想試圖成為一個新時代的基礎設施供應商。

再到2023年,上市公司和大廠陸續(xù)放出做大模型的信號,AIGC概念股股價翻番,外加“AI的iPhone時刻 ”無不讓這股熱度從二級市場涌向一級,引發(fā)對語言大模型的重點關注。

風口之下,從前年開始布局的學院派等語言大模型創(chuàng)企從去年開始浮出水面,擊中了有出手壓力的VC心巴。

鐘偉成表示,多數(shù)投資人在大環(huán)境不確定下,會傾向于尋求一些偏底層及回報較高、能最終形成一家獨大的投資領域,外加對錯過下一個時代風口的焦慮,使得語言大模型項目成為了市面上最為性感的一類投資標的。

然而賽道雖香,語言大模型的火爆表象下,技術差距并不止一點。

以當前國內大廠語言基礎大模型十幾億、幾百億的參數(shù)規(guī)模,以及大多數(shù)創(chuàng)業(yè)公司還在做一兩百億的參數(shù)模型來看,跟ChatGPT相比,還有2-3年的距離。

VC看多投少,項目端狂蹭熱點

正如上文所說,現(xiàn)在VC看大模型,光看鮮出手。

一方面,是因為一些基金是從AIGC火了后,才研究和關注大模型,開始找項目,正處于學習階段,而更主要的原因是貴。

以OpenAI為例,其在推出GPT3的API接口出來之前,已經燒了好幾億,后在微軟百億美元狂砸下,才有了GPT3的面世及能力的涌現(xiàn)。

所以想要對標ChatGPT,資金必不可少。

鐘偉成表示,過去,團隊健全的大佬創(chuàng)業(yè)項目,一般第一輪估值2-3億元就已經很高。但放到大模型創(chuàng)企來說,光1年租1000張GPU卡就要花大幾千萬到1億元的支出。

“這還只是試錯的成本,萬一技術路徑選錯了,模型訓練的過程中出了一些bug,重新弄根本吃不消。天使輪估值就這么高,等退出還要7-8年,跑出來的還不一定是投資的那一家。冒著整支基金回報的風險去投大模型,是項目推進時較大的阻力?!?/p>

與此同時,不同背景的基金之間,對于基金存續(xù)期以及試錯風險的承受度都有不同的要求,部分基金會要求被投企業(yè)盡早做商業(yè)化嘗試,而這樣的投資模式跟慢工出細活的通用基礎大模型并不適配。

就目前來說,旗下有美元基金的機構存續(xù)期較長,更容易下注投資語言大模型,但就目前主要投資早期輪來看,隨著語言大模型項目到第三四輪,一輪5-10億的砸錢下,估值到50億元后,誰來接盤又成為問題。

在鐘偉成看來,與百度阿里等大廠,有內部資金支持科研團隊去做不同,國內語言大模型創(chuàng)企,投資風險高就在于不確定因素太多,早期VC基金攢局投完以后,后期輪還是需要國資機構的投資介入,幫助創(chuàng)企緩和資金量,才能推動扶持出一家頭部企業(yè)。

他不禁感慨,“別看創(chuàng)業(yè)公司去做語言大模型好像很熱鬧,最后的格局可能還是一家特別大,兩家相對小的中文語言大模型存活下來?!?/p>

與此同時,以目前市面上的大模型項目來說,蹭熱點的也不在少數(shù)。

就華映資本董事劉天杰的感觸來說,他從年底開始開始看AIGC的項目,過去是一個月看5-10個,現(xiàn)在是每天都要看3-4個,其中大概有1/4跟大模型相關。在他看來,現(xiàn)在項目多到已經成為繼上一波移動互聯(lián)網以來的新一輪全球狂潮。

“所有人都想第一波沖進去,挺正?!,F(xiàn)在很多做語音圖像識別的中后期輪甚至上市公司都在蹭這一波熱度,有些公司號稱做大模型,但最終是面向應用的,其中大模型也得分語言大模型,以及中度的促進性模型?!?/p>

故而在一級市場上,普遍VC采取看多投少的節(jié)奏,尤其是在大模型底層還未確定能發(fā)展多快的情況下,美元基金偏好語言大模型,人民幣基金則更偏向應用層,但總體出手還是相當審慎。

此外,劉天杰還指出,上一波AI公司現(xiàn)在往AIGC靠攏,其實已經很難追上。事實上,這就是一場AI的自我革命。

“國外大模型從2018年就開始研究,這不是一蹴而就的事情。傳統(tǒng)判別式或者做卷積網絡的AI團隊現(xiàn)在跳出來講大模型,但是他在傳統(tǒng)AI技術路線上投入了太多時間人力,歷史包袱成為其困局所在。”

同時,劉天杰也坦言,在基礎大模型領域,其實文字、圖形乃至視頻的創(chuàng)業(yè)機會都不大。

“因為這不是一個擁有幾個算法天才就能解決的事情,你需要一個非常龐大的算力基礎,這可能現(xiàn)在連國內的大廠都沒有,就更別說創(chuàng)業(yè)公司。同時你還需要一個巨大的高質量數(shù)據集基礎,純靠公網扒取、或者花錢去買,想要去做語言大模型真是挺困難。”

再回到現(xiàn)如今的大佬紛紛下場創(chuàng)業(yè),在鐘偉成看來也并非獨具優(yōu)勢。

“很多大佬是邀請了一些以前參與過大模型訓練項目的人,把架構搭起來重造,但其實不同量級的語言大模型訓練,在工程化上都有很多不同的坑需要去逐步攻克,從0開始做,同行的競爭壓力還是蠻大的?!?/p>

應用層暫時失寵,模型層投資機會在“細分”

短期來看,國內互聯(lián)網大廠在研發(fā)語言及多模態(tài)大模型的節(jié)奏下,未來3-5年會出現(xiàn)各種不同垂直領域的大模型,甚至細分到各個公司私有化部署的大模型。

在這樣趨勢下,各家都會有一個嘗鮮期。

在鐘偉成看來,這就跟過去的中臺概念很像,短期內激發(fā)一波需求,會有很多大廠或初創(chuàng)公司,去輔助大企業(yè)煉制自己的AI大模型。而中國的市場里面,長遠來看還是會走出一兩家通用的語言大模型,由百家爭鳴的狀態(tài)走向大一統(tǒng),且目前來看互聯(lián)網大廠的勝率較大。

“國內公域流量上的中文語料非常差,優(yōu)質的中文語料又集中在各個不同大廠的私域場景里,比方抖音的視頻數(shù)據、阿里的圖文數(shù)據、百度的文本數(shù)據,還有知乎跟小紅書等,這些數(shù)據都是不會共享出來給外部去做通用的大模型訓練。而有著私域數(shù)據及資金能力的互聯(lián)網大廠訓練各自領域的大模型后,再看哪一家有能力擴展到更多行業(yè),變成一個通用的語言大模型,我覺得這是國內大模型比較符合常理的一個發(fā)展過程。”

那既然創(chuàng)業(yè)公司做基礎大模型對標ChatGPT的機會不大,那么大模型創(chuàng)業(yè)還能往哪卷?

對此,有投資人給出一些答案:投細分、投基礎設施。

劉天杰表示,現(xiàn)階段,國內有一些大模型在垂直領域的細分機會可以查漏補缺,包括一些現(xiàn)在在國際上比較前沿的領域,比如3D大模型、視頻大模型、多模態(tài)大模型等中型模型。

“微軟英偉達,他們也沒有足夠多的3D數(shù)據去訓練一個通用的3D大模型,而是用一些中型模型的路徑或者說用一些模型監(jiān)督強化學習的方式去迫近3D大模型。在這一點上,我覺得國內公司是有機會的?!?/p>

對此,鐘偉成也持相同看法?!瓣P注垂直的語言大模型或多模態(tài)的大模型,國內創(chuàng)企還是有一定的數(shù)據優(yōu)勢,譬如字節(jié)或快手的人去做視頻生成,就很有可能做成。我認為在垂直領域,市場規(guī)模足夠大、你進得足夠早,比別人先積累一些領域內的私有數(shù)據,很有可能做到行業(yè)一霸。”

此外,他也認為未來針對模型推理/訓練的優(yōu)化、AI推理/訓練專用芯片等AI基礎設施方向,也是有比較明確的市場需求。

值得注意的是,目前相較于模型層,應用層暫時屬于失寵狀態(tài)。

過去移動互聯(lián)網或元宇宙浪潮,其最大特點是基礎設施發(fā)展較慢,但基礎設施架構上的應用發(fā)展較快。但到了這一波AI,基礎設施不僅已經迎來爆發(fā)式增長,更在大廠大模型的涌入下,不斷變化著。

在劉天杰看來,這種情況下講應用毫無意義,投入后一旦大廠發(fā)了一個新模型,就可能直接把應用干翻。

“在這種情況下,我們第二波才會看應用。現(xiàn)在的AI公司,如果能在目前中文大模型不那么完善的情況下,釋放功能給C端積累大量的高質量數(shù)據集,那這家公司才有意義和價值。”

此外,據鐘偉成透露,4月看大模型的投資人基本會對心儀的項目做最后推進,好幾家已經close了?,F(xiàn)在還在市面融資的大模型項目相對變少,但還是會有很多做應用的AIGC項目主動找上門。

在他看來,眼下大廠百家爭鳴,大模型越割裂,對資本來說是一個利好,讓投資機構有機會參與到垂直領域的大模型投資。但對于創(chuàng)業(yè)者來說,無論是模型層還是應用層,都需要想清楚,一是找到一個AI原生的細分領域,二是認真思考其所帶來的根本性變化在哪,只是生成內容,還是內容的理解及后續(xù)合成。

顯然,這新一輪AI浪潮下,找VC拿錢的條件越來越高了。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

這屆VC,對AI大模型“望而生畏”

太貴,讓VC更理性了。

文|獵云網 孫媛

2023年,大模型狂飆;但一級市場卻略顯十動然拒。

一邊,大廠跟大佬all in大模型的規(guī)劃掀起賽道的狂熱,有VC搶做一個吃螃蟹的人,數(shù)億元融資成大模型投早標配。

譬如,啟明攜手經緯,數(shù)億元天使輪投向周伯文創(chuàng)辦的銜遠科技;創(chuàng)新工場孵化的AI 2.0 大模型瀾舟科技,也續(xù)上一筆數(shù)億元Pre-A輪,斯道資本和創(chuàng)新工場持續(xù)加碼。

但到了另一邊,卻仿佛現(xiàn)實照進理想,大模型自研所需的“鈔能力”讓不少VC望而生畏。

一次運算450萬美元(約合3000萬元)的開銷,以及月薪2萬至10萬/人的重金求賢爭奪賽,讓某家美元基金相關人員直接表示,“不關注AI大模型,太貴了。”

更有投資人直言,真實情況是項目根本搶不起來。一是估值體系還不成熟,幾億一輪融資,釋放10到20個點的股權,估值馬上超10億,而這估值還是按照一個大模型燒GPU消耗的成本去計算,而不是以其真正的商業(yè)價值去評估;二是國內存在商業(yè)化落地以及時機的不確定性。

“大家看好宏觀趨勢,也更愿意做跟投,但到具體項目,要領投可太需要勇氣了。而且一起進場投,很可能會追高?!?/p>

但有VC放棄,就會有VC勇往直前。

有幾家機構跟獵云網表示目前仍在持續(xù)學習中,但還未形成投資邏輯,處于想投但是多觀望的狀態(tài)。而這樣的狀態(tài)反應到項目端,卻也引發(fā)了部分創(chuàng)業(yè)者的吐槽,有創(chuàng)業(yè)者表示,很多基金與其說是投資溝通,不如說是找他們學習。

“有VC還在問一些很基礎的問題,譬如大模型跟原來小模型有什么不同。天天給人教育,相當于變成了一個免費的老師,后面的盡調也一直在問偏學術上的問題,商業(yè)上的考量都還沒有聊到?!?/p>

顯然,在一級市場投“真香”大模型上,多看少投甚至不投成為了大部分VC的日常。

國內大模型“冷飯熱吃”

說起大模型,其實也不算什么新鮮概念。

國外超大規(guī)模預訓練模型始于2018年谷歌提出BERT大規(guī)模預訓練語言模型,并在2021年進入“軍備競賽”階段。

2020年,OpenAI推出GPT-3超大規(guī)模語言訓練模型,參數(shù)達到1750億,用了大約兩年的時間,實現(xiàn)了模型規(guī)模從1億到上千億級的突破,并能實現(xiàn)作詩、聊天、生成代碼等功能。

再到2021年,谷歌推出的Switch Transformer模型成為歷史上首個萬億級語言模型多達 1.6 萬億個參數(shù),并在12月提出了具有 1.2 萬億參數(shù)的 GLaM 通用稀疏語言模型,在7項小樣本學習領域的性能優(yōu)于 GPT-3。

同期,國內超大模型的研發(fā)發(fā)展也很迅速,2021年成為中國AI大模型爆發(fā)的一年。

商湯科技的計算機視覺模型、華為云聯(lián)合發(fā)布的盤古NLP超大規(guī)模預訓練語言模型和盤古α超大規(guī)模預訓練模型、阿里達摩院PLUG中文預訓練模型以及聯(lián)合發(fā)布的M6中文多模態(tài)預訓練模型以及百度的ERNIE 3.0 Titan模型陸續(xù)面世,其中達摩院M6模型的參數(shù)達到10萬億,直接將大模型的參數(shù)提升了一個量級。

雖然當時國內院校跟大廠都在做大模型,但在銀杏谷資本高級投資經理鐘偉成看來,這更多是科研上的效果復現(xiàn),對國外較為前沿的AI模型的跟進。直到2022年年底StableDiffusion、ChatGPT的出現(xiàn),才開始讓更多業(yè)內人士從觀望走向下場。

“之前產品的商用價值并沒有完全體現(xiàn)出來,大部分比較好的落地場景是心理慰藉的對話,或者文檔的改寫生成,以及此前的AI繪畫。ChatGPT出來后,大家發(fā)現(xiàn)說可以通過多輪對話去做不斷微調、上下文學習,然后去生成更好的內容。”

從技術和戰(zhàn)略層面上看,ChatGPT讓更多人意識到這不單只是一個應用工具,甚至會成為一個新的PaaS層基礎設施。從技術和戰(zhàn)略層面上,群雄爭霸,都想試圖成為一個新時代的基礎設施供應商。

再到2023年,上市公司和大廠陸續(xù)放出做大模型的信號,AIGC概念股股價翻番,外加“AI的iPhone時刻 ”無不讓這股熱度從二級市場涌向一級,引發(fā)對語言大模型的重點關注。

風口之下,從前年開始布局的學院派等語言大模型創(chuàng)企從去年開始浮出水面,擊中了有出手壓力的VC心巴。

鐘偉成表示,多數(shù)投資人在大環(huán)境不確定下,會傾向于尋求一些偏底層及回報較高、能最終形成一家獨大的投資領域,外加對錯過下一個時代風口的焦慮,使得語言大模型項目成為了市面上最為性感的一類投資標的。

然而賽道雖香,語言大模型的火爆表象下,技術差距并不止一點。

以當前國內大廠語言基礎大模型十幾億、幾百億的參數(shù)規(guī)模,以及大多數(shù)創(chuàng)業(yè)公司還在做一兩百億的參數(shù)模型來看,跟ChatGPT相比,還有2-3年的距離。

VC看多投少,項目端狂蹭熱點

正如上文所說,現(xiàn)在VC看大模型,光看鮮出手。

一方面,是因為一些基金是從AIGC火了后,才研究和關注大模型,開始找項目,正處于學習階段,而更主要的原因是貴。

以OpenAI為例,其在推出GPT3的API接口出來之前,已經燒了好幾億,后在微軟百億美元狂砸下,才有了GPT3的面世及能力的涌現(xiàn)。

所以想要對標ChatGPT,資金必不可少。

鐘偉成表示,過去,團隊健全的大佬創(chuàng)業(yè)項目,一般第一輪估值2-3億元就已經很高。但放到大模型創(chuàng)企來說,光1年租1000張GPU卡就要花大幾千萬到1億元的支出。

“這還只是試錯的成本,萬一技術路徑選錯了,模型訓練的過程中出了一些bug,重新弄根本吃不消。天使輪估值就這么高,等退出還要7-8年,跑出來的還不一定是投資的那一家。冒著整支基金回報的風險去投大模型,是項目推進時較大的阻力?!?/p>

與此同時,不同背景的基金之間,對于基金存續(xù)期以及試錯風險的承受度都有不同的要求,部分基金會要求被投企業(yè)盡早做商業(yè)化嘗試,而這樣的投資模式跟慢工出細活的通用基礎大模型并不適配。

就目前來說,旗下有美元基金的機構存續(xù)期較長,更容易下注投資語言大模型,但就目前主要投資早期輪來看,隨著語言大模型項目到第三四輪,一輪5-10億的砸錢下,估值到50億元后,誰來接盤又成為問題。

在鐘偉成看來,與百度阿里等大廠,有內部資金支持科研團隊去做不同,國內語言大模型創(chuàng)企,投資風險高就在于不確定因素太多,早期VC基金攢局投完以后,后期輪還是需要國資機構的投資介入,幫助創(chuàng)企緩和資金量,才能推動扶持出一家頭部企業(yè)。

他不禁感慨,“別看創(chuàng)業(yè)公司去做語言大模型好像很熱鬧,最后的格局可能還是一家特別大,兩家相對小的中文語言大模型存活下來。”

與此同時,以目前市面上的大模型項目來說,蹭熱點的也不在少數(shù)。

就華映資本董事劉天杰的感觸來說,他從年底開始開始看AIGC的項目,過去是一個月看5-10個,現(xiàn)在是每天都要看3-4個,其中大概有1/4跟大模型相關。在他看來,現(xiàn)在項目多到已經成為繼上一波移動互聯(lián)網以來的新一輪全球狂潮。

“所有人都想第一波沖進去,挺正?!,F(xiàn)在很多做語音圖像識別的中后期輪甚至上市公司都在蹭這一波熱度,有些公司號稱做大模型,但最終是面向應用的,其中大模型也得分語言大模型,以及中度的促進性模型?!?/p>

故而在一級市場上,普遍VC采取看多投少的節(jié)奏,尤其是在大模型底層還未確定能發(fā)展多快的情況下,美元基金偏好語言大模型,人民幣基金則更偏向應用層,但總體出手還是相當審慎。

此外,劉天杰還指出,上一波AI公司現(xiàn)在往AIGC靠攏,其實已經很難追上。事實上,這就是一場AI的自我革命。

“國外大模型從2018年就開始研究,這不是一蹴而就的事情。傳統(tǒng)判別式或者做卷積網絡的AI團隊現(xiàn)在跳出來講大模型,但是他在傳統(tǒng)AI技術路線上投入了太多時間人力,歷史包袱成為其困局所在?!?/p>

同時,劉天杰也坦言,在基礎大模型領域,其實文字、圖形乃至視頻的創(chuàng)業(yè)機會都不大。

“因為這不是一個擁有幾個算法天才就能解決的事情,你需要一個非常龐大的算力基礎,這可能現(xiàn)在連國內的大廠都沒有,就更別說創(chuàng)業(yè)公司。同時你還需要一個巨大的高質量數(shù)據集基礎,純靠公網扒取、或者花錢去買,想要去做語言大模型真是挺困難。”

再回到現(xiàn)如今的大佬紛紛下場創(chuàng)業(yè),在鐘偉成看來也并非獨具優(yōu)勢。

“很多大佬是邀請了一些以前參與過大模型訓練項目的人,把架構搭起來重造,但其實不同量級的語言大模型訓練,在工程化上都有很多不同的坑需要去逐步攻克,從0開始做,同行的競爭壓力還是蠻大的?!?/p>

應用層暫時失寵,模型層投資機會在“細分”

短期來看,國內互聯(lián)網大廠在研發(fā)語言及多模態(tài)大模型的節(jié)奏下,未來3-5年會出現(xiàn)各種不同垂直領域的大模型,甚至細分到各個公司私有化部署的大模型。

在這樣趨勢下,各家都會有一個嘗鮮期。

在鐘偉成看來,這就跟過去的中臺概念很像,短期內激發(fā)一波需求,會有很多大廠或初創(chuàng)公司,去輔助大企業(yè)煉制自己的AI大模型。而中國的市場里面,長遠來看還是會走出一兩家通用的語言大模型,由百家爭鳴的狀態(tài)走向大一統(tǒng),且目前來看互聯(lián)網大廠的勝率較大。

“國內公域流量上的中文語料非常差,優(yōu)質的中文語料又集中在各個不同大廠的私域場景里,比方抖音的視頻數(shù)據、阿里的圖文數(shù)據、百度的文本數(shù)據,還有知乎跟小紅書等,這些數(shù)據都是不會共享出來給外部去做通用的大模型訓練。而有著私域數(shù)據及資金能力的互聯(lián)網大廠訓練各自領域的大模型后,再看哪一家有能力擴展到更多行業(yè),變成一個通用的語言大模型,我覺得這是國內大模型比較符合常理的一個發(fā)展過程?!?/p>

那既然創(chuàng)業(yè)公司做基礎大模型對標ChatGPT的機會不大,那么大模型創(chuàng)業(yè)還能往哪卷?

對此,有投資人給出一些答案:投細分、投基礎設施。

劉天杰表示,現(xiàn)階段,國內有一些大模型在垂直領域的細分機會可以查漏補缺,包括一些現(xiàn)在在國際上比較前沿的領域,比如3D大模型、視頻大模型、多模態(tài)大模型等中型模型。

“微軟英偉達,他們也沒有足夠多的3D數(shù)據去訓練一個通用的3D大模型,而是用一些中型模型的路徑或者說用一些模型監(jiān)督強化學習的方式去迫近3D大模型。在這一點上,我覺得國內公司是有機會的。”

對此,鐘偉成也持相同看法。“關注垂直的語言大模型或多模態(tài)的大模型,國內創(chuàng)企還是有一定的數(shù)據優(yōu)勢,譬如字節(jié)或快手的人去做視頻生成,就很有可能做成。我認為在垂直領域,市場規(guī)模足夠大、你進得足夠早,比別人先積累一些領域內的私有數(shù)據,很有可能做到行業(yè)一霸?!?/p>

此外,他也認為未來針對模型推理/訓練的優(yōu)化、AI推理/訓練專用芯片等AI基礎設施方向,也是有比較明確的市場需求。

值得注意的是,目前相較于模型層,應用層暫時屬于失寵狀態(tài)。

過去移動互聯(lián)網或元宇宙浪潮,其最大特點是基礎設施發(fā)展較慢,但基礎設施架構上的應用發(fā)展較快。但到了這一波AI,基礎設施不僅已經迎來爆發(fā)式增長,更在大廠大模型的涌入下,不斷變化著。

在劉天杰看來,這種情況下講應用毫無意義,投入后一旦大廠發(fā)了一個新模型,就可能直接把應用干翻。

“在這種情況下,我們第二波才會看應用?,F(xiàn)在的AI公司,如果能在目前中文大模型不那么完善的情況下,釋放功能給C端積累大量的高質量數(shù)據集,那這家公司才有意義和價值。”

此外,據鐘偉成透露,4月看大模型的投資人基本會對心儀的項目做最后推進,好幾家已經close了?,F(xiàn)在還在市面融資的大模型項目相對變少,但還是會有很多做應用的AIGC項目主動找上門。

在他看來,眼下大廠百家爭鳴,大模型越割裂,對資本來說是一個利好,讓投資機構有機會參與到垂直領域的大模型投資。但對于創(chuàng)業(yè)者來說,無論是模型層還是應用層,都需要想清楚,一是找到一個AI原生的細分領域,二是認真思考其所帶來的根本性變化在哪,只是生成內容,還是內容的理解及后續(xù)合成。

顯然,這新一輪AI浪潮下,找VC拿錢的條件越來越高了。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。