文|定焦 黎明
編輯|魏佳
AI創(chuàng)業(yè)者陳冉,發(fā)現(xiàn)行業(yè)里有一些“怪現(xiàn)象”。
很多客戶向他反饋,自己很困惑。一方面,大模型更新速度太快,搞不清楚到底哪個(gè)好用;同時(shí),自己也不知道大模型怎么跟業(yè)務(wù)結(jié)合;另外,自己的數(shù)據(jù)集究竟能不能精調(diào)出一個(gè)好用的大模型,心里也沒譜。
最后的結(jié)果就是,愿意投入大模型,但不知如何下手,即便下定決心了,也摳摳搜搜拿不出太多預(yù)算來。
這進(jìn)而導(dǎo)致,大模型公司開始卷價(jià)格,打起了價(jià)格戰(zhàn)?!捌吹阶詈缶褪?,又燒錢、價(jià)格還低、還沒人用的狀態(tài)?!?/p>
陳冉是人工智能社區(qū)和生態(tài)公司開放傳神(OpenCSG)的創(chuàng)始人、CEO,他認(rèn)為大模型行業(yè)的無效內(nèi)卷是一種消耗。去年一哄而上做大模型的公司們,最終沒能避免掉進(jìn)當(dāng)年ofo們踩過的陷阱。
這逼得行業(yè)大佬、零一萬物創(chuàng)始人李開復(fù)放話,“如果中國市場就是這么卷,大家寧可賠光、通輸也不讓你贏,那我們就走外國市場”。
做了多年技術(shù)開發(fā),很早就開始AI創(chuàng)業(yè)的李友峰,同樣對今天的現(xiàn)象感到不解?!耙郧拔覀冇懻撘粋€(gè)項(xiàng)目,會關(guān)注它有什么價(jià)值,但到了AI大模型,大家很少討論價(jià)值,都在討論領(lǐng)先?!?/p>
鋪天蓋地的榜單,五花八門的排名,自吹自擂的營銷,讓這個(gè)行業(yè)顯得浮躁喧囂。廠商們最后花了很多錢,產(chǎn)品落地不了,技術(shù)實(shí)際上也沒有太領(lǐng)先。
5月下旬,清華系大模型公司銜遠(yuǎn)科技被曝?fù)Q帥,創(chuàng)始人周伯文將離開公司。消息傳出后,有創(chuàng)業(yè)者稱:聚焦算法,或許是一條彎路。
大模型創(chuàng)業(yè),在中國是一條窄路,對某些團(tuán)隊(duì)也許是不歸路。
如今,2024年過半,“百模大戰(zhàn)”也過去一年多了,行業(yè)發(fā)展到哪了?接下來又會往哪卷?
卷技術(shù):考高分的太多,能干活的太少
國內(nèi)大模型行業(yè),今年明顯比去年“安靜”。去年是“阿貓阿狗”都來參與,幾百個(gè)大模型面世,今年除了幾個(gè)科技大廠和頭部的創(chuàng)業(yè)公司,其他大部分都消停了。
因?yàn)榇蠹野l(fā)現(xiàn),吆喝再大聲,落不了地都是白搭。
國內(nèi)的大模型不是太少,而是太多,尤其是吹牛的多。
“廠商總是宣傳大模型能干啥,卻不說不能干啥,客戶就有點(diǎn)被誤導(dǎo),以為大模型什么都能干,想著把原來的業(yè)務(wù)顛覆重做一遍,這不現(xiàn)實(shí)。”陳冉對「定焦」說。
回看過去一年大模型行業(yè)的發(fā)展,我們會發(fā)現(xiàn),最先打起來的不是價(jià)格戰(zhàn),甚至也不是技術(shù)戰(zhàn),而是營銷戰(zhàn)。
營銷是為了搶聲量。開發(fā)布會、刷榜、投廣告甚至碰瓷對手,能吸引更多關(guān)注,讓大家“覺得”自己領(lǐng)先。至于好不好用,真實(shí)的技術(shù)實(shí)力如何,可以后期再補(bǔ)課。
李友峰告訴「定焦」,現(xiàn)在國內(nèi)所有的所謂自研大模型,基本都是基于開源架構(gòu)改的,沒有真正意義上的原創(chuàng)和全自研。這意味著,大模型公司之間的技術(shù)差距并不大。
這也是為什么一家創(chuàng)業(yè)公司,能在兩三個(gè)月內(nèi)從零到一推出一款全新大模型。最好的例證是,去年李開復(fù)的零一萬物發(fā)布“Yi”系列模型,被指使用了LLaMA的架構(gòu),只對兩個(gè)張量進(jìn)行了重命名。
陳冉認(rèn)為,國內(nèi)大模型還沒有形成完整的創(chuàng)業(yè)生態(tài),大家一蜂窩沖上來,發(fā)布幾個(gè)模型證明不了什么。他以智能汽車行業(yè)早期做類比:大家都想造車,做輪胎的、造發(fā)動機(jī)的、甚至做雨刷的,都想親自下場,但最基本的電池、電控甚至輪子座椅都還沒準(zhǔn)備好。
單純從技術(shù)層面,時(shí)至今日,國內(nèi)沒有哪個(gè)團(tuán)隊(duì)處于絕對領(lǐng)先位置。
AI大模型有三大要素:算法、數(shù)據(jù)、算力,國內(nèi)廠商們過去一直在啃算法,大家發(fā)布模型,本質(zhì)上是發(fā)布一套算法和系統(tǒng)。大家比拼誰的算法更先進(jìn),誰的模型參數(shù)更大,推理效率更高。但現(xiàn)在越來越多從業(yè)者發(fā)現(xiàn),算法其實(shí)沒有壁壘。陳冉更是直言“大模型不值錢”。
“我認(rèn)為企業(yè)級的大模型沒意義,開源企業(yè)級就行了,因?yàn)樽钪匾氖菙?shù)據(jù)?!彼f。
數(shù)據(jù)是比算法更稀缺的資源。算法可以通過修改開源模型和人海戰(zhàn)術(shù)迭代,算力可以通過砸錢買卡獲得,但優(yōu)質(zhì)的數(shù)據(jù)沒有渠道售賣,花錢不一定能買來。
訓(xùn)練模型跟訓(xùn)練學(xué)生類似,數(shù)據(jù)相當(dāng)于教材或教育資源,過程就叫預(yù)訓(xùn)練。偏遠(yuǎn)山區(qū)的孩子和一線城市的孩子,從小獲得的教育資源不同,訓(xùn)練過程不同,最后高考考上重點(diǎn)大學(xué)的概率也必然不同。某種意義上,擁有優(yōu)質(zhì)數(shù)據(jù),預(yù)訓(xùn)練就成功了一半。
過去一年,行業(yè)里評估一個(gè)大模型好壞的標(biāo)準(zhǔn),是通過測評,相當(dāng)于考試。既然是考試,就有作弊的空間,或者可以通過刷題得高分。這就導(dǎo)致,很多大模型其實(shí)是“應(yīng)試教育”的產(chǎn)物——參數(shù)大、得分高、性能強(qiáng),但沒啥實(shí)踐能力。
李友峰認(rèn)為,算法有很大局限性,如果脫離具體的應(yīng)用場景,算法沒有意義?!氨热缒P偷膮?shù)大,計(jì)算能力很強(qiáng),做數(shù)學(xué)題也許表現(xiàn)很好,但這并不意味著它能在實(shí)際業(yè)務(wù)里產(chǎn)生價(jià)值?!?/p>
今年以來,大模型拼參數(shù)的風(fēng)氣有所改觀,各種雜七雜八的“野榜”也有所收斂,說明公眾不好糊弄了。問題是,如果不比參數(shù),大家還能比啥?
卷價(jià)格:C端不敢收,B端收不起
一個(gè)模型或一個(gè)項(xiàng)目要證明自己有價(jià)值,最直接的方法是從市場上賺到錢。今年以來,越來越多AI創(chuàng)業(yè)者和投資人,開始將商業(yè)模式掛在嘴邊。
大模型行業(yè)的商業(yè)化有兩大類——To C和To B,即向個(gè)人用戶收費(fèi),和向企業(yè)(包括政府、開發(fā)者)收費(fèi)。去年行業(yè)達(dá)成共識,To C收費(fèi)很難,先從B端入手。
B端企業(yè)是大模型的最大客戶。一家做系統(tǒng)集成公司的員工曾對「定焦」說,他們很早就接入了百度的千帆大模型平臺,擁抱大模型的意愿很強(qiáng),不過他們不是因?yàn)槟P托Ч枚褂?,僅僅是怕被AI落下。而一旦模型收費(fèi),他們就得再考慮考慮了。
這代表了很多企業(yè)的心態(tài):能白嫖就白嫖,付費(fèi)就必須得看到效果。用陳冉的話說:“讓客戶花錢,就得讓他看到成倍的增效,不見兔子不撒鷹?!?/p>
李友峰認(rèn)為,真正用大模型的企業(yè),都關(guān)注業(yè)務(wù)數(shù)據(jù)而不是算法指標(biāo)?!氨热甾D(zhuǎn)化率、點(diǎn)擊率和其他關(guān)鍵指標(biāo),分別提升了幾個(gè)百分點(diǎn),如果不能做到這些,即便算法有1萬億參數(shù),價(jià)格低至1毛錢,客戶也不會買單?!?/p>
5月的這一波價(jià)格戰(zhàn),大模型API的調(diào)用價(jià)格直降超過90%。以字節(jié)跳動、阿里、百度為例,每百萬token推理輸入量的價(jià)格,降到了8毛、5毛和免費(fèi)。
然而這更多被市場解讀為營銷行為,有點(diǎn)清倉大甩賣的意味。
Lepton AI創(chuàng)始人、阿里原副總裁賈揚(yáng)清說:“今天不是說API貴才沒有人用,而是因?yàn)?,企業(yè)首先得搞清楚到底怎么用起來產(chǎn)生業(yè)務(wù)價(jià)值,否則的話,再便宜也是浪費(fèi)?!?/p>
出門問問創(chuàng)始人李志飛更是直言:“將API價(jià)格降到無限逼近零,說明OpenAI對消費(fèi)者收費(fèi)和對企業(yè)收費(fèi)的兩種商業(yè)模式在中國競爭環(huán)境下都不可持續(xù)?!?/p>
百度是C端B端兩手抓,其中面向C端的文心一言4.0是付費(fèi)版,連續(xù)包月49.9元,百度一直沒有公布文心一言的付費(fèi)率數(shù)據(jù)。據(jù)AI產(chǎn)品榜的數(shù)據(jù),后起之秀月之暗面的Kimi,網(wǎng)頁版的訪問量在4月超過了文心一言。Kimi沒有選擇用收會員費(fèi)的形式“自廢武功”,而是非常另類地推出了打賞功能,非強(qiáng)制,在高峰期算力不足時(shí)可獲得優(yōu)先使用的權(quán)益。
這還是C端大模型的頭部選手,由此可見收費(fèi)之難。歸根到底,當(dāng)前的大模型產(chǎn)品還不夠好用,不是那么剛需,需要給人們一個(gè)付費(fèi)的理由。
AI初創(chuàng)公司語核拿到了奇績創(chuàng)壇的投資,它一開始的產(chǎn)品都是面向C端,解決各種實(shí)用需求。創(chuàng)始人池光耀告訴「定焦」,其中一款主力產(chǎn)品CopyAsk,既能免費(fèi)使用,也可以付費(fèi)解鎖更多功能,但超過99%的用戶在白嫖免費(fèi)額度,收上來的錢很難養(yǎng)活公司。
今年初,語核進(jìn)行轉(zhuǎn)型,開始做面向B端的Agent產(chǎn)品,目前已經(jīng)拿下兩個(gè)訂單,“客戶付費(fèi)意愿還不錯(cuò),現(xiàn)在有錢賺了蠻好?!辈贿^,要徹底跑通某個(gè)垂類的B端業(yè)務(wù),還需要一段時(shí)間探索。
有極少部分公司,抓住了市場需求,并打通了業(yè)務(wù)場景,率先賺到錢。
陳冉想做生態(tài),他的OpenCSG線上做社區(qū),線下賣軟件CSGHub和Starship,客戶以B端企業(yè)和D端開發(fā)者為主,已探索出應(yīng)用分傭和用戶訂閱兩個(gè)變現(xiàn)模式,未來還可以增加算力分傭模式。他告訴「定焦」,公司今年預(yù)期營收幾千萬,盈利大幾百萬。
卷應(yīng)用:爆款應(yīng)用未出現(xiàn),產(chǎn)品和工程落地難
大模型發(fā)展到今天,從業(yè)者一方面想辦法賺錢,同時(shí)也在等待爆款應(yīng)用出現(xiàn)。之前我們見證了妙鴨相機(jī)、Kimi、Suno等應(yīng)用的走紅,但這都還稱不上爆款。而只有出現(xiàn)爆款,才能說明AI不是紙上談兵。
大模型廠商打響API價(jià)格戰(zhàn)之時(shí),有人不以為然,有人嗤之以鼻,也有人格外興奮。
作為一個(gè)獨(dú)立應(yīng)用開發(fā)者,池光耀認(rèn)為API降價(jià)是巨大利好。API降價(jià)之前,他每個(gè)月要花200元左右的預(yù)算在模型調(diào)試上,現(xiàn)在他調(diào)用降價(jià)之后的深度求索DeepSeek-V2模型,半個(gè)多月只花了1.11元。
他去年開發(fā)了好幾款應(yīng)用,受限于高頻調(diào)用帶來的高額推理成本,而用戶又不愿意付費(fèi),導(dǎo)致至今產(chǎn)品沒有推出去。現(xiàn)在他迫不及待想讓這些應(yīng)用“跑”起來,“要不是現(xiàn)在手上有B端的單子推不掉,我就直接去做C端產(chǎn)品了?!蓖瑫r(shí),那些以前因?yàn)樨?fù)擔(dān)不起API調(diào)用費(fèi)而做不了的B端訂單,現(xiàn)在也可以做了。
他認(rèn)為,接下來幾個(gè)月,會有海量關(guān)于大模型的應(yīng)用場景的探索,很可能會帶來應(yīng)用場景的大幅增加。一些過去需要依靠人工或工程化的手段判斷的高頻的、低邏輯需求的,且延時(shí)不敏感的應(yīng)用場景,或許可被免費(fèi)的大模型API取代掉。
大模型落地,一定是從場景開始突破。無論大模型API是否降價(jià),找場景都會成為下半年的共識。
李友峰認(rèn)為,下半年出圈的應(yīng)用會越來越多,找到合適的場景,在規(guī)模產(chǎn)出的基礎(chǔ)上覆蓋規(guī)模的成本?!按蠹覒?yīng)該拼命去找價(jià)值,而不是卷價(jià)格?!?/p>
目前的AI應(yīng)用中,有兩類已經(jīng)顯現(xiàn)出了價(jià)值,并獲得了不錯(cuò)的反饋。
一類是提效,Kimi幫助職場打工人搜索資料、整理文獻(xiàn);造物云給品牌用AI做產(chǎn)品設(shè)計(jì)和營銷物料,創(chuàng)始人邱懿武告訴「定焦」,他們用AI給某咖啡品牌做了2000個(gè)杯子的設(shè)計(jì)方案,不算模型投入,算力成本只要10塊錢。
另一類是娛樂,比如Suno這種AI寫歌軟件,以及很多創(chuàng)業(yè)公司在做的AI陪伴、角色扮演。
目前行業(yè)里普遍認(rèn)為,Agent AI是下半年行業(yè)的重點(diǎn),國內(nèi)外從業(yè)者都在往這方面卷。
隨著對產(chǎn)業(yè)的探索加深,李友峰發(fā)現(xiàn),AI真正難的是產(chǎn)品和工程(指構(gòu)建、開發(fā)和部署大型機(jī)器學(xué)習(xí)模型的一系列技術(shù)和實(shí)踐)?!安粩嘧尨竽P妥呦虍a(chǎn)品、工程、商業(yè)、產(chǎn)業(yè),是中國創(chuàng)業(yè)公司成長的唯一路徑?!?/p>
一旦工程問題解決了,模型反而不重要了,用戶在使用產(chǎn)品的過程中,不關(guān)心底層用的是哪個(gè)模型,自研占多大比重,效果好比說啥都強(qiáng)。
現(xiàn)在的情況是,大模型在具體應(yīng)用時(shí),還不能百分之百保證效果。以大語言模型為例,“胡說八道”的毛病一直沒有克服?!斑@種不可控的狀態(tài),很難讓它在生產(chǎn)中發(fā)揮很大作用,還需要時(shí)間打磨。對于大部分B端客戶,如何跟上社區(qū)和大模型生態(tài)發(fā)展和進(jìn)化才是應(yīng)該關(guān)注的?!?陳冉說。
他認(rèn)為,之前行業(yè)對大模型過于樂觀,總有“訓(xùn)練一個(gè)大模型改變世界”這種不切實(shí)際的幻想,事實(shí)上大模型還沒有真正形成生產(chǎn)力。在AI 1.0到AI 2.0之間,還有一個(gè)過渡的過程。“就是如何通過AI先賦能已有體系,而不是全盤否認(rèn)?!?/p>
在向上爬的過程里,必然有一些公司會摔下去被淘汰,尤其是那些還不具備造血能力的公司。斯坦福大學(xué)以人為本人工智能研究院在一份報(bào)告中稱,2023年全球?qū)θ斯ぶ悄艿耐顿Y連續(xù)第二年下降。
在國內(nèi),以阿里、百度為代表的科技大廠還在持續(xù)投資,比如阿里就耗資8億美金,投資了Kimi的母公司月之暗面,占股36%,市場傳聞騰訊也在洽談跟進(jìn)。
然而,對于推動原始創(chuàng)新和產(chǎn)品落地,這些大廠究竟發(fā)揮了多大作用、扮演著什么角色,我們越來越難以評估。大廠一方面自己做大模型,同時(shí)又投資了市面上幾乎所有的明星創(chuàng)業(yè)公司,用股權(quán)把對手綁定。甚至這一波被開發(fā)者稱贊的API降價(jià),也不是由大廠發(fā)起,而是一個(gè)叫幻方量化的私募巨頭,以及創(chuàng)業(yè)公司智譜AI帶頭,隨后的大廠跟進(jìn),充滿了被動和營銷的味道。
下半年,行業(yè)依然會很卷,畢竟國內(nèi)大模型從一開始就是競爭驅(qū)動的。也許,我們能卷出來幾個(gè)贏家,爆款應(yīng)用也不遠(yuǎn)了。
應(yīng)受訪者要求,李友峰為化名。