界面新聞?dòng)浾?| 肖芳
界面新聞編輯 | 文姝琪
界面新聞從多個(gè)知情人士處獲悉,豆包大模型去年大幅降價(jià)后,毛利率依然為正。其中,字節(jié)跳動(dòng)最新推出的豆包大模型1.5,在推理成本優(yōu)化上取得進(jìn)一步突破。在火山引擎上售賣API的Doubao-1.5-pro,毛利率仍能達(dá)到50%。
去年5月,字節(jié)跳動(dòng)正式對(duì)外發(fā)布豆包大模型。其中,豆包通用模型pro-32k版,模型推理輸入價(jià)格僅每百萬(wàn)tokens 0.8元,而當(dāng)時(shí)市場(chǎng)上同規(guī)格模型的定價(jià)一般為每百萬(wàn)tokens 120元,是豆包模型價(jià)格的150倍。
豆包大模型降價(jià)之后,阿里云通義大模型等產(chǎn)品也相繼調(diào)低了價(jià)格。市場(chǎng)上也一直有聲音質(zhì)疑價(jià)格大幅降低之后,大模型是否還能賺錢。上述知情人士表示,現(xiàn)在看來(lái),這種擔(dān)心有些多慮了。
火山引擎總裁譚待此前接受界面新聞采訪時(shí),也曾經(jīng)談及過(guò)模型大幅降價(jià)的問(wèn)題。在他看來(lái),使用量足夠大,才能打磨出好模型,也能大幅降低模型推理的單位成本。“大模型降價(jià),不能只提供低價(jià)的輕量化版本,主力模型和最先進(jìn)的模型也要夠便宜,才能真正滿足企業(yè)的復(fù)雜業(yè)務(wù)場(chǎng)景需求,充分驗(yàn)證大模型的應(yīng)用價(jià)值,從而催化出超越現(xiàn)有產(chǎn)品和組織模式的創(chuàng)新。”
從過(guò)去一年的發(fā)展來(lái)看,豆包通用大模型在市場(chǎng)上的表現(xiàn)一定程度上驗(yàn)證了譚待的判斷。
一方面,豆包大模型的調(diào)用量在快速增長(zhǎng)。字節(jié)跳動(dòng)對(duì)外公布的數(shù)據(jù)顯示,截至去年12月中旬,豆包通用模型的日均tokens使用量已超過(guò)4萬(wàn)億,較首次發(fā)布時(shí)增長(zhǎng)了33倍。
另一方面,豆包大模型的能力快速提升,但成本仍在持續(xù)降低。1月22日,字節(jié)跳動(dòng)發(fā)布了豆包大模型1.5Pro,性能比之前版本顯著增強(qiáng),多項(xiàng)基準(zhǔn)測(cè)試甚至超過(guò)GPT4o,推理成本卻大幅降低。據(jù)字節(jié)跳動(dòng)官方介紹,豆包1.5采用大規(guī)模稀疏MoE架構(gòu),性能等效7倍激活參數(shù)的稠密模型,遠(yuǎn)高于業(yè)界常規(guī)的3倍杠桿。
界面新聞查詢火山引擎官網(wǎng)發(fā)現(xiàn),Doubao-1.5-pro-32k的百萬(wàn)tokens輸入價(jià)格仍為0.8元,命中緩存為0.16元,輸出價(jià)格為2元;輕量化版本Doubao-1.5-lite-32k的百萬(wàn)tokens輸入價(jià)格0.3元,命中緩存0.06元,輸出價(jià)格0.6元。兩款模型價(jià)格在業(yè)界同級(jí)別最低。
新模型在價(jià)格保持不變的同時(shí),隨著推理成本持續(xù)優(yōu)化,毛利率也顯著增加。一位接近火山引擎的知情人士透露,豆包大模型API之前只能說(shuō)是有合理毛利率,1.5版的毛利則能達(dá)到50%的可觀水平。
大模型應(yīng)用正在向各行各業(yè)加速滲透。據(jù)字節(jié)跳動(dòng)方面此前公布的信息,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入到多家手機(jī)、PC等智能終端,覆蓋終端設(shè)備約3億臺(tái),來(lái)自智能終端的豆包大模型調(diào)用量在半年時(shí)間內(nèi)增長(zhǎng)100倍。最近幾個(gè)月,豆包大模型在信息處理場(chǎng)景的調(diào)用量增長(zhǎng)了39倍,客服與銷售場(chǎng)景增長(zhǎng)16倍,硬件終端場(chǎng)景增長(zhǎng)13倍,AI工具場(chǎng)景增長(zhǎng)9倍,學(xué)習(xí)教育等場(chǎng)景也有大幅增長(zhǎng)。
但上述知情人士透露,由于研發(fā)投入巨大,字節(jié)的大模型業(yè)務(wù)仍是虧損狀態(tài)。只有持續(xù)擴(kuò)大應(yīng)用側(cè)的模型調(diào)用規(guī)模,才能長(zhǎng)期攤銷掉研發(fā)成本。
界面新聞向字節(jié)跳動(dòng)方面求證上述信息,截至發(fā)稿,對(duì)方暫未回應(yīng)。