界面新聞?dòng)浾?| 肖芳
界面新聞編輯 | 文姝琪
DeepSeek走紅數(shù)月之后,字節(jié)跳動(dòng)終于對(duì)外發(fā)布自研的深度思考模型。
4月17日,豆包1.5?深度思考模型由火山引擎對(duì)外發(fā)布,面向企業(yè)市場提供服務(wù)。技術(shù)報(bào)告顯示,豆包深度思考模型采用MoE架構(gòu),總參數(shù)為200B,激活參數(shù)為20B。相比之下,同樣采用MoE架構(gòu)的DeepSeek-V3模型總參數(shù)為671B,激活參數(shù)為37B。
豆包1.5?深度思考模型的參數(shù)實(shí)現(xiàn)更小,但從評(píng)測結(jié)果來看,其能力不遜于頂尖模型的效果。其中,豆包1.5?深度思考模型在專業(yè)領(lǐng)域的推理任務(wù)中表現(xiàn)出色,數(shù)學(xué)推理AIME 2024測試得分追平OpenAI o3-mini-high,編程競賽和科學(xué)推理測試成績也接近o1,在編程競賽Codeforces pass@8得分接近 OpenAI o1,在科學(xué)推理GPQA 得分接近o3-mini。
同時(shí),基于高效算法和高性能推理系統(tǒng),豆包模型API服務(wù)在保障高并發(fā)的同時(shí),延遲低至20毫秒。
豆包深度思考模型還上線了多模態(tài)版,具備視覺推理能力,能像人類一樣對(duì)看到的事物進(jìn)行聯(lián)想和思考,拓展了智能推理的應(yīng)用邊界。比如,這款模型可以看懂復(fù)雜的企業(yè)項(xiàng)目管理流程圖表,快速定位到關(guān)鍵信息,并能夠嚴(yán)格按照流程圖,回答客戶的問題。在分析航拍圖時(shí),能結(jié)合地貌特征判斷區(qū)域開發(fā)可行性。
從現(xiàn)場演示來看,上傳一份可口可樂財(cái)報(bào),豆包深度思考模型能夠提取財(cái)報(bào)中不同區(qū)域的營收、增長等關(guān)鍵數(shù)據(jù)指標(biāo),并能夠結(jié)合這些數(shù)據(jù)分析不同區(qū)域數(shù)據(jù)表現(xiàn)差異的原因;上傳一份西餐廳菜單圖片,并給出點(diǎn)餐需求和預(yù)算指令,豆包深度思考模型能夠推理不同菜品是否符合需求,從而按照開胃菜、主菜、配菜、甜點(diǎn)搭配推薦菜品。
去年5月,字節(jié)跳動(dòng)首次對(duì)外發(fā)布豆包系列模型。一年以來,豆包系列模型的數(shù)量在不斷增加,模型的能力也在持續(xù)提升。豆包多款主力模型的發(fā)布都晚于同行,但還是有其市場認(rèn)可度。
據(jù)火山引擎披露,截至2025年3月底,豆包大模型日均tokens調(diào)用量已達(dá)到12.7萬億,較去年5月發(fā)布時(shí)增長上百倍?;鹕揭婵偛米T待在接受界面新聞等媒體采訪時(shí)透露,從長期來看,豆包大模型日均tokens調(diào)用量百倍甚至更高的增長是有可能的。但未來兩三年內(nèi),最關(guān)鍵的取決于模型是否有重大突破。
去年,豆包大模型首次對(duì)外發(fā)布,火山引擎把豆包大模型的定價(jià)降低了一個(gè)數(shù)量級(jí)。其中,豆包通用模型pro-32k版,模型推理輸入價(jià)格不足市面上同規(guī)格模型的定價(jià)的1%;豆包通用模型pro-128k版,模型推理輸入價(jià)格比行業(yè)價(jià)格低95.8%。在譚待看來,基礎(chǔ)信息處理能力的提升以及成本的下降讓豆包大模型從去年到今年獲得了快速增長,今年模型在深度思考能力上的突破又帶來新的增長。
火山引擎也在遵循相同的邏輯思考大模型未來的增長點(diǎn)。譚待認(rèn)為,視覺推理能力以及Agent相關(guān)技術(shù)能否獲得重大突破,是未來幾年大模型增長的關(guān)鍵節(jié)點(diǎn)。
此次發(fā)布豆包深度思考模型,火山引擎正是在押寶這兩個(gè)新的機(jī)會(huì)。因?yàn)楝F(xiàn)實(shí)世界中的很多應(yīng)用場景是靠視覺驅(qū)動(dòng)的,豆包深度思考模型具備了視覺推理能力,便可以在更多場景助力企業(yè)進(jìn)行落地應(yīng)用。
火山引擎更大的野心在于爭奪Agent市場的機(jī)會(huì)。2025年被業(yè)界視為“Agent智能體元年”。譚待認(rèn)為,在多模態(tài)深度思考模型的基礎(chǔ)上,Agent需要良好的架構(gòu)和工具,去操作數(shù)字世界和物理世界。同時(shí),模型的推理成本和延遲要持續(xù)降低,才能推動(dòng)應(yīng)用普惠。
為此,火山引擎宣布推出OS Agent解決方案,并演示了由Agent操作瀏覽器,搜索商品頁,實(shí)現(xiàn)iPhone比價(jià)的任務(wù),甚至由Agent在遠(yuǎn)程計(jì)算機(jī)上用剪映進(jìn)行視頻編輯、配樂。
據(jù)發(fā)布會(huì)現(xiàn)場的介紹,OS Agent解決方案包含豆包UI-TARS模型,以及veFaaS函數(shù)服務(wù)、云服務(wù)器、云手機(jī)等產(chǎn)品,實(shí)現(xiàn)對(duì)代碼、瀏覽器、電腦、手機(jī)以及其他Agent的操作。其中,豆包UI-TARS模型將屏幕視覺理解、邏輯推理、界面元素定位和操作整合在一起,突破傳統(tǒng)自動(dòng)化工具依賴預(yù)設(shè)規(guī)則的局限性,為Agent的智能交互提供了更接近人類操作的模型基礎(chǔ)。
好的模型和工具能夠加速Agent的落地,但Agent也會(huì)帶來更大量的模型推理消耗。面對(duì)大規(guī)模推理需求,火山引擎還有AI云原生ServingKit推理套件,讓模型部署更快、推理成本更低,GPU消耗相比傳統(tǒng)方案降低80%。
譚待在接受媒體采訪時(shí)表示,聊天和信息處理只是AI應(yīng)用的一小部分,AI要真正為各行各業(yè)帶來變革,Agent是必經(jīng)之路。對(duì)于垂直類Agent,火山引擎會(huì)基于自身優(yōu)勢(shì)領(lǐng)域進(jìn)行探索;對(duì)于通用型Agent,火山引擎更重要的是搭建好基礎(chǔ)框架、提供好用的工具。
IDC發(fā)布的《中國公有云大模型服務(wù)市場格局分析,1Q25》顯示,火山引擎以46.4%的市場份額位居第一。
豆包大模型去年率先降價(jià)對(duì)火山引擎的增長提供了積極助力,火山引擎也希望通過Agent應(yīng)用增長的機(jī)會(huì)獲得更大的市場份額。譚待表示,每一次大的模型突破都肯定能激發(fā)一次大的變化,他對(duì)未來2年內(nèi)豆包大模型的調(diào)用量能否再翻100倍保持謹(jǐn)慎樂觀。