界面新聞?dòng)浾?| 伍洋宇
界面新聞編輯 | 文姝琪
從不久前Manus刷屏互聯(lián)網(wǎng)開始,就不斷有聲音議論智譜AI的Agent會(huì)如何選擇下一個(gè)迭代方向。
在此之前,智譜AI是國(guó)內(nèi)第一家押注并發(fā)力AI Agent的“AI六小虎”,其AutoGLM也憑借“人類歷史上第一個(gè)AI發(fā)出的紅包”獲得了一波熱度。
再次舉辦發(fā)布會(huì),智譜的確把重心放在了AI Agent上。3月31日,智譜AI在2025中關(guān)村論壇上正式發(fā)布“AutoGLM沉思”,同時(shí)具備深度研究能力(Deep Research)和實(shí)際操作(Operator),可自主打開并瀏覽網(wǎng)頁(yè),完成從數(shù)據(jù)檢索、分析到生成報(bào)告。
簡(jiǎn)而言之,AutoGLM沉思約等于AutoGLM與Deep Research的結(jié)合。
Deep Research起初是由谷歌在去年底上線,但這項(xiàng)“Gemini with Deep Research”功能受限于Gemini當(dāng)時(shí)的模型能力,并沒(méi)有發(fā)揮出最好功效,反倒由OpenAI隨后推出的Deep Research奪走了用戶的關(guān)注與支持。
盡管OpenAI只向收費(fèi)200美元/月的ChatGPT Pro用戶開放,但在o1、o3等模型支持下,Deep Research仍然迅速成為了這個(gè)付費(fèi)模式下的核心產(chǎn)品。
智譜AutoGLM沉思是國(guó)內(nèi)第一個(gè)跟進(jìn)深度研究能力的Agent產(chǎn)品,并且做到了免費(fèi)、不限量。在演示視頻中,它展示了在法律、教育、金融等領(lǐng)域的自主操作、研究及報(bào)告生成能力。
遇到模型的知識(shí)盲區(qū)時(shí),該Agent除了搜索網(wǎng)頁(yè),也會(huì)自主打開瀏覽器等頁(yè)面,基于GUI(Graphical User Interface,圖形用戶界面)閱讀能力在小紅書等內(nèi)容App讀取信息。
在模型底座上,智譜表示,AutoGLM沉思接入了智譜推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中,GLM-Z1-Air性能對(duì)標(biāo)DeepSeek-R1,速度最高可提升8倍,價(jià)格為后者的1/30。
具體技術(shù)演進(jìn)路徑方面,智譜表示AutoGLM沉思經(jīng)過(guò)了“GLM-4基座模型-GLM-Z1推理模型-GLM-Z1-Rumination沉思模型-AutoGLM模型”。其中核心鏈路的模型和技術(shù),智譜稱將于4月14日正式開源,并于近期陸續(xù)上線。
需要指出的是,智譜當(dāng)前十分強(qiáng)調(diào)AutoGLM沉思的初階屬性。不僅是智譜AI CEO張鵬在現(xiàn)場(chǎng)表示這是一個(gè)預(yù)覽版本,核心支持Research場(chǎng)景。智譜AI AutoGLM技術(shù)負(fù)責(zé)人劉瀟在介紹產(chǎn)品時(shí),也指出其現(xiàn)階段產(chǎn)品還有諸多不足,并在演示視頻中表示它是在“Entry Level(入門級(jí)別)”處理很多繁雜的任務(wù)。
在功能實(shí)現(xiàn)上,它與OpenAI的Deep Research也確實(shí)存在差距。例如,在實(shí)測(cè)中,當(dāng)AutoGLM沉思處于生成任務(wù)狀態(tài)時(shí),它無(wú)法進(jìn)行多窗口對(duì)話,以及在任務(wù)發(fā)布階段,它不會(huì)像OpenAI一樣對(duì)用戶進(jìn)行反向詢問(wèn),以豐富研究框架并界定結(jié)論邊界。
這意味著AutoGLM沉思在產(chǎn)品功能層面還有更多優(yōu)化空間。
不過(guò),張鵬此次強(qiáng)調(diào)了智譜對(duì)于AI Agent的重視與信心?!爸亲V很早便布局AI Agent,甚至早過(guò)OpenAI和Anthropic?!睆堸i說(shuō),智譜率先提出了Phone use(AutoGLM),也幾乎與Anthropic在同一時(shí)間發(fā)布了Computer use。
在演進(jìn)方向上,張鵬從技術(shù)角度指出,不僅是模型訓(xùn)練存在Scaling Law(規(guī)模法則),Agent也存在類似法則?!巴ㄟ^(guò)擴(kuò)展訓(xùn)練時(shí)的 inference compute(推理時(shí)計(jì)算),我們觀察到Agent展現(xiàn)出了更強(qiáng)的性能。”
他解釋稱,這背后是其自進(jìn)化在線課程強(qiáng)化學(xué)習(xí)算法框架WebRL,通過(guò)設(shè)計(jì)由易到難的任務(wù)序列,逐步引導(dǎo)模型從簡(jiǎn)單場(chǎng)景向復(fù)雜場(chǎng)景過(guò)渡學(xué)習(xí),從而提升訓(xùn)練效率和最終性能。
該方法模擬人類學(xué)習(xí)過(guò)程,通過(guò)動(dòng)態(tài)調(diào)整任務(wù)難度,幫助模型積累基礎(chǔ)能力后再挑戰(zhàn)高難度任務(wù),可以避免直接處理復(fù)雜問(wèn)題時(shí)的訓(xùn)練不穩(wěn)定。
“2025年將會(huì)是Agent應(yīng)用的元年,智譜也將深度參與這一場(chǎng)浪潮?!睆堸i說(shuō)。
目前來(lái)看,綜合已有模型性能水平、研究實(shí)力、產(chǎn)品化能力等多方面因素,智譜是當(dāng)前國(guó)內(nèi)在AI Agent領(lǐng)域跑在前列的創(chuàng)業(yè)公司之一。但Manus效應(yīng)在前,在外接非自研模型的基礎(chǔ)上,出色的產(chǎn)品設(shè)計(jì)及工程化能力也可能創(chuàng)造出驚艷的產(chǎn)品效果,這或許是智譜AutoGLM接下來(lái)面臨的最大挑戰(zhàn)。