界面新聞?dòng)浾?| 崔鵬
界面新聞編輯 | 文姝琪
5月30日,騰訊推出基于混元大模型的App“騰訊元寶”,主要面向工作場(chǎng)景,提供AI搜索、AI總結(jié)和AI寫作等核心能力,同時(shí)面向日常生活場(chǎng)景新增創(chuàng)建個(gè)人智能體的能力。
從去年底至今,眾多頭部大模型廠商和創(chuàng)業(yè)公司都推出了面向C端的App應(yīng)用,騰訊的入局時(shí)間并不算早,考慮到騰訊擁有國(guó)內(nèi)數(shù)一數(shù)二的C端用戶體量,這個(gè)決定讓人有些意外。
騰訊云副總裁、騰訊混元大模型負(fù)責(zé)人劉煜宏在采訪中給出了官方的態(tài)度:“騰訊做大模型不爭(zhēng)一時(shí)之先?!?
因?yàn)榘凑镇v訊的估算,目前國(guó)內(nèi)大模型應(yīng)用日活躍用戶滲透率還不到1%,比同行慢幾個(gè)月推出App也沒什么影響。
在混元大模型發(fā)布至今的九個(gè)月時(shí)間里,騰訊在技術(shù)架構(gòu)上做了比較大的升級(jí),從最初的通用專家稠密大模型,變成了如今的MoE混合專家架構(gòu),打開了混元大模型參數(shù)量的天花板。
“從測(cè)試數(shù)據(jù)看,能力提升超過50%”,劉煜宏介紹稱,升級(jí)之后,騰訊混元大模型的參數(shù)規(guī)模已從千億提升至萬億,預(yù)訓(xùn)練語料從萬億提升至7萬億tokens。
在騰訊元寶上線之后,絕大多數(shù)頭部大模型產(chǎn)品都已經(jīng)推出了獨(dú)立的C端應(yīng)用,業(yè)界推動(dòng)AI落地的共識(shí)也進(jìn)入了新的階段。
雖然市面上與大模型相關(guān)的AI應(yīng)用有很多,而且每家產(chǎn)品都說自己有幾十萬或者幾百萬DAU,但劉煜宏認(rèn)為,在去重之后,這些應(yīng)用合并到一起的DAU也就幾百萬,對(duì)比國(guó)內(nèi)的12億移動(dòng)互聯(lián)網(wǎng)用戶規(guī)模來說,用戶滲透率還不到1%。
看似火熱的技術(shù)和產(chǎn)品,滲透率為何如此之低?
他給出了兩個(gè)原因:一個(gè)是大模型從ChatGPT 3.5問世開始大火,至今也就不到兩年時(shí)間,大模型技術(shù)的發(fā)展處于早期階段,產(chǎn)品能力不足,距離企業(yè)和用戶需求又很遠(yuǎn),導(dǎo)致大模型的落地能力較弱。
另一個(gè)原因是公眾對(duì)大模型的認(rèn)知度不夠。雖然很多企業(yè)、開發(fā)者和用戶都知道大模型很厲害,但具體怎么用它,大部分人都不知道。
騰訊與很多企業(yè)的CTO或技術(shù)負(fù)責(zé)人都聊過大模型的應(yīng)用場(chǎng)景,很多人的第一反應(yīng)還是智能客服,應(yīng)用落地的探索路徑很窄,說明在用戶教育層面還有很長(zhǎng)的路要走。
所以劉煜宏認(rèn)為就算騰訊元寶的發(fā)布時(shí)間晚了幾個(gè)月,拉長(zhǎng)時(shí)間看也不是什么重要的事情,“(大模型應(yīng)用的)滲透率不到1%,先發(fā)優(yōu)勢(shì)也就百分之零點(diǎn)幾,這個(gè)優(yōu)勢(shì)微不足道。”
騰訊不著急的心態(tài)從“打榜”這件事上也能體現(xiàn)出來。
“我們看到很多榜單,(有些模型)天天刷榜,但是對(duì)用戶有用么?”騰訊并不太關(guān)注榜單,也不太參與評(píng)測(cè),很多時(shí)候“看到媒體報(bào)道才知道我們被評(píng)測(cè)了”,劉煜宏表示。
今年以來,字節(jié)跳動(dòng)旗下的豆包以及月之暗面的Kimi等應(yīng)用,都投入不少資金用于買量,進(jìn)行付費(fèi)推廣以及廣告投放。
劉煜宏對(duì)此表態(tài)稱,買量營(yíng)銷不是騰訊元寶現(xiàn)階段的主要目標(biāo),“甚至對(duì)標(biāo)競(jìng)品拉高整體規(guī)模也不是我們現(xiàn)階段的目標(biāo)。”
同樣,因?yàn)楫?dāng)下大模型應(yīng)用的滲透率非常低,現(xiàn)階段去談?wù)麄€(gè)行業(yè)的商業(yè)化也為時(shí)尚早,“還是個(gè)摸索的階段?!?/span>
未來一段時(shí)間,騰訊元寶的重心會(huì)放在串聯(lián)騰訊內(nèi)部的核心產(chǎn)品(比如微信公眾號(hào)和小程序)通路,以及優(yōu)化更多垂直行業(yè)(法律、金融和醫(yī)療等)的大模型應(yīng)用體驗(yàn)。
因?yàn)轵v訊元寶主要面向工作場(chǎng)景,所以在信息獲取、處理和生產(chǎn)三個(gè)環(huán)節(jié)進(jìn)行了針對(duì)性優(yōu)化。
在AI搜索方面,騰訊元寶接入了微信搜一搜、搜狗搜索等搜索引擎,同時(shí)內(nèi)容覆蓋微信公眾號(hào)等信源。
在AI總結(jié)方面,騰訊元寶可上傳最多10個(gè)PDF、word、txt等多格式文檔,一次性解析多個(gè)微信公眾號(hào)鏈接、網(wǎng)址,支持256K的原生窗口上下文,相當(dāng)于一本《三國(guó)演義》或英文版《哈利波特》全集。
很多大模型都說自己有千萬文字的長(zhǎng)文能力,劉煜宏認(rèn)為這個(gè)技術(shù)上不是問題,騰訊混元大模型也支持,但用戶沒什么需求,“誰會(huì)扔一千萬的文字給它,256K長(zhǎng)文足以支持99%的需求。”
在AI寫作方面,元寶不僅支持多輪問答,還能夠?qū)?duì)話的內(nèi)容整理成報(bào)告,按照要求進(jìn)行結(jié)構(gòu)化輸出。
此外,目前騰訊元寶還提供了AI頭像、口語陪練和智能翻譯等生活場(chǎng)景中的常見應(yīng)用,它們大多由第三方開發(fā)者完成。
根據(jù)公開信息,騰訊內(nèi)部有超600個(gè)業(yè)務(wù)及場(chǎng)景都已經(jīng)接入混元大模型,其中包括騰訊廣告、微信讀書、騰訊會(huì)議、騰訊文檔和騰訊客服等都已經(jīng)基于混元進(jìn)行過升級(jí),內(nèi)部業(yè)務(wù)每日調(diào)用次數(shù)已經(jīng)超過2億次。
這被劉煜宏稱為混元大模型最大的優(yōu)勢(shì)之一。他認(rèn)為騰訊的產(chǎn)品覆蓋領(lǐng)域非常全面,大模型在內(nèi)部落地時(shí)應(yīng)用的場(chǎng)景也很廣泛,其它產(chǎn)品無法遇到的問題,混元都已經(jīng)遇到并且解決了。
混元底層的騰訊自研Angel分布式系統(tǒng)架構(gòu),也被視為騰訊的優(yōu)勢(shì)之一。
與行業(yè)內(nèi)很多大模型產(chǎn)品相比,“騰訊的產(chǎn)品工程能力比較強(qiáng),技術(shù)演進(jìn)比較早”,劉煜宏表示,“同等情況下我們的成本更低、表現(xiàn)更好?!?/span>
此外,在5月中旬,騰訊剛推出一站式智能體創(chuàng)作與分發(fā)平臺(tái)“騰訊元器”,主要面向企業(yè)用戶和開發(fā)者群體。
該平臺(tái)能提供豐富的官方插件和知識(shí)庫(kù),支持用戶低門檻創(chuàng)建智能體。該平臺(tái)支持用戶以API形式將智能體分發(fā)至各類場(chǎng)景,免費(fèi)token額度從此前的100萬提升至1個(gè)億。本次發(fā)布的騰訊元寶也支持用戶和開發(fā)者自建智能體的操作。
“騰訊自己不會(huì)做太多智能體”,劉煜宏表示,“更多還是希望(第三方)開發(fā)者用它去創(chuàng)作?!?/span>