文|獵云網(wǎng) 王非
“我們也一樣在埋頭研發(fā),但是并不急于早早做完,把半成品拿出來展示?!?/p>
在騰訊2023股東大會上,馬化騰針對大模型“低調(diào)、憋大招”這一問題,作出了上述回答。
掌舵者“不急”,騰訊上下自然“低調(diào)”。自研“混元大模型”之外,對外投資亦是如此。
就在剛剛過去的周五,一天之內(nèi),騰訊接連被爆投資兩家大模型創(chuàng)企?!笆状瓮顿Y”來源于市場消息,第二次則來源于白紙黑字的工商變更。
伴隨騰訊大手筆投資,前者據(jù)傳已成為“獨角獸”,后者也相差不遠。
依然是熟悉的感覺,騰訊這個“超級VC”,又回來了!
4000萬美元投向MiniMax,催生AIGC獨角獸
大模型熱潮之下,被冠以“騰訊首次投資”的創(chuàng)企,名為MiniMax。
6月1日,據(jù)路透社報道,國內(nèi)通用大模型初創(chuàng)企業(yè)MiniMax完成了超2.5億美元新一輪融資,目前公司估值超12億美元。在本輪融資中,有騰訊有關(guān)聯(lián)的實體參與,參投資金或為4000萬美元。
此前,MiniMax已完成兩輪融資,投資方包括米哈游、IDG資本、高瓴創(chuàng)投、云啟資本、明勢資本等。云啟資本曾在4月份發(fā)文確認,該機構(gòu)于2021年投資MiniMax,是天使輪中唯一的早期投資機構(gòu)。
來源:天眼查
公開資料顯示,MiniMax隸屬于名之夢(上海)科技有限公司,該公司注冊成立于2021年11月。MiniMax聯(lián)合創(chuàng)始人為前商湯科技副總裁、通用智能技術(shù)負責人閆俊杰,也曾擔任商湯研究院副院長。
MiniMax法定代表人、技術(shù)合伙人楊斌于2014年在中科院自動化所第一次參與深度學習相關(guān)的項目,2016年前往加拿大多倫多大學攻讀博士學位。在海外留學期間,他先后作為創(chuàng)始團隊成員在Uber ATG研究院、自動駕駛初創(chuàng)公司W(wǎng)aabi等團隊供職,擁有多年研發(fā)經(jīng)驗,對基于數(shù)據(jù)驅(qū)動的端到端系統(tǒng)問題頗有研究。
今年2月16日,MiniMax在北京舉辦的小型媒體溝通會上曾透露,團隊人數(shù)已過百,公司核心技術(shù)研發(fā)成員均來自全球知名高校和全球頂尖科技公司,擁有世界頂尖自然語言處理、語音、計算機視覺、計算機圖形學等工業(yè)界和學術(shù)界經(jīng)驗,1/3的團隊成員擁有世界頂尖技術(shù)實驗室的博士學位。
據(jù)介紹,MiniMax直接從底層的基礎(chǔ)模型做起,自研了三個foundation model(基礎(chǔ)模型)——文本到視覺(text to visual)、 文本到語音(text to audio ),文本到文本( text to text)。
楊斌表示,MiniMax可能是國內(nèi)第一家同時擁有三個模態(tài)大模型能力的創(chuàng)業(yè)公司?!爸灰龊眠@三個模態(tài)的基礎(chǔ)大模型,就能提供非常好的內(nèi)容生成能力。”
而在三個基礎(chǔ)模型之上有一個計算推理平臺,將三個基礎(chǔ)大模型的能力以一種低成本、高魯棒性的方式釋放給用戶。
目前,基于該推理平臺MiniMax在去年11月推出了第一款to C的用戶產(chǎn)品Glow,是一款能夠讓你與AI(人工智能)技術(shù)創(chuàng)造的“智能體”實時交流、沉浸互動并建立情感羈絆的應用。上線四個月后,其注冊用戶數(shù)量已達近500萬。
來源:官網(wǎng)截圖
Glow官網(wǎng)顯示,該產(chǎn)品隸屬于北京稀宇科技有限公司,注冊成立于2022年9月,法定代表人為周彧聰。作為MiniMax核心成員之一,周彧聰也被證實是商湯科技早期員工之一,曾經(jīng)在商湯科技研究院帶領(lǐng)算法團隊。
楊斌還表示,MiniMax的初心是實現(xiàn)通用人工智能,而這必須要靠一個開放的生態(tài)。所以從今年開始,MiniMax會逐步開放API,讓更多的個人用戶和企業(yè)用戶基于多種模態(tài)的大模型構(gòu)建自己的應用。
于是在3月份,MiniMax就推出了面向企業(yè)用戶的API開放平臺,支持文本和語音模型的服務調(diào)用。
4月18日,金山辦公發(fā)布生成式AI應用WPS AI,接入的正是國內(nèi)合作伙伴MiniMax的自研大模型。基于MiniMax三個模態(tài)的基礎(chǔ)大模型,WPS AI目前已提供文檔的起草、改寫、總結(jié)、潤色、翻譯、續(xù)寫等功能,并將在人機交互問答方向持續(xù)優(yōu)化。
除WPS外,MiniMax還與國內(nèi)游戲、社交網(wǎng)絡(luò)等多個行業(yè)內(nèi)的頭部公司達成合作,國產(chǎn)自研大模型正在迅速成為生活中的基礎(chǔ)設(shè)施,為人們的生活和工作帶來便捷和高效。
值得一提的是,在大模型對戰(zhàn)平臺SuperCLUE瑯琊榜首發(fā)排行榜上,MiniMax模型以1188分登頂國服,全球位列第二。
位列第一的是Anthropic公司開發(fā)的Claude,緊隨MiniMax其后的是1171分的GPT3.5。
這是國內(nèi)大模型首次在公開測評中超過GPT3.5。
騰訊好未來“撿漏”入股,王慧文曾有意收購
天眼查App顯示,5月31日,北京深言科技有限責任公司發(fā)生工商變更,股東新增騰訊旗下廣西騰訊創(chuàng)業(yè)投資有限公司、好未來旗下公司欣欣相融教育科技 (北京)有限公司等,同時,注冊資本由約131.6萬增至約183.5萬元。
所以,從時間維度,以及工商變更的確定性上,深言科技才是騰訊“首次投資”的大模型創(chuàng)企。
有意思的是,此次騰訊好未來入股深言科技,頗有“撿漏”的意味。
作為最早一批入局大模型的互聯(lián)網(wǎng)大佬,王慧文在招兵買馬上速度驚人。“帶資進組”的他,自然可以用“買買買”來換取時間。
潛在的收購目標,至少有三家:一流科技、面壁智能、深言科技。最終,王慧文成功并購了一流科技,對另外兩家清華NLP校友公司“很感興趣”的消息,也在市場上流傳一時。
據(jù)稱,王慧文確實與面壁智能團隊有過接觸和交流。經(jīng)綜合考慮,這家公司還是決定獨立發(fā)展,并在后續(xù)獲得了知乎投資。
此前,深言科技已“低調(diào)”完成兩輪融資,并未官宣,投資方包括奇績創(chuàng)壇、英諾天使基金、紅杉中國等。據(jù)傳,該公司完成第二輪融資時,估值已達1億美元。
可能是因為發(fā)展勢頭迅猛,王慧文為光年之外挑選潛在并購對象時,才會考慮過深言科技。也或許是后者估值已然較高,才讓兩者“遺憾錯過”,最終“成全”了騰訊和好未來。
股權(quán)結(jié)構(gòu)圖顯示,深言科技創(chuàng)始人兼CEO豈凡超作為實際控制人,最終受益股份達61.28%,馬化騰最終受益股份為4.04%,張邦鑫則為2.54%。
來源:天眼查
深言科技創(chuàng)始人兼CEO豈凡超,清華大學電子工程系2013級本科,計算機科學與技術(shù)系2017級博士,主要研究方向為NLP,曾在EMNLP等頂會發(fā)表論文30多篇。
據(jù)豈凡超介紹,深言科技團隊孵化自清華大學自然語言處理實驗室(THUNLP)和北京智源人工智能研究院,由歐洲科學院院士、清華大學計算機系教授孫茂松領(lǐng)銜擔任公司首席科學家。目前,團隊已發(fā)表頂會頂刊論文數(shù)百篇,獲得各類知識產(chǎn)權(quán)數(shù)十項。涵蓋文本理解、文本生成、知識圖譜等多技術(shù)方向,擁有自研可控文本生成大模型以及相關(guān)數(shù)據(jù)清洗、處理技術(shù)專利。
值得一提的是,THUNLP是國內(nèi)第一個開展NLP研究的科研單位,早在上世紀70年代就已經(jīng)成立。
基于此,豈凡超在第三屆“清華大學國強研究院杯”雙創(chuàng)大賽上底氣十足,“我們的團隊來自國內(nèi)最早做NLP的研究機構(gòu),在NLP領(lǐng)域深耕30年,有國內(nèi)最多的中文大模型訓練經(jīng)驗。”
ChatGPT爆火后,深言科技發(fā)現(xiàn)了該產(chǎn)品的局限性:由于天然的語言差異和中英文屏障,國外的英文大模型無法較好地用于中文文本信息處理場景,存在中文領(lǐng)域知識掌握不足等問題。而中文大模型的研發(fā)遠未成熟,實際性能相較英文大模型仍有不小差距。
深言科技希望以自研的中文超大規(guī)模預訓練模型為核心構(gòu)建工業(yè)級中文信息處理引擎,并研發(fā)最優(yōu)秀的產(chǎn)品,引領(lǐng)中國的文本信息處理智能化革命,為中國的3億腦力勞動者和數(shù)千萬信息密集型組織重塑信息處理全流程。
在路演環(huán)節(jié),豈凡超也公布了深言科技的部分成績,“我們的大規(guī)模預訓練模型在續(xù)寫、改寫、擴寫、摘要4類文本生成任務和6個數(shù)據(jù)集上均超過現(xiàn)有其他中文模型,達到了當前最好的中文文本生成效果?!?/p>
最終,深言科技的“基于超大模型的新一代語言理解與生成平臺”,斬獲技術(shù)創(chuàng)新賽初創(chuàng)組一等獎。
巧合的是,正是在今年1月13日,深言科技獲得上述獎項的同一天,奇績創(chuàng)壇、紅杉中國、零以資本完成了對該公司投資的工商變更。
投研并進,騰訊“不急”
自研+投資,一直被認為是企業(yè)發(fā)展的兩條腿。
騰訊,也不例外。
早在2019年時,馬化騰就對外表示,騰訊已建立四大AI實驗室,涵蓋AI從全面基礎(chǔ)研究到多種應用開發(fā)。
2022年4月,騰訊首次對外披露旗下混元AI大模型的研發(fā)進展,該模型包含但不限于:計算機視覺、自然語言處理、多模態(tài)內(nèi)容理解、文案生成、文生視頻等多個方向的超大規(guī)模AI智能模型。
隨后,騰訊于2022年12月推出了萬億中文NLP預訓練模型HunYuan-NLP-1T(混元AI大模型),是目前國內(nèi)首個低成本、可落地的NLP萬億大模型,且登頂自然語言理解任務榜單CLUE。目前,該模型已成功落地于騰訊廣告、搜索、對話等內(nèi)部產(chǎn)品并通過騰訊云服務外部客戶。
在5月17日一季度財報會上,騰訊高管也回應稱,混元大模型“進展很不錯”。
具體來看,數(shù)據(jù)方面,一方面是來自互聯(lián)網(wǎng)公共數(shù)據(jù),一方面是騰訊內(nèi)部數(shù)據(jù),后者相對公共數(shù)據(jù)具有更高價值;模型序列方面,也正在增加訓練量;基礎(chǔ)設(shè)施方面,云和高性能計算集群,增加了訓練模型的效率,這是騰訊的優(yōu)勢。
針對傳聞中“騰訊針對類ChatGPT對話式產(chǎn)品成立‘混元助手’項目組”,騰訊也曾作出回應:相關(guān)方向上已有布局,專項研究也在有序推進。
據(jù)職場Bonus消息,這個項目組的負責人正是騰訊史上最高職級擁有者——張正友(騰訊首位17級研究員/杰出科學家)。
除了與大模型相關(guān)的直接消息,在間接層面,騰訊方面也在陸續(xù)釋出動態(tài):
3月30日,騰訊發(fā)布了全新的AI智能創(chuàng)作助手“騰訊智影”,推出了智影數(shù)字人、文本配音、文章轉(zhuǎn)視頻等AI創(chuàng)作工具。
其中,智影數(shù)字人能實現(xiàn)“形象克隆”和“聲音克隆”,創(chuàng)作者通過上傳少量圖片、視頻和音頻素材,就能得到自己的數(shù)字人分身和定制音色,進而快速生成自己的數(shù)字人播報視頻。
4月14日,騰訊云正式發(fā)布面向大模型訓練的新一代HCC(High-Performance Computing Cluster)高性能計算集群。該集群采用騰訊云星星海自研服務器,搭載英偉達最新代次H800 GPU,服務器之間采用業(yè)界最高的3.2T超高互聯(lián)帶寬,為大模型訓練、自動駕駛、科學計算等提供高性能、高帶寬和低延遲的集群算力。
據(jù)騰訊介紹,實測顯示,新一代集群整體性能比過去提升了3倍,是國內(nèi)性能最強的大模型計算集群。
5月16日,AI繪圖工具Midjourney也選擇以QQ為載體,開啟官方中文版內(nèi)測……
對于AI的重要性,馬化騰在股東大會上擲地有聲,“我們最開始以為這是互聯(lián)網(wǎng)十年不遇的機會,但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機遇,所以我們覺得(AI)非常重要。”
所以,“對于工業(yè)革命來講,早一個月把電燈泡拿出來在長的時間跨度上來看是不那么重要的。”
也因此,馬化騰“不急”,“我感覺現(xiàn)在有很多公司太急了,感覺是為了提振股價,我們一貫不是這種風格?!?/p>