界面新聞記者 | 伍洋宇
界面新聞編輯 | 宋佳楠
12月26日,界面新聞獨家獲悉,小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入。小米大模型團隊在成立時已有6500張GPU資源。
界面新聞?chuàng)讼蛐∶追矫媲笞C,截至發(fā)稿,小米暫未置評。
一名知情人士對界面新聞記者表示,該計劃已經(jīng)施行數(shù)月之久,雷軍在其中扮演了重要的領(lǐng)導角色。“在AI硬件這件事情上,最核心的是手機而不是眼鏡,小米在這個領(lǐng)域不‘a(chǎn)ll in’是不可能的?!?/span>
小米對AI大模型的重視度提升此前已有信號。12月20日,據(jù)第一財經(jīng)報道,DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉?qū)⒓尤胄∶?,或供職于小米AI實驗室,領(lǐng)導小米大模型團隊。
此前DeepSeekV2在模型架構(gòu)上的重要創(chuàng)新在于對MLA(Multi-head Latent Attention)的采用,這項技術(shù)在降低大模型使用成本上發(fā)揮了關(guān)鍵作用,而羅福莉是這項工作的核心人物之一。
2023年4月,小米AI實驗室大模型團隊正式組建,任命欒劍擔任大模型團隊負責人,向小米技術(shù)委員會副主席、AI實驗室主任王斌匯報。
欒劍此前為AI實驗室語音生成團隊的負責人,曾任東芝(中國)研究院研究員、微軟(中國)工程院高級語音科學家、微軟小冰首席語音科學家及語音團隊負責人等職位。
同一時間,雷軍發(fā)文談論對大模型和AIGC的看法時表示,小米在AI領(lǐng)域已經(jīng)耕耘多年,有AI實驗室、小愛同學、自動駕駛等團隊。“對于大模型,我們當然會全力以赴,堅決擁抱。我們正在研發(fā)一些有趣的技術(shù)和產(chǎn)品,等我們打磨好了,再給大家展示?!?/span>
隨后,在小米2023周年演講上,雷軍再度談及公司大模型業(yè)務進展。
他稱團隊成立之后,小米大模型技術(shù)的主力突破方向為輕量化、本地部署。作為最新成果,小米已初步跑通手機端側(cè)大模型(13億參數(shù)級別),在部分場景效果接近云端60億參數(shù)級別的大模型,將同步推送升級大模型版本的小愛同學。
彼時,小米有MiLM-6B/1.3B兩個參數(shù)級別模型。王斌在接受界面新聞等媒體采訪時強調(diào),包括數(shù)據(jù)、算法等在內(nèi),小米所訓練的模型都是從零開始,但團隊也不反對第三方大模型,將以開放態(tài)度堅持自研與第三方合作相結(jié)合,來推動其大模型發(fā)展。
值得注意的是,小愛同學首次升級時的大模型版本就采用了第三方和自研的混合方案。
公開資料顯示,自2016年組建AI團隊以來,小米人工智能團隊經(jīng)過7年6次擴展,相關(guān)領(lǐng)域人員規(guī)模已達3000多人,其AI技術(shù)能力已覆蓋視覺、聲學、語音、NLP、知識圖譜、機器學習、大模型、多模態(tài)方向,并逐步接入手機、汽車、AIoT、機器人等業(yè)務板塊。