文|光子星球 吳坤諺
編輯|吳先之
急需找到新飛輪的手機(jī)廠商,盯上了大模型。
華為在8月初的開發(fā)者大會(huì)上宣布將在 HarmonyOS 4中搭載的AI助手小藝接入大模型,并在8月底邀測(cè);小米也差不多同一時(shí)間開啟了其AI助手小愛接入大模型的邀測(cè)。OPPO與vivo緊隨其后,兩者均在11月開始手機(jī)大模型的落地嘗試。
“將大模型塞進(jìn)手機(jī)”于業(yè)界并不是新鮮事兒,不談自10月中旬開始密集預(yù)熱的vivo,榮米O三家均曾在今年召開的發(fā)布會(huì)上透出過相關(guān)消息。業(yè)界普遍看法是智能手機(jī)賽道的硬件部分幾乎卷無可卷,而大多跑在云端的大模型恰是一個(gè)游離于硬件之外的變量。
需要注意的是,端側(cè)部署對(duì)大模型賽道而言同樣也是行業(yè)趨勢(shì)。以ChatGPT為例,作為云側(cè)大模型的典型代表,其訓(xùn)練與推理都跑在微軟的Azure上,用戶則通過瀏覽器或App獲取結(jié)果。input-output來回之間,不僅存在影響使用體驗(yàn)的時(shí)延,耗能、算力等云端成本也居高不下。
從實(shí)際場(chǎng)景與需求來看,不少需求完全可以通過邊緣設(shè)備來滿足,尤其是手機(jī)、PC、新能源車等廣泛應(yīng)用的終端。
于是,大模型的端側(cè)部署逐漸成為共識(shí),不僅有手機(jī)廠商鉚足了勁訓(xùn)練模型,PC賽道聯(lián)想與芯片賽道的高通等均在前段時(shí)間發(fā)布了端側(cè)AI的相關(guān)解決方案。尤其是剛剛發(fā)布的高通驍龍8 Gen3以及聯(lián)發(fā)科天璣9300,其AI性能的提升可以說是手機(jī)端大模型的基礎(chǔ)。
行業(yè)需求與硬件條件都已被滿足,大模型終于可以進(jìn)入手機(jī)之內(nèi)??闪钊祟H為意外的是,率先掏出“完整產(chǎn)品”的手機(jī)廠商竟是vivo。
vivo大模型成色如何?
11月1日,vivo召開開發(fā)者大會(huì),于會(huì)上發(fā)布了自研大模型矩陣"藍(lán)心"(BlueLM),包含十億、百億、千億等不同參數(shù)規(guī)模。同時(shí)還發(fā)布了適配其大模型的自研操作系統(tǒng)OriginOS 4。
面對(duì)大模型這塊“應(yīng)許之地”,vivo的急切幾乎寫在臉上。
據(jù)10月26日市場(chǎng)調(diào)研機(jī)構(gòu)Canalys公布的最新數(shù)據(jù),vivo出貨量出貨量下滑,排名也出現(xiàn)下跌。vivo迫切需要大模型以及OriginOS 4來扭轉(zhuǎn)局勢(shì),率先下場(chǎng)“開卷”并不讓人意外。
而且與大模型相比,本次vivo推出的OriginOS 4的更新跨度略顯寡淡。在公域討論中,不僅其虛擬顯卡、異構(gòu)計(jì)算空間與輕量化等迭代幅度不及預(yù)期,vivo用戶中聲量頗高的原子通知等模塊也沒有升級(jí)。也就是說,大模型才是本次發(fā)布會(huì)的主角。
從業(yè)務(wù)模式看,vivo本次發(fā)布會(huì)展示的路線與此前業(yè)內(nèi)其他玩家相似,以人工智能助手為載體,采取端側(cè)+云側(cè)混合的部署方式,其中作為重頭戲的端側(cè)大模型,呈現(xiàn)本地化、輕量化的明顯特征。
這么做的目的顯而易見,手機(jī)這一方小天地所提供的功耗、算力與機(jī)房不可同日而語(yǔ)。只是如何將模型能力與手機(jī)深度結(jié)合成為手機(jī)廠商們迫切需要突破的“konw how”。
對(duì)此,vivo給出的解決方案是推出多參數(shù)規(guī)格模型,其中主要面向文本場(chǎng)景的10億規(guī)格與面向自然對(duì)話、知識(shí)問答長(zhǎng)焦的70億規(guī)格為端側(cè)部署的重頭戲。在官方介紹中,10億規(guī)格單獨(dú)面向端側(cè),70億規(guī)格設(shè)為端云兩用,自700億起均為云端部署,這也體現(xiàn)了vivo在端云協(xié)同上“讓上帝的歸上帝,讓凱撒的歸凱撒”的矩陣思路。
這與谷歌在今年5月的 I/O 開發(fā)者大會(huì)如出一轍,當(dāng)時(shí)谷歌發(fā)布的大模型 PaLM2 有四個(gè)參數(shù)規(guī)格,其中小參數(shù)模型可在離線狀態(tài)下實(shí)現(xiàn)每秒處理20 tokens,適配于終端的離線使用。
如果就此認(rèn)為vivo是“拾人牙慧”則未免過于嚴(yán)苛。實(shí)際上,vivo早在2017年便著手組建內(nèi)部人工智能團(tuán)隊(duì),時(shí)至今日,vivo人工智能研究院已有過千研究人員。
縱使其技術(shù)沉淀總體上不如阿里、百度等第一梯隊(duì),但開源社區(qū)的存在也讓稍晚入場(chǎng)的玩家們能迅速趕上大部隊(duì)。而vivo在2018年成立的知識(shí)圖譜研究院也能在一定程度上補(bǔ)強(qiáng)其作為手機(jī)廠商可能遭遇的訓(xùn)練數(shù)據(jù)不足問題。
至于模型能力方面,vivo在預(yù)熱時(shí)期便交出了一份不錯(cuò)的答卷。據(jù)悉,BlueLM在中文大模型第三方測(cè)評(píng)集C-Eval中獲得了“受限訪問模型”類目的第一名。其官方通告中稱BlueLM是行業(yè)內(nèi)首家7B端側(cè)大模型。
但是在測(cè)評(píng)中斬獲高分卻實(shí)際表現(xiàn)不如人意的模型不在少數(shù),更是有業(yè)內(nèi)人士稱這份榜單已經(jīng)在過去一段時(shí)間被“刷脫皮”了,只能代表模型“做題”的能力而無法體現(xiàn)推理、安全、應(yīng)變等能力。照此來看,vivo的業(yè)務(wù)成果顯然還需要更多實(shí)際檢驗(yàn)。
況且,vivo目前展示的云端模型能力如文生圖、交互等并未跳出大模型賽道窠臼,新意有限。而且其作為重頭戲的端側(cè)模型能力還停留在測(cè)試階段,同時(shí)端側(cè)能力的展現(xiàn)也必然受到手機(jī)硬件的限制。
我們了解到,多位受邀參與藍(lán)心內(nèi)測(cè)的用戶使用的是以X90 Pro為代表的旗艦機(jī),這批機(jī)型也是目前vivo釋出的大模型應(yīng)用公測(cè)適配時(shí)間表中最為靠前的。
毫無疑問,大模型正在成為手機(jī)廠商開辟高端化的第二戰(zhàn)場(chǎng),同時(shí)也是盤活用戶,激活I(lǐng)oT的重要變量。盡管如此,vivo依靠大模型增加高端產(chǎn)品價(jià)值的打算,還存在諸多變量
歸根結(jié)底,大模型的推出既是vivo高端化的新基石,也是其試圖拉動(dòng)新機(jī)與高端產(chǎn)品的一駕馬車。
低端機(jī)型自然難以勝任這場(chǎng)高端化的戰(zhàn)爭(zhēng)。以vivo于本次發(fā)布會(huì)前發(fā)布的基礎(chǔ)機(jī)型Y100為例,這是上述適配計(jì)劃中最晚上線的機(jī)型之一,如此類似“背刺”的舉動(dòng)背后是vivo希望靠高端產(chǎn)品重回王座的“小算盤”。
縱使如此,大模型的推出還是不太能成為vivo高端產(chǎn)品的加分項(xiàng)。
開源社區(qū)端側(cè)大模型創(chuàng)業(yè)者王陽(yáng)(化名)告訴光子星球,大模型在端側(cè)的能力表現(xiàn)在于其NPU(專門為深度神經(jīng)網(wǎng)絡(luò)計(jì)算而設(shè)計(jì)的處理器)所帶來的AI性能。而在vivo既往機(jī)型中,并不注重NPU能力,因此老機(jī)型大概率難以順暢地跑大模型。
至于即將發(fā)布的,搭載聯(lián)發(fā)科天璣9300旗艦芯片與新一代AI處理器的新機(jī)型vivo X100系列或許能順暢使用模型能力,但在在市面上早已存在文心一言、訊飛星火等大模型應(yīng)用的情況下,留給手機(jī)端的空間沒有想象中那么大。相比于能力,或許vivo這次展示的玩法更值得深究。
讓手機(jī)再智能一些?
力推微軟成為 OpenAI 天使投資人的微軟CTO Kevin Scott 曾公開表示,模型本身不是產(chǎn)品,而是基礎(chǔ)設(shè)施。言下之意是在訓(xùn)練精調(diào)出模型底座后,產(chǎn)品化的探索才是一眾玩家們“二次創(chuàng)業(yè)”的核心。
大模型于手機(jī)端的“再產(chǎn)品化”水到渠成,但部署于手機(jī)端的大模型,還需要進(jìn)一步產(chǎn)品化探索。從目前曝光的信息看,vivo將通過一款名為小V助手的應(yīng)用來實(shí)現(xiàn)大模型能力,而目前業(yè)內(nèi)主流路線也是將大模型能力嵌入既有的人工智能助手之上。
智能手機(jī)使用者存在對(duì)大模型理解能力的現(xiàn)實(shí)需求,無論是被戲稱為“人工智障”的智能助手還是在容量爆炸下日益臃腫的應(yīng)用與數(shù)據(jù),都需要手機(jī)能更懂交互,幫助用戶梳理信息。而大模型的加入,本質(zhì)上便是為手機(jī)帶來自然語(yǔ)言理解能力。
未落地實(shí)裝的情況下,端側(cè)模型可能出現(xiàn)的功耗、散熱、時(shí)延等用戶體驗(yàn)問題可以暫且不談。在王陽(yáng)看來,vivo模型落地面臨的首要問題是多款模型配合使用時(shí),如何區(qū)分不同模型的能力邊界以及如何調(diào)用,“這關(guān)乎最終的產(chǎn)品形態(tài)以及呈現(xiàn)”。
面對(duì)場(chǎng)景泛化且需求復(fù)雜的C端,不同需求調(diào)用的模型各不相同。例如端側(cè)的10億規(guī)格模型與70億規(guī)格模型需要針對(duì)用戶本地?cái)?shù)據(jù)學(xué)習(xí),試圖“更懂用戶”。那么能否通過模型能力以及與之適配的OS,在手機(jī)上實(shí)現(xiàn)復(fù)雜指令是重要指標(biāo)。
目前來看,BlueLM展示的復(fù)雜指令功能頗具亮點(diǎn)。在新發(fā)布的OriginOS 4之下,小V助手常駐側(cè)邊欄的右下角,點(diǎn)擊即可彈出。不僅操作邏輯相對(duì)云側(cè)模型更短,更適配手機(jī)使用,同時(shí)也可以理解OS內(nèi)的一些復(fù)雜指令,例如智能搜索相冊(cè)、初步完成第三方App指令以及OS內(nèi)設(shè)置等。
值得一提的是,小V助手在功能與路徑上,和vivo既有的Jovi語(yǔ)音存在隔離,兩者相互獨(dú)立,這是明顯有別于此前其他廠商提出的端側(cè)大模型路徑。
從功能上看,小V助手基本可以做到Jovi語(yǔ)音的全覆蓋,那么兩者區(qū)分的目的很可能是為了便于用戶感受兩者之間的差別。而且小V助手的產(chǎn)品邏輯形態(tài)與微軟全家桶中搭載的Copilot相似,兩種不同的路徑很可能會(huì)在未來完成整合。
這也體現(xiàn)出目前的BlueLM還處于試水階段,產(chǎn)品形態(tài)難言成熟。
據(jù)參與BlueLM內(nèi)測(cè)人士反饋,以vivo旗艦機(jī)型使用模型能力,輸入20 tokens以內(nèi)的純文本生成需求還存在2s~5s的時(shí)延,這對(duì)于后續(xù)實(shí)裝而言不算是個(gè)好消息——云側(cè)模型的時(shí)延并未得到很好的解決。這一點(diǎn)或許會(huì)在搭載芯片廠商最新AI芯片的機(jī)型中得到改善,只是對(duì)于消費(fèi)者來說,這并不構(gòu)成換機(jī)的理由。
此外,作為行業(yè)內(nèi)首個(gè)手機(jī)大模型,vivo的云側(cè)模型能力還面臨許多云廠商大模型的“圍剿”。
例如vivo宣布將上線應(yīng)用商店的對(duì)話機(jī)器人藍(lán)心千詢,1750億的參數(shù)規(guī)格與當(dāng)下應(yīng)用商店中的大模型相比并不顯眼。云廠商中的百度已經(jīng)就近日發(fā)布的文心4.0專業(yè)版試水收費(fèi),而藍(lán)心千詢看起來更多只是vivo大模型生態(tài)中不算亮眼的一員,其道路顯然有阻且長(zhǎng)。
不得不提的還有vivo作為后來者,技術(shù)沉淀的差距也將限制其大模型業(yè)務(wù)的進(jìn)一步推進(jìn)。
軟件方面,vivo大模型已經(jīng)成為阿里云旗下Pai機(jī)器學(xué)習(xí)平臺(tái)的宣傳素材,我們甚至可以從“藍(lán)心千詢”的命名中找到“通義千問”的影子。跑在云上的業(yè)務(wù)意味著長(zhǎng)期成本,這一點(diǎn)在OpenAI上體現(xiàn)得淋漓盡致。成本視角下,如果vivo希望將BlueLM發(fā)展成為長(zhǎng)期生態(tài),自建IDC顯然比上云更利于長(zhǎng)期發(fā)展。
硬件方面,華為與蘋果兩家頭部廠商早已在現(xiàn)有產(chǎn)品線中集成自研的NPU能力,vivo則還需依賴于芯片廠商。即使模型訓(xùn)練與調(diào)優(yōu)方面可以構(gòu)筑一定壁壘,但作為核心的硬件差距仍導(dǎo)致其與頭部廠商拉開了數(shù)個(gè)身位。
大模型的終端戰(zhàn)事
大模型的加入,讓我們重新認(rèn)識(shí)到智能手機(jī)的本質(zhì)是一種集成多種能力的智能終端,且同時(shí)身兼硬件與OS兩大入口。得天獨(dú)厚的條件使得手機(jī)天然需要與大模型相結(jié)合。
那么其他終端是否也可以接入大模型,就像重做應(yīng)用一樣重新定義終端的能力邊界?
對(duì)于這一問題的探尋可以追溯到深度學(xué)習(xí)網(wǎng)絡(luò)爆發(fā)之時(shí),而對(duì)端側(cè)模型可能性探討也源于業(yè)內(nèi)人“老生常談”的時(shí)延、能耗、隱私等問題,大模型的爆發(fā)成功地讓手機(jī)成為裝舊酒的“新瓶”。
實(shí)際上,早在本次往手機(jī)里塞大模型的熱潮正式開啟前,新能源車攜自動(dòng)駕駛早已成為大模型的一個(gè)終端。業(yè)內(nèi)也不乏智能可穿戴設(shè)備搭載大模型的暢想,只是手機(jī)似乎即將憑借場(chǎng)景多樣性與網(wǎng)絡(luò)便利而后發(fā)先至。
更進(jìn)一步說,當(dāng)手機(jī)廠商密集發(fā)布大模型并投入使用后,屆時(shí)便是端側(cè)模型的一個(gè)絕佳的練兵場(chǎng)。我們也可以自手機(jī)大模型的落地情況,探討多種終端搭載大模型的方法論。
畢竟,無論手機(jī)上的模型如何出色,短時(shí)間內(nèi)能做到的最佳表現(xiàn)無非是一位用戶生活領(lǐng)域的“秘書”。其他智能終端搭載大模型所帶來的想象力無疑更大。
例如目前因移動(dòng)支付而逐漸退出歷史舞臺(tái)的ATM,能否憑借大模型,讓用戶無需前往銀行排隊(duì)辦理深度業(yè)務(wù);亦或是同屬B端場(chǎng)景的智能攝像頭,在醫(yī)療領(lǐng)域識(shí)別患者基本體征、在工業(yè)領(lǐng)域快速質(zhì)檢、在農(nóng)業(yè)領(lǐng)域智能灌溉等。而今憑借云側(cè)模型未能廣泛打開的B端市場(chǎng),也可能將迎來端側(cè)這一變量。
這也是為什么vivo會(huì)在其生態(tài)尚不及華為、小米完善之時(shí),便在本次發(fā)布會(huì)上展示了搭載在新款vivo Watch的藍(lán)河操作系統(tǒng)(BlueOS)。作為vivo面向通用人工智能時(shí)代研發(fā)的跨端系統(tǒng),其推出旨在通過手機(jī)帶動(dòng)一系列IoT產(chǎn)品,無疑具備不錯(cuò)的想象空間。
vivo亦宣布開源其7B規(guī)格模型,并推出了藍(lán)心大模型開發(fā)套件BlueKit,生態(tài)建設(shè)的野心昭然欲揭?;蛟S目前vivo只走到了讓IoT聽得懂指令的階段,但這對(duì)于vivo其后的高端化、生態(tài)化等戰(zhàn)略相當(dāng)重要。
手機(jī)大模型的能力未知,面臨的挑戰(zhàn)很多,正式發(fā)布與落地之后,勢(shì)必為業(yè)內(nèi)帶來更多“開卷”的方向。更多千奇百怪的落地姿勢(shì),正在等待業(yè)界的解鎖。