文|腦極體
大模型帶來的Web復(fù)興,會是曇花一現(xiàn)嗎?
導語:移動端,才是模型服務(wù)商和云廠商的下一個戰(zhàn)場
大家是不是對GPT、對話式AI、生成式AI之類的話題,已經(jīng)有點審美疲勞了?
寫這篇文章之前,我有點猶豫,究竟還要不要接著討論GPT了。最終決定寫,是覺得個人用戶、開發(fā)者,以及正在緊鑼密鼓訓大模型的AI公司和云廠商,還是有必要提前琢磨一下這個事情——大模型能力要從云入端,究竟什么時候做、怎么做?
AIGC熱潮帶來Web復(fù)興,但大眾更愛移動端
我們看到,大多數(shù)基于大模型的AIGC應(yīng)用,都選擇了Web端接入。
微軟第一時間推出了帶有對話(Chat)功能的必應(yīng)(Bing),更新了Edge瀏覽器,嵌入到Microsoft 365 應(yīng)用中。國內(nèi),高校機構(gòu)推出的MOSS(復(fù)旦大學)、SegGPT(智源),企業(yè)推出的文心一言(yiyan.baidu.com)、通義千問(tongyi.aliyun.com),都要從官網(wǎng)入口訪問。
圖像和視頻類的生成式AI,比如Midjourney、Stable Diffusion、DALLE2,以及視頻平臺Make-A-Video(Meta)、Imagen Video(谷歌)等,也是如此。
有業(yè)內(nèi)人士認為,生成式AI帶來了Web的復(fù)興。
當然,市面上也有通過小程序、App等訪問的AIGC產(chǎn)品,大多通過調(diào)用基礎(chǔ)模型的API來提供服務(wù)。
但受限于網(wǎng)絡(luò)傳輸、算力等,領(lǐng)先的技術(shù)能力都不得不打折扣,比如只能生成很短的一句話文本,手機app的作圖效果一般,加載速度很慢經(jīng)常排隊掉線卡頓……
這是因為大模型的大量計算,還是要通過云服務(wù)來完成,Web頁面的承載能力比較大,加載速度快,還不用考慮流量損耗。
所以,想體驗大模型強大的能力,目前還是以PC Web端+云服務(wù)更佳。
但是,大模型的商業(yè)化潛力,還是在移動端。
大家可能都記得,去年底AI作圖就火爆過,意間 AI 繪畫、YUAN 初等多款具有 AI 作圖功能的移動端小程序,用戶量和付費激增。意間 AI 繪畫的官方數(shù)據(jù)顯示,上線不到兩個月,用戶量增長了 117 萬人。
大部分人也都更希望,便捷、低門檻地體驗AIGC。要使用GPT-4、New bing、DALLE等應(yīng)用,注冊、登錄、付費的一系列操作,都非常麻煩,勸退了不少人。
國內(nèi)的大模型應(yīng)用,移動端也明顯很受期待。比如就有人抓住了“官方?jīng)]有app”這個“時間差”,造出了“文心一言”盜版 App,嚇得百度趕緊出來聲明:凡是在App Store和各種應(yīng)用商店看到的“文心一言”App都是假的,凡是“文心一言”收費下載、付費會員都是騙子!
顯而易見,場景化、輕量化的移動端應(yīng)用,用戶又喜歡,又能付費賺到錢,如果官方不搞,投機客/騙子都要來搞。
無論是從用戶體驗的角度,還是大模型服務(wù)普及化的需要,以及回收訓練成本的商業(yè)化考量,移動端應(yīng)用都是一塊不能輕言放棄的陣地。
既然如此,為什么各大基礎(chǔ)模型服務(wù)商,就是不早點抓住這個機會呢?我們什么時候才能用上和Web版一樣強大的移動AI應(yīng)用呢?
千呼萬喚不出來,基礎(chǔ)模型服務(wù)商在想啥?
基礎(chǔ)大模型的服務(wù)商,比如OpenAI、谷歌、百度、阿里以及各類研究院所,就是不去吃移動端應(yīng)用這塊蛋糕。
除了大家都知道的移動端側(cè)計算能力限制之外,還有其他考量:
1.產(chǎn)品?;A(chǔ)模型往往技術(shù)和能力比較超前,產(chǎn)品化不是最優(yōu)先考慮的,尤其移動端應(yīng)用要適配各種系統(tǒng)、機型、配置,更不可能投入太大的人力、物力。
OpenAI 的聯(lián)合創(chuàng)始人 Sam Altman就說過,ChatGPT 是一個糟糕的產(chǎn)品,只是這個產(chǎn)品蘊含著很大價值,所以人們愿意忍受。覺得Web不好用?那你先忍忍吧。
2.用戶。別看全民熱議生成式AI,但真正堅持使用并愿意付費的,還是一小撮早期客戶,包括技術(shù)狂熱者和專業(yè)人士,比如程序員、插畫師。
他們大多會將生成式AI當作生產(chǎn)力工具,用于研究、編程、辦公、設(shè)計、游戲制作、軟件開發(fā)等,還要跟其他專業(yè)軟件相結(jié)合來使用,比如生成圖片之后再通過Photoshop增強,還是要用到PC、一體機等設(shè)備,PC Web端比移動App有更強的可編輯性,更能滿足這部分群體的需求。
3.商業(yè)化。目前基礎(chǔ)大模型的商業(yè)模式,以API為主,需要一定的開發(fā)經(jīng)驗,更適合極客和開發(fā)者,深度開發(fā)集成部署等工作,很少會通過移動端來完成,所以模型服務(wù)商自然也就沒有緊鑼密鼓去適配移動端的動力。
大模型千帆競渡,移動端是商業(yè)化必爭之地
既然如此,為什么還要做移動端呢?一個很表層的答案是:大眾需要。
能夠真正引發(fā)全民體驗熱潮的,還是那些能夠通過社交軟件分享、小程序、App等形式,低成本快速觸達的能力,不需要什么“智能涌現(xiàn)”,更在乎有趣、好玩。
往深了說,大模型技術(shù)被視為“新工業(yè)革命”的引擎,要發(fā)揮效應(yīng),必須將技術(shù)能力更好地集成到產(chǎn)品和服務(wù)中去。此時,移動端能夠提供至少三重價值:
第一,規(guī)模落地。
中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布第51次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》中,我國10.67億網(wǎng)民,使用手機上網(wǎng)的比例為99.8%,移動端用戶已經(jīng)遠遠超過了PC端的用戶,要提升生成式AI的應(yīng)用范圍,移動端應(yīng)用必不可少。
第二,商業(yè)潛力。
高科技行業(yè)的主流市場,是由“實用主義者”組成的,相比技術(shù)的前沿性、炫酷感,他們更看重技術(shù)解決方案的可靠、穩(wěn)定、性價比、配套服務(wù)等。移動端的廣泛普及度、即時訪問、便捷低成本的優(yōu)勢,可以讓AI以更短的路徑觸達用戶,在移動端應(yīng)用AI技術(shù)是大勢所趨。
開發(fā)者眼中的AIGC應(yīng)用是這樣的:
(OpenAI發(fā)布會演示的編程能力)
大眾眼中的AIGC應(yīng)用是這樣的:
(某GPT類應(yīng)用平臺截圖)
第三,市場壁壘。
大模型的商業(yè)化路徑之一,是走向產(chǎn)業(yè),走向ToB,將大模型能力封裝為AI解決方案,參與到千行百業(yè)的數(shù)字化、智能化進程中。
如今頭部科技公司、云廠商都在煉大模型,很多直接對標GPT-3.5,沒有顯著的差異化價值,很難與業(yè)界領(lǐng)先水平拉開差距。
云廠商要打開ToB市場,移動端應(yīng)用工具與能力是非常有吸引力的。近年來,不僅消費類、服務(wù)型企業(yè),在不斷加強移動端側(cè)的布局和產(chǎn)品能力,一些傳統(tǒng)的企業(yè)和機構(gòu),比如工業(yè)制造、政務(wù)銀行等,無論是在內(nèi)部生產(chǎn)管理中移動化,也推出了更多移動應(yīng)用來更好地服務(wù)終端用戶。如果直接在云上端到端用好大模型,比如訓練開發(fā)環(huán)節(jié)直接調(diào)用云端的大模型和AI算力資源,完成后,一鍵分發(fā)到智能手機等終端上,可以大大減少工作量。
互聯(lián)網(wǎng)的演進之路,已經(jīng)說明,無論To B還是To C行業(yè),都在追求越來越集約精簡的終端硬件、越來越低門檻的交互入口、越來越輕盈的軟件應(yīng)用。
所以說,大模型從云入端,是模型服務(wù)商實現(xiàn)商業(yè)化的必爭之地。
從云入端,一條天路
高瞻遠矚如OpenAI和DeepMind,照樣有商業(yè)化的要求。賺錢嘛,不寒摻??墒?,大模型由云入端,這個錢還真沒那么好賺。非不為也,實不能也。
云計算、AI能力要進入移動終端設(shè)備,所面對的是一條天路:
首先,一些大型的生成式AI應(yīng)用,運行環(huán)境在云上,要經(jīng)過網(wǎng)絡(luò)傳輸,而移動端的設(shè)備能力、網(wǎng)絡(luò)環(huán)境,是很多樣且不穩(wěn)定的,比如從5G蜂窩網(wǎng)絡(luò)轉(zhuǎn)移到室內(nèi)寬帶,或者在高架橋、地鐵等特殊環(huán)境,都有可能讓生成過程中斷或失敗,影響到端側(cè)體驗。
其次,生成式AI應(yīng)用的計算量比較大,在端側(cè)加載渲染運行時,比如智能手機CPU會有比較高的負載,出現(xiàn)卡頓、發(fā)熱、電量損耗等情況,如果讓AI改一篇文檔畫一張圖就咔咔掉電,當然不能接受。
此外,把AI深度集成到業(yè)務(wù)中,必須通過云計算,而云端開發(fā)環(huán)境和端側(cè)是不同的操作系統(tǒng)。這意味著,開發(fā)者要進行二次開發(fā)或迭代開發(fā),完成之后才能進行不同終端下的觸達,同事要考慮不同終端的兼容性,這就提升了AI云應(yīng)用的風險成本、人力成本、時間成本。要保證集成之后的應(yīng)用效果,需要云平臺有一整套完整的產(chǎn)品服務(wù)和工具來支撐快速搭建、驗證、部署分發(fā)。
另外,云側(cè)和端側(cè)的架構(gòu)不同,也導致算力割裂,云端一體的AI應(yīng)用開發(fā)要充分結(jié)合端側(cè)算力和云上算力,一部分應(yīng)用場景搭建在端,一部分搭建在云,這就給云廠商帶來了比較大的技術(shù)難題:如何提供穩(wěn)定一致的底層環(huán)境?
天路難行亦需行。大家都知道,云計算靠基礎(chǔ)設(shè)施IaaS層是很難賺到錢的,云廠商煉大模型,本質(zhì)上是希望提升軟件的先進性,進而調(diào)動SaaS服務(wù)的商業(yè)價值。
要讓個人用戶和企業(yè),都得到簡單、易用、低門檻的大模型能力,云廠商不僅要訓練基礎(chǔ)模型,還需要在產(chǎn)業(yè)鏈上游,就解決AI應(yīng)用從云到端的一系列技術(shù)難題,為開發(fā)者和產(chǎn)業(yè)用戶提供移動AI開發(fā)能力,才能讓大模型在端側(cè)爆發(fā)。
各種形態(tài)的大模型應(yīng)用百花齊放,這個新技術(shù)才能真正迎來商業(yè)化的奇點。