文|適道
編輯|獅刀
那邊適道剛盤點(diǎn)完2024年的AI預(yù)言,這邊三星就宣布將在今年1月18日推出新款Galaxy手機(jī),并引入多項(xiàng)AI功能,包括但不限于:視頻AI處理、本地AI聊天機(jī)器人、通話實(shí)時(shí)翻譯等等。相比之下,蘋果iPhone16要搞的“AI大動作”還在外界的猜測中。
可以看到,幾乎在所有預(yù)言中,AI硬件爆發(fā)和邊緣計(jì)算都有被提及。不過,盡管AI硬件包含XR眼鏡、“領(lǐng)帶夾”AI Pin,甚至是比爾蓋茨提到的智能耳機(jī)。但就目前來看,智能手機(jī),一個人人都離不開的“器官”,最可能先被AI改造。
2007年,隨著第一代iPhone橫空出世,智能手機(jī)時(shí)代就此拉開序幕。17年來,手機(jī)屏幕越來越大,攝像頭越來越多,功能越來越強(qiáng)大。然而,顛覆性創(chuàng)新似乎沒有出現(xiàn),即便你可以從“會說話的湯姆貓”玩到“王者榮耀”。
無論是“卷誰屏幕更大”還是“卷誰劉海更短”,內(nèi)卷的本質(zhì)是科技創(chuàng)新的停滯。如今,AI技術(shù)的突飛猛進(jìn)讓智能手機(jī)廠商久旱逢甘露。近日,高通CEO Cristiano Amon在接受FT采訪時(shí)預(yù)測,2024年將成為全球AI智能手機(jī)的關(guān)鍵元年,生成式AI正在“非常、非??臁钡倪M(jìn)入手機(jī)。
有句話“立場決定嘴巴?!痹缭谌ツ?月,Amon就表示:在ChatGPT熱潮之下,手機(jī)將成AI主流設(shè)備,并帶領(lǐng)高通成為AI公司。
當(dāng)然,高通急于“押寶”的心情可以理解。2021年7月,Amon出任高通CEO,并將工作重心放在尋找5G應(yīng)用場景,探索5G時(shí)代硬件形態(tài)等推動5G發(fā)展的事業(yè)上。結(jié)果是,5G技術(shù)并沒有帶來手機(jī)銷量銷量的“大躍進(jìn)”,反而是彎道超車的英偉達(dá),用GPU擠出了一片天。
在此背景下,去年6月,高通的高級副總裁 Alex Katouzian 宣布,高通正在從一家通信公司過渡到一家智能邊緣計(jì)算公司。
那么,換道鉆研邊緣計(jì)算的高通如何看待發(fā)生在終端設(shè)備上的AI革新?適道簡譯了FT對Amon的采訪,試著梳理出一些要點(diǎn)。
01 為什么不能100%在云端?
首先,提出一個根本問題:為什么執(zhí)著將模型塞進(jìn)手機(jī)里?AI運(yùn)算放在云端不好嗎?
終端側(cè),即可以直接和用戶交互的設(shè)備,例如手機(jī)、汽車、XR眼鏡等。具有兩個特點(diǎn):一是個體相對復(fù)雜,部署起來各有各的難點(diǎn);二是本地芯片算力有限,帶不動大模型。(雖然蘋果最新發(fā)布的Flash-LLM技術(shù)可能會改變這一情況。)
因此,在云端部署AI模型是一條正確的思路。
然而,這其中也有一些限制。一是,云計(jì)算帶寬不足。例如,高速公路上的無人駕駛汽車要在毫秒內(nèi)做出反應(yīng),即便云端算力足夠,帶寬也無法承載。
二是,云計(jì)算不能保證隱私。例如,用生成式AI撰寫包含敏感財(cái)務(wù)數(shù)據(jù)文檔時(shí),你一定不想將這些數(shù)據(jù)上傳到云端。
三是,傳統(tǒng)云端AI交互性差。例如,你要向ChatGPT發(fā)出一串明確的Prompts,它才會作出響應(yīng)。但在理想情況下,你更想讓ChatGPT預(yù)測出自己的每一個動作,主動理解需求并提供服務(wù)。
Amon在采訪中表示:一方面,隨著訓(xùn)練方法的改進(jìn),一些更小型、高效的AI處理器和模型將被集成到便攜設(shè)備中。端側(cè)芯片的算力困局得到了解決;另一方面,更多混合型AI將在設(shè)備上運(yùn)行,即一部分AI處理在端側(cè)進(jìn)行,而另一部分在云端完成。這種方法可以降低運(yùn)行AI的成本。例如,開發(fā)者基于在終端運(yùn)行的Stable Diffusion創(chuàng)建應(yīng)用程序,生成每張圖像將承擔(dān)很低的查詢成本,甚至完全沒有成本。
對此,Amon還提出了一條人類運(yùn)算史的發(fā)展規(guī)律:“創(chuàng)新最初出現(xiàn)在集中化的系統(tǒng)(大型計(jì)算機(jī)或云計(jì)算中),隨后轉(zhuǎn)移到更分散的系統(tǒng)(PC和手機(jī))?!?/p>
02 AI手機(jī)將如何改變生活?
具體來看,以端側(cè)AI為代表的AI手機(jī)將如何改變我們的生活?
Amon從兩個層面回答了這個問題。
一是,響應(yīng)速度更快。例如文生圖大模型 Stable Diffusion的參數(shù)超過了10億,但目前在手機(jī)上運(yùn)行僅花費(fèi)0.6 秒就能生成一張圖像,大大提高了用戶拍照和編輯圖片的體驗(yàn)。
二是,可實(shí)現(xiàn)更深層次交互。不同于傳統(tǒng)智能手機(jī)只能操作單一應(yīng)用,AI手機(jī)由生成式 AI 調(diào)動所有應(yīng)用協(xié)同工作。例如,訪問用戶的實(shí)時(shí)上下文信息(如位置、當(dāng)前活動等),提供定制化服務(wù)。
Amon舉了一個發(fā)短信的例子。你正在編寫發(fā)給Clare的短信,此時(shí)部署在手機(jī)里的AI會思考“這里有我要做的事嗎?”。當(dāng)你寫道:想和Clare約下周二見面。AI助手會調(diào)出日程表,提示你的空閑時(shí)間,詢問是否給Clare發(fā)送邀請;而當(dāng)你又寫道:剛和家人度過了一個美好的假期。AI會跳出來:這些是你拍的照片,想分享給Clare嗎?
Amon表示,不同于連比爾蓋茨都吐槽過的微軟Clippy,當(dāng)前的AI應(yīng)用更加精確和智能。過去的技術(shù)難以準(zhǔn)確理解用戶語言和上下文含義,需要對每個一步驟進(jìn)行編程。而現(xiàn)在,內(nèi)置AI的設(shè)備能夠更準(zhǔn)確地學(xué)習(xí)用戶的行為和偏好,并提供更個性化,且不打擾用戶的體驗(yàn)。
至于AI手機(jī)能否刺激消費(fèi)者市場,Amon非常樂觀:“這是一個價(jià)值數(shù)十億美元的問題。你將在2024年初看到搭載多種AI用例的手機(jī)。它有潛力創(chuàng)造智能手機(jī)的新升級周期。最終你會說:‘我的舊手機(jī)已經(jīng)用了四年,但現(xiàn)在我想購買一部可以運(yùn)行AI的新手機(jī)?!悴坏貌毁I一部新手機(jī),因?yàn)檫@關(guān)乎那些新平臺上將出現(xiàn)的計(jì)算引擎?!?/p>
03 “訓(xùn)練”芯片轉(zhuǎn)向“推理”芯片
當(dāng)我們談?wù)揂I大模型時(shí),芯片制造商有兩個角色:一是事先處理所有數(shù)據(jù)來構(gòu)建模型,被稱為“訓(xùn)練”;二是在實(shí)際應(yīng)用中使用模型,被稱為“推理”。
Amon表示,芯片制造商的主要戰(zhàn)場會由“訓(xùn)練”轉(zhuǎn)向“推理”。
目前AI市場主要集中在使用大數(shù)據(jù)訓(xùn)練模型的“訓(xùn)練”階段,英偉達(dá)是主要受益者。但Amon表示,隨著AI模型變得更小巧、能夠在設(shè)備上運(yùn)行并專注于特定任務(wù),芯片制造商的主要市場將轉(zhuǎn)向“推理”,即模型的應(yīng)用。數(shù)據(jù)中心也開始對專門用于已訓(xùn)練模型推理的處理器感興趣,這一切預(yù)示著推理市場將大于訓(xùn)練市場。
Amon的話有暗戳戳給自家貼金的嫌疑。公正起見,我們也來看看高通的老對手——英偉達(dá)。
去年11月,英偉達(dá)發(fā)布了新一代GPU——H200。相較H100,其實(shí)H200在算力方面提升并不明顯。數(shù)據(jù)顯示,在GPT-3175B大模型的訓(xùn)練中,H200只比H100強(qiáng)了10%。
但在處理Llama 2等大語言模型時(shí),H200的推理速度比H100提高了接近1倍。
也就是說,無論是高通還是英偉達(dá),都提前切中了“推理”和“模型應(yīng)用”這一要點(diǎn)。在接下來的時(shí)間里,我們或許將會看到新的競爭格局和新的贏家。
04 改變iOS和Android雙雄格局
Amon表示:目前負(fù)責(zé)構(gòu)建和運(yùn)行AI大模型的公司(如OpenAI、Anthropic、微軟、亞馬遜和Meta)和生產(chǎn)智能手機(jī)及操作系統(tǒng)的公司(如蘋果、谷歌和三星)存在很大不同。
但隨著將AI模型放進(jìn)手機(jī)里,微軟和Meta等公司可能會重獲影響力,改變由iOS和Android長期主導(dǎo)的行業(yè)格局。然而,實(shí)現(xiàn)這一目標(biāo)需要手機(jī)制造商、操作系統(tǒng)開發(fā)商和應(yīng)用開發(fā)商之間的合作,而這種合作實(shí)現(xiàn)起來也不太容易。
和App Store不同,AI模型將被預(yù)先安裝在設(shè)備引擎中。移動平臺將支持第一方和第三方模型,以及原始設(shè)備制造商(OEM)的模型。這就像將相機(jī)功能內(nèi)置在設(shè)備中一樣,不同的AI引擎也將內(nèi)置于設(shè)備中。
另外,除了AI手機(jī),Amon表示,他本人始終看好輕便型的可穿戴設(shè)備,比如AR眼鏡,(沒有提VR)。一是產(chǎn)品會變得更輕,用戶能夠佩戴更長時(shí)間。二是隨著這些設(shè)備功能增多,更優(yōu)質(zhì)的內(nèi)容將會出現(xiàn)。他相信,隨著市場規(guī)模的擴(kuò)大,開發(fā)者將愿意投入更多資金,進(jìn)一步推動更豐富的內(nèi)容。
結(jié)語
2024年,隨著AI大模型應(yīng)用落地,智能手機(jī)進(jìn)化的號角也終于吹響。
根據(jù)市場研究機(jī)構(gòu)Counterpoint預(yù)測,2024年生成式AI智能手機(jī)出貨量有望突破1億支,在整體智能手機(jī)中占比8%;2027年出貨量有望達(dá)到5.22億支,占智能手機(jī)比重40%。2023-2027年復(fù)合成長率達(dá)83%,這或?qū)⒃谖迥陜?nèi),引發(fā)一場關(guān)于交互方式的革新。
可以預(yù)見的是,無論是三星、蘋果還是其他廠商,都會在巨大的壓力和機(jī)遇中完成智能手機(jī)的第二次革命?,F(xiàn)在,AI改造終端的浪潮才剛剛開始,我們將持續(xù)觀察。