文|光子星球 王 潘 吳坤諺
編輯|吳先之
生成式AI走向大眾市場(chǎng)的關(guān)鍵時(shí)期已經(jīng)到來。
2月16日,OpenAI推出了堪稱“王炸”的文生視頻大模型Sora,AI軍備競(jìng)賽的戰(zhàn)場(chǎng)加速向多模態(tài)轉(zhuǎn)移,這意味著相比尋常LLM更為豐富的場(chǎng)景與機(jī)會(huì)。此外,2024年將成為AI硬件元年的共識(shí)也基本形成,業(yè)界對(duì)AI在智能終端的應(yīng)用寄予厚望,將其視為提振消費(fèi)電子市場(chǎng)的關(guān)鍵。
智能手機(jī)與PC兩大終端的戰(zhàn)況愈發(fā)激烈,而玩家們眼中的終局似乎與通用模型基座并無二致——廠商忙不迭搞起大模型與OS,互不兼容的同時(shí)卻又在功能上高度趨同,將行業(yè)引向近在咫尺的紅海。
與之相比,未被大公司注意到的細(xì)分場(chǎng)景反而成為創(chuàng)業(yè)者的樂土。當(dāng)AI與硬件實(shí)現(xiàn)耦合的場(chǎng)景愈發(fā)豐富,AI終于開始擺脫生產(chǎn)力工具的固有印象,其技術(shù)落地的場(chǎng)景愈發(fā)貼近消費(fèi)語境。如曾在去年為業(yè)內(nèi)熱議的Humane的AI Pin和Rabbit的R1,均試圖跳脫出既往智能終端的束縛,從而更貼近我們的生活。
正因如此,此時(shí)我們更應(yīng)該關(guān)注這些未被商業(yè)競(jìng)爭(zhēng)所桎梏的創(chuàng)新,興許能為國(guó)內(nèi)大模型的商業(yè)落地提供更多視角。
我們注意到,繼AI Pin和R1之后,來自新加坡的AR初創(chuàng)公司Brilliant Labs剛剛推出一款嵌入多模態(tài)AI功能的AR智能眼鏡“Frame”,再次試圖將AI從我們熟知的智能終端中解放出來。
Frame看起來是一副平平無奇的框架眼鏡,鏡架中央搭載了微型攝像頭,以及右鏡頭嵌入一個(gè)640 x 400像素的微型OLED顯示屏。AI大模型的能力主要依賴于云端和無線接入,由Brilliant Labs推出的AI Agent “Noa”統(tǒng)籌,能夠進(jìn)行現(xiàn)實(shí)世界的視覺處理、創(chuàng)新圖像生成以及實(shí)時(shí)語音識(shí)別和翻譯。
從工程體驗(yàn)看來,F(xiàn)rame有些類似于是谷歌眼鏡與Ai Pin的結(jié)合。
在Brilliant Labs看來,AIGC為我們打開了新的數(shù)字世界大門,這個(gè)嶄新的世界需要更加自然地融入人們所見和體驗(yàn)的物理世界,而Frame應(yīng)運(yùn)而生。
AI硬件,手機(jī)的延伸
在智能手機(jī)的絕對(duì)優(yōu)勢(shì)面前,智能硬件一直像是一只長(zhǎng)期盤旋在周圍的老鷹,時(shí)刻準(zhǔn)備著啄出一個(gè)缺口?,F(xiàn)在它們距離成功已經(jīng)很近了。
回顧AIGC浪潮前的智能硬件,不難發(fā)現(xiàn)它們并沒有不可替代性,甚至難言創(chuàng)造了新的使用場(chǎng)景。就像10余年前的智能眼鏡、8年前的智能音箱、3年前的XR頭盔,它們都曾經(jīng)歷過短暫的高光時(shí)刻,燃燒自己為市場(chǎng)一點(diǎn)點(diǎn)建立消費(fèi)認(rèn)知。
說白了,自智能手機(jī)問世起至今,集成了越來越多功能的手機(jī)也在變得越來越難以替代,試圖創(chuàng)造下一個(gè)手機(jī)來徹底取代這個(gè)消費(fèi)品的嘗試大多都失敗了。因而,我們也在AI硬件創(chuàng)業(yè)中清晰地看到路線轉(zhuǎn)換——硬件不再試圖取代手機(jī),而是成為手機(jī)的延伸。
交互方式的革新是生成式AI為硬件帶來的全新變量。以Frame為例,作為市場(chǎng)上首款多模態(tài)AI眼鏡,Frame提供一個(gè)無需屏幕即可獲取AI能力的交互方式,交互圖形界面會(huì)呈現(xiàn)在右鏡片的OLED顯示屏中,我們可以使用語音、點(diǎn)觸以及眼球轉(zhuǎn)動(dòng)與之交互。
如此一來,新的AI硬件與此前的手機(jī)便不會(huì)構(gòu)成“換機(jī)”式的替代關(guān)系,甚至用戶會(huì)為了縮短獲取AI能力的鏈路,從而購(gòu)買硬件來配合手機(jī)使用。這是新一代AI硬件之所以在商業(yè)模式上能成立的根本邏輯。
我們了解到,在這款產(chǎn)品在設(shè)計(jì)之初,Brilliant Labs便為其立下了重構(gòu)個(gè)人數(shù)字生活的目標(biāo),尤其是重構(gòu)我們?nèi)祟惻c周身無數(shù)電子設(shè)備的關(guān)系。
另一方面,智能手機(jī)這個(gè)鐵桶陣被啄出缺口的原因還在于智能手機(jī)作為終端載體的成熟程度,載體的成熟意味著更高的落地要求。典型表現(xiàn)便是這樣的集成智能終端剛需運(yùn)行端側(cè)大模型的能力,否則便與通過App獲取云端模型能力的“前輩”們找不出區(qū)別,也就難以驅(qū)動(dòng)新的換機(jī)周期。
目前,端側(cè)大模型能力展現(xiàn)必備的NPU還處于集中研發(fā)期,可靠的產(chǎn)品方案出現(xiàn)之前,這無異于為其他AI硬件提供了一個(gè)突破口。
Brilliant Labs選擇將自己積累的光學(xué)與AR技術(shù)為突破的尖刀,Brilliant Labs創(chuàng)始人、CEO Bobak Tavangar在既往AR眼鏡的基礎(chǔ)上引入了一款類似于《鋼鐵俠》中JARVIS的AI助手“Noa”。更重要的是,Brilliant Labs還為Frame打造了一個(gè)可以同時(shí)運(yùn)行多個(gè)大模型的CPU。
在全天候AI助手Noa的統(tǒng)籌下,F(xiàn)rame可以調(diào)用不同云端模型能力處理不同任務(wù),甚至同時(shí)組織多個(gè)AI系統(tǒng)一起完成更高級(jí)的任務(wù),比如我們對(duì)著一本全英文的菜單,讓Noa為我們推薦一個(gè)口味合適的搭配。
更值一提的是,智能手機(jī)廠商匆匆踏入AI大模型賽道時(shí),他們眼中的商業(yè)化終局是打造出下一時(shí)代的集成式硬件入口,即一個(gè)AI OS。這導(dǎo)向了當(dāng)下大模型能力和硬件互斥的情況,將競(jìng)爭(zhēng)拉向模型底層。
Frame選擇以開源方式接入GPT等在內(nèi)的模型能力,“讓上帝的歸上帝,讓凱撒的歸凱撒”,無需陷入模型層的競(jìng)爭(zhēng)泥潭。Bobak稱,“我們創(chuàng)業(yè)的最初靈感便來自于豐富的開源生態(tài),唯有開源才能讓一個(gè)產(chǎn)品接受全人類、全世界的體驗(yàn)和檢視,更多創(chuàng)造性的火花也迸發(fā)于此?!?/p>
比手機(jī)更深入生活
回看Frame的產(chǎn)品形態(tài),與我們熟悉的虛擬現(xiàn)實(shí)設(shè)備動(dòng)輒重達(dá)上百克不同的是,其在搭載了電池以及上述元器件的情況下,重量?jī)H40克(1.4盎司)。如此輕巧、便攜、簡(jiǎn)約的設(shè)計(jì)隱約透露出一股“蘋果味兒”。
果不其然,Bobak本就出自蘋果。我們了解到,在他任職于蘋果期間,他曾負(fù)責(zé)多個(gè)硬件項(xiàng)目的設(shè)計(jì)工作。
Bobak從蘋果身上學(xué)到的最重要的設(shè)計(jì)理念是“以人為中心”,追求貼合用戶的實(shí)際使用語境,而工程、銷售、供應(yīng)鏈等環(huán)節(jié)都只能“適配”于這個(gè)中心理念?!昂玫脑O(shè)計(jì)精準(zhǔn)匹配某些群體或場(chǎng)景,偉大的設(shè)計(jì)從開始便向往匹配所有人”, Bobak的觀點(diǎn)與其產(chǎn)品一般,強(qiáng)調(diào)普適性。
我們不妨審視蘋果推出的新品,無論是無線耳機(jī)AirMax亦或是Vision Pro,看著都不太像喬布斯設(shè)計(jì)出的東西。同一家公司因?yàn)檎贫嬲叩淖兓沟卯a(chǎn)品追求不能一以貫之,可見產(chǎn)品理念在多方因素下的脆弱與可貴。
或因如此,F(xiàn)rame天然是一個(gè)極其貼近消費(fèi)語境的產(chǎn)品。除設(shè)計(jì)語言外,它對(duì)消費(fèi)場(chǎng)景的貼合還在于其取代了手機(jī)屏幕的AR顯示屏,讓我們使用AI能力時(shí)不需要掏出手機(jī)打開App,極大簡(jiǎn)化了流程,縮短了鏈路。
馬斯克與英偉達(dá)AI科學(xué)家Jim Fan所提出的“具身智能”或者說“環(huán)境智能”,便是讓AI的物理存在感降低,只在我們需要的時(shí)候出現(xiàn)。
對(duì)于面向大眾消費(fèi)群體的硬件而言,其使用場(chǎng)景必然極其生活化。人們追求使用上的“無感體驗(yàn)”,要求沉浸感以及更多的交互能在無意識(shí)下發(fā)生。如今,手機(jī)這個(gè)集成最多日常功能的智能終端,儼然成為我們獲取某項(xiàng)服務(wù)的一種儀式道具,就像上世紀(jì)的互聯(lián)網(wǎng)需要調(diào)制解調(diào)器與電話線。
為了進(jìn)一步加強(qiáng)AI賦予硬件的交互革新,Brilliant Labs與時(shí)下領(lǐng)跑AI搜索賽道的 Perplexity展開深度合作,顯著提升了AIGC內(nèi)容的可溯源度。
Perplexity由出身于OpenAI的Aravind Srinivas于2022年8月創(chuàng)立,目前估值5億美元。其問答引擎可以說是對(duì)傳統(tǒng)搜索引擎的一次升級(jí),在理解用戶提問的基礎(chǔ)上將問題解析為更精細(xì)化的數(shù)個(gè)搜索指令,最終由模型閱讀并篩選出內(nèi)容以輸出結(jié)果。
當(dāng)我們向Perplexity提問,最終呈現(xiàn)的結(jié)果是一個(gè)不亞于百科的全面回答,不同信息的出處均可溯源,甚至側(cè)邊欄會(huì)呈現(xiàn)與主題相關(guān)的圖片與視頻。簡(jiǎn)單來說,Perplexity所做的是讓搜索引擎“更懂你”,這是對(duì)搜索顆粒度的進(jìn)一步細(xì)化。
另一方面,Perplexity也為生成式AI增添了一份時(shí)效性與準(zhǔn)確性,這直指模型能力最為人所詬病的“幻覺”。當(dāng)這一功能被添加進(jìn)Noa的多模態(tài)功能組后,我們可以隨時(shí)隨地、解放雙手地獲取來自網(wǎng)絡(luò)的實(shí)時(shí)可靠信息。
在Perplexity的能力調(diào)用下,F(xiàn)rame可以通過簡(jiǎn)單的交互動(dòng)作,在Noa的訪問下了解、認(rèn)知并觸達(dá)我們身邊的萬事萬物。比如我們看向自己家的房子,便可以在貝殼App上搜索其房源;轉(zhuǎn)頭看看久不打理的雜物房,便可以獲取一套包含用品、方法在內(nèi)的清潔方案。
Bobak表示,“我們希望Frame能夠使人們以全新的方式彼此連接,并在日常生活、工作場(chǎng)所、課堂等方面開啟新的體驗(yàn),真正為人類與數(shù)字世界以及彼此之間的接口帶來了新的范式”。
走向星辰大海的不同航路
生成式AI代表未來是東西方大模型創(chuàng)業(yè)者的共識(shí),而就AI發(fā)展道路來看,這個(gè)共識(shí)之后延伸出的道路卻在不同的構(gòu)想中走向分野,就像字母Y一般。
在中國(guó)創(chuàng)業(yè)語境里,“入口”往往是某個(gè)產(chǎn)品或業(yè)務(wù)的終局。在既往發(fā)展路徑與移動(dòng)互聯(lián)網(wǎng)高速發(fā)展的引導(dǎo)下,我們追求的是極致規(guī)?;瘞淼慕跤趬艛嗟氖袌?chǎng)地位。
海外則與之不同,產(chǎn)品或業(yè)務(wù)的終局是通過極致工程化來盡可能放大產(chǎn)品對(duì)人類社會(huì)發(fā)展進(jìn)程的影響,做那只大洋彼岸煽動(dòng)翅膀的蝴蝶。當(dāng)影響力足夠大時(shí),商業(yè)模式與盈利也將隨之而來。
或許這也是為什么面對(duì)同樣的AI硬件風(fēng)口,國(guó)內(nèi)企業(yè)會(huì)一窩蜂擠進(jìn)確定性較強(qiáng)的AI OS賽道,而以Brilliant Labs為代表的海外創(chuàng)業(yè)者會(huì)從不同的角度切入較垂直的細(xì)分場(chǎng)景,尋找潛在的機(jī)會(huì)。
正如法國(guó)哲學(xué)家在批判現(xiàn)代工業(yè)社會(huì)時(shí)提出的“單向度的人”,效率至上的社會(huì)節(jié)奏規(guī)訓(xùn)出人們單一的價(jià)值取向和判斷標(biāo)準(zhǔn),一維的社會(huì)聲音和思想逐漸形成, Bobak希望能通過他的產(chǎn)品改變這一現(xiàn)狀。
“我一直鼓勵(lì)人們學(xué)習(xí)從多個(gè)層次(Layers)去看待周圍的萬事萬物,跳脫出經(jīng)歷、觀念、教育等帶來的局限性。而Frame便是用來幫助我們從多層次、多維度與多角度觀察世界的工具?!?/p>
正是這一愿景推動(dòng)Brilliant Labs將AI與AR技術(shù)相結(jié)合,并推出了Frame。這背后的邏輯是,如果大模型本身解決了最基礎(chǔ)的交流,那么虛擬現(xiàn)實(shí)與多模態(tài)便賦予了AI更豐富的交互與感知,這本身便是一個(gè)創(chuàng)新機(jī)遇所在。
反過來看,AR這項(xiàng)技術(shù)也不應(yīng)自我限制在簡(jiǎn)單的娛樂上。
Brilliant Labs創(chuàng)立時(shí)恰逢疫情與NLP、CV一類AI技術(shù)大爆發(fā)期間,但AR賽道的創(chuàng)業(yè)者們?cè)谝訮okemon GO為代表的數(shù)個(gè)成功案例的引導(dǎo)下,不斷將AR概念向影音、游戲等娛樂方式推動(dòng)。彼時(shí)的Bobak便時(shí)常捫心自問,這究竟是不是AR的終局?
這樣的疑問在AI之下得到了解答,Bobak早在大模型風(fēng)起前數(shù)年便將目光投向AI,并構(gòu)想了一個(gè)透過AI突破人類承載知識(shí)的極限,從而成為尼采設(shè)想中的“超人”的終局——all of the knowledge on the internet will live within our minds(互聯(lián)網(wǎng)上的所有知識(shí)都將存在于我們的腦海中)。
“Noa不僅是一個(gè)多模態(tài)AI助手,它的知識(shí)圖譜還可以持續(xù)記錄、分析使用者遇到的問題并總結(jié)經(jīng)驗(yàn)”,Bobak說,“如果我們使用Frame足夠長(zhǎng)的時(shí)間,這些個(gè)性化的知識(shí)與經(jīng)驗(yàn)便可以傳承給我們的后代”。
如果說上文提到的Perplexity解決了我們獲得去偽存真的互聯(lián)網(wǎng)信息的問題,那么Noa的知識(shí)圖譜解決的便是個(gè)性化的私人經(jīng)驗(yàn)問題。作為一款支持處方鏡片的AI眼鏡,F(xiàn)rame天然有著比智能手機(jī)更長(zhǎng)的使用時(shí)間,也能通過與我們的交互,感知并記錄更多生活上的細(xì)節(jié),無論是學(xué)習(xí)、求職、婚戀還是養(yǎng)老。
那么當(dāng)我們的后代使用Frame,與我們的personal Noa交互,其便能在他們遇到相似情況時(shí)給出建議,比如求職時(shí)應(yīng)如何應(yīng)對(duì)面試官,學(xué)習(xí)時(shí)要通過思維導(dǎo)圖提升效率等,讓人們都不會(huì)再“淌入同一條河流”,就像美劇《權(quán)力的游戲》中能看見古今未來的三眼烏鴉。
當(dāng)然,長(zhǎng)期主義下的終局仍需持續(xù)的商業(yè)運(yùn)作,F(xiàn)rame作為一個(gè)面向普羅大眾的硬件產(chǎn)品,它還是要考慮其受眾、盈利、商業(yè)模型等問題。
據(jù)悉,F(xiàn)rame在銷售上采取了以直銷為主的銷售模式,其已于日前開啟預(yù)定,并在2024年4月開始發(fā)貨。如果Frame進(jìn)入大陸地區(qū),其還將支持調(diào)用包括文心一言在內(nèi)的國(guó)產(chǎn)大模型。我們還了解到,目前預(yù)定Frame最多的群體并非對(duì)AI感興趣的普通人,而是根植于賽道內(nèi)的開發(fā)者。
和許多帶有極客色彩的創(chuàng)新產(chǎn)品相似,面對(duì)一個(gè)全新的產(chǎn)品,往往是開發(fā)者率先嘗試并形成由美國(guó)學(xué)者埃弗雷特·羅杰斯提出的創(chuàng)新擴(kuò)散模型。實(shí)際上,無論是開發(fā)者還是早期用戶,在面對(duì)一個(gè)不甚成熟的產(chǎn)品時(shí)都會(huì)自發(fā)探索其邊界,最終通過社區(qū)、社交媒體、私域等渠道與企業(yè)建立良好的強(qiáng)化反饋體系,幫助產(chǎn)品迭代。
整個(gè)2023年,AI技術(shù)在頂層設(shè)計(jì)與B端商業(yè)化的影響下,直至去年9月才開始大規(guī)模面向用戶,這導(dǎo)致AI的創(chuàng)新擴(kuò)散走了大半年的限速車道。這也是國(guó)內(nèi)大模型應(yīng)用落地遜于海外的原因之一。
AI硬件賽道持續(xù)火熱,在這條試圖通往AGI的航路上,我們目前難以斷言東西方的不同創(chuàng)業(yè)者中,誰將率先拿下賽點(diǎn)?;蛟S,商業(yè)化的終局導(dǎo)致AI PC與AI Phone的發(fā)展已經(jīng)開始進(jìn)入相互角力的垃圾時(shí)間,而小而美的創(chuàng)業(yè)公司更能代表生成式AI的創(chuàng)新與未來。