文|烏鴉智能說(shuō)
今年,被很多人看作是AI硬件的元年,很多公司發(fā)布了不少有趣的AI硬件,像AI Pin、Rabbit R1,但都有點(diǎn)高開(kāi)低走的意思,評(píng)價(jià)最好的反而是只做AI+錄音機(jī)的Rewind Pendant。
可能是受到這個(gè)事情的啟發(fā),科技巨頭們開(kāi)始紛紛盯上了另一種AI驅(qū)動(dòng)的新設(shè)備——AI耳機(jī)。根據(jù)外媒報(bào)道,Meta平臺(tái)正在探索開(kāi)發(fā)帶有攝像頭的人工智能耳機(jī)。而就在4月,字節(jié)跳動(dòng)也收購(gòu)了一家耳機(jī)公司。
相比AI Pin、Rabbit R1等AI硬件,AI耳機(jī)的好處在于,完全拋棄了顯示功能,在充分利用AI感知能力的同時(shí),最大程度地優(yōu)化了便捷性,與手機(jī)形成了明顯的差異化。
畢竟,在光學(xué)顯示技術(shù)沒(méi)有革命性進(jìn)步的前提下,足夠分辨率的顯示效果,就需要增加設(shè)備的體積,進(jìn)而影響便捷性,以至于AI硬件很容易面臨靈魂拷問(wèn):既然都是要拿在手里,我為什么不用手機(jī)呢?
在所有人都幻想著下一代個(gè)人計(jì)算平臺(tái)的當(dāng)下,主打便捷性的AI耳機(jī),似乎成為AI硬件最容易突破的方向。
/ 01 / 科技巨頭扎堆AI耳機(jī)
這段時(shí)間,越來(lái)越多科技公司開(kāi)始布局AI耳機(jī)。
據(jù)國(guó)外媒體報(bào)道,Meta平臺(tái)正在探索開(kāi)發(fā)帶有攝像頭的人工智能耳機(jī),希望這種設(shè)備能用來(lái)識(shí)別物體和翻譯外語(yǔ)。
Meta的首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)已經(jīng)看過(guò)了該設(shè)備的幾種可能設(shè)計(jì),但一名員工表示,他還沒(méi)有對(duì)任何設(shè)計(jì)感到滿意。目前尚不清楚最終設(shè)計(jì)將是入耳式耳機(jī)還是頭戴式耳機(jī)。這個(gè)項(xiàng)目在Meta內(nèi)部被稱(chēng)為“Camerabuds”。
OpenAI的CEO Sam Altman最近告訴一位合作伙伴,他和前蘋(píng)果首席設(shè)計(jì)師Jony Ive的設(shè)計(jì)公司LoveFrom已經(jīng)探索了開(kāi)發(fā)帶攝像頭的耳機(jī)設(shè)備。不僅如此,蘋(píng)果也在探索在其耳機(jī)中加入攝像頭和AI。
據(jù)國(guó)外媒體報(bào)道,電子產(chǎn)品公司Ear Micro的Bear Clark表示,科技公司對(duì)開(kāi)發(fā)“可聽(tīng)穿戴設(shè)備”的興趣在過(guò)去八到十個(gè)月里激增。Clark說(shuō),最近有兩家大型科技公司聯(lián)系他,希望開(kāi)發(fā)智能耳機(jī),盡管他拒絕透露這些公司的名稱(chēng)。
除了自行研發(fā)外,科技巨頭們也在通過(guò)收購(gòu)布局耳機(jī)市場(chǎng)。根據(jù)媒體報(bào)道,字節(jié)跳動(dòng)已于4月份收購(gòu)OWS公司Oladance品牌大十科技,收購(gòu)價(jià)格在3-5億元之間,目前字節(jié)跳動(dòng)團(tuán)隊(duì)人員已經(jīng)進(jìn)駐大十科技。
收購(gòu)Oladance或是字節(jié)推出AI眼鏡和AI手機(jī)的重要?jiǎng)幼鳌?jù)說(shuō)創(chuàng)始人李浩乾將入職字節(jié)跳動(dòng),職級(jí)比大多類(lèi)似的收購(gòu)的CEO級(jí)別都要高,體現(xiàn)字節(jié)硬件的決心和戰(zhàn)略高度。
今年4月,由 Alphabet 旗下的神秘實(shí)驗(yàn)室 Google X 孵化的Iyo,已經(jīng)推出了一款A(yù)I 藍(lán)牙耳機(jī)Iyo One。
Iyo One 的外觀和交互沒(méi)有 Ai Pin 那么激進(jìn),就是一副體型更大的藍(lán)牙耳機(jī),沒(méi)有屏幕,不搞手勢(shì),不搞投影,不搞觸摸,專(zhuān)注于自然語(yǔ)言的語(yǔ)音交互。在應(yīng)用場(chǎng)景上,創(chuàng)始人 Jason Rugolo 舉了一些例子,比如收到郵件或短信,不必拿出手機(jī)、滑動(dòng)、打字,完全可以在坐著喝咖啡的時(shí)候,用耳朵接收信息。
至少?gòu)哪壳翱矗呀?jīng)有Meta、OpenAI、字節(jié)跳動(dòng)等多家科技大廠有意布局AI耳機(jī)。
/ 02 / 把便攜性拉到極致
為什么這么科技公司會(huì)選擇耳機(jī)?在我看來(lái),主要有以下兩個(gè)原因:
第一,盡管新的計(jì)算平臺(tái)尚未誕生,但基于過(guò)去硬件發(fā)展的經(jīng)驗(yàn),行業(yè)對(duì)下一代計(jì)算設(shè)備仍然有幾點(diǎn)共識(shí):一個(gè)比手機(jī)更輕、更小、更便宜、更隨身的設(shè)備。基于這幾點(diǎn),眼鏡、耳機(jī)、項(xiàng)鏈、帽子等等一切可攜帶的物品,都被認(rèn)為是可能的候選形態(tài)。
與AI Pin等AI硬件相比,AI耳機(jī)在便攜性方面有著天然優(yōu)勢(shì)。AI耳機(jī)基本完全拋棄了顯示這一交互方式,有利于最大程度放大便攜性?xún)?yōu)勢(shì)。
根據(jù)怒喵科技CEO李楠的看法,光學(xué)顯示技術(shù)在三年內(nèi)不會(huì)有革命性的進(jìn)步,因此要想做到有足夠分辨率的顯示效果,就需要增加設(shè)備的體積,而這勢(shì)必會(huì)影響便攜性。而便攜性恰恰是AI硬件最重要的屬性。
第二,耳機(jī)這個(gè)品類(lèi)過(guò)去幾年在場(chǎng)景化方面取得了重要的突破,變得越來(lái)越重要。
手機(jī)滲透生活的歷史,也是耳機(jī)技術(shù)變革的歷史。智能手機(jī)時(shí)代耳機(jī)的變革分成三個(gè)階段:音質(zhì)驅(qū)動(dòng)階段:耳機(jī)的主要改進(jìn)聚焦在音質(zhì)提升;場(chǎng)景驅(qū)動(dòng)階段:分別面向開(kāi)放場(chǎng)景和封閉場(chǎng)景兩個(gè)方向發(fā)展;體驗(yàn)驅(qū)動(dòng)階段:為了能夠長(zhǎng)時(shí)間佩戴,出現(xiàn)了 OWS 開(kāi)放式可穿戴耳機(jī),分別向掛耳耳機(jī)和夾耳耳機(jī)兩個(gè)方向發(fā)展。
隨著手機(jī)中音頻、視頻內(nèi)容占比的逐漸增加,人們對(duì)長(zhǎng)時(shí)間佩戴耳機(jī)的需求越來(lái)越大。這標(biāo)志著耳機(jī)從單一功能(僅用于聽(tīng)音樂(lè)或打電話)的轉(zhuǎn)變?yōu)槎喙δ芷者m性產(chǎn)品,成為接收各類(lèi)多媒體信息的設(shè)備。
也就是說(shuō),耳機(jī)已經(jīng)能夠完成多媒體內(nèi)容與日常信息交流的處理,是重要性、計(jì)算能力僅次于手機(jī)的第二大可攜帶計(jì)算設(shè)備。
基于以上兩點(diǎn),在沒(méi)有新硬件形態(tài)的情況下,將便捷性拉到極致的耳機(jī),似乎成為AI硬件最容易突破的方向。
/ 03 / 探索AI耳機(jī)的兩種思路
從目前看,AI耳機(jī)的探索大致有兩種思路:
AI耳機(jī)的第一種思路是AI+耳機(jī),以耳機(jī)為硬件載體,通過(guò)更多交互方式,讓耳機(jī)成為下一個(gè)的個(gè)人計(jì)算中心,路徑有三:
一是,利用AI提升耳機(jī)的環(huán)境感知能力,不僅通過(guò)視覺(jué)感知環(huán)境,甚至加入視覺(jué)。比如,蘋(píng)果和Meta都在嘗試往耳機(jī)上面裝攝像頭。
根據(jù)彭博社爆料,蘋(píng)果從去年開(kāi)始就研究帶有攝像頭的AirPods,代號(hào)為 “B798”。這款耳機(jī)的大小和現(xiàn)有AirPods幾乎相同,只不過(guò)內(nèi)嵌了低分辨率攝像頭。攝像頭可以用來(lái)拍照,以及通過(guò)AI實(shí)現(xiàn)多個(gè)功能,為用戶(hù)的日常生活提供協(xié)助。
二是通過(guò)技術(shù)實(shí)現(xiàn)更好的交互體驗(yàn)。比如,GPT-4o把語(yǔ)音交互的延遲從2s降低到300ms,還給了極其豐富的音色表現(xiàn)力。
不久前,華盛頓大學(xué)也研發(fā)了一款名為T(mén)arget Speech Hearing(TSH)的人工智能耳機(jī)系統(tǒng),它能夠通過(guò)佩戴者的注視來(lái)“鎖定”目標(biāo)說(shuō)話者,過(guò)濾掉環(huán)境中的其他聲音。
佩戴者只需將頭部對(duì)準(zhǔn)目標(biāo)說(shuō)話者,注視3-5秒鐘后,輕按一個(gè)按鈕,系統(tǒng)便會(huì)開(kāi)始捕捉并分析該說(shuō)話者的聲音特征。此后,無(wú)論佩戴者如何移動(dòng),系統(tǒng)都會(huì)持續(xù)播放被“鎖定”的說(shuō)話者的聲音,實(shí)現(xiàn)個(gè)性化的聽(tīng)覺(jué)體驗(yàn)。
三是基于更強(qiáng)的計(jì)算能力,提供更多的語(yǔ)音功能。比如,Iyo One 正式發(fā)布時(shí),預(yù)計(jì)將有消息、電話、導(dǎo)航、音樂(lè)播放等語(yǔ)音功能,動(dòng)動(dòng)嘴巴就能回消息。
AI耳機(jī)的另一種思路是往現(xiàn)有耳機(jī)里增加AI功能,在原有的基礎(chǔ)上,利用AI技術(shù)補(bǔ)充一些功能,提供新的體驗(yàn)。
比如,研發(fā)翻譯軟硬件產(chǎn)品的深圳公司 Wooask,推出了結(jié)合 ChatGPT 的新款觸屏耳機(jī) TransBuds A8,支持實(shí)時(shí)翻譯 144 種語(yǔ)言,聲音傳到耳朵,文字則顯示在屏幕。
消費(fèi)電子品牌 Nothing 也是這個(gè)思路,升級(jí)現(xiàn)有設(shè)備,而不是通過(guò)新的硬件重新發(fā)明輪子。
今年 4 月,Nothing 宣布,在 Nothing 手機(jī)安裝了最新 Nothing OS 和 ChatGPT 的用戶(hù),可以直接通過(guò) Nothing 耳機(jī)與 ChatGPT 對(duì)話,聯(lián)網(wǎng)后捏住耳機(jī)便能激活,捏住耳機(jī)就能和 AI 對(duì)話、問(wèn)問(wèn)題。
相比于后者,前者的路線無(wú)疑更加興奮。尤其當(dāng)所有人都沉浸在AI創(chuàng)造下一個(gè)計(jì)算平臺(tái)的敘事里,AI耳機(jī)無(wú)疑為我們帶來(lái)了更多的可能性。