文|劉曠
曾經靠語音助手紅極一時的智能音箱,近年來的市場表現(xiàn)卻欠佳。據(jù)洛圖科技發(fā)布的最新《中國智能音箱零售市場月度追蹤》報告顯示,2022年中國智能音箱總銷量為2631萬臺,同比下降28%;市場銷售額為75.3億元,同比下降25%。而IDC發(fā)布的2023年中國智能家居市場的十大洞察也透露,智能音箱的市場需求正在逐漸消退,整個市場呈現(xiàn)下滑趨勢。
但隨著ChatGPT這種生成式AI技術的快速發(fā)展,搭載ChatGPT的智能音箱將有望獲得新的增長空間。據(jù)中泰證券分析,目前全球存量智能音箱超7億臺,如考慮產品本身3-5年左右的替換周期,本輪ChatGPT帶來的替換需求或在1.4億-2億臺每年,有望再次成為市場熱點。在此基礎上,智能音箱的交互水平也將有望再上新臺階。
ChatGPT或成新變量
一直以來,市場上的智能音箱產品多多少少都存在著交互體驗差、應用場景單一、產品缺乏創(chuàng)新,以及互聯(lián)互通差等問題,而當下以ChatGPT為代表的生成式AI技術,則在上下文理解、多輪對話、內容生成等方面,展現(xiàn)出了極高的交互水準,ChatGPT或將為智能音箱帶來新的變量。
一來,依托于ChatGPT在內容生成和理解能力上的優(yōu)勢,智能音箱的應用場景將進一步被擴展。ChatGPT具有在對話系統(tǒng)、文本生成、語音識別和文本分類等多種場景中的應用優(yōu)勢。具體來說,在對話系統(tǒng)中,ChatGPT可以生成自然流暢的對話內容,支持多輪對話;在文本生成中,ChatGPT可以生成高質量的文本內容,支持多種文本生成任務;在語音識別中,ChatGPT支持多語種語音識別,提供全面的語音交互體驗;在文本分類中,ChatGPT可以應用于多種文本分類任務,自動學習特征,提高分類效果和效率。ChatGPT的多領域應用優(yōu)勢,使得它成為自然語言處理領域的重要工具之一。
也就是說,搭載了ChatGPT的智能音箱可以進一步理解用戶的意圖,讓回答內容的質量能夠更趨向于真人的表現(xiàn)。未來,智能音箱的功能可能并不止于家庭,或許會走進辦公場所成為人們工作的助手等。
二來,ChatGPT也正在帶動智能音箱產業(yè)成為資本的焦點。隨著ChatGPT在全球的走紅,作為人工智能交互載體的智能音箱再次成為市場熱點,包括奮達科技、漫步者、惠威科技、國光電器等在內的智能音箱概念股,近期都出現(xiàn)了大漲行情,資金涌入跡象十分明顯??梢哉f,在智能音箱產業(yè)進入瓶頸期的當下,ChatGPT的出現(xiàn)又將智能音箱重新拉回了大眾視野,并為其帶來了全新的可能。
當然,ChatGPT能為智能音箱產業(yè)帶來多少新變量,還需等到搭載著ChatGPT的智能音箱真正走進萬千家庭才能知曉。
小度更聰明
目前為止,智能音箱與生成式AI技術的結合已經在巨頭玩家中初現(xiàn)雛形。據(jù)悉,今年2月9日,小度宣布將融合文心一言,打造針對智能設備場景的AI模型“小度靈機”,并將其應用到小度全系產品中。借助小度靈機大模型,小度智能音箱中的語音助手可以變成“超級助理”。
其一,借助小度靈機大模型,小度智能音箱擁有了提取和整合復雜信息的能力。在官方發(fā)布的測試視頻中,測試員告訴超級助理,他要在周末做各種各樣的事情,而在敘述這些事的時候,測試員會故意提出“修改時間”的要求,比如原定于周日要做的A事件被B事件替換。即使面對測試員的一系列復雜要求,這位超級助理也可以從中提煉出真正有效的信息,并據(jù)此給測試員生成一份正確的時間安排表。
而此前的小度智能音箱并沒有理解和提取整合這樣復雜信息的能力,可見小度靈機模型的作用體現(xiàn)得比較明顯。
其二,在智能家居場景中的設備控制環(huán)節(jié),小度靈機大模型能更準確地識別出用戶的真實需求。在智能家居場景中,小度靈機大模型可以化身為“智能管家”,例如在官方的測試中,測試員告訴智能管家他每天早上七點半一定要起床,周末可以晚一些,大概九點,干脆就九點半,冬天室內溫度不能低于23度,夏天溫度可以定在26度。此時,超級助理就可以根據(jù)這些描述,確定要在什么時候開啟家中的空調、調整到什么樣的溫度比較合適。
相比傳統(tǒng)智能助手只會理解“打開空調”這樣簡單、單一的指令,靈機模型則可以認識到用戶到家時,家里溫度與用戶所期望的不一樣,所以需要打開空調,并且根據(jù)現(xiàn)在的季節(jié)調節(jié)到合適的溫度。顯然,大模型的加入,可以讓智能音箱實現(xiàn)認知能力上的提升。
天貓精靈更有溫度
另一智能音箱領域的巨頭玩家天貓精靈,也亮出了其在生成式AI技術領域的成果積累。4月11日,天貓精靈宣布將正式接入阿里巴巴通義千問。根據(jù)官網顯示的信息,通義千問是一個專門響應人類指令的大模型,目前已經開啟了企業(yè)邀請測試,并放出了測試官網。
據(jù)阿里巴巴集團董事會主席兼首席執(zhí)行官、阿里云智能集團首席執(zhí)行官張勇透露,未來,天貓精靈除了能回答用戶的提問外,還會成為更人性化的智能助手,天貓精靈的策略是針對智能音箱訓練出一個個性更為鮮明的大模型。
一方面,接入通義千問的天貓精靈能夠產生一些特定的人格化特征,滿足用戶的個性化需求。不同于知識面更為廣泛的通識性大模型,天貓精靈在通義千問這種更加垂直的個性化大模型的加持下,能夠變得更擬人、更聰明,其知識、情感、個性、記憶力等都會得到大幅躍升。比如“鳥鳥分鳥”這一模型,其語氣、語調與脫口秀演員鳥鳥就如出一轍,這樣也增加了天貓精靈的可玩性,使其成為有溫度的智能化助手。
另一方面,新一代的天貓精靈將具備更為靈活的對話能力。接入通義千問的天貓精靈支持自由對話,用戶可以隨時打斷或者切換話題,天貓精靈能根據(jù)用戶需求和場景隨時生成內容。例如,用戶在跑步過程中,可以要求天貓精靈根據(jù)180步頻合成適合跑步的歌單,同時還可以與天貓精靈展開關于文化、人生等領域的深入交流。
得益于通義千問強大的技術支持,天貓精靈的用戶體驗將更具智能化和個性化。而在正式接入通義千問之后,天貓精靈在未來一段時間或許會出現(xiàn)比較大幅度的使用體驗提升,這或許也可以幫助阿里巴巴進一步鞏固其在智能音箱市場的領先地位。
現(xiàn)實壁壘
事實上,不只是小度和天貓精靈在ChatGPT領域有所布局,華為、小米等也在生成式AI技術以及智能音箱領域均有布局。不過,要想讓搭載著生成式AI技術的智能音箱真正在每一個用戶家中實現(xiàn)普及,其背后還存著一些天然壁壘。
一是,算力成本高昂。從算力層面來看,面對參數(shù)規(guī)模的大幅增長,“暴力堆疊”(利用大量高性能GPU)已經成為企業(yè)提升大模型訓練效果的主要手段,這背后高昂的成本可能將會成為ChatGPT版智能音箱落地普及的門檻。
不過,隨著開源大模型的出現(xiàn),一些企業(yè)不需要自己從0到1去訓練大模型,被訓練好的大模型可以直接調用,再在這一基礎上進行優(yōu)化,這相比于從頭開始訓練的大模型,其成本將少得多。并且,未來隨著算法進化,大模型訓練過程中對算力的依賴度也會大大降低。
二是,搭載ChatGPT的智能音箱的使用場景受限。ChatGPT爆火的很大一部分原因是它可以顛覆式提升生產效率,而這種輸出方式主要是以文字、圖片、視頻為主,但智能音箱則更注重語音交互。而且在人們的日常生活和工作中,需要音頻反饋的內容可能只占一小部分,因此ChatGPT版智能音箱的普及落地需要尋找更多的適配于語音交互的場景,而使用場景受限則意味著使用ChatGPT版智能音箱可能很快也會褪去熱度。
三是,搭載ChatGPT的智能音箱可能面臨數(shù)據(jù)安全挑戰(zhàn)。若想要搭載生成式AI技術的智能音箱能夠更好地理解用戶需求,并給出個性化的解決方案,那么生成式AI勢必會涉及對用戶個人信息的收集,而用戶對于個人隱私的收集問題一直都比較敏感。另外,相關的法律法規(guī)并不健全,這都將是ChatGPT版智能音箱在普及過程中面臨的挑戰(zhàn)。
此外,ChatGPT對智能音箱整個產業(yè)的影響必然是一個長期的過程,而生成式AI技術仍處于發(fā)展早期,其對于智能音箱這一產業(yè)所產生的切實影響可能還未明確展現(xiàn)出來,但可以預見的是,ChatGPT引爆的熱潮正在加速這一進程。