文|光子星球 郝 鑫
編輯|吳先之
沉寂已久的AI語音賽道,因GPT4o又熱鬧起來了。
語音開源項目ChatTTS爆火出圈,能笑、能模仿還能實時互動;主打共情AI語音的Hume AI趁勢推出了第一個AI情感互動播客產(chǎn)品;AI音視頻基礎設施平臺初創(chuàng)公司LiveKit宣布籌集2250萬美元的A輪融資,OpenAI和Character.AI都是其客戶。
自大模型浪潮席卷而來,AI語音賽道經(jīng)歷了從克隆、合成到實時反饋、情感化的變化。
在大模型多模態(tài)進化的主線之下,AI語音一直像“影子”般存在。作為工具屬性的痕跡尤其明顯,它是狼人殺游戲里NPC發(fā)號的指令,是數(shù)字人表演的一環(huán),也是Sora生成視頻后的背景樂。
正因如此,語音的價值被低估了。
聲音打通的是無數(shù)個場,游戲的、帶貨的、教育的等等,最后抵達的是用戶。在大模型時代,把聲音功能前置是一種典型的產(chǎn)品思維,這意味著更低的門檻、更高效的交互方式以及更龐大的用戶群體。
“這幾乎是我第一次熬夜看美國科技產(chǎn)品發(fā)布會,很多場景能夠被解鎖,十分驚艷”,瀾碼科技創(chuàng)始人周健掩按捺不住內(nèi)心的激動。
GPT4o進一步打開了多模態(tài)的想象力。當補齊了語音模態(tài)這塊拼圖后,主打原生交互體驗的產(chǎn)品被推向了商業(yè)化落地的邊緣,其背后是一批等待突圍的情感陪伴類大模型應用產(chǎn)品。
不同于數(shù)字人、智能客服的toB模式,面向C端的AI產(chǎn)品同樣競爭激烈,MiniMax“星野”、字節(jié)“貓箱”和“小黃蕉”、百度“萬話”、美團“Wow”、閱文“筑夢島”、聆心智能“Aiu”,正在排隊等待下一場Kimi式的爆火。
語音激活客服、情感陪伴
TTS(文本轉(zhuǎn)語音)在語音賽道已經(jīng)是一項比較成熟的技術。大模型爆火初期,就有一些創(chuàng)業(yè)公司入局該領域,通過精調(diào)小參數(shù)模型來實現(xiàn)克隆、還原聲音的功能,以出售“聲音皮膚”或被集成到原有的游戲、直播等場景中來提供服務。
但在實際落地中,語音淪為了蛋糕上的裝裱。
以典型的智能客服行業(yè)為例,智齒科技向光子星球透露,“語音在業(yè)務中僅承擔了通道的角色,最終決定客戶是否買單,還是解決問題的效率和準確率?!痹谶@種情況下,很少有客戶直接提出要定制化聲音客服的需求。
“大模型來臨前,在客服營銷場景中,語音技術已經(jīng)可以做到百毫秒內(nèi)響應”,智齒科技表示道。
大模型創(chuàng)業(yè)者曾在公開采訪中表示,GPT4o技術實現(xiàn)上難度不太大,“直接把語音模型和語言模型合在了一起”。
GPT4o或許不夠驚艷,但落地產(chǎn)品可以用“打通任督二脈”來形容,本質(zhì)上多模態(tài)讓AI應用和場景“活”了起來。
免費、靈活調(diào)用、情感化、無延遲互動反饋,是本次GPT4o升級的關鍵詞。眾多行業(yè)和賽道中,語音客服和情感陪伴類產(chǎn)品成為了第一批受益者。
智齒科技告訴光子星球,客服系統(tǒng)以前也有情緒打分評價,但是方式比較簡單粗暴,更多是通過詞語表面?zhèn)鬟_的含義來判斷,比如“累、困”這類字眼就與情緒低落相聯(lián)系,但是機器感受不到用戶的情緒波動。
在加入情感因素后,可以通過捕捉客戶聲音的大小、急緩變化來判斷響應的緊急性?!坝脩粽f話特別激動,特別大的時候,就得立馬人工介入了,再使用機器人就得出問題”,智齒科技表示道。
于是,語音只是通道和承載容器的現(xiàn)狀被打破了。在智能客服營銷場景,語音變成了新維度的增值信息,用來做決策參考。
同樣立竿見影的效果也發(fā)生在情感陪伴類產(chǎn)品賽道。
觀察國內(nèi)外AI原生應用,會發(fā)現(xiàn)一個共同的邏輯,凡是瞄準C端用戶的產(chǎn)品,就會在一開始內(nèi)嵌語音功能。這樣的例子比比皆是,比如國外的Character.AI、Pi、Digi,國內(nèi)的豆包、星野、貓箱等。
語音前置的產(chǎn)品思維,首先是為了降低使用門檻,來擴大適用人群的范圍,這是能成為Super App的前提條件之一。同時,相較于文字,語音的媒介更容易抵達用戶,上述列舉的AI應用不約而同地都指向了體驗、陪伴和情緒價值。
同樣是對話生成,在國內(nèi)外分野出了兩條賽道,一類是效率類工具,一類是情感陪伴類產(chǎn)品。效率和情感類產(chǎn)品站在了大模型幻覺的兩極,前者是盡可能杜絕,后者則是放大化。
在國內(nèi),Kimi打響了效率類工具的爭奪戰(zhàn),靠在B站、抖音、小紅書等平臺投流占領用戶心智,完成了破圈傳播。然而,在無人在意的角落,MiniMax的情感陪伴類產(chǎn)品星野也在嘗試占據(jù)“中國ChatGPT”、“智能助手”一類相同的詞條獲得關注。
在GPT4o之前,情感陪伴類的產(chǎn)品只能算得上半截子產(chǎn)品,多以靜態(tài)的文字交互為主。最能抵達用戶,穿透場景直接傳遞感情溫度的語音則更像是順手設置的功能。待多模態(tài)大范圍應用后,一批情感陪伴類的產(chǎn)品將迎來升級,能夠主動捕捉用戶的需求和情感變化,以更加人格化的方式與用戶實時互動交流。
一如MiniMax 創(chuàng)始人兼 CEO 閆俊杰所判斷,“大模型在多模態(tài)的每一次進步,都會帶來用戶體驗的提升、獲得更高的用戶滲透率。比如,當 GPT-4o 擁有更絲滑的語音交互(延時縮短、增加情感等)后,它就會走向更多人?!?/p>
情感類AI應用產(chǎn)品等待爆發(fā)
國內(nèi)情感陪伴類AI應用產(chǎn)品等待著升級,更等待著爆發(fā)。
這類應用實際上是披著小說外殼的智能體“大禮包”,目前有兩類玩家在押注這個賽道。
一類是老牌玩家,有百度的“萬話”、美團的“Wow”、閱文的“筑夢島”、字節(jié)的“貓箱”等,這類公司的特點是資源豐富,有大量的應用場景,也有資本砸錢投流營銷;另一類是年輕的大模型公司玩家,如Minimax的“星野”、清華系聆心智能的“Aiu”等,這類公司對于AI原生的理解更具想象力,愿意投入大量的精力和資源All in 應用層。此外,豆包、通義、智譜清言等效率助手也內(nèi)嵌了大量偏娛樂向的智能體。
國內(nèi)大部分的情感類產(chǎn)品都在不同程度上對標Character.AI。Character.AI在社交娛樂賽道上遙遙領先,已經(jīng)成長為僅次于ChatGPT的全球第二大AI應用。數(shù)據(jù)顯示,Character.AI總月活用戶超過了千萬,活躍用戶日均使用時長超過了2個小時。
相關研究機構(gòu)預測,2024年將會是情感陪伴類產(chǎn)品爆發(fā)式增長一年。但目光聚焦到國內(nèi),暫時無法能找到與Character.AI差不多量級的情感類AI應用。在這種情況下,也許多模態(tài)能成為一個新的突破口。
延續(xù)著Character.AI的路線,市面上的大部分玩家都想做AI時代的UGC內(nèi)容社區(qū)。從內(nèi)容上做進一步劃分,有偏向游戲化的星野,將故事對話、抽卡、集小卡等游戲的玩法融入到了應用中;有融合了專業(yè)心理咨詢指導的Aiu,也有乙女向的萬話、筑夢島、貓箱等。
在如何做產(chǎn)品上,新老玩家呈現(xiàn)出了截然不同的態(tài)度。老玩家要復制曾經(jīng)成功過的自己,新玩家則更想創(chuàng)造一個全新的AI原生應用。
在資深玩家的身上總能找到過去產(chǎn)品的影子。
閱文開發(fā)的筑夢島文字感極強,幾乎與閱讀小說的體驗一樣,里面有不少閱文旗下IP化的小說人物角色智能體。閱文筑夢島為智能體打的標簽、角色介紹以及對話細節(jié)的刻畫,在當前仍以文字交互為主的狀態(tài)下,代入感會更強。
(圖源:閱文筑夢島)
開啟智能體角色對話模式后,產(chǎn)品體驗感類似于主打互動式文字游戲的橙光。贈送禮物、購買日卡、月卡,吸引用戶付費的方式也與閱讀小說如出一轍。
當前各個應用為了聚集用戶,對智能體的創(chuàng)建沒有明確的限制,但長期以往,IP版權(quán)會成為一項競爭力,屆時閱文的優(yōu)勢將凸顯出來。閱文依舊可以通過授權(quán)IP,將熱門影視作品IP的主要人物打造成智能體,來延長IP生命周期,打通新的變現(xiàn)渠道。
字節(jié)的貓箱就像是另一個抖音,上下滑動可以隨機掉落不同的智能體,一鍵點擊加號可以創(chuàng)建智能體,點擊作者名字可以關注,進入頁面還能查看該作者的其他作品。因此,相較于其他應用,貓箱一進主頁就給了人一種熟悉感,也就更容易上手試玩。
(圖源:字節(jié)貓箱)
貓箱的前身是話爐,雖然在今年才正式上線,但早在去年字節(jié)就靠海外AI產(chǎn)品賽馬的方式積累了大量經(jīng)驗。另據(jù)光子星球了解,為了獲得更精準的反饋數(shù)據(jù),字節(jié)曾招聘專門的人員來訓練智能體。所以,字節(jié)貓箱一上線就呈現(xiàn)出了較成熟的產(chǎn)品形態(tài)。背靠抖音的流量大池,貓箱獲得了大量的曝光機會,有豆包的用戶增長案例在前,貓箱有很大潛力出圈成為下一個爆款。
星野等新應用雖然看不到太多互聯(lián)網(wǎng)的痕跡,但是整個賽道面臨著和效率工具同樣的問題,同質(zhì)化嚴重。目前,除了星野建立了一點用戶心智,剩下的應用產(chǎn)品似乎都站在了同一起跑線上,當大家的玩法差不多,誰先能像Kimi一樣出圈,誰就擁有了主動權(quán)。
AI女友,危險的“現(xiàn)金?!?/h4>
AI情感類產(chǎn)品經(jīng)常被戲謔為“AI女友”項目,字節(jié)“空降”的小黃蕉應用,從二次元走向了真人,直接貼上了AI虛擬交友的標簽。
盡管OpenAI的奧特曼曾經(jīng)在公開場合表達過對“AI女友”的不屑。
但有多位投資人對光子星球表示過,“當大家都開始找PMF(產(chǎn)品與市場的匹配度)的時候,情感類是最確定的?!毖韵轮饩褪?,當用戶的使用規(guī)模和時長達到一定量級后,就自然能找到了PMF,其中AI情感類產(chǎn)品占有優(yōu)勢。
Kimi的出現(xiàn)打破了AI 1.0時代技術首先得靠B端變現(xiàn)的認知,那在當下效率工具卷生卷死的時間節(jié)點,Character.AI、星野也在提醒大家,情緒所帶來的價值依然不可忽略。
在付費意愿普遍不那么強烈的大環(huán)境下,頂著投資人壓力的Kimi在商業(yè)化變現(xiàn)上也抓住了“情緒價值”的關鍵點,通過鼓勵用戶打賞的迂回策略,來緩解投流和運營成本的壓力。
光子星球在接觸創(chuàng)業(yè)者的過程中發(fā)現(xiàn),做C端AI應用產(chǎn)品早期獲取用戶的難度沒有想象中困難,只要能精準觸達到有特定情感需求的目標用戶,即使是長尾產(chǎn)品也能產(chǎn)生付費。
有的人在國內(nèi)上線產(chǎn)品,第一個訂閱付費用戶卻產(chǎn)生在遠隔千里之外的大洋彼岸;有的創(chuàng)業(yè)者被追著加微信,基于產(chǎn)品體驗效果搶著付費。
AI情感陪伴類產(chǎn)品,難的不是找到嘗鮮付費的用戶,而是能夠持續(xù)加深用戶與應用之間的綁定關系,篩選出重度用戶,不斷地產(chǎn)生付費行為。
在留下用戶方面,AI情感陪伴應用有天然的優(yōu)勢,Character.AI的日活躍用戶使用時長已經(jīng)超過了ChatGPT。閆俊杰在采訪中也直言,“fantasy(星野)產(chǎn)品,挺夸張的,是很長的時長”。
GPT4o實現(xiàn)了端到端的視覺、語音聯(lián)動,端側(cè)的價值正在逐漸凸顯。
數(shù)據(jù)顯示,ChatGPT 移動應用程序的凈收入在 GPT-4o 推出的當天首次增長了22%。截至到5月17日,ChatGPT 移動應用在 App Store 和 Google Play 兩個平臺上共賺取了 420 萬美元的凈收入。
(圖源:Appfigures)
據(jù)白鯨出海報道,海外版星野——Talkie ,截至今年4月份,Talkie累計下載將近 1400 萬(不包含中國大陸)、累計營收將近 83 萬美元。有接近 Talkie 人士透露,Talkie 已經(jīng)實現(xiàn)了 ROI 轉(zhuǎn)正。
效率類的智能助手需要考慮小程序、網(wǎng)頁、手機應用跨端的適配,但情感陪伴類的產(chǎn)品主要在端側(cè)。用戶黏性加上端側(cè)潛在的增長潛力,buff疊加后,盡管“AI女友”不是一個好項目,但是似乎是一門好生意。
問題是,目前的大部分產(chǎn)品的情感價值濃度還遠遠不夠,這就導致讓用戶長期付費暫時還很困難。
顯然,賽道上的玩家也意識到了這個問題,于是采用了免費+付費的模式來推進商業(yè)化。短期來看,免費可以讓更多用戶試玩應用,產(chǎn)生的數(shù)據(jù)和留下的反饋評價,這些數(shù)據(jù)可以反過來喂養(yǎng)底層模型,增強應用的體驗效果。長期一點,各家致力于做內(nèi)容社區(qū),如同抖音一樣,未來需要有大量的UGC、PGC內(nèi)容撐起整個生態(tài)。
當前階段的產(chǎn)品付費,距離情緒價值“買單”還很遠,更多體現(xiàn)在功能付費上。作為情感陪伴類的產(chǎn)品,理想的情況是,用戶付費是為了解鎖與智能體更深度、親密、互動頻繁的關系。
(圖源:左星野,右Character.AI)
但現(xiàn)狀是,迫于技術、算力上的局限,用戶不得不為自動播放語音、更長線的記憶能力、更快速的對話反饋來訂閱付費。
具有爆款潛質(zhì)的AI情感陪伴類的應用,可能先要思考如何最大程度上滿足用戶需求。