文|AI鯨選社 曉睿
編輯|楊曉鶴
2023年的這時(shí)候,很多人都在講,所有的產(chǎn)品都值得用AI再做一遍。
前阿里的CEO張勇說:“面向AI時(shí)代,所有產(chǎn)品都值得用大模型重新升級(jí)?!?/p>
百度的CEO李彥宏說:“百度還要做第一個(gè)把全部產(chǎn)品重新做一遍的公司,用 AI 原生的思維重構(gòu)產(chǎn)品?!?/p>
不過,這些都是大佬們發(fā)表在去年的話。在國(guó)內(nèi)大廠卷了一年后,大模型的概念炒作階段已經(jīng)過去,隨著AI升級(jí)后的效果顯現(xiàn),人們對(duì)大模型技術(shù)逐漸祛魅,大佬們開始思考,AI的機(jī)會(huì)到底在哪。
尤其近期有媒體報(bào)道,被稱為“AI六小虎”的6家中國(guó)大模型獨(dú)角獸(智譜、零一萬物、MiniMax、百川智能、月之暗面、階躍星辰)中,已經(jīng)有兩家逐步放棄預(yù)訓(xùn)練模型,業(yè)務(wù)重心轉(zhuǎn)向AI應(yīng)用,但產(chǎn)品端并沒有見多大動(dòng)作。
李彥宏也冷靜了下來,他開始思考大模型的能力如何在業(yè)務(wù)和場(chǎng)景中應(yīng)用?!昂?jiǎn)單機(jī)械地往產(chǎn)品中集成大模型的能力,意義不大,純屬過度焦慮?!被赝ツ晁l(fā)表過的言論,今年的這句話似乎有些反轉(zhuǎn),但停下來思考技術(shù)如何服務(wù)于業(yè)務(wù)場(chǎng)景,確實(shí)是回到了正確的道路。
的確,這次AIGC的浪潮可以應(yīng)用在非常廣泛的領(lǐng)域,如果AI真的如我們想象的那樣無所不能的話,那這些領(lǐng)域可能早就出現(xiàn)現(xiàn)象級(jí)的AI產(chǎn)品了。
但事實(shí)卻是,在現(xiàn)有AI能力的支撐下,可能只有10%的產(chǎn)品值得用AI再做一遍,其他90%的產(chǎn)品加了AI后,90%的人嘗鮮后就會(huì)忘記它,還有一部分人甚至?xí)?duì)AI產(chǎn)生反感,以及覺得AI很雞肋。
90%的AI功能都很雞肋
如果我們把AI產(chǎn)品分為兩類,一類是AI native的產(chǎn)品,像豆包、通義千問、文心一言這類純AI的對(duì)話類產(chǎn)品,這類產(chǎn)品如今已有了千萬級(jí)用戶量級(jí)的產(chǎn)品誕生,但和移動(dòng)互聯(lián)網(wǎng)時(shí)代的微信QQ 10億+的用戶量級(jí)還差得很遠(yuǎn),留存率也是一個(gè)非常大的問題。
這類產(chǎn)品很受關(guān)注,但另一類AI產(chǎn)品也同樣值得關(guān)注,就是在原有的業(yè)務(wù)上如何利用AI做賦能,讓移動(dòng)互聯(lián)網(wǎng)時(shí)代的 APP 能利用 AI 煥發(fā)新生。
最近新出的支小寶,就是這類產(chǎn)品的典型代表,它剛出現(xiàn)時(shí)讓不少人眼前一亮,用AI提升服務(wù)的質(zhì)量的想法也很好。但細(xì)究整個(gè)操作路徑,改善有限。它本應(yīng)該幫助人節(jié)省時(shí)間,提高效率,但支小寶有些能力反而拉長(zhǎng)了原來支付寶的使用鏈路。
舉例,如果一個(gè)用戶想坐公交,需要刷公交碼,那他可以用手機(jī)的NFC直接刷碼上車,不需要打開任何App就完成了這個(gè)操作。即便是沒有NFC,也可以把交通碼直接放在桌面,一鍵點(diǎn)開,耗費(fèi)時(shí)長(zhǎng)不到2s。但如果我用支小寶坐公交,我需要把APP打開,點(diǎn)開對(duì)話,再輸入指令“我要坐公交”,等待2-3s加載出來,這個(gè)過程至少需要5s以上。
其次,從支小寶的AI能力上來看,大部分功能并未發(fā)揮出 AI 的能力,只要跳出產(chǎn)品定義好的指令模板提問,支小寶很快就會(huì)出現(xiàn)難以識(shí)別用戶意圖,回答無意義或瞎答的情況?,F(xiàn)在大部分的功能看起來是通過產(chǎn)品側(cè),定義某個(gè)問題的回答模板,然后調(diào)用之前支付寶已支持的接口。
拿【查下我的社保】來舉例,其實(shí)就是把原來支付寶社保小程序那個(gè)接口調(diào)了過來,然后app自動(dòng)讀取了你支付寶的個(gè)人信息,通過你的個(gè)人信息決定調(diào)哪個(gè)城市的小程序,如果是北京就會(huì)調(diào)【京通】,然后你就能在支小寶里進(jìn)入這個(gè)小程序了。這個(gè)和你在支付寶里搜【社?!匡@示的內(nèi)容沒有任何區(qū)別,這里到底哪里用到了AI能力,好像也沒有用到。
不管怎么說,支小寶給AI服務(wù)生活開了個(gè)好頭,并且造勢(shì)造得很大,這點(diǎn)還是勇氣可嘉的。不像其他的一些我們熟知的APP,大多都還在內(nèi)測(cè)階段,產(chǎn)品經(jīng)理們把AI助手的入口埋得很深,生怕用戶發(fā)現(xiàn)了它們的能力還很弱。
生活領(lǐng)域,頭部電商APP也在努力尋找AI的落地場(chǎng)景。淘寶在去年九月就上線了智能助手【淘寶問問】,但目前我只在搜索欄找到了它的入口,目前主打的功能是輔助用戶購(gòu)物決策,這的確是一個(gè)很好的切入點(diǎn),但目前給的建議很空泛,對(duì)用戶幾乎產(chǎn)生不了價(jià)值。
例如,我提了一個(gè)“推薦幾款沖鋒衣”的問題,小淘給我推薦了幾個(gè)沖鋒衣品牌的特點(diǎn),想看具體的還得點(diǎn)擊跳轉(zhuǎn)。后面綴了一個(gè)千元以內(nèi)的沖鋒衣排行榜的卡片,但這并不是我想要的價(jià)位。說明AI還不能根據(jù)用戶的消費(fèi)習(xí)慣特征進(jìn)行推薦,這一點(diǎn)不如直接在淘寶的頁(yè)面搜索關(guān)鍵詞再做篩選,還能更直觀地看到詳情圖和價(jià)格。
同為電商領(lǐng)域扛把子的京東也在瘋狂找AI購(gòu)物助手的應(yīng)用場(chǎng)景,和淘寶問問的定位很像,京東京言1.0同樣也在幫用戶做購(gòu)物決策,它通過和用戶對(duì)話的方式推薦商品,同時(shí)可以讓AI劃重點(diǎn)總結(jié)評(píng)論。
體驗(yàn)下來,發(fā)現(xiàn)京東京言的多輪對(duì)話理解能力較差,我上個(gè)問題在說推薦鼠標(biāo)墊,中間插了一句無關(guān)緊要的話,再回去點(diǎn)我想要的鼠標(biāo)墊款式,再推薦就變成了T裇 。
同樣讓我覺得對(duì)用戶產(chǎn)生不了價(jià)值的還有AI劃重點(diǎn)功能,基本只能對(duì)好評(píng)進(jìn)行總結(jié),眾所周知,電商的好評(píng)大多是被刷出來的,這種被濾鏡過的內(nèi)容生成AI評(píng)價(jià),屬于人為地讓AI『報(bào)喜不報(bào)憂』,看了之后對(duì)用戶沒有任何意義。
無獨(dú)有偶,用AI對(duì)評(píng)價(jià)進(jìn)行總結(jié)的能力在餓了么也曾上線過,但是目前這個(gè) APP 的AI入口都難以尋覓,據(jù)說之前上線過又很快下線了,原因可能是產(chǎn)品經(jīng)理們也發(fā)現(xiàn)了,這一功能不僅礙眼,還對(duì)用戶產(chǎn)生不了價(jià)值,并且還要浪費(fèi)調(diào)用大模型的費(fèi)用。
未來,或許這一功能可以迭代成讓AI能識(shí)別真實(shí)的評(píng)價(jià)和刷單的評(píng)價(jià),并對(duì)用戶評(píng)價(jià)做出更加客觀的總結(jié)和統(tǒng)計(jì)分析,差評(píng)好評(píng)都用更加多維和量化的方式展現(xiàn)出來,還能追溯到原評(píng)價(jià)的內(nèi)容,做個(gè)完全公正的第三方AI,但這樣一來,亮出差評(píng)又有可能會(huì)傷害商家的利益,這確實(shí)是一個(gè)很難權(quán)衡的問題。
再說說國(guó)內(nèi)Top1的旅游類產(chǎn)品,在首頁(yè)懸浮球上線了一個(gè)“攜程問道”,它能幫助用戶做旅行規(guī)劃,也能推薦一些景點(diǎn),但說實(shí)話,攜程問道生成的干巴巴文字,并且你不知道它基于什么維度推薦。所以,我更愛看小紅書的真實(shí)用戶給出的圖文并茂的內(nèi)容,或者直接去看攜程的口碑榜和社區(qū)版塊UGC發(fā)布的內(nèi)容,現(xiàn)在攜程問道給我的感覺是,很像搜索,但又沒有搜索好用。
大廠產(chǎn)品經(jīng)理,找不到AI的使用場(chǎng)景
吐槽了那么多,我并不是覺得現(xiàn)有的移動(dòng)互聯(lián)網(wǎng)app都不適合做AI,而是因?yàn)樵谝延械某墒煲苿?dòng)互聯(lián)網(wǎng)應(yīng)用中嵌入AI能力,指望AI能為應(yīng)用帶來指數(shù)級(jí)的增長(zhǎng),這對(duì)目前的大模型能力來說,還有很長(zhǎng)的路要走。
核心是很多產(chǎn)品是為了跟上AI的潮流而做AI,而不是真的在解決用戶的痛點(diǎn)問題。
一個(gè)好的產(chǎn)品,首先應(yīng)該解決用戶的痛點(diǎn),我們現(xiàn)在處在AI風(fēng)口的時(shí)代,同時(shí)也是移動(dòng)互聯(lián)網(wǎng)的末期,這個(gè)時(shí)代有個(gè)特點(diǎn),用戶的痛點(diǎn)基本上都被挖掘完了,每當(dāng)你發(fā)現(xiàn)一個(gè)用戶可能存在的某個(gè)痛點(diǎn)時(shí),你就會(huì)發(fā)現(xiàn)市面上早就有對(duì)應(yīng)的產(chǎn)品在做這件事了,很難挖掘到某個(gè)用戶沒被解決的需求。所以,通過挖掘用戶痛點(diǎn),寄希望用AI來滿足用戶未被滿足的需求,就成為一件非常困難的事情。
不可否認(rèn),的確有一些AI native產(chǎn)品找到了用戶的痛點(diǎn),并且完成了市場(chǎng)落地。這些產(chǎn)品大多集中在幻覺率容錯(cuò)程度高的場(chǎng)景。
例如AI占卜,像之前鯨哥在《高學(xué)歷年輕人迷上AI占卜》這篇文章里提到的,月見塔羅這類小眾的AI占卜應(yīng)用現(xiàn)在都已經(jīng)落地并且盈利了,其實(shí)本質(zhì)上就是結(jié)合用戶的提問和塔羅牌的牌面檢索知識(shí)庫(kù),并生成答案的過程,真人塔羅占卜得到的答案本身就模棱兩可,所以即便是AI說錯(cuò)了答案,用戶的感知也會(huì)非常非常低。
例如虛擬女友,也是AI應(yīng)用中最早落地的,這是因?yàn)樵诹奶斓膱?chǎng)景中,用戶允許不完美的回應(yīng),在聊天的過程中往往更注重情感上的陪伴和互動(dòng),而不是追求絕對(duì)正確的答案,因此會(huì)對(duì)虛擬女友的一些小錯(cuò)誤或不完美之處更加包容。
這些產(chǎn)品發(fā)現(xiàn)了用戶的痛點(diǎn)——AI玄學(xué)產(chǎn)品,滿足了用戶對(duì)24h隨時(shí)占卜、價(jià)格又便宜的需求;AI聊天類產(chǎn)品,滿足了下沉市場(chǎng)里那些有情感陪伴需求的用戶。但這些需求只是一小部分人群需要的,看起來并不是大眾普遍存在的一些痛點(diǎn),因此也很難落地成為現(xiàn)象級(jí)的應(yīng)用。
幻覺率是大模型幾乎永遠(yuǎn)無法避免的問題。因?yàn)橛?xùn)練AI的數(shù)據(jù)集不可能是完美的,存在著知識(shí)上的錯(cuò)誤或某些內(nèi)容的缺失,遇到未涵蓋的情況時(shí),AI就會(huì)編出一個(gè)答案,讓你覺得煞有其事,但仔細(xì)考究就會(huì)漏洞百出。
生成式AI的本質(zhì)是是對(duì)已有的數(shù)據(jù)和知識(shí)進(jìn)行向量化的歸納,總結(jié)出下一個(gè)字符出現(xiàn)的概率。就連蘋果也發(fā)文質(zhì)疑——目前最先進(jìn)的GPTo1根本不具備真正的邏輯推理能力,而是基于訓(xùn)練數(shù)據(jù)中的模式進(jìn)行匹配,而非像人類一樣進(jìn)行符號(hào)和邏輯推導(dǎo)。
有人發(fā)現(xiàn),此前測(cè)試回答正確的問題,只要改動(dòng)一個(gè)小數(shù)據(jù),答案大概率就會(huì)出現(xiàn)偏差。
論文鏈接:https://arxiv.org/abs/2410.05229
在一些嚴(yán)肅場(chǎng)景中,我們發(fā)現(xiàn)AI落地成功的產(chǎn)品寥寥無幾。為什么?因?yàn)閲?yán)肅的場(chǎng)景不允許出現(xiàn)錯(cuò)誤。
比如在銷售服務(wù)客戶的場(chǎng)景,設(shè)想如果AI來替代銷售服務(wù)客戶的話,一是很難對(duì)客戶的一些情緒做出回應(yīng),二是AI總是傾向于“討好”用戶,如果AI給出了一個(gè)錯(cuò)誤的成交價(jià),這個(gè)錯(cuò)誤到底應(yīng)該歸結(jié)于誰(shuí)?假使企業(yè)宣布AI說的不算話,那又會(huì)導(dǎo)致越來越多的用戶不愿意相信AI,依然會(huì)直接轉(zhuǎn)接人工客服。
被寄予厚望的AI客服,雖然能給業(yè)務(wù)帶來銷量的提升,但卻使得客戶的滿意度降低了,有用戶評(píng)論:“作為消費(fèi)者每次遇到AI客服真的就是怒火中燒,人工客服永遠(yuǎn)排不上?!?/p>
再比如在出行的場(chǎng)景,AI在某天告訴用戶的預(yù)計(jì)起飛時(shí)間錯(cuò)了,導(dǎo)致用戶錯(cuò)誤地決定退票,這將給業(yè)務(wù)帶來多大的損失。
還有些場(chǎng)景AI可升級(jí),是大家都明眼知道的,但是囿于其他因素,還不敢廣泛應(yīng)用,因?yàn)闀?huì)影響核心蛋糕。
比如百度的AI搜索,李彥宏聲稱AI搜索的結(jié)果永遠(yuǎn)不放廣告,用戶對(duì)百度上線AI搜索功能后評(píng)價(jià)卻褒貶不一,有人說搜索的效率顯著提升,有人則認(rèn)為AI生成的內(nèi)容不僅慢還“驢頭不對(duì)馬嘴”。
從百度近期的財(cái)報(bào)上看,目前AI搜索不僅對(duì)業(yè)務(wù)營(yíng)收貢獻(xiàn)甚微,還影響了百度的廣告變現(xiàn)率,對(duì)傳統(tǒng)的搜索業(yè)務(wù)帶來了沖擊。
大廠難做AI,小公司更難。因?yàn)榇竽P托枰乃懔Τ杀咎?,小公司無法承擔(dān)得起。
如果是一家小型的創(chuàng)業(yè)公司,想要讓LLM實(shí)現(xiàn)在嚴(yán)肅場(chǎng)景下的準(zhǔn)確回答,就需要提供大量的優(yōu)質(zhì)數(shù)據(jù)集來訓(xùn)練模型,大量的人工來進(jìn)行數(shù)據(jù)標(biāo)注,那就要面臨著GPU算力、部署算法、大模型成本、人力成本相關(guān)的問題,這需要非常高昂的成本。
要不要免費(fèi)開放給用戶使用,又是一個(gè)讓產(chǎn)品經(jīng)理糾結(jié)的問題。如果免費(fèi),那就意味著用戶量級(jí)一旦增加,會(huì)面臨著高昂的成本,而目前AI產(chǎn)品又沒有找到合適的商業(yè)化方式;如果收費(fèi),那就意味著產(chǎn)品的競(jìng)爭(zhēng)力會(huì)變?nèi)?,一些本就需求不旺盛的用戶依然?huì)選擇保持原有的習(xí)慣。
AI如何賦能現(xiàn)有的業(yè)務(wù)?
為什么AI從出現(xiàn)到現(xiàn)在,兩年半的時(shí)間,還沒有出現(xiàn)一個(gè)殺手級(jí)的應(yīng)用?就連有強(qiáng)大算力、有密集人才、愿意投入資金做AI的大廠,諸如字節(jié)、阿里、京東這類公司也難以讓AI成功賦能現(xiàn)有的業(yè)務(wù)?
一是因?yàn)锳I的使用門檻太高,它對(duì)于提問者的要求很高,而大多數(shù)人不會(huì)提問。就像Perplexity AI 的CEO在訪談中說的“我們最大的障礙不是Google,而是人們天生不會(huì)提問。” 沒有高質(zhì)量的輸入就不會(huì)有高質(zhì)量的輸出,這就是為什么需要有AI提示詞工程,因?yàn)樵诓煌降奶崾驹~下,大模型的水平差異確實(shí)會(huì)非常大。
就拿我公司做的智能助手來說,我們后臺(tái)看到的用戶提問大多是一些口語(yǔ)化的短句,有人甚至連問題都無法描述清楚,指望用幾個(gè)模糊不清的詞讓模型去理解,說實(shí)話一個(gè)碩士畢業(yè)的文科生都很難理解他的意圖,大模型在意圖理解能力上更弱了,它經(jīng)常識(shí)別錯(cuò)誤用戶的意圖,路由錯(cuò)了,就會(huì)出現(xiàn)答非所問的情況。
為了讓產(chǎn)品更好地落地,一方面需要提升大模型能力,通過不斷地修復(fù)badcase提升大模型在垂直領(lǐng)域的生成能力。另一方面,需要引導(dǎo)用戶學(xué)會(huì)提問,比如在文生圖場(chǎng)景下,將一塊只有提問的白板變成常用場(chǎng)景下關(guān)鍵詞的選擇,這樣一來用戶的使用門檻就會(huì)低很多。
二是目前AI還處在初期階段,復(fù)雜問題的處理還難解決。雖然在Coze上的智能體百花齊放,但這可能需要時(shí)間落地產(chǎn)業(yè),就像是互聯(lián)網(wǎng)的初期個(gè)人建站曾掀起大浪,成為大廠卻都需要10年以上的時(shí)間。
現(xiàn)在有一個(gè)閱讀類的智能體,主要功能是用戶提供書名,它提供書籍的核心內(nèi)容和背景資料,使用人數(shù)達(dá)到了46萬。
現(xiàn)在市場(chǎng)共識(shí),智能體是提升AI能力的捷徑,通過Agent實(shí)現(xiàn)復(fù)雜問題的拆解處理。很多大廠產(chǎn)品經(jīng)理,確實(shí)在探索智能體解決目前的問題,當(dāng)然,智能體的工作流如何發(fā)揮最大效果,還需要時(shí)間探索。
以上兩種方案是以發(fā)展的眼光解決問題,目前AI已經(jīng)落地的業(yè)務(wù)就兩種:
第一種是AI+寫作/圖像,AI的確可以幫助創(chuàng)作者幾秒生成一篇文章或者一個(gè)圖像,一些創(chuàng)作者通過生成百次以上獲得滿意的作品,生成完之后還需要對(duì)一些細(xì)節(jié)問題進(jìn)行二次加工。
不可否認(rèn)的是,如果一個(gè)會(huì)提問的作者用上AI,在信息搜集、內(nèi)容整理、文章潤(rùn)色上的效率會(huì)翻倍。這一點(diǎn)的確賦能了無數(shù)自媒體創(chuàng)作者,有人成功做出來了百萬粉絲的賬號(hào),有人運(yùn)用AI洗稿一個(gè)人批量運(yùn)營(yíng)了上百個(gè)賬號(hào)。
圖像領(lǐng)域借助AI,很多傳統(tǒng)產(chǎn)品也取得了效果,美圖付費(fèi)訂閱用戶數(shù)超1081萬,同比增長(zhǎng)50.1%,付費(fèi)滲透率約為4.2%。美圖負(fù)責(zé)人吳欣鴻表示:“目前美圖產(chǎn)品的AI含量已經(jīng)達(dá)到87%以上?!彪m然開創(chuàng)性AI技術(shù)少,但美圖確實(shí)利用開源嘗到了AI紅利。
第二種就是AI+ChatBot,除了我們熟知的豆包、文心一言、通義千問這類產(chǎn)品,AI情感陪伴類產(chǎn)品也出現(xiàn)了大規(guī)模的增長(zhǎng),一些產(chǎn)品如星野、叨叨、Character AI 等一些含有擦邊的虛擬女友類產(chǎn)品已完成了商業(yè)落地。
在一些嚴(yán)肅場(chǎng)景下,也有一些面向C端用戶的AI產(chǎn)品,只是目前還不成熟。例如Chat Law 能提供基礎(chǔ)的法律咨詢,完成簡(jiǎn)單的法律專業(yè)文書寫作,醫(yī)聯(lián)能給人們線上問診,多鄰國(guó)的教育大模型能提供語(yǔ)言陪練、學(xué)習(xí)內(nèi)容規(guī)劃等,螞蟻的螞小財(cái),能提供最新的財(cái)報(bào)資訊解讀,還能分析某個(gè)基金的走勢(shì)。
嚴(yán)肅場(chǎng)景下的垂直大模型通過增量預(yù)訓(xùn)練,注入該領(lǐng)域的專業(yè)知識(shí),并進(jìn)行指令微調(diào),再運(yùn)用RAG(檢索增強(qiáng)生成)來解決大模型在檢索和生成能力上的不足,它能夠讓大模型從外部知識(shí)中快速找到與問題相關(guān)的信息,然后將這些信息重新整合到現(xiàn)有的答案中,使答案更加豐富具體、符合要求。
但這些場(chǎng)景下的垂直大模型能力尚且不夠,距離能產(chǎn)品化還有很大的距離,還有很多的corner case沒有解決,例如如何拒識(shí)領(lǐng)域外的問題,如何避免領(lǐng)域外的問題大模型出現(xiàn)“幻覺”的情況。
不過我相信,隨著技術(shù)的迭代,未來大模型的能力會(huì)越來越強(qiáng),成本也會(huì)越來越低,最終成為一個(gè)人人都用得起,真正走入人們生活,走入千家萬戶的生產(chǎn)力。
這就像是在蒸汽機(jī)開始的時(shí)代,瓦特1765年發(fā)明的蒸汽機(jī),但過了近百年后,蒸汽機(jī)才真正被廣泛使用,成為高效又廉價(jià)的動(dòng)力來源。
蔡崇信說:“AI模型訓(xùn)練就像在教育孩子?!边@句話告訴我們,要對(duì)AI有足夠的耐心,像培養(yǎng)一個(gè)孩子一樣不斷地喂給他成長(zhǎng)所需的營(yíng)養(yǎng),也許在目前這個(gè)階段我們還不能明顯地感知到AI對(duì)我們的生活帶來的顛覆性改變,但是只要我們足夠耐心地長(zhǎng)期投入,我相信會(huì)有一天,AIGC時(shí)代的“奇點(diǎn)”就會(huì)來臨。