文丨智能相對(duì)論 沈浪
“我想讓人們知道,是我們(微軟)讓他們(谷歌)‘跳舞’?!?/p>
當(dāng)加入ChatGPT功能的新一代Bing上線,微軟CEO納德拉就已經(jīng)按耐不住向谷歌發(fā)起了挑戰(zhàn)。他認(rèn)為加入新一代人工智能對(duì)搜索是一次重新思考的變革,從現(xiàn)在開始,包括核心排名在內(nèi)的幾乎所有東西都可以重新想象。
在AI大模型的加持下,搜索的游戲規(guī)則正面臨顛覆性的改變,對(duì)應(yīng)的市場(chǎng)的格局也要重塑。很顯然,如果AI大模型能“上岸”,那么這第一劍大概率就先斬向傳統(tǒng)的搜索巨頭。
在AI大模型的推動(dòng)下,微軟和谷歌之間的戰(zhàn)爭(zhēng)已經(jīng)打響,而國(guó)內(nèi)的反應(yīng)也同樣激烈。
前不久,昆侖萬(wàn)維推出國(guó)內(nèi)第一款融入大模型的搜索引擎——天工AI搜索,并宣稱“傳統(tǒng)搜索已到了奇點(diǎn)時(shí)刻,陳舊的體驗(yàn)需要被顛覆、被改變”。換句話來(lái)說(shuō),國(guó)內(nèi)的傳統(tǒng)搜索引擎同樣面臨著新技術(shù)的挑戰(zhàn),也迎來(lái)了第一位真正意義上的大模型+搜索產(chǎn)品。
事實(shí)上,在天工AI搜索之外,國(guó)內(nèi)大多數(shù)大模型產(chǎn)品只是沒(méi)有明確挑戰(zhàn)傳統(tǒng)搜索引擎,但實(shí)際上在做的事情基本都離不開對(duì)用戶搜索模式的重塑。
「智能相對(duì)論」試用了目前市面上的大多數(shù)大模型產(chǎn)品,包括通義千問(wèn)、訊飛星火、Baichuan-53B,還有文心一言等等。從體驗(yàn)來(lái)看,比起生成式AI,這些大模型產(chǎn)品更成熟的體驗(yàn)在于對(duì)用戶獲取信息模式的優(yōu)化和升級(jí),也就是搜索引擎一直在做的事情。
然而,以天工AI搜索為代表,融入大模型技術(shù)的AI+搜索引擎想要突圍,取代傳統(tǒng)的搜索引擎并沒(méi)有那么容易,一方面且不說(shuō)做大模型產(chǎn)品的廠商就不少,“百模大戰(zhàn)”還在持續(xù),另一方面融入大模型的搜索引擎能否力敵傳統(tǒng)搜索引擎,還有待驗(yàn)證。天工AI搜索的征程才剛剛開始。
01、搜索增強(qiáng)
搜索增強(qiáng),正在成為各家大模型廠商首要強(qiáng)化的目標(biāo),百度在做,百川智能也在做。
百度副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)認(rèn)為,“ChatGPT要解決的問(wèn)題很多就是搜索要解決的問(wèn)題,它們的目標(biāo)是一致的?!薄裁茨繕?biāo)?從目前趨勢(shì)來(lái)看,應(yīng)是搜索增強(qiáng)。
百川智能認(rèn)為,搜索增強(qiáng)是解決模型時(shí)效性和幻覺(jué)的有效手段,將搜索技術(shù)與大語(yǔ)言模型能力結(jié)合實(shí)現(xiàn)了創(chuàng)新的模型優(yōu)化,也提升了 AI 回答的可用性。
對(duì)此,百川大模型融合了多個(gè)模塊,包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等組件。該體系通過(guò)深入理解用戶指令,精確驅(qū)動(dòng)查詢?cè)~的搜索,并結(jié)合大語(yǔ)言模型技術(shù)來(lái)優(yōu)化模型結(jié)果生成的可靠性。
本應(yīng)用在搜索引擎升級(jí)上的技術(shù),比如動(dòng)態(tài)超參數(shù)調(diào)整技術(shù)、智能化搜索詞生成、高質(zhì)量搜索結(jié)果篩選、RLHF 搜索結(jié)果增強(qiáng)等等,如今用在了大模型預(yù)訓(xùn)練上,由此結(jié)合大模型的產(chǎn)品表現(xiàn),打造出了一個(gè)超越傳統(tǒng)搜索引擎的AI搜索應(yīng)用。
在「智能相對(duì)論」體驗(yàn)文心一言、天工AI搜索等大模型產(chǎn)品的過(guò)程中,發(fā)現(xiàn)其背后的搜索流程和結(jié)果輸出基本都得到了不同程度的強(qiáng)化,帶來(lái)不少令人驚艷的搜索體驗(yàn)。
比如,向文心一言提問(wèn)“我10月份想去長(zhǎng)沙旅游”,結(jié)果反饋給出了長(zhǎng)沙的知名景點(diǎn)推薦。而在天工AI搜索上,除了景點(diǎn)推薦外,甚至還會(huì)給出10月份長(zhǎng)沙的天氣情況介紹、美食推薦等其他更詳細(xì)的信息。
從這一結(jié)果來(lái)說(shuō),相比傳統(tǒng)搜索引擎,大模型技術(shù)加持的智能搜索在兩大方面實(shí)現(xiàn)了升級(jí),一是對(duì)用戶需求的理解,不再是關(guān)鍵詞匹配,更多是一種對(duì)話式的交互和理解,覺(jué)得說(shuō)得不夠詳細(xì)的,還可以進(jìn)一步的追問(wèn),目前文心一言、天工AI搜索等大模型產(chǎn)品都支持。
二是對(duì)結(jié)果反饋的優(yōu)化,省去用戶查找和篩選信息的一大段過(guò)程,在大多數(shù)情況下AI都能給出相對(duì)客觀且準(zhǔn)確的答案。同時(shí),文心一言、天工AI搜索等也都會(huì)標(biāo)注相關(guān)信息的來(lái)源,便于用戶二次確認(rèn)信息的權(quán)威性與準(zhǔn)確度。
盡管也會(huì)出現(xiàn)一些答非所問(wèn)或是東拼西湊的回答,但是就現(xiàn)階段的體驗(yàn)來(lái)說(shuō),搜索強(qiáng)化下的大模型產(chǎn)品相對(duì)傳統(tǒng)搜索引擎,是有著實(shí)際性的進(jìn)步的。
02、傳統(tǒng)的桎梏
進(jìn)步是有,不足也存在。
隨著體驗(yàn)越深度,問(wèn)的問(wèn)題越多,越會(huì)發(fā)現(xiàn)當(dāng)前的大模型產(chǎn)品在搜索上同樣存在著諸多傳統(tǒng)搜索引擎遇到的問(wèn)題,比如信息的來(lái)源、知識(shí)的準(zhǔn)確性等等。
在目前的搜索體驗(yàn)上,天工AI搜索會(huì)同步給出知識(shí)、信息的參考標(biāo)注,以便用戶進(jìn)一步確認(rèn)知識(shí)、信息的準(zhǔn)確度和權(quán)威性。但,「智能相對(duì)論」也發(fā)現(xiàn),給出的參考來(lái)源大多是知乎、搜狐、新浪財(cái)經(jīng)的,同時(shí)根據(jù)問(wèn)題的類別也會(huì)出現(xiàn)其他的來(lái)源,比如旅游相關(guān)會(huì)有馬蜂窩、攜程、本地寶的參考標(biāo)注。
這些網(wǎng)站上的信息有問(wèn)題嗎?就體驗(yàn)來(lái)說(shuō)似乎并沒(méi)有問(wèn)題,哪怕我們用傳統(tǒng)搜索引擎,搜出來(lái)的結(jié)果也大抵如此。
但是,呈現(xiàn)在一個(gè)新的產(chǎn)品上,就有較大的問(wèn)題了。如果新的AI搜索所帶給用戶的信息、知識(shí)還和傳統(tǒng)搜索引擎呈現(xiàn)出來(lái)的結(jié)果差不多,都是些未經(jīng)驗(yàn)證的、網(wǎng)友口口相傳的泛泛之談,那么搜索的結(jié)果還是沒(méi)有得到改善,只是過(guò)程變了、形態(tài)變了。
對(duì)于天工AI搜索以及其他大模型產(chǎn)品而言,實(shí)際上要建立的同樣也是這種權(quán)威性、準(zhǔn)確度。作為用戶獲取信息、知識(shí)的重要渠道,任何一個(gè)產(chǎn)品都需要讓用戶覺(jué)得自己的知識(shí)、信息是對(duì)的、準(zhǔn)確的、權(quán)威的。
當(dāng)前,市場(chǎng)上的大模型產(chǎn)品要么只給用戶一個(gè)答案,要么像天工AI搜索那樣給出一大堆第三方的來(lái)源標(biāo)注。然而,這兩種模式似乎都不能鞏固用戶對(duì)搜索結(jié)果的權(quán)威感、信任度?;蛟S,在接下來(lái)的產(chǎn)品優(yōu)化上,大模型產(chǎn)品還需要繼續(xù)做用戶教育,向用戶證明自家AI給出的答案、知識(shí)、信息等是權(quán)威的,是科學(xué)的。
回過(guò)頭來(lái)看,正對(duì)應(yīng)肖陽(yáng)的觀點(diǎn),ChatGPT和傳統(tǒng)搜索引擎的目標(biāo)是一致的。
03、新的可能
如果用搜索的視角來(lái)看大模型產(chǎn)品,很容易就能看到當(dāng)前缺什么。那么反過(guò)來(lái),如果用大模型的視角來(lái)做搜索,或許也會(huì)有新的發(fā)現(xiàn)——大模型+搜索,應(yīng)該呈現(xiàn)給用戶什么樣的體驗(yàn)?
答案絕不會(huì)是傳統(tǒng)的搜索引擎。
目前,通用人工智能的一大演進(jìn)方向是多模態(tài),而在大模型產(chǎn)品上,多模態(tài)就重塑了搜索的價(jià)值。日前,阿里云推出大規(guī)模視覺(jué)語(yǔ)言模型Qwen-VL,以通義千問(wèn)70億參數(shù)模型Qwen-7B為基座語(yǔ)言模型研發(fā),支持圖文輸入,具備多模態(tài)信息理解能力。
基于Qwen-VL,用戶的搜索體驗(yàn)得到了升級(jí)。比如,一位不懂中文的外國(guó)游客到醫(yī)院看病,不知怎么去往對(duì)應(yīng)科室,他拍下樓層導(dǎo)覽圖問(wèn)Qwen-VL“骨科在哪層”“耳鼻喉科去哪層”,Qwen-VL會(huì)根據(jù)圖片信息給出文字回復(fù)。
這是用戶獲取準(zhǔn)確信息的一個(gè)重要方式,也是搜索,但很顯然,這不同于傳統(tǒng)的搜索引擎。
如同天工AI搜索想實(shí)現(xiàn)的跨代際搜索體驗(yàn),Qwen-VL正在呈現(xiàn)出新的搜索跨越。
可以想象,在未來(lái)的時(shí)間內(nèi),搜索不再是單一的,而是多模態(tài)的、多場(chǎng)景的,比如用戶可以在旅游的過(guò)程中隨手拍下一處景點(diǎn),大模型產(chǎn)品就能給予相關(guān)的游玩建議、購(gòu)票服務(wù)等,又或者是用戶在旅游的某個(gè)瞬間聽到一首民謠,錄下來(lái)也能在大模型產(chǎn)品上搜到相應(yīng)的歌曲等等。
基于這一趨勢(shì),大模型+搜索所帶來(lái)的新體驗(yàn)將是顛覆的。那個(gè)時(shí)候,或許搜索的奇點(diǎn)才算是正式到來(lái)了。
傳統(tǒng)的搜索引擎將黯然失色,而用戶將在大模型產(chǎn)品的智能搜索下無(wú)時(shí)無(wú)刻不在獲取新的信息、服務(wù)和體驗(yàn)。