文|讀懂財(cái)經(jīng)
曾經(jīng),很多人以為,ChatGPT的橫空出世,就幾乎等于敲響搜索的喪鐘。
這樣的說(shuō)法在當(dāng)時(shí)不在少數(shù)。按前谷歌第23位員工、Gmail的創(chuàng)建者之一Paul Buchheit的說(shuō)法,ChatGPT將摧毀谷歌,就像當(dāng)年搜索引擎徹底干掉黃頁(yè)電話簿一樣。
一年時(shí)間過(guò)去了,AI大模型替代搜索的進(jìn)程,遠(yuǎn)沒(méi)有大家想象的那般順利。但一切并非毫無(wú)意義。隨著Perplexity等AI搜索產(chǎn)品的涌現(xiàn),也讓我們對(duì)AI給搜索行業(yè)帶來(lái)的變化有了更加清晰的認(rèn)識(shí):
首先,與傳統(tǒng)搜索引擎相比,AI搜索讓信息的顆粒度從網(wǎng)頁(yè)細(xì)化到信息本身,進(jìn)而提升了信息獲取的效率。這是AI搜索最大的價(jià)值。
其次,作為一款A(yù)I套殼產(chǎn)品,像Perplexity等產(chǎn)品的成功在于,實(shí)現(xiàn)了單點(diǎn)的價(jià)值創(chuàng)造和體驗(yàn)優(yōu)化,更是一次AI工程化層面的勝利。
第三,像Perplexity這樣的AI搜索,目前更多集中在知識(shí)等小眾領(lǐng)域,距離替代谷歌成為通用搜索引擎仍然有很長(zhǎng)的距離要走。
盡管當(dāng)下AI搜索替代谷歌幾無(wú)可能,但長(zhǎng)期并非毫無(wú)可能。從過(guò)去科技的演進(jìn)看,新技術(shù)對(duì)老技術(shù)的替代,往往是以意想不到的顛覆形式完成的。正如誰(shuí)能想到如今擁有上億用戶的快手,當(dāng)初只是一個(gè)做GIF的工具。變化與未知,就是新技術(shù)的魅力。
01 比搜索更精準(zhǔn)是如何做到的?
在AI搜索的賽道,Perplexity 是絕對(duì)的明星。公司創(chuàng)始人Aravind Srinivas來(lái)自O(shè)penAI,2022 年 8 月創(chuàng)立了 Perplexity。2023年10月,公司完成了新一輪融資,估值達(dá)到 5 億美元。
與其說(shuō),Perplexity是一個(gè)搜索引擎,倒不如說(shuō)是答案引擎。當(dāng)用戶向Perplexity輸入問(wèn)題并點(diǎn)擊搜索后,你能得到一個(gè)回答。比如,當(dāng)你向Perplexity提問(wèn)“蠟筆小新是誰(shuí)”,會(huì)得到Perplexity的相應(yīng)回答。
這個(gè)答案是通過(guò)網(wǎng)上已有的信息總結(jié)提煉而來(lái)。在回答欄目的上方,Perplexity還會(huì)給出參考內(nèi)容的來(lái)源,并支持點(diǎn)擊。在回答的下方,Perplexity預(yù)測(cè)了幾個(gè)用戶可能會(huì)追問(wèn)的問(wèn)題,點(diǎn)擊后頁(yè)面繼續(xù)向下展開(kāi)對(duì)于該問(wèn)題的答案,用戶也可以自行進(jìn)行提問(wèn)。
此外,在回答欄目的側(cè)邊,用戶還可以搜索相關(guān)主題的圖片和視頻。
Perplexity不僅能夠回答簡(jiǎn)單問(wèn)題,還能理解用戶一些比較復(fù)雜的問(wèn)題,比如當(dāng)用戶就“生成式AI與過(guò)去的AI相比有哪些不同和特點(diǎn)”進(jìn)行提問(wèn)時(shí),Perplexity也能進(jìn)行回答。
但不足的地方是,在“生成式AI與過(guò)去的AI相比有哪些不同和特點(diǎn)”問(wèn)題來(lái)說(shuō),Perplexity推薦的視頻和主題關(guān)系并不大。也就是說(shuō),在復(fù)雜問(wèn)題從文字向更多模態(tài)轉(zhuǎn)化過(guò)程中,搜索內(nèi)容的效率有比較大的下降。
看上去,AI搜索更像是傳統(tǒng)搜索引擎的一次升級(jí),即從過(guò)去的單邊的信息查詢和SEO策略優(yōu)化,轉(zhuǎn)變成雙邊的信息交互。
過(guò)去的傳統(tǒng)搜索引擎的工作流程是,基于用戶搜索的內(nèi)容,對(duì)相關(guān)內(nèi)容進(jìn)行索引并創(chuàng)建搜索索引,所謂的索引,可以理解為內(nèi)容過(guò)濾后,一個(gè)與搜索內(nèi)容有關(guān),且包含頁(yè)面及其內(nèi)容和排名信息的數(shù)據(jù)庫(kù)。然后再對(duì)索引中的頁(yè)面使用各種算法進(jìn)行排名,進(jìn)而給出搜索結(jié)果。
相比之下,Perplexity比搜索引擎額外多做了幾件事。在搜索前,Perplexity會(huì)通過(guò)大模型,重新理解用戶提出的問(wèn)題,然后解析為一個(gè)更清晰的搜索指令。接下來(lái),調(diào)用Google、Bing等搜索引擎的API創(chuàng)建相應(yīng)的索引庫(kù),然后用自有的排序算法,對(duì)所有的搜索結(jié)果做重新排序,篩選出數(shù)量不等且高質(zhì)量的網(wǎng)頁(yè)。最后,讓大模型閱讀篩選出來(lái)的內(nèi)容并輸出和問(wèn)題相關(guān)的答案,以及可能用到的問(wèn)題。
也就是說(shuō),相比搜索引擎做的是信息相關(guān)度的匹配,而Perplexity是在此基礎(chǔ)上做了更多理解指令上的工作,進(jìn)而讓搜索結(jié)果更接近用戶想要的東西。
搜索效率升級(jí)的背后,是搜索顆粒度的細(xì)化。在互聯(lián)網(wǎng)時(shí)代,搜索引擎將信息以網(wǎng)頁(yè)為最小粒度為用戶進(jìn)行排序和推薦。而大模型能夠?qū)W習(xí)所有 Google上能得到的信息,并將知識(shí)以詞匯為最小粒度生成相應(yīng)的內(nèi)容。
02 Perplexity破局的啟示
聽(tīng)起來(lái),Perplexity所做的事情很簡(jiǎn)單,就是在原有搜索引擎基礎(chǔ)上加入了大模型的自然語(yǔ)言理解和生成豐富回答能力。那么,是不是意味著所有大模型企業(yè)也可以做?
其實(shí)并非如此。曾經(jīng)在很多人看來(lái),生成式 AI 可能會(huì)取代傳統(tǒng)搜索引擎,但用大模型直接進(jìn)行搜索也會(huì)出現(xiàn)很多問(wèn)題。
比方說(shuō),生成式AI無(wú)法做到實(shí)時(shí)更新,且受限于訓(xùn)練數(shù)據(jù),可能無(wú)法覆蓋相對(duì)小眾、缺乏通用性的長(zhǎng)尾知識(shí)。同時(shí),生成式AI對(duì)生成內(nèi)容的可控性較差,存在“幻覺(jué)”問(wèn)題,用戶也難以對(duì)答案進(jìn)行直接驗(yàn)證。
Perplexity所做的事情就是,把這些大模型搜索過(guò)程中出現(xiàn)的“坑”一個(gè)個(gè)都填掉,其中最重要的事情就是信息的實(shí)時(shí)性和準(zhǔn)確性。
實(shí)時(shí)性方面,與ChatGPT等大模型依賴訓(xùn)練時(shí)的數(shù)據(jù)和語(yǔ)料獲取信息不同,Perplexity基于底層傳統(tǒng)搜索引擎開(kāi)發(fā)而得,能夠及時(shí)抓取最新的信息。
準(zhǔn)確性方面,Perplexity做了兩件事情:減輕幻覺(jué)和內(nèi)容溯源。為了減少幻覺(jué)現(xiàn)象,Perplexity引入了RAG技術(shù)(檢索增強(qiáng)生成),RAG的作用好比是給模型提供一本教科書(shū),讓它根據(jù)特定的問(wèn)題去查找信息,通過(guò)關(guān)聯(lián)外部知識(shí)來(lái)提高答案的準(zhǔn)確性,有效減少了語(yǔ)言模型中出現(xiàn)的虛假信息,使得生成的回答更準(zhǔn)確可信。
與此同時(shí),Perplexity還對(duì)生成的每一句話都附有引用鏈接,在保證可靠性的同時(shí)便于用戶溯源或深入研究。
不僅如此,Perplexity還對(duì)召回和排序環(huán)節(jié)的算法做了創(chuàng)新,保證內(nèi)容的有用性及引用的精確程度。其中,“召回”指根據(jù)搜索指令從數(shù)據(jù)庫(kù)中獲取盡可能多的正確結(jié)果,“排序”指根據(jù)用戶搜索內(nèi)容的相關(guān)性對(duì)召回結(jié)果進(jìn)行排序,決定了搜索引擎的精確程度和性能上限。
來(lái)源:中金研究部
這也讓Perplexity成為當(dāng)下綜合性能最好的AI搜索引擎。在2023年4月的論文中,斯坦福的研究人員對(duì)YouChat、Perplexity.AI、NeevaAI及BingChat四個(gè)生成式搜索引擎進(jìn)行了人工評(píng)估。結(jié)果顯示,Perplexity.ai生成內(nèi)容有用性的評(píng)分為4.56分,排名第二;引文召回率和精確度為68.7,排名第一;在泛搜索引擎類的體驗(yàn)中,綜合能力位于最前列。
除了在信息準(zhǔn)確、可靠上,Perplexity在響應(yīng)速度上也花了很多功夫。比如,Perplexity通過(guò)自研推理堆棧,讓其內(nèi)容生成速度快于GPT類通用模型。在模型側(cè),公司對(duì)GPT-3.5進(jìn)行微調(diào),在降低成本的同時(shí)進(jìn)一步提升響應(yīng)速度。
Perplexity的成功,也給了那些苦苦探索AI大模型落地的創(chuàng)業(yè)者一些啟示:比起模型能力,產(chǎn)品本身單點(diǎn)的價(jià)值創(chuàng)造和體驗(yàn)的優(yōu)化,是一個(gè)更為重要的事情。
03 替代谷歌言之過(guò)早
從數(shù)據(jù)上看,自產(chǎn)品發(fā)布以來(lái),Perplexity的成績(jī)著實(shí)不錯(cuò)。
根據(jù)Similar Web數(shù)據(jù),截至2023年10月25日,Perplexity APP的日度下載量為14,163次;2023年2月1日至10月25日,Perplexity網(wǎng)頁(yè)端的周度訪問(wèn)量由275萬(wàn)增加至1,113萬(wàn),增長(zhǎng)3倍,與同類別的AI搜索應(yīng)用YouChat相比增長(zhǎng)勢(shì)頭強(qiáng)勁。
盡管Perplexity的表現(xiàn)足夠優(yōu)秀,但距離真正替代谷歌等傳統(tǒng)搜索引擎還有很長(zhǎng)的距離。從定位上看,當(dāng)下的Perplexity更像一個(gè)知識(shí)平臺(tái),用戶對(duì)其需求大都集中在知識(shí)領(lǐng)域,定位類似于AI時(shí)代的Wikipedia 和 Quora。
從Perplexity后續(xù)的更新動(dòng)作上,也不難看出這一點(diǎn)。比如,Perplexity正在嘗試以知識(shí)分享為核心,創(chuàng)建相關(guān)的內(nèi)容社群生態(tài),Perplexity支持用戶將搜索問(wèn)題及答案分享至社區(qū),供其他用戶學(xué)習(xí)討論。
之所以Perplexity選擇以知識(shí)平臺(tái)為切入點(diǎn),主要基于兩點(diǎn)考慮:
一是RAG技術(shù)更擅長(zhǎng)在開(kāi)放域知識(shí)問(wèn)答及生成式問(wèn)答中發(fā)揮作用。Meta的技術(shù)論文對(duì)RAG技術(shù)進(jìn)行了詳細(xì)測(cè)評(píng),包括開(kāi)放域問(wèn)答、開(kāi)放域問(wèn)題生成、抽取式問(wèn)答及分類推理任務(wù)。在開(kāi)放域問(wèn)答中,RAG-Token和RAG-Seq得分處于領(lǐng)先地位;在生成任務(wù)和分類任務(wù)中,RAG表現(xiàn)優(yōu)于BART模型。
二是谷歌在消費(fèi)、地圖上積累了大量的數(shù)據(jù),這讓Perplexity在生活/購(gòu)物等更高頻的場(chǎng)景沒(méi)有任何優(yōu)勢(shì),很難實(shí)現(xiàn)場(chǎng)景的泛化。
以知識(shí)平臺(tái)為目標(biāo),固然讓Perplexity找到了差異化的方向。但同時(shí)也意味著,Perplexity短期內(nèi)很難成為一款低門(mén)檻的大眾化互聯(lián)網(wǎng)產(chǎn)品,至于替代谷歌更是無(wú)從談起。
不僅如此,與大多數(shù)AI創(chuàng)業(yè)公司一樣,Perplexity并沒(méi)有形成可持續(xù)的商業(yè)模式。目前,Perplexity的變現(xiàn)方式主要有兩個(gè):會(huì)員訂閱和API調(diào)用,但尚未形成規(guī)?;杖?。
雖然收入沒(méi)起來(lái),但支出卻一點(diǎn)都不少。根據(jù)中金測(cè)算,目前Perplexity調(diào)用Bing搜索引擎及GPT-4的單個(gè)問(wèn)題成本約為0.03美元,年成本約為6000萬(wàn)美元,這還不包括后續(xù)Perplexity自研模型所產(chǎn)生的成本。
從過(guò)去看,搜索向來(lái)是個(gè)馬太效應(yīng)極其明顯的市場(chǎng)。盡管用戶對(duì)百度詬病頗多,也不影響百度在中國(guó)搜索引擎的市占率超過(guò)7成。如果用當(dāng)下的視角理解產(chǎn)品技術(shù)演進(jìn)的結(jié)果,Perplexity似乎沒(méi)有任何機(jī)會(huì)。
但這事好就好在,新技術(shù)對(duì)老技術(shù)的替代,往往是以顛覆的形式出現(xiàn)的,甚至老玩家固有的“習(xí)慣”還會(huì)成為其迭代的最大障礙。就拿搜索這事來(lái)說(shuō),AI搜索直接給出關(guān)鍵信息的交互方向,天然與谷歌現(xiàn)有競(jìng)價(jià)排名的商業(yè)模式相背離。
如何取舍對(duì)谷歌來(lái)說(shuō)是一個(gè)難題,而對(duì)Perplexity來(lái)說(shuō)則是一個(gè)機(jī)會(huì)。從這個(gè)角度來(lái)說(shuō),Perplexity替代谷歌固然言之過(guò)早,但也未必沒(méi)有可能。