文|產(chǎn)業(yè)家 思杭
編輯 | 皮爺
有新人入場,也有老人退場。這個原本只有百度、360、谷歌、夸克等傳統(tǒng)搜索企業(yè)的戰(zhàn)場上,一眾新的玩家正在踴躍出現(xiàn),在AI的加持下,他們看到了另一種搜索業(yè)務(wù)發(fā)展且變現(xiàn)的可能,看到了另一個藍海市場。
我們一直使用的搜索,到底是什么樣子的?
根據(jù)一份微軟的調(diào)查數(shù)據(jù)顯示,人們每天使用搜索的頻次近乎超過百億,問題覆蓋方方面面,從天文到地理,從人文到賽博朋克等等。但在這些問題中,大約有一半問題都沒有答案。
激發(fā)人們?nèi)ジ惺芴剿鞯目鞓泛蛣?chuàng)造的力量,并駕馭世界知識,這是過去很長一段時間里搜索引擎被賦予的使命。更直白地說,搜索引擎和瀏覽器就是我們探索世界的最大入口。
但如今,這個模式正在發(fā)生微妙的變化。
在搜索引擎發(fā)展的數(shù)十載里,盡管一部分問題已經(jīng)得到解決,比如搜索技術(shù)和商業(yè)模式,但有一個問題卻始終困擾著海內(nèi)外的搜索引擎巨頭——“并不是所有問題都有答案”。
至于其中的原因,在他們看來是,人們所問的問題,并非是在搜索引擎設(shè)計過程中“定制”的那些問題,也就是說技術(shù)人員不會把所有人們要問的問題都想到,再輸入給搜索引擎。
搜索引擎只可以用來回答一些簡單的問題,比如2+2=4;再或者找網(wǎng)頁也是它的強項。但對于復(fù)雜問題的回答,和復(fù)雜任務(wù)的處理,卻力不從心。
而在今天,AI大模型的出現(xiàn),對搜索引擎而言,則是出現(xiàn)一種新的想象力。這也是為什么微軟、谷歌都在競相推出AI搜索的主要原因。實際上,在搜索引擎領(lǐng)域,對于自然語言的探索,早在21世紀初期就開始了。只是受限于當時的人工智能發(fā)展,還未出現(xiàn)一個平臺或一種技術(shù),能對自然語言的理解達到有所突破。
那么,站在當下大模型以及AIGC應(yīng)用爆發(fā)的風(fēng)口下,AI又能賦予搜索引擎怎樣的想象力?在國內(nèi),對百度、360、天工以及其它玩家,新的搜索形態(tài)到底意味著什么?而從商業(yè)模式而言,傳統(tǒng)搜索固有的廣告形態(tài)是否又在受到?jīng)_擊?
這些變化正在發(fā)生。從某種程度來看,它不僅是搜索本身形態(tài)的變化,更是一面鏡子,是一場其背后對應(yīng)的商業(yè)模式、入場玩家的新排位戰(zhàn)。
一、從“弄潮兒”到“破冰者”,是兩波人
“在未來,基于語音識別技術(shù)的發(fā)展,搜索體驗可以完全脫離搜索框?!痹缭?018年,原百度副總裁吳海鋒就在媒體上發(fā)表文章,并站在“無框、無界和無極”三個角度闡釋了AI搜索的未來。
語音識別技術(shù)也恰好是在這一年有所突破。那一年,百度推出了有語音識別和交互功能的小度智能音箱;也是在那一年的世界人工智能大會上,開始嘗試用機器完成同聲傳譯,提供該技術(shù)的廠商分別是騰訊和科大訊飛。
此后,各種智能設(shè)備層出不窮,其種類和功能也不斷推陳出新。大家都在研究如何讓自家的智能設(shè)備更能聽得懂人話,而在這過程中,國內(nèi)的語音識別技術(shù)就更是突飛猛進。
這也正應(yīng)了吳海鋒當年的觀點——“無界強調(diào)無邊界,任何智能設(shè)備都可以通過‘搜索入口’調(diào)用”。而站在當時的時代下,它所對應(yīng)的則是一個更大的AI搜索的未來,即通過自然語言就可以完成傳統(tǒng)搜索引擎的輸入和輸出。
聽起來,這正是像如今文心一言、通義千問和kimi等AIGC應(yīng)用所做的事。不同的是,AIGC重在“創(chuàng)作”,或者說“創(chuàng)意”;而搜索則需要絕對的精準。
從2018年到今天,過去六年的時間里,已經(jīng)有無數(shù)的智能設(shè)備嘗試了用自然語言來完成搜索這件事,它們也都實現(xiàn)了在各種場景下的應(yīng)用和落地,比如汽車駕駛艙內(nèi)的各種AI小助理,再比如智能家居甚至全屋智能的AI家電們。
站在助推語音識別技術(shù)發(fā)展的角度,它們都可以算作是AI搜索的“弄潮兒”。
可以說,兩者是相互促進的。智能設(shè)備在推動語音識別技術(shù)的發(fā)展,反過來,自然語言處理、語言識別技術(shù)的進步,也在推動著智能設(shè)備的發(fā)展。比如在前不久的百度開發(fā)者大會,李彥宏現(xiàn)場演示小度,從其智能水平就可以看出,如今的小度已不同于之前的小度。這是用大模型重構(gòu)之后的小度。
與此同時,它也是百度在AI搜索方面的嘗試。而在軟件側(cè),互聯(lián)網(wǎng)廠商則幾乎是在每一個移動端都嵌入了AI搜索,通過改變?nèi)藗兪褂盟阉鞯牧?xí)慣,來試圖重構(gòu)搜索引擎。其中最為典型的嘗試是,幾乎可以代替搜索引擎的微信,和可以稱得上第二個“百科全書”的百度文庫。
然而就在AI到來之后,被認為“早已成定局”的搜索市場在2024年初發(fā)生了一些小變化。
多年以來,在全球搜索引擎市場,谷歌一直都居于霸主位置上,其市場占有率也穩(wěn)居90%左右,留下剩余的10%給微軟Bing等其他搜索引擎分割。然而,到了2024年初,據(jù)StatCounter的最新數(shù)據(jù),微軟在美國市場份額上漲了1.52%;谷歌則下降了1.5%。
這份數(shù)據(jù)統(tǒng)計時間為2023年2月到2024年1月。而就在一年前的2023年2月,微軟CEO宣布其搜索引擎Bing正式接入ChatGPT。
一個問題被隨之擺到桌面上:大模型時代,AI是否會改變搜索引擎的市場格局?如果是,又會如何改變?
2023年,海外一家以AI搜索起家的初創(chuàng)公司,在成立僅一年的時間里,就拿到了兩筆巨額融資,且估值達5億美元,甚至差點兒撼動谷歌搜索引擎巨頭的位置。
據(jù)Similarweb數(shù)據(jù),截至2023年10月25日,該搜索引擎的網(wǎng)頁端周度訪問量由275萬增加至1,113萬,增長3倍;而到了今年2月,其用戶數(shù)甚至達到5000萬。
這就是去年火爆一時的Perplexity,創(chuàng)始團隊不僅有前OpenAI研究員,還有Meta研究科學(xué)家,以及Perplexity首席技術(shù)官等。
那么,一個純技術(shù)出身的初創(chuàng)公司,還沒有任何搜索相關(guān)的背景,Perplexity是如何做到這個成績的?
首先,對于毫無搜索相關(guān)背景這一點,Perplexity則非常聰明地選擇直接調(diào)用谷歌和微軟必應(yīng)等搜索引擎的API,可謂是站在巨人的肩膀上“看”世界,這同時也保證了搜索的實時性。
另一方面,這也是AI搜索需要克服的一大問題,即幻覺問題。對此,Perplexity的做法是通過RAG技術(shù)(檢索增強生成),讓AI搜索可以根據(jù)特定的問題在指定的“知識庫”里尋找答案,這也保證了它的準確性。
2024年初,一款中國版Perplexity也橫空出世。其火爆程度不亞于Perplexity,推出不到兩個月的時間里,就有數(shù)百萬訪問量。據(jù)Similarweb數(shù)據(jù),截至2024年3月24日,該搜索網(wǎng)站訪問量達779.3萬次。
這就是前獵豹移動首席科學(xué)家閔可銳于2018年成立的秘塔科技。只是與Perplexity不同的是,秘塔的創(chuàng)始團隊既有來自谷歌的人才,也有來自微軟的人才。
然而,在國內(nèi),“破冰者”并非是仿照Perplexity的秘塔科技,而是早在2023年8月就推出天工AI搜索的昆侖萬維。
另外,2024年初,昔日與百度抗衡的搜素引擎巨頭360也推出AI搜索,并在應(yīng)用商店上線了其移動端App。而國內(nèi)最大的搜索巨頭百度則是將AI搜索這一功能嵌入到百度搜索、百度文庫,以及包括小度在內(nèi)的所有產(chǎn)品當中。
而不同的入局方式,又會產(chǎn)生怎樣的“連鎖反應(yīng)”?
二、從瀏覽器到交互框:搜索的驚喜與短板
如今,在國內(nèi)搜索市場上,出現(xiàn)了兩大陣營。一方是以360和昆侖萬維為首,推出獨立的“AI搜索”應(yīng)用;另一方陣營則是以百度為首,將自身的GPT能力嵌入進去。
以目前已推出“AI搜索”應(yīng)用的360和昆侖萬維為例。
注:天工AI(左)、360AI搜索(右)
可以看到,無論是360AI搜索還是天工AI,在輸入關(guān)鍵詞后,都有完整且系統(tǒng)性的文字回答。而總結(jié)歸納也正是大模型的強項。另外,加持了大模型技術(shù)的AI搜索,還有效克服了過去很長一段時間傳統(tǒng)搜索的弊病,即生成網(wǎng)頁太多,總是讓人眼花繚亂。
在過去傳統(tǒng)搜索中,當用戶輸入關(guān)鍵詞進行搜索之后,便會跳出成千上萬個答案,更繁瑣的是,這些答案來自于幾百個網(wǎng)頁。用戶需要一一打開網(wǎng)頁才能找到答案,一不小心就會掉進“信息繭房”當中。
注:天工AI(左)、360AI搜索(右)
而從目前推出的AI搜索來看,天工AI和360AI搜索都是以“參考資料”或“參考鏈接”的方式呈現(xiàn)出相關(guān)網(wǎng)頁。
如果說,傳統(tǒng)的搜索引擎都是基于“查詢(Query)”邏輯去海量互聯(lián)網(wǎng)內(nèi)容中給用戶匹配答案,其底層架構(gòu)均是“爬蟲+索引+查詢”。那么,AI搜索則添加了生成式搜索和多模態(tài)搜索,即利用大模型的歸納和推理能力來生成答案。
對于AI搜索,360創(chuàng)始人周鴻祎在其社交賬號微信視頻號中還提到了AI搜索需要突破的一點:如今的大模型對于prompt的精準性要求很高,但如果放在AI搜索中,這種精準的要求就會變得非常反人性。如何讓prompt提示詞從準確的一句話變成幾個概括的關(guān)鍵詞,則正是“AI搜索”要解決的問題。
從上述天工AI和360AI搜索的表現(xiàn)來看,很顯然,實現(xiàn)這一突破對“AI搜索”而言并非難題。
但如果從搜索的本質(zhì)出發(fā),“激發(fā)人們?nèi)ジ惺芴剿鞯目鞓泛蛣?chuàng)造的力量,并駕馭世界知識,”這是過去很長一段時間里搜索引擎被賦予的使命。
而僅僅16-17個相關(guān)網(wǎng)頁既限制了想象空間,也并未起到“激發(fā)”人們探索欲的作用。如果僅僅從AI搜索生成的答案來看,它們所提供的“標準答案”也許并非是用戶想得到的答案。一些曾經(jīng)傳統(tǒng)搜索無法回答的復(fù)雜問題,當前的AI搜索也未必能夠回答。
而如果從商業(yè)模式的角度,僅提供十幾個網(wǎng)頁鏈接,也讓“AI搜索”無法再延續(xù)過去傳統(tǒng)搜索引擎的商業(yè)模式。
種種技術(shù)問題和商業(yè)模式等難題都預(yù)示著AI搜索并未成熟。
這也是為什么目前的搜索巨頭谷歌、微軟和百度選擇的方式都是以嵌入式的方式入局,入口則并未發(fā)生變化。在前不久剛過去谷歌I/O大會上,谷歌宣布向美國用戶推出AI Overviews服務(wù),這是一個AI搜索服務(wù),用戶可以自行選擇是否讓AI來生成答案。
但在AI搜索的成熟度方面,谷歌CEO桑達爾·皮查伊也公開表示:“搜索的作用是給用戶提供更多的上下文信息,可以讓人們更深入地探索,而答案不準確或者有錯誤,這些都是我們需要不斷改進的地方?!?/p>
如果拋開AI搜索目前存在的問題不談,大模型賦予“搜索”更大的想象力則是,通過完成一個個的數(shù)據(jù)閉環(huán),來補齊傳統(tǒng)搜索引擎的最大短板——場景。
海內(nèi)外傳統(tǒng)的搜索引擎谷歌和百度并不缺算法、算力和數(shù)據(jù),但對于發(fā)展AI,以及再進一步商業(yè)化落地而言,場景則是與前三者同樣重要的存在。
在前Google亞洲區(qū)CMO王懷南與騰訊科技的訪談中,王懷南反思道,谷歌也存在很多問題。比如缺少數(shù)據(jù)閉環(huán),谷歌知道用戶點了什么網(wǎng)頁,但并不知道具體做了什么。換句話說,谷歌無法追蹤到一個完整的線路。但大模型可以做到。
用戶向大模型問問題的過程,也是大模型在自我學(xué)習(xí)的過程。這樣一來,用戶在AIGC應(yīng)用和AI搜索上做的每一件事,大模型都可以追蹤到。這種商業(yè)閉環(huán)反過來,帶給大模型的則是越來越快的成長速度。
而如果說大模型可以反哺給AI搜索更多的場景,那么對于本身已經(jīng)聚齊了算法、算力、數(shù)據(jù)和場景的中型公司而言,則面臨著更大的商業(yè)機會。
值得一提的是,除了中型公司,目前正在崛起的AI創(chuàng)業(yè)公司更是一股不可忽視的力量。以O(shè)penAI為例,作為一個創(chuàng)業(yè)公司,其本身并沒有足夠的數(shù)據(jù)。但OpenAI背后的微軟有,同樣地,國內(nèi)的智譜科技和百川智能,背后也站著國內(nèi)的一眾互聯(lián)網(wǎng)大廠。
與此同時,這意味著,未來的AI搜索“明星公司”也許未必出現(xiàn)在如今的傳統(tǒng)搜索巨頭中,而是新的AI初創(chuàng)企業(yè)。
但一個值得思考的問題,屆時,傳統(tǒng)的搜索巨頭是否會允許類似情況發(fā)生?
三、搜索,變化背后的新排位戰(zhàn)
“現(xiàn)在大部分AI的應(yīng)用主要是在搜索?!彬v訊元寶相關(guān)負責人表示,“甚至從比例來看,這個功能的占比幾乎超過70%?!?/p>
這個數(shù)據(jù)在和字節(jié)豆包、kimi、阿里通義千問、智譜清語等相關(guān)企業(yè)的溝通交流中更是得到證實。
從某種層面來看,搜索是如今AI大模型在C端的主要形態(tài),盡管有層出不窮的智能體應(yīng)用和新玩法,但基于主交互框的搜索仍然是C端用戶的主要選擇。相較于人們之前一問一答的形式,人們基于大模型更多能得到的是一個具備邏輯性和完整性的回答,這種回答是過去的搜索引擎所不具備的。
但從不同家的模式來看,這種搜索又帶有一定程度的特殊性和企業(yè)性。比如騰訊元寶的搜索更多是把公眾號文章作為信息的引用來源,而文心一言、天工等則是基于百度公開數(shù)據(jù)進行整理,對于豆包而言,其更大的數(shù)據(jù)底池來自字節(jié)產(chǎn)品體系的文字和視頻語料,這些數(shù)據(jù)來源的不確定性也恰構(gòu)成了人們在基于AI搜索提問時的不同。
也或者可以說,搜索這個功能背后,也更像是一個中國企業(yè)過去產(chǎn)品矩陣和底層積累的鏡子,其中的展現(xiàn)形態(tài)、對問題回答的邏輯方式以及引用來源,恰對應(yīng)的是企業(yè)過去多年的底盤。
而如果從更深層次來看,盡管如今基于AI的搜索仍然未成為主流,包括傳統(tǒng)的如百度、360等企業(yè)也對應(yīng)產(chǎn)出自身的copilot嵌入到自身的產(chǎn)品中,但能感知到的是,搜索這個功能仍然在平民化和普惠化。
如果說過去二三十年里,搜索的入場券必須是瀏覽器(PC或者移動),那么如今,這個入場券不再被局限形態(tài),在交互框?qū)?yīng)的模式背后,它未來的形態(tài)會是機器人、車機、智能家居,乃至一切可以被智能化的組件。
有新人入場,也有老人退場。這個原本只有百度、360、谷歌、夸克等等傳統(tǒng)搜索企業(yè)的戰(zhàn)場上,一眾新的玩家已經(jīng)出現(xiàn),在AI的加持下,它們看到了另一種搜索業(yè)務(wù)發(fā)展且變現(xiàn)的可能。
雖然AI搜索實現(xiàn)的時間尚早,但故事的大幕已被悄然拉開。