正在閱讀:

對(duì)話李彥宏:AI價(jià)格戰(zhàn)開打、大模型閉源、超級(jí)應(yīng)用以及中國(guó)市場(chǎng)機(jī)會(huì)

掃一掃下載界面新聞APP

對(duì)話李彥宏:AI價(jià)格戰(zhàn)開打、大模型閉源、超級(jí)應(yīng)用以及中國(guó)市場(chǎng)機(jī)會(huì)

AI價(jià)格戰(zhàn)下企業(yè)的機(jī)會(huì)在哪?

文|硅谷101

在世界人工智能大會(huì)WAIC期間,我們硅谷101從硅谷飛到了上海,采訪了百度創(chuàng)始人、董事長(zhǎng)兼CEO,李彥宏(Robin Li)先生,就目前市場(chǎng)非常關(guān)心的AI議題進(jìn)行了深度討論。

很有趣的是,這一輪生成式AI,中國(guó)市場(chǎng)的打法和海外截然不同,在硅谷大家開始卷多模態(tài)模型和交互,創(chuàng)業(yè)企業(yè)還側(cè)重infra基礎(chǔ)設(shè)施,同時(shí)市場(chǎng)在等GPT-5來(lái)驗(yàn)證Scaling Law的時(shí)候,中國(guó)市場(chǎng)的“百模大戰(zhàn)”已經(jīng)發(fā)展到打響價(jià)格戰(zhàn)的階段了,速度比很多人想象中都要早很多。

接下來(lái)中國(guó)市場(chǎng)要開始卷AI應(yīng)用了,所以在采訪中,李彥宏對(duì)中國(guó)市場(chǎng)大模型的價(jià)格戰(zhàn)、AI的To B企業(yè)級(jí)機(jī)會(huì)、開源/閉源路線選擇、AI超級(jí)應(yīng)用、AI Agent智能體的看法、以及AGI和Scaling Law的思考,都和我們做出了分享。

這是李彥宏2024年首次接受媒體采訪,非常難得,以下是我們的對(duì)話實(shí)錄,希望能為大家?guī)?lái)一些新的思考和角度。

01 不可避免的價(jià)格戰(zhàn):燒錢不是事情的本質(zhì)

楊宇東:

我們看到這個(gè)很多閉源大模型的API調(diào)用的費(fèi)用越來(lái)越低了,而且很多又有開源大模型可以選,所以在這么一個(gè)市場(chǎng)的這么一個(gè)商業(yè)環(huán)境之下,那我們很關(guān)注,就百度肯定是身在其中,那大模型靠推理這樣收費(fèi)的這種商業(yè)模式,它未來(lái)成立不成立?以后我們市場(chǎng)再去比拼大模型的話,會(huì)比拼哪些點(diǎn)?就是你剛才提到的可能是速度、成本等等的,你怎么看?

李彥宏:

說(shuō)實(shí)話,我們內(nèi)部不斷在思考、討論這個(gè)問(wèn)題,我覺(jué)得價(jià)格戰(zhàn)幾乎是不可避免的,在中國(guó)互聯(lián)網(wǎng)干了這么長(zhǎng)時(shí)間,其實(shí)已經(jīng)對(duì)價(jià)格戰(zhàn)非常熟悉了,確實(shí)他來(lái)的比我想象還要更早一點(diǎn),這么早就開始把這個(gè)價(jià)格打到了幾乎不可思議這種低的地步。

但我覺(jué)得某種意義上講,也不是壞事兒,當(dāng)你價(jià)格足夠低、甚至免費(fèi)的時(shí)候,就會(huì)讓更多人有積極性,來(lái)嘗試在大模型基礎(chǔ)上,去開發(fā)各種各樣的應(yīng)用,也就是說(shuō)大模型對(duì)于各行各業(yè)的這個(gè)滲透速度會(huì)更快。

那你都免費(fèi)了,或者說(shuō)價(jià)格足夠低的話,你大模型公司靠什么賺錢呢?我是這樣想的,大模型技術(shù)的天花板還是很高的,今天我們還是對(duì)于大模型的能力,有很多不滿意的地方,那我們?nèi)匀恍枰芏喾浅?yōu)秀的技術(shù)人員、需要很多的算力、需要很多很多的數(shù)據(jù),才能夠訓(xùn)練出來(lái)下一代的大模型,我們還可能需要下下代,甚至下下下代這種大模型。

所以最終我覺(jué)得,大家是要去拼誰(shuí)的技術(shù)更好,你的技術(shù)好,你為客戶產(chǎn)生了更好的價(jià)值,將來(lái)你還是能夠收到費(fèi)的。

今天之所以把價(jià)格打到足夠低,是因?yàn)楝F(xiàn)在模型的能力,其實(shí)技術(shù)還沒(méi)有到最好,大家能力都差不多的時(shí)候,那行就拼價(jià)格唄,誰(shuí)的價(jià)格低就用誰(shuí)的。

時(shí)間長(zhǎng)了之后,市場(chǎng)本身會(huì)回歸理性,那同樣的效果,就是當(dāng)我的成本比你低的時(shí)候,你打價(jià)格戰(zhàn)你肯定打不過(guò)我,時(shí)間久了之后你就退出了。

這個(gè)過(guò)程我們?cè)诎俣染W(wǎng)盤上是經(jīng)歷過(guò)的,那些年大家在卷網(wǎng)盤的時(shí)候,我今天給你10G的免費(fèi)空間,明天100G,后天給1T,再后天說(shuō)無(wú)限空間永久免費(fèi),當(dāng)你說(shuō)無(wú)限空間永久免費(fèi)的時(shí)候,大家也會(huì)說(shuō)這怎么能夠持續(xù)呢?這一定是不可持續(xù)的。

但是某一段時(shí)期,可能有個(gè)一兩年左右,大家這樣不理性的去打價(jià)格戰(zhàn),慢慢就一個(gè)一個(gè)退出,那為什么百度沒(méi)有退出呢?因?yàn)槲腋掖蜓剑业募夹g(shù)、存儲(chǔ)成本低,所以最終還是說(shuō)誰(shuí)的技術(shù)好,誰(shuí)的效率高,誰(shuí)會(huì)勝出。

陳茜:

剛才說(shuō)這個(gè)價(jià)格來(lái)的時(shí)間比你想象中的早很多,也比我想象中的早很多,這個(gè)才一年半的時(shí)間,已經(jīng)開始打價(jià)格戰(zhàn)了,但你覺(jué)得價(jià)格戰(zhàn)會(huì)持續(xù)多久呢?可能大家有一些人就覺(jué)得說(shuō)技術(shù)不行,沒(méi)油水我要退出了,可能就最后的市場(chǎng)贏家會(huì)浮現(xiàn)出來(lái)。

李彥宏:

這個(gè)很難講,現(xiàn)在有些創(chuàng)業(yè)公司是玩家,但是也有很大型的這種互網(wǎng)平臺(tái)公司是玩家,那么燒錢的話,其實(shí)理論上講是可以燒很長(zhǎng)時(shí)間的,但我覺(jué)得,燒錢不是這個(gè)事情的本質(zhì),本質(zhì)仍然是誰(shuí)的技術(shù)更好、誰(shuí)的效率更高,當(dāng)你的技術(shù)好、效率高的時(shí)候,你就不怕去打價(jià)格戰(zhàn),所以多長(zhǎng)時(shí)間都OK,最終它會(huì)是優(yōu)勝劣汰的這樣一個(gè)過(guò)程。

陳茜:

你覺(jué)得在中國(guó)市場(chǎng)會(huì)是一個(gè)贏家通吃的局面嗎?還是說(shuō)等價(jià)格戰(zhàn)之后會(huì)剩下幾個(gè)主要的?可能還有一些更小模型這樣的生態(tài)?

李彥宏:

我是這樣想的,這次生成式AI,它是對(duì)于整個(gè)IT技術(shù)棧的一個(gè)大的變革,我們一般認(rèn)為,過(guò)去的IT技術(shù)棧,就是芯片層、操作系統(tǒng)層、應(yīng)用層或軟件層,就這三層。到生成式AI之后,我們認(rèn)為IT的技術(shù)棧變成了四層,芯片層、框架層(深度學(xué)習(xí)框架)、模型層、然后是應(yīng)用層,我認(rèn)為在每一層可能都會(huì)誕生至少2~3個(gè)大玩家。

那到應(yīng)用層的話,可能數(shù)以百萬(wàn)計(jì),甚至千萬(wàn)的各種各樣的應(yīng)用都會(huì)出來(lái),也會(huì)逐步的出現(xiàn)超級(jí)應(yīng)用。當(dāng)然根據(jù)“超級(jí)”的定義來(lái)看,它是不會(huì)很多,可能是三五個(gè)之類的。

模型層我覺(jué)得也許兩三個(gè)就足夠了,因?yàn)樽詈筮€是大家比拼的是效率嘛,你的效率如果不夠高的話,慢慢就覺(jué)得,還不如用別人的,去在這之上,再去開發(fā)更多的應(yīng)用,是更劃算的。

所以在每一層其實(shí)都有機(jī)會(huì),但是不同的層發(fā)展規(guī)律,需要的專業(yè)知識(shí)什么的都不太一樣。

陳茜:

非常同意您的說(shuō)法,之前我問(wèn)Dario Amodei from Anthropic(百度前高管)他也說(shuō)過(guò),他當(dāng)時(shí)在做語(yǔ)言還有翻譯方面的工作,剛剛從斯坦福畢業(yè)之后在百度,他說(shuō)在國(guó)際市場(chǎng),可能最后也就剩四個(gè)左右的大模型,因?yàn)槠渌赡芏寂懿怀鰜?lái),就是跟您的想法非常一致。

02 商業(yè)落地:AI企業(yè)需求比互聯(lián)網(wǎng)時(shí)期大得多

楊宇東:

你說(shuō)過(guò),大模型對(duì)于B端的影響會(huì)超過(guò)互聯(lián)網(wǎng),你為什么認(rèn)為,大模型對(duì)B端的改造,比互聯(lián)網(wǎng)對(duì)B端的影響更大?

李彥宏:

其實(shí)你想一想,互聯(lián)網(wǎng)對(duì)C端的改造,我們都是感同身受的,是非常徹底的,是顛覆性的。

但是互聯(lián)網(wǎng)對(duì)B端的改造,其實(shí)我覺(jué)得一般般吧,雖然不能說(shuō)沒(méi)有,但是“互聯(lián)網(wǎng)+”其實(shí)最后,可能只是一個(gè)信息化、或者數(shù)據(jù)化的過(guò)程,用的技術(shù)比較簡(jiǎn)單,產(chǎn)生的增益也沒(méi)有那么明顯。

但是大模型確實(shí)不一樣,各種AI應(yīng)用,比如說(shuō)小說(shuō)創(chuàng)作,讀小說(shuō)叫做C端,小說(shuō)創(chuàng)作就可以當(dāng)做是B端,法律援助其實(shí)在幫助律師在提升效率。

我們接觸到的一些能源電力行業(yè),生產(chǎn)制造業(yè)等等,都有類似的需求,比如說(shuō)像現(xiàn)在國(guó)內(nèi)電動(dòng)車卷的也很厲害,車?yán)镱^對(duì)話系統(tǒng),很多也在用文心大模型,使用量也不小,但是對(duì)于百度來(lái)說(shuō),這就是一個(gè)To B的應(yīng)用,我們不直接提供給用戶,它是經(jīng)過(guò)了OEM,經(jīng)過(guò)了車廠,他們的集成之后,把這個(gè)應(yīng)用提供給了終端消費(fèi)者。

這種事情其實(shí)非常多,而且我們就看調(diào)用量,如果調(diào)用量上的很快,這就說(shuō)明我們的客戶需要這些東西,B端靠著這個(gè)大模型,靠著AI原生應(yīng)用產(chǎn)生了價(jià)值。

楊宇東:

最近我跑制造業(yè)比較多,你前面說(shuō)的有些像車企它直接調(diào)用了,直接把文心一言或者大模型調(diào)用了,在制造業(yè)里面,很多企業(yè)家說(shuō),我們覺(jué)得未來(lái)AI對(duì)于我們高端制造業(yè),智能制造顯然是重要的價(jià)值,是一種革命性的突破,但是一直就搞不明白,比如說(shuō)通用大模型,和我自己的行業(yè)垂直領(lǐng)域,垂直大模型,它將來(lái)到底是什么樣的關(guān)系,你說(shuō)的OEM,他們也希望,到底是什么樣的供應(yīng)商,和你們這樣平臺(tái)型的大廠商之間,形成什么樣的業(yè)務(wù)鏈條,這個(gè)問(wèn)題是制造業(yè),尤其是先進(jìn)制造業(yè)特別關(guān)注的。

李彥宏:

這個(gè)問(wèn)題確實(shí)很重要,實(shí)際上大模型在各個(gè)垂直的場(chǎng)景里怎么用,我們也經(jīng)過(guò)了探索過(guò)程,最初我們的想法是,我把基礎(chǔ)模型做得越來(lái)越強(qiáng)大,大家叫通用人工智能(AGI),在什么場(chǎng)景我都能做得很好。

后來(lái)發(fā)現(xiàn)這件事情沒(méi)有那么容易,每個(gè)場(chǎng)景都有它自己的道,而且要求也不太一樣,有些地方,大模型思考兩分鐘再給結(jié)果也OK,只要給出來(lái)的結(jié)果是準(zhǔn)確的、是全面的就可以了。但是有些場(chǎng)景,如果你一秒鐘不出結(jié)果,用戶就放棄了,所以這兩個(gè)場(chǎng)景對(duì)大模型要求是不一樣的。

今天即使是最強(qiáng)大的模型,還不能做到反應(yīng)又快又準(zhǔn),所以當(dāng)應(yīng)用場(chǎng)景需要反應(yīng)快的時(shí)候,我們需要更小的模型,它由于沒(méi)有大模型通用的能力,所以在垂直場(chǎng)景當(dāng)中,還要對(duì)它做精調(diào),就是做SFT(監(jiān)督微調(diào)),把你行業(yè)的數(shù)據(jù)灌進(jìn)去,再經(jīng)過(guò)各種各樣的調(diào)教,在這個(gè)場(chǎng)景里的效果,能夠跟大模型相比差不多。

類似這種場(chǎng)景,我們也見了很多,去年10月份,我們發(fā)了文心4.0之后,主要精力在做什么呢?根據(jù)最強(qiáng)大的模型,去裁剪各種體量的小模型,比如說(shuō)十億量級(jí)的模型,百億量級(jí)的模型,千億量級(jí)的模型。

這個(gè)模型也許擅長(zhǎng)角色扮演,那個(gè)模型也許擅長(zhǎng)邏輯推理等等,根據(jù)客戶的不同使用場(chǎng)景不同的要求,出來(lái)各種各樣的模型。

這些模型的大多數(shù)速度都比文心EB4要快,推理成本比它要低,所以這種應(yīng)用是大家更愛用的。

即使到今天,我剛才講的5億的調(diào)用量,調(diào)用量最大的,一定不是最強(qiáng)大的模型,大家都覺(jué)得,反應(yīng)太慢了,成本太高了。

但是隨著時(shí)間推移,成本會(huì)下降,反應(yīng)速度也會(huì)提升,比如說(shuō)前幾天剛剛發(fā)布EB4的Turbo,Turbo就是在EB4的基礎(chǔ)上,效果有提升,但更重要的是,響應(yīng)速度比以前快了很多,成本下降了很多,因?yàn)槭裁茨兀?/p>

我們發(fā)現(xiàn)真正的市場(chǎng)需求,是要求你響應(yīng)速度一定要足夠的快,成本一定要足夠的低,這樣我才能用起來(lái),至于說(shuō)下一代的大模型,到底有多強(qiáng)大,在哪些場(chǎng)景能夠用到,那是我們會(huì)繼續(xù)去探索的過(guò)程,但是今天你要看市場(chǎng)需求的話,規(guī)模更小一點(diǎn)的模型,市場(chǎng)需求量是更大的。

楊宇東:

幫我們介紹一下,大模型在B端的應(yīng)用比較成功的商業(yè)案例,或者是商業(yè)模式、產(chǎn)品形態(tài)。

李彥宏:

除了我剛才舉了小說(shuō)創(chuàng)作,還有比如電商的數(shù)字人直播,通過(guò)大模型來(lái)生成直播的話術(shù),很多數(shù)據(jù)人不容易記得特別清楚,比如說(shuō)我要賣一個(gè)營(yíng)養(yǎng)品,這個(gè)營(yíng)養(yǎng)品在哪一年,哪一個(gè)大學(xué),哪一個(gè)教授做了多少實(shí)驗(yàn),實(shí)驗(yàn)出來(lái)之后結(jié)果是什么樣子,讓自然人去記這些東西,他記不住的,但是這些數(shù)據(jù)恰恰能夠很好的說(shuō)明,這個(gè)產(chǎn)品到底有什么作用,這些東西靠數(shù)字人把它表達(dá)出來(lái),靠大模型把它生成出來(lái),很多時(shí)候比真人的直播效果反而要更好,幾乎任何一個(gè)行業(yè),我們都可以取出來(lái)類似的東西。

陳茜:

現(xiàn)在企業(yè)們,他們對(duì)AI調(diào)用成本怎么去看?我們幫企業(yè)去算一下賬,我花100塊錢,買各種各樣的AI服務(wù),我可能要乘以五,我要賺500塊錢,我的商業(yè)才能跑得通。現(xiàn)在企業(yè)們是否會(huì)愿意去為AI去付費(fèi),你在跟一些企業(yè)客戶交流的時(shí)候,他們的態(tài)度是什么樣子的?

李彥宏:

這個(gè)問(wèn)題特別好,當(dāng)你處在市場(chǎng)經(jīng)濟(jì)環(huán)境當(dāng)中的時(shí)候,這些企業(yè)其實(shí)是非常理性的,尤其是中小企業(yè),它賬是算得非常精的,如果這件事情能夠讓我降本增效,能夠讓我賺到更多的錢,那我就會(huì)用它,如果不能,你再吹破天,我也不會(huì)用。

其實(shí)市場(chǎng)會(huì)告訴你,大模型到底有沒(méi)有用,我們看到調(diào)用量的迅速提升,確實(shí)是因?yàn)樵谟脩魝?cè),在客戶側(cè),它為這個(gè)企業(yè)確實(shí)產(chǎn)生了降本增效的作用。

我再舉個(gè)例子,比如招聘場(chǎng)景,雇主要找一個(gè)具備什么技能的人,對(duì)于技能的描述,它可以是千差萬(wàn)別的,在這種情況下,用大模型去理解這是一個(gè)什么人,理解老板要招什么樣的人,去進(jìn)行匹配的話,大模型的效率就會(huì)高很多。

過(guò)去是HR坐在那,一份一份簡(jiǎn)歷篩查,然后一個(gè)一個(gè)人去面試,面試100個(gè)人,最后篩出來(lái)10個(gè)人來(lái),這個(gè)效率是非常非常低的,但是大模型進(jìn)來(lái)之后,它可以非常明顯的去提升這方面的效率,有了這樣的場(chǎng)景之后,你去算一算模型的推理成本,其實(shí)幾乎是可以忽略不計(jì)的。

尤其在國(guó)內(nèi),現(xiàn)在大模型價(jià)格戰(zhàn)是非常厲害的,所以像一些比較輕量級(jí)的模型,百度的輕量級(jí)模型都是免費(fèi)的,這個(gè)免費(fèi)不僅僅指的是模型免費(fèi),實(shí)際上算力也送你了,你本來(lái)要有電腦,我得要有帶寬等等,這些都沒(méi)有了,你只要來(lái)用就好。

陳茜:

后面的推理也很便宜是嗎?

李彥宏:

推理是免費(fèi)的。

陳茜:

有一個(gè)比較好奇的問(wèn)題,在SaaS時(shí)期,在互聯(lián)網(wǎng)時(shí)期,SaaS在中國(guó)To B沒(méi)有做出來(lái),為什么您會(huì)覺(jué)得在AI時(shí)期,AI as a service可以在中國(guó)做起來(lái)呢?To B方面的話。

李彥宏:

我覺(jué)得在SaaS時(shí)期,之所以沒(méi)有做起來(lái),更多的是因?yàn)?,比如像互?lián)網(wǎng)大的平臺(tái),它既做了To C的事,也做了To B的事。

像在美國(guó)的話,每一個(gè)商家都有一個(gè)自己的電商網(wǎng)站,用戶也可以到它網(wǎng)站上去購(gòu)物,在中國(guó)的話,大家都到電商平臺(tái)去購(gòu)物,商家所需要的To B能力,電商平臺(tái)都替他做了,所以他不需要這種東西了,但是在美國(guó)的話,你自己比如說(shuō)你要建立一個(gè)自己的網(wǎng)站,上面要能夠賣東西,要有各種各樣的這種功能,要對(duì)自己的用戶進(jìn)行了解,那是需要做很多投入的。

所以在某種意義上講,其實(shí)中國(guó)并不是沒(méi)有這樣的需求,而是說(shuō)這些需求,被更大的平臺(tái)所滿足掉了。

但是在AI時(shí)代,我覺(jué)得情況又發(fā)生了變化。剛才也講了,它不是從0到1的、大家過(guò)去從來(lái)沒(méi)有見過(guò)的這個(gè)業(yè)態(tài),它先誕生的恰恰是對(duì)于現(xiàn)有業(yè)態(tài)的一個(gè)增強(qiáng),所以當(dāng)現(xiàn)有業(yè)態(tài)被增強(qiáng)效率越來(lái)越高的時(shí)候,他可能就更能夠抵御,類似于互聯(lián)網(wǎng)平臺(tái)這樣的公司,對(duì)他的這種業(yè)務(wù)的侵蝕,所以這方面我是我倒是覺(jué)得,AI的這種ToB的需求,在中國(guó)會(huì)比互聯(lián)網(wǎng)To B的需求要要大很多。

03 開源vs閉源:大模型商業(yè)化路徑的選擇

陳茜:

在國(guó)際上對(duì)開源閉源大家也爭(zhēng)論的很厲害,比如說(shuō)馬斯克他噴OpenAI, 說(shuō)你這么閉源,你要不然就叫CloseAI好了,我們看到馬斯克的xAI也開源了,Meta的Llama也是開源的,為什么你對(duì)閉源這么堅(jiān)持呢?

李彥宏:

我覺(jué)得開源其實(shí)是一種智商稅,你仔細(xì)想一想,我們?yōu)槭裁匆龃竽P??它能夠有?yīng)用,這些應(yīng)用在各種場(chǎng)景下,能夠?yàn)榭蛻魹橛脩籼嵘?,降低成本,產(chǎn)生過(guò)去產(chǎn)生不了的作用。

所以當(dāng)你理性的去想,大模型能夠以什么樣的成本,給我?guī)?lái)什么價(jià)值的時(shí)候,你就會(huì)發(fā)現(xiàn)你永遠(yuǎn)應(yīng)該選擇閉源模型。

今天閉源的無(wú)論是ChatGPT也好,文心一言也好,以及各種各樣的模型,你看一下它的平均水平,一定是比開源模型要更強(qiáng)大的,它的推理成本它一定是比這個(gè)開源模型更低的。

尤其在國(guó)內(nèi)的話,我們連算力都送你了,所以當(dāng)你想要一個(gè)開源模型的時(shí)候,你得把這個(gè)模型拿過(guò)來(lái),根據(jù)你的場(chǎng)景去做這個(gè)SFT(監(jiān)督微調(diào)),很有可能還要做這種安全上的對(duì)齊,就是哪些風(fēng)險(xiǎn)要去進(jìn)行規(guī)避,你還要根據(jù)自己的場(chǎng)景,去準(zhǔn)備各種各樣的數(shù)據(jù),去一輪一輪的去迭代,最后剛才說(shuō)的買算力,你要把它放上去,由于是你自己獨(dú)有的一個(gè)模型,你還沒(méi)有辦法,跟別的應(yīng)用去共享這個(gè)算力,最高峰的時(shí)候用多少,那就要準(zhǔn)備多少算力,這個(gè)是非常非常不經(jīng)濟(jì)的。

反過(guò)來(lái)你用閉源的模型,算力可以和大家共享,這些個(gè)能力在同等的參數(shù)下,閉源模型一定比開源模型的量更強(qiáng),那同等能力下,由于閉源模型可能參數(shù)規(guī)模會(huì)更小一點(diǎn),它的推理成本就會(huì)更低。所以長(zhǎng)久來(lái)看,我覺(jué)得閉源模型,它使用一定是非常大的比例,會(huì)超過(guò)開源模型。

當(dāng)然,我也不能說(shuō)開源模型沒(méi)有存在的價(jià)值,從學(xué)術(shù)研究的角度,你是一個(gè)科學(xué)家,你想研究大模型的原理是啥,因?yàn)闃I(yè)界其實(shí)也一直在抱怨就是說(shuō),大模型的不可解釋對(duì)吧,你怎么解釋大模型為什么會(huì)具有這種能力,或者說(shuō)你是一個(gè)高校學(xué)生,你想學(xué)這些東西,你想拿來(lái)練練手,那開源大模型我覺(jué)得有它的價(jià)值。

但如果你是一個(gè)企業(yè),要的就是大模型能夠帶來(lái)價(jià)值上的增益,你只要一算賬,就會(huì)發(fā)現(xiàn)開源模型是沒(méi)有機(jī)會(huì)的。

陳茜:

我看百度是用的公有云的方式對(duì)吧,就是閉源大模型,但再加一個(gè)公有云,上面有集合了不同的閉源和開源的模型,供客戶去調(diào)用,那我看比如說(shuō)亞馬遜云科技,還有微軟他們其實(shí)也是采取這樣的一個(gè)方式。所以百度本身大模型閉源加公有云,你對(duì)這樣的一套的打法,對(duì)企業(yè)的客戶來(lái)說(shuō)有什么考量嗎?

李彥宏:

我覺(jué)得ToB的客戶要選擇一個(gè)模型,對(duì)他來(lái)說(shuō)性價(jià)比最好的,一方面模型要對(duì)他的這個(gè)應(yīng)用能夠產(chǎn)生價(jià)值,另外一方面就是成本要足夠的低。

很多時(shí)候就是你看著有用,一算成本不劃算,那么客戶就放棄了,這是為什么我剛才講,開源模型打不過(guò)閉源模型,你只要理性的去看待,你的收益是啥、成本是啥,你就會(huì)發(fā)現(xiàn),最好還是去選擇閉源模型。

當(dāng)然,閉源模型不是一個(gè)模型,它是一系列的模型,根據(jù)你的使用場(chǎng)景,你去平衡一下,到底要多好的效果,要多快的推理速度,要多低的成本,所以我的模型非常多的變種,可以根據(jù)用戶的需求,讓他來(lái)選擇。

而這些相對(duì)來(lái)說(shuō)規(guī)模更小的模型,都是從最大最強(qiáng)的模型裁剪出來(lái)的,這也是我覺(jué)得開源模型不具備的一個(gè)優(yōu)勢(shì),當(dāng)最先進(jìn)的模型是閉源的時(shí)候,我根據(jù)閉源往下去裁剪,裁剪出來(lái)一些規(guī)模更小的模型,仍然比那些同樣規(guī)模的開源模型效果更好。

我們也看到一些參數(shù)規(guī)模比較大的這種開源模型,其實(shí)這個(gè)就更沒(méi)有道理了,當(dāng)規(guī)模越大的時(shí)候,你會(huì)發(fā)現(xiàn)他的推理速度變得更慢了,如果不在乎推理速度的話,你就用最強(qiáng)大的閉源模型,那它效果一定是更好的。

而且參數(shù)規(guī)模越大意味著什么?意味著對(duì)算力的消耗也越大,也就是說(shuō)你得準(zhǔn)備更多服務(wù)器,來(lái)伺候這個(gè)大模型,其實(shí)這東西是根本不劃算的,越往上走,越應(yīng)該去共享這個(gè)算力,這樣才能算過(guò)來(lái)賬。

所以我覺(jué)得大家只要是不是在那兒坐而論道,而是真的說(shuō),我對(duì)模型有需求的時(shí)候,你就會(huì)發(fā)現(xiàn)幾乎是無(wú)需思考,不可能去選擇開源模型。

04 AI超級(jí)應(yīng)用:AI時(shí)代不再卷日活10億?

楊宇東:

由ChatGPT掀起的熱潮已經(jīng)一年多了,你也曾經(jīng)表達(dá)過(guò),接下來(lái)超級(jí)應(yīng)用什么時(shí)候出現(xiàn)。我們看到國(guó)內(nèi)面向C端的大模型產(chǎn)品形態(tài),看起來(lái)差不多都是搜索框問(wèn)答這種模式,你怎么看?有沒(méi)有可能產(chǎn)生一種差異化的競(jìng)爭(zhēng)?什么樣好的產(chǎn)品會(huì)出現(xiàn)?

李彥宏:

準(zhǔn)確的講,我倒不是一定在等待一個(gè)超級(jí)應(yīng)用的出現(xiàn),我更覺(jué)得在基礎(chǔ)模型之上,在大模型之上,應(yīng)該能夠誕生數(shù)以百萬(wàn)計(jì)的、各種各樣的應(yīng)用。

這些應(yīng)用有些是很小的領(lǐng)域,大家可能不太容易想到的應(yīng)用,但是它對(duì)于那個(gè)領(lǐng)域的問(wèn)題,解決得就比以前好很多。也有可能是用戶量龐大,用戶使用時(shí)長(zhǎng)非常長(zhǎng)的,類似于移動(dòng)互聯(lián)網(wǎng)的超級(jí)應(yīng)用。

確切的講,我覺(jué)得現(xiàn)在還沒(méi)有看到,能夠比肩移動(dòng)互聯(lián)網(wǎng)時(shí)期超級(jí)應(yīng)用的AI原生應(yīng)用,但是已經(jīng)看到,越來(lái)越多、各種各樣場(chǎng)景,尤其是ToB(對(duì)企業(yè))場(chǎng)景,利用大模型提升效果,提升效率,產(chǎn)生更多的收入,或者說(shuō)能夠節(jié)省更多的成本的情況出現(xiàn)。

尤其是今年以來(lái),我們看到在各個(gè)領(lǐng)域,各行各業(yè)都有AI的應(yīng)用場(chǎng)景出現(xiàn)了,它的出現(xiàn)使得我們大規(guī)模節(jié)省了人力成本,或者是效率大規(guī)模的提升,也許對(duì)于投資者、創(chuàng)業(yè)者,他們沒(méi)有覺(jué)得這個(gè)東西很令人興奮。

因?yàn)榇蠹叶荚谙?,我能不能有一天,?到1做出一個(gè)人們想也沒(méi)想到過(guò)的東西,變成一個(gè)DAU(日活用戶)10億的超級(jí)應(yīng)用,這個(gè)當(dāng)然很重要,假以時(shí)日也一定會(huì)出現(xiàn),但是目前已經(jīng)看到的,甚至是更重要的是,大模型在各個(gè)領(lǐng)域、各個(gè)場(chǎng)景的應(yīng)用。

這方面從百度文心一言的日調(diào)用量來(lái)看,已經(jīng)是非常明顯了。我們?cè)?月份的時(shí)候,曾經(jīng)公布過(guò)一個(gè)數(shù)據(jù),文心一言的調(diào)用量,每天有兩億次,到最近一次,前幾天我們?cè)诠嫉臅r(shí)候,文心一言調(diào)用量已經(jīng)到了5億次,也就是說(shuō)兩個(gè)月的時(shí)間,調(diào)用量翻倍。

調(diào)用增長(zhǎng)背后意味著什么?意味著它在給應(yīng)用產(chǎn)生價(jià)值,因?yàn)闆](méi)有價(jià)值的話,人家也不會(huì)花錢去做這種調(diào)用。所以這種增長(zhǎng)速度,還是非常令人興奮的。大模型對(duì)于實(shí)體產(chǎn)業(yè),對(duì)于各行各業(yè)的提效降本這些作用現(xiàn)在已經(jīng)非常明顯了。

楊宇東:

你更多是談到了在垂直的行業(yè),我們想百度還是有很強(qiáng)C端基因的公司,作為一個(gè)普通的消費(fèi)者和使用者,我們也想請(qǐng)您聊一聊,C端用戶會(huì)有什么樣很好的場(chǎng)景?包括我們說(shuō)端側(cè),甚至最后手機(jī)上的APP,可以被手機(jī)硬件去調(diào)用,而不是經(jīng)過(guò)一個(gè)APP,這個(gè)你怎么看?

李彥宏:

我覺(jué)得分兩類,一類是大家比較關(guān)注的,過(guò)去從來(lái)沒(méi)有的應(yīng)用,現(xiàn)在比較流行的,類似于ChatGPT這樣的,我們把它叫做ChatBot(聊天機(jī)器人)。

國(guó)內(nèi)每一個(gè)大模型公司,都會(huì)推出一個(gè)相應(yīng)的APP,或者是網(wǎng)站來(lái)做ChatBot,它的作用也比較明顯,如果你有一個(gè)很具體的問(wèn)題,丟給它的話,它就會(huì)給你一個(gè)還不錯(cuò)的答案,而且準(zhǔn)確率也越來(lái)越高了,很多人逐步的對(duì)這種ChatBot產(chǎn)生了依賴。

對(duì)于現(xiàn)有的這些ToC(對(duì)消費(fèi)者)的應(yīng)用,其實(shí)它信息增益作用也是非常大的。我們?cè)?月份的時(shí)候,公布過(guò)一個(gè)數(shù)據(jù),就是百度搜索,今天有11%的搜索結(jié)果會(huì)由AI來(lái)生成的,這個(gè)比例還在不斷的提升。

也就是說(shuō),現(xiàn)有大家比較常見的應(yīng)用,其實(shí)也越來(lái)越多的,在被大模型、生成式AI所改造。

另外一個(gè)例子,比如說(shuō)百度文庫(kù),過(guò)去是一個(gè)大家在上面找現(xiàn)成的文檔,比如中學(xué)老師要備課了,初中的物理課,他要找一找人大附中的老師,最優(yōu)秀的老師,他的教案是什么樣子,去找現(xiàn)成的文檔。

今天百度文庫(kù)經(jīng)過(guò)大模型改造之后,已經(jīng)更多的變成了,生成式AI這種應(yīng)用,也就是說(shuō),不管你想要產(chǎn)生什么樣的文檔,是PowerPoint,是論文的格式,還是什么各種各樣的,甚至是漫畫這樣的,它都可以根據(jù)你的要求來(lái)生成。

而且不僅它的用戶量比較廣,這個(gè)產(chǎn)品它是收費(fèi)的,今年以來(lái)已經(jīng)有大約2600萬(wàn)付費(fèi)用戶,你如果說(shuō)用超級(jí)應(yīng)用的標(biāo)準(zhǔn)來(lái)看的話,它也沒(méi)有到超級(jí)應(yīng)用的水準(zhǔn),但是你要是看它實(shí)際產(chǎn)生價(jià)值的話,有那么多人愿意為這個(gè)產(chǎn)品付費(fèi),那還是很厲害的。

這些產(chǎn)品都是過(guò)去已經(jīng)存在的,只是說(shuō)你經(jīng)過(guò)了大模型的改造之后,它的能力跟以前完全不一樣了,人們對(duì)它的認(rèn)知也在不斷的迭代,不斷的在加深。

楊宇東:

因?yàn)樗芰Φ奶嵘?,大家更愿意付費(fèi)了,而原來(lái)只是免費(fèi)搜索。

李彥宏:

是的。

陳茜:

我特別同意您最近在多個(gè)場(chǎng)合強(qiáng)調(diào)的,去卷AI的原生應(yīng)用,這樣的話,大模型才有意義。同時(shí)我也有一點(diǎn)小困惑,比如說(shuō)OpenAI它的GPT-4,在8個(gè)月之前就推出來(lái)了,當(dāng)時(shí)大家都會(huì)覺(jué)得,AI應(yīng)用時(shí)刻要爆發(fā)了,但是8個(gè)月之后的今天,我們看到還沒(méi)有爆發(fā),可能很多應(yīng)用出來(lái)也不太盡人意。

最近最火的Perplexity,這個(gè)AI搜索現(xiàn)在是2000萬(wàn)美元的ARR(年度經(jīng)常性收入),2000萬(wàn)用戶的量級(jí),其實(shí)也還沒(méi)有到所謂的Super app(超級(jí)應(yīng)用),或者是killer app(殺手級(jí)應(yīng)用),所以我的問(wèn)題或者疑惑在于說(shuō),如果基于GPT-4的模型能力,是不是我們現(xiàn)在還沒(méi)有到去卷應(yīng)用的時(shí)候,這個(gè)時(shí)刻還沒(méi)到?

李彥宏:

剛才你提到了GPT,以及perplexity,還是我剛才說(shuō)的第一類,過(guò)去從來(lái)沒(méi)有過(guò)的東西,它是從0到1去做的。

超級(jí)應(yīng)用確實(shí)現(xiàn)在還沒(méi)有出現(xiàn),即使是ChatGPT的話,它的DAU也沒(méi)有過(guò)億,還算不上一個(gè)真正的超級(jí)應(yīng)用,但是對(duì)于現(xiàn)有產(chǎn)品的改造,無(wú)論是中國(guó)也好,美國(guó)也好,我們都看到了實(shí)實(shí)在在的增益。

比如美國(guó)的話,微軟的Copilot,它已經(jīng)收到了很多付費(fèi),美國(guó)更多的是ToB(對(duì)企業(yè))的行業(yè),Palantir、Snowflake這些,都是通過(guò)軟件被大模型、被生成式AI加持了之后,他們的業(yè)績(jī)得到實(shí)實(shí)在在的增長(zhǎng)。

所以從這個(gè)意義上講,大模型應(yīng)用其實(shí)已經(jīng)逐步在浮現(xiàn)出來(lái),它對(duì)于現(xiàn)有業(yè)態(tài)的改造作用,比從0到1顛覆,作用更早到來(lái)、更明顯,甚至我覺(jué)得也能夠創(chuàng)造更多價(jià)值。

以前Satya(微軟CEO)說(shuō)過(guò),他說(shuō)過(guò)去互聯(lián)網(wǎng)叫做AutoPilot,意思就是,你自己就都把這個(gè)結(jié)果給弄出來(lái)了,現(xiàn)在的生成式AI叫Copilot,它實(shí)際上是人和機(jī)器共創(chuàng)的過(guò)程。

這個(gè)過(guò)程一開始大家覺(jué)得沒(méi)有那么性感,但是它對(duì)于人的工作效率的提升,對(duì)于成本的下降,對(duì)于打開新的可能性,產(chǎn)生的促進(jìn)作用,其實(shí)是比那些從0到1的應(yīng)用,反而要更大。

如果僅僅是從0到1,你可能會(huì)希望出現(xiàn)某幾個(gè)Super app,那它也就是公司從中受益,但是今天幾乎各行各業(yè)所有的公司,被大模型加持之后,它都能受益,這種影響力,對(duì)于整個(gè)社會(huì),對(duì)于人類來(lái)說(shuō),無(wú)疑是更大的。

只是大家好像覺(jué)得,這個(gè)東西我以前見過(guò)嘛?所以沒(méi)有那種新鮮感,或者他更多誕生在生產(chǎn)力場(chǎng)景,他的受眾群體,或者單一應(yīng)用受眾群體,不會(huì)過(guò)億、過(guò)十億那樣,尤其在C端,在公眾層面體感沒(méi)有那么集中,這是大家現(xiàn)在一直想找一個(gè)Super app的原因。

楊宇東:

你的問(wèn)題是挑戰(zhàn)Robin,Robin說(shuō)要卷起來(lái),你說(shuō)怎么沒(méi)看到卷,我總結(jié)下來(lái),我的感覺(jué),聽完Robin講完之后,我就知道了,我們理解的超級(jí)這兩個(gè)字,在Robin概念里面,一個(gè)是數(shù)以百萬(wàn)計(jì)的應(yīng)用已經(jīng)開始起來(lái)了,第二個(gè),所謂的超級(jí)反而是在垂直的,在一些局部的領(lǐng)域,它有非常顯著的加速度或者是增益。

陳茜:

或者是“超級(jí)”這個(gè)定義在互聯(lián)網(wǎng)時(shí)代跟在AI時(shí)代是不一樣的。

李彥宏:

是不一樣的。在互聯(lián)網(wǎng)時(shí)代可能是某一個(gè)單一的從0到1,或者是到100這樣的應(yīng)用,今天所謂的超級(jí)應(yīng)用,它是對(duì)現(xiàn)有場(chǎng)景的一種加持,這種加持還在早期,我必須得承認(rèn),它逐步會(huì)改變現(xiàn)有產(chǎn)品的形態(tài)。

我再舉一個(gè)例子,小說(shuō)創(chuàng)作、網(wǎng)文,這個(gè)在國(guó)內(nèi)是特別火的行業(yè),過(guò)去就是人肉,靠自己的能力、想象,不斷的去更新一篇文章,或者是一個(gè)小說(shuō),這個(gè)效率是很低的。現(xiàn)在有了大模型的加持,基本上有一個(gè)構(gòu)思,它就會(huì)給你相應(yīng)的文檔,你給的再豐富一點(diǎn),它就生成的再豐富一點(diǎn),你說(shuō)文風(fēng)太溫柔了,要不要強(qiáng)悍一點(diǎn),根據(jù)你的想法,它可以不斷的去調(diào)整。

這樣的東西,在用戶看來(lái),我仍然在讀一篇網(wǎng)文,在讀一篇小說(shuō),但是這個(gè)小說(shuō)的生產(chǎn)成本生產(chǎn)效率,它的內(nèi)容豐富度,可讀性,優(yōu)良率等等,都是跟以前不一樣的。所以這樣的例子,其實(shí)我們?cè)趲缀跞魏涡袠I(yè)都能夠看到。

05 AI Agent智能體:門檻一定要夠低

楊宇東:

我們前面聊的總結(jié)一下叫卷應(yīng)用,接下來(lái)還有一個(gè)關(guān)鍵詞叫智能體,你說(shuō)過(guò)好多次,AI時(shí)代最看好的是智能體,但是目前來(lái)看好像也沒(méi)有特別強(qiáng)大的爆發(fā)。你為什么認(rèn)為智能體是AI時(shí)代未來(lái)的趨勢(shì)呢?

李彥宏:

我覺(jué)得智能體正在爆發(fā),只是說(shuō)它現(xiàn)在基數(shù)還比較小的時(shí)候,大家的體感沒(méi)有那么強(qiáng)烈,但是你要看業(yè)界大模型公司,都在做智能體,業(yè)界這些意見領(lǐng)袖,基本上算是共識(shí),一般大家都會(huì)說(shuō),我看好智能體。

智能體為什么代表未來(lái)?基礎(chǔ)模型它本身是需要靠應(yīng)用才能顯現(xiàn)出來(lái)的價(jià)值,智能體就是,一個(gè)幾乎可以放之四海而皆準(zhǔn)的、基于大模型的應(yīng)用。

什么意思呢?根據(jù)我自己的場(chǎng)景,我設(shè)定一個(gè)角色人設(shè),我連編程都不用,我只要把我想要做的事情跟它講清楚,當(dāng)然有時(shí)候要把自己的私有知識(shí)庫(kù)對(duì)接進(jìn)來(lái),或者把自己做事情的套路給它說(shuō)清楚,這個(gè)專業(yè)術(shù)語(yǔ)叫做工作流,把工作流套進(jìn)去,它就是一個(gè)非常有用的、跟基礎(chǔ)模型不一樣的東西。

今天不能說(shuō)所有,但是大多數(shù)AI的原生應(yīng)用,你用智能體的方式都可以做出來(lái),做出來(lái)之后效果也不錯(cuò)。

由于它的門檻足夠低了,可能你連編程都不用編,就可以做出來(lái)一個(gè)效果不錯(cuò)的智能體,就意味著越來(lái)越多的人可以做出他想要的智能體。

這個(gè)有點(diǎn)像什么呢?有點(diǎn)像90年代中期的時(shí)候,互聯(lián)網(wǎng)的網(wǎng)站,這個(gè)網(wǎng)站你可以把它做得非常復(fù)雜,當(dāng)時(shí)比如說(shuō)雅虎也是很厲害的網(wǎng)站,但是仍然在學(xué)校里讀書的大學(xué)生,他也可以做一個(gè)自己的HomePage,他把他常用的幾個(gè)網(wǎng)站鏈接鏈在那,比如說(shuō)Java學(xué)習(xí)攻略這些東西,做幾個(gè)鏈接,就是他自己的網(wǎng)站,其實(shí)很簡(jiǎn)單。

由于做網(wǎng)站很簡(jiǎn)單,所以在90年代的時(shí)候,從中期到末期,就是誕生了數(shù)以百萬(wàn)計(jì)的網(wǎng)站,這種大浪淘沙,最終會(huì)出來(lái)一些非常優(yōu)秀的網(wǎng)站,像Google、Facebook,這當(dāng)然是若干年之后才出現(xiàn),但是早期看的話,你可能看到的都是,這些網(wǎng)站怎么都是亂糟糟的,一個(gè)大學(xué)生就能做一個(gè)網(wǎng)站出來(lái),這有啥價(jià)值呀?

但是你必須得門檻足夠低的時(shí)候,讓更多人進(jìn)來(lái),他們發(fā)揮聰明才智,指不定哪條路跑通了,它就是一個(gè)Super app,這就是為什么,我覺(jué)得智能體代表未來(lái),我特別看好的一個(gè)新興的業(yè)態(tài)。

陳茜:

智能體AI Agent它是特別重要的概念,包括在美國(guó)硅谷也是這樣的,在業(yè)界大家對(duì)AI Agent,它的定義還是有一點(diǎn)不同的探討,我看到有些人說(shuō),比如說(shuō)GPTs,也都是一些智能體,有些人會(huì)說(shuō),可能更加高級(jí)一點(diǎn)的Agent才算智能體,我的Agent要調(diào)取不同的工具,要成為一個(gè)虛擬世界的機(jī)器人,它可能才叫Agent,你對(duì)Agent的定義是什么樣子的?

李彥宏:

我首先要考慮這個(gè)門檻要足夠的低,就一個(gè)小白,比如說(shuō)大一的學(xué)生,他也可以很方便的能夠制作一個(gè)智能體出來(lái)。

當(dāng)然在此之上,可以有各種各樣比較有趣的玩法,剛才你講的調(diào)用工具、反思呀、長(zhǎng)期的記憶等等,這些能力會(huì)逐步的加進(jìn)去。

這個(gè)跟90年代時(shí)候的網(wǎng)站誕生過(guò)程,也有類似之處,我們一開始的網(wǎng)站,都是很簡(jiǎn)單的,后來(lái)我可以用Java把一些動(dòng)態(tài)的東西放在一個(gè)網(wǎng)站里,再后來(lái)我可以加上cookie,這樣從一個(gè)網(wǎng)頁(yè)轉(zhuǎn)到下一個(gè)網(wǎng)頁(yè)的時(shí)候,我還記得上一個(gè)網(wǎng)頁(yè)你干了什么,這些東西在早期的時(shí)候,網(wǎng)站生態(tài)里頭是沒(méi)有的,但是一旦有越來(lái)越多的人在生產(chǎn)網(wǎng)站,技術(shù)就會(huì)跟進(jìn)說(shuō),你有什么需求,我去解決你的問(wèn)題。

Agent是一樣的,不是說(shuō)用了最先進(jìn)的,剛才講的這些能力之后,它才叫一個(gè)AI Agent,我反而覺(jué)得我們要把這個(gè)門檻降的足夠低,讓大家覺(jué)得說(shuō),我也可以搞一個(gè)AI Agent,進(jìn)來(lái)之后隨著時(shí)間的推移,隨著你遇到新問(wèn)題,解決問(wèn)題的過(guò)程,會(huì)把各種各樣最先進(jìn)的技術(shù)用進(jìn)來(lái)。

說(shuō)實(shí)話,我認(rèn)為現(xiàn)在AI Agent用到的這些能力,仍然是非常初級(jí)的,未來(lái)還會(huì)產(chǎn)生我們今天想也想不到的Agent能力。

但是這些能力的誕生,反而要依賴數(shù)以百萬(wàn)計(jì)的開發(fā)者,去開發(fā)各種各樣的應(yīng)用,在他們使用的過(guò)程當(dāng)中,產(chǎn)生新的需求,這些需求被解決的過(guò)程,就是一個(gè)創(chuàng)新的過(guò)程,就是AI Agent進(jìn)化的過(guò)程,這個(gè)我還是非常期待的。

陳茜:

百度有什么比較有意思的AI Agent的案例可以給我們分享一下嗎?

李彥宏:

有很多,國(guó)內(nèi)高考是一個(gè)非常大的事件,不僅是學(xué)生,還有家長(zhǎng)都非常重視。過(guò)去大模型在干什么事呢?高考有個(gè)作文題,我們用大模型來(lái)寫一個(gè)作文,看它能得多少分。

其實(shí)你想一想,這個(gè)東西在哪用呢?不可能讓考生帶著大模型去參加高考嘛,但是高考完了之后,你要估分,你要報(bào)志愿,你要選擇學(xué)校,你要選擇專業(yè),可能有人在乎說(shuō),這個(gè)宿舍里頭,一個(gè)宿舍要住幾個(gè)人,那個(gè)人在乎這個(gè)學(xué)校有沒(méi)有游泳池,或者說(shuō)哪個(gè)專業(yè)更適合我未來(lái)發(fā)展,每個(gè)人的情況都是不一樣的,每個(gè)人的問(wèn)題也都是不一樣的。這種情況下,哪有一個(gè)全能的輔導(dǎo)老師可以告訴你說(shuō),你最適合的是哪個(gè)學(xué)校哪個(gè)專業(yè),但是AI Agent就可以干這個(gè)事情。

所以過(guò)去大家來(lái)百度或者到其他地方去搜索,都是找世界上已經(jīng)存在的內(nèi)容,他沒(méi)有專門為這個(gè)人、這個(gè)時(shí)刻、這個(gè)地點(diǎn)、這樣的環(huán)境生產(chǎn)內(nèi)容。

而今天的AI,尤其是智能體,它就可以做到,你告訴我你是什么情況,你的情況可以不用一句話就說(shuō)清楚,你用十句話也可以,我都記得,這樣的例子非常非常多。

陳茜:

而且它會(huì)非常個(gè)人化的給你很多的規(guī)劃,包括我看到你們跟新加坡旅游局也是有合作的。

李彥宏:

是的。你自己消費(fèi)水平是多少、有多長(zhǎng)時(shí)間、有什么喜好、愛吃什么、不愛吃什么,每個(gè)人都是不一樣的,它可以完全根據(jù)你的情況來(lái)生成你要的答案。

06 AGI與Scaling Law:值得長(zhǎng)期奮斗的信仰

楊宇東:

我們說(shuō)Scaling Law,以前大家都覺(jué)得沒(méi)問(wèn)題,但是最近開始不同的聲音出來(lái)了,那確實(shí)我看很多行業(yè),做一些速度更快,效率更高的小模型,那Scaling Law會(huì)不會(huì)這么快又被顛覆掉了?

李彥宏:

Scaling Law本身可能還會(huì)有若干年的生命周期,但與此同時(shí)的話,就是在此之上會(huì)疊加出來(lái)各種各樣的創(chuàng)新。

剛才講的智能體、它的反思能力、它的進(jìn)化的能力等等,其實(shí)跟Scaling Law已經(jīng)有點(diǎn)分離了,它是兩個(gè)路線在發(fā)展,但是它仍然是基于Transformer這類大模型在往上在做。

那未來(lái)再過(guò)一兩年,還會(huì)出現(xiàn)什么新的技術(shù)創(chuàng)新,在此基礎(chǔ)上再去疊加,我們也不知道,大家都在探索。

換句話說(shuō),我覺(jué)得Scaling Law短期之內(nèi)倒不會(huì)被顛覆,但是在Scaling Law之上會(huì)疊加出來(lái)很多很多、現(xiàn)在還無(wú)法想象的創(chuàng)新。

楊宇東:

你個(gè)人認(rèn)為AGI實(shí)現(xiàn)的標(biāo)準(zhǔn)是什么?還有哪些路徑可以讓我們更快的去通向AGI?

李彥宏:

我覺(jué)得這個(gè)問(wèn)題確實(shí)業(yè)界沒(méi)有一個(gè)標(biāo)準(zhǔn)答案,以前大家覺(jué)得,通過(guò)圖靈測(cè)試就實(shí)現(xiàn)AGI了,實(shí)際上現(xiàn)在大模型已經(jīng)通過(guò)了圖靈測(cè)試,但是人們所說(shuō)的AGI,其實(shí)大多數(shù)時(shí)候已經(jīng)不是只通過(guò)圖靈測(cè)試。

那什么叫AGI?在我的心目當(dāng)中,AGI就是說(shuō)是機(jī)器、或者AI,它能夠具備人在任何場(chǎng)景下所具備的能力,就是general intelligence(普遍能力)是通用的,我不管在什么場(chǎng)景,我的能力都是跟人是一樣的,這是一個(gè)很高的要求。

其實(shí)今天你看像我們做這個(gè)無(wú)人駕駛,做了有11年的時(shí)間了,仍然不能說(shuō)這個(gè)技術(shù)成熟,它還是只一個(gè)專用場(chǎng)景,AI都做不到非常成熟,你不能容錯(cuò)的話這個(gè)就不行了。

所以,真正要實(shí)現(xiàn)AGI,我認(rèn)為確實(shí)是還需要很多很多年。但是業(yè)界有人說(shuō)AGI可能再過(guò)2年,或者5年就能實(shí)現(xiàn),但是我自己的判斷是10年以上,也許10年,也許20年,也許更長(zhǎng)的時(shí)間。

我們聽到很多人在講,AGI是一種信仰,當(dāng)你把它當(dāng)做信仰的時(shí)候,誰(shuí)的信仰會(huì)明年就實(shí)現(xiàn)?這是自相矛盾的。如果是一個(gè)信仰,它就是值得為之長(zhǎng)期奮斗的目標(biāo),啥叫長(zhǎng)期呢?但是如果連10年都沒(méi)有的話,不能把它叫做信仰。

陳茜:

太容易了就不能叫信仰。

李彥宏:

對(duì)呀。

陳茜:

現(xiàn)在大家其實(shí)都在等GPT-5,但是GPT-5一直在延后,所以我在周圍聽到的擔(dān)憂的聲音也是越來(lái)越高,就怕說(shuō)比如說(shuō)5~10萬(wàn)億這樣的參數(shù)加上去,但是最后大家發(fā)現(xiàn)它的效果并沒(méi)有躍升這么多,是不是會(huì)打擊一些人們對(duì)Scaling Law的信仰,可能我們的AGI沒(méi)有辦法用Scaling Law的這個(gè)方式去帶我們?nèi)?shí)現(xiàn)了,你對(duì)這個(gè)有擔(dān)憂嗎?

李彥宏:

我不是很擔(dān)心這件事情,我覺(jué)得大家應(yīng)該更關(guān)注應(yīng)用,而不是關(guān)注基礎(chǔ)模型,某種意義上講,基礎(chǔ)模型迭代速度稍微放緩一點(diǎn)不是壞事,就是今天的這些應(yīng)用的開發(fā)者,他有一個(gè)相對(duì)穩(wěn)定的base(基礎(chǔ)),來(lái)開發(fā)應(yīng)用的話,其實(shí)是效率更高一些的,如果模型天天在那兒練,他每天都要重寫一遍過(guò)去的這個(gè)代碼,那是很累的。

但是在現(xiàn)有基礎(chǔ)模型基礎(chǔ)上不斷的去做微調(diào),去做一些漸進(jìn)式的迭代和和創(chuàng)新,其實(shí)你看到它是一直在發(fā)生的,無(wú)論是OpenAI不斷在推的東西,還是我們百度的turbo模型、更小量級(jí)的模型等等,都是在根據(jù)市場(chǎng)需求做迭代。

但是長(zhǎng)遠(yuǎn)來(lái)講,我確實(shí)認(rèn)為下一代的大模型,一定會(huì)比現(xiàn)在這一代模型強(qiáng)大的多。什么時(shí)候推出來(lái)我不是很著急,我覺(jué)得應(yīng)該多看一下真實(shí)的市場(chǎng)需求是啥,然后我們下一代模型迭代的時(shí)候,根據(jù)市場(chǎng)需求來(lái)迭代。

如果我們認(rèn)為AGI 10年都達(dá)不到,下一代模型離AGI其實(shí)還有很遠(yuǎn)的距離,也就是說(shuō)他有他擅長(zhǎng)的、也有不擅長(zhǎng)的地方,如果擅長(zhǎng)的恰好不是市場(chǎng)需求的,那這個(gè)意義是不大的,如果他不擅長(zhǎng)的恰好是市場(chǎng)需求的,那我們浪費(fèi)了很多資源,去做一些不該做的事情。

這是為什么我更關(guān)注應(yīng)用,我想知道市場(chǎng)上(的需求)。比如說(shuō)我是一個(gè)賣車的銷售,我用什么樣的話術(shù),能夠說(shuō)服進(jìn)店的這個(gè)人來(lái)買我的車,而不是說(shuō)我怎么能夠考過(guò)高考數(shù)學(xué)。這就是市場(chǎng)需求,當(dāng)不是很清楚的時(shí)候拼命往前跑,去做一個(gè)名義上更強(qiáng)大的模型,其實(shí)很有可能是會(huì)走彎路,是浪費(fèi)資源的。

陳茜:

我非常同意,那你覺(jué)得接下來(lái)大家在卷應(yīng)用之余,會(huì)不會(huì)開始卷一些中小模型,比如說(shuō)國(guó)際上Mistral這樣的中小模型,也是受很多開發(fā)者歡迎的。那接下來(lái)你覺(jué)得百度在對(duì)于中小模型上,還有一些模型蒸餾上有什么樣的這個(gè)策劃?

李彥宏:

我覺(jué)得我們看到的真實(shí)需求,確實(shí)在絕大多數(shù)情況下都不是最大的模型,它都要求這個(gè)模型變小,變小意味著什么?速度快,成本低。比如說(shuō)我干這個(gè)事兒,總共能夠給我?guī)?lái)每年100萬(wàn)的增益,我一算,最大的模型要120萬(wàn)的成本,那我肯定不干了嘛。

那我給你這個(gè)大模型公司提的要求,就是說(shuō)你能把成本給我降到80萬(wàn),甚至降到8萬(wàn),那我們就得想,怎么最強(qiáng)大的模型蒸餾到足夠小,也就是成本足夠足夠低的時(shí)候,仍然能夠滿足你這個(gè)場(chǎng)景的需求。

我覺(jué)得這一方面,閉源模型仍然有優(yōu)勢(shì),因?yàn)殚]源有最強(qiáng)大的基礎(chǔ)模型,那他根據(jù)這個(gè)模型蒸餾或者裁剪出來(lái)的小模型,會(huì)比那些開源模型蒸餾的會(huì)更好。畢竟你的基礎(chǔ)沒(méi)有人家好,做出來(lái)的東西在競(jìng)爭(zhēng)力上也會(huì)顯得劣勢(shì)。

所以這方面我們看到真實(shí)的需求確實(shí)是非常非常多的,我們也覺(jué)得這方面的機(jī)會(huì),仍然在閉源不在開源。

以上就是我們與李彥宏的采訪內(nèi)容,這次采訪其實(shí)對(duì)我個(gè)人理解市場(chǎng)很有幫助,因?yàn)檫@讓我理解到,企業(yè)家是如何去思考大模型商業(yè)化落地這件事情,特別是在大廠們?nèi)菀赘鞣N卷的中國(guó)市場(chǎng)。

當(dāng)全球的生成式AI公司們,無(wú)論是科技巨頭還是創(chuàng)業(yè)公司,都耗費(fèi)大量資源、算力、金錢和人力去押注“Scaling Law是人類未來(lái)發(fā)展的正確途徑”的時(shí)候,總是有種聲音在提醒我們,我們需要算賬,這件事情如何以更經(jīng)濟(jì)、更合理的方式去發(fā)展。

飛往上海采訪李彥宏的前一個(gè)周末,在硅谷的一個(gè)聚會(huì)上,一位資深人士給我算了一筆賬:

全球芯片用于AI上的支出是4000億美元,這相當(dāng)于1.1萬(wàn)億美元的數(shù)據(jù)中心支出,如果我們要求 25%的ROIC(投資資本回報(bào)率),這相當(dāng)于企業(yè)們需要產(chǎn)生1.4萬(wàn)億美元的成本節(jié)省。

1.4萬(wàn)億美元是全球技術(shù)工人工資的5%,全球總工資的3%,也是全球EBIT(息稅前利潤(rùn))的5%?;蛘?,如果我們假設(shè)利潤(rùn)率為50%,則需要企業(yè)們用AI去創(chuàng)造2.8萬(wàn)億美元的收入,即全球上市公司收入的3%,或全球GDP的2%。

這樣算起來(lái)的話,是不是可以說(shuō),以現(xiàn)在的投入量,只要AI能讓全球企業(yè)們創(chuàng)造2.8萬(wàn)億美元的收入,那么發(fā)展AI這筆賬就是能算得過(guò)來(lái)的,到底什么時(shí)候能打平這筆帳呢?

反正我看高盛是預(yù)測(cè),生成式AI可能會(huì)在10年內(nèi)推動(dòng)全球 GDP 增長(zhǎng)7%,也就是接近7萬(wàn)億美元,并將生產(chǎn)率增長(zhǎng)提高1.5個(gè)百分點(diǎn)。

所以,你會(huì)怎么去算AI發(fā)展的這筆帳呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

李彥宏

  • 商業(yè)頭條No.54 | 百度造車夢(mèng)碎
  • 閃電快訊|百度李彥宏:將于2025年初發(fā)布文心大模型新版本

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

對(duì)話李彥宏:AI價(jià)格戰(zhàn)開打、大模型閉源、超級(jí)應(yīng)用以及中國(guó)市場(chǎng)機(jī)會(huì)

AI價(jià)格戰(zhàn)下企業(yè)的機(jī)會(huì)在哪?

文|硅谷101

在世界人工智能大會(huì)WAIC期間,我們硅谷101從硅谷飛到了上海,采訪了百度創(chuàng)始人、董事長(zhǎng)兼CEO,李彥宏(Robin Li)先生,就目前市場(chǎng)非常關(guān)心的AI議題進(jìn)行了深度討論。

很有趣的是,這一輪生成式AI,中國(guó)市場(chǎng)的打法和海外截然不同,在硅谷大家開始卷多模態(tài)模型和交互,創(chuàng)業(yè)企業(yè)還側(cè)重infra基礎(chǔ)設(shè)施,同時(shí)市場(chǎng)在等GPT-5來(lái)驗(yàn)證Scaling Law的時(shí)候,中國(guó)市場(chǎng)的“百模大戰(zhàn)”已經(jīng)發(fā)展到打響價(jià)格戰(zhàn)的階段了,速度比很多人想象中都要早很多。

接下來(lái)中國(guó)市場(chǎng)要開始卷AI應(yīng)用了,所以在采訪中,李彥宏對(duì)中國(guó)市場(chǎng)大模型的價(jià)格戰(zhàn)、AI的To B企業(yè)級(jí)機(jī)會(huì)、開源/閉源路線選擇、AI超級(jí)應(yīng)用、AI Agent智能體的看法、以及AGI和Scaling Law的思考,都和我們做出了分享。

這是李彥宏2024年首次接受媒體采訪,非常難得,以下是我們的對(duì)話實(shí)錄,希望能為大家?guī)?lái)一些新的思考和角度。

01 不可避免的價(jià)格戰(zhàn):燒錢不是事情的本質(zhì)

楊宇東:

我們看到這個(gè)很多閉源大模型的API調(diào)用的費(fèi)用越來(lái)越低了,而且很多又有開源大模型可以選,所以在這么一個(gè)市場(chǎng)的這么一個(gè)商業(yè)環(huán)境之下,那我們很關(guān)注,就百度肯定是身在其中,那大模型靠推理這樣收費(fèi)的這種商業(yè)模式,它未來(lái)成立不成立?以后我們市場(chǎng)再去比拼大模型的話,會(huì)比拼哪些點(diǎn)?就是你剛才提到的可能是速度、成本等等的,你怎么看?

李彥宏:

說(shuō)實(shí)話,我們內(nèi)部不斷在思考、討論這個(gè)問(wèn)題,我覺(jué)得價(jià)格戰(zhàn)幾乎是不可避免的,在中國(guó)互聯(lián)網(wǎng)干了這么長(zhǎng)時(shí)間,其實(shí)已經(jīng)對(duì)價(jià)格戰(zhàn)非常熟悉了,確實(shí)他來(lái)的比我想象還要更早一點(diǎn),這么早就開始把這個(gè)價(jià)格打到了幾乎不可思議這種低的地步。

但我覺(jué)得某種意義上講,也不是壞事兒,當(dāng)你價(jià)格足夠低、甚至免費(fèi)的時(shí)候,就會(huì)讓更多人有積極性,來(lái)嘗試在大模型基礎(chǔ)上,去開發(fā)各種各樣的應(yīng)用,也就是說(shuō)大模型對(duì)于各行各業(yè)的這個(gè)滲透速度會(huì)更快。

那你都免費(fèi)了,或者說(shuō)價(jià)格足夠低的話,你大模型公司靠什么賺錢呢?我是這樣想的,大模型技術(shù)的天花板還是很高的,今天我們還是對(duì)于大模型的能力,有很多不滿意的地方,那我們?nèi)匀恍枰芏喾浅?yōu)秀的技術(shù)人員、需要很多的算力、需要很多很多的數(shù)據(jù),才能夠訓(xùn)練出來(lái)下一代的大模型,我們還可能需要下下代,甚至下下下代這種大模型。

所以最終我覺(jué)得,大家是要去拼誰(shuí)的技術(shù)更好,你的技術(shù)好,你為客戶產(chǎn)生了更好的價(jià)值,將來(lái)你還是能夠收到費(fèi)的。

今天之所以把價(jià)格打到足夠低,是因?yàn)楝F(xiàn)在模型的能力,其實(shí)技術(shù)還沒(méi)有到最好,大家能力都差不多的時(shí)候,那行就拼價(jià)格唄,誰(shuí)的價(jià)格低就用誰(shuí)的。

時(shí)間長(zhǎng)了之后,市場(chǎng)本身會(huì)回歸理性,那同樣的效果,就是當(dāng)我的成本比你低的時(shí)候,你打價(jià)格戰(zhàn)你肯定打不過(guò)我,時(shí)間久了之后你就退出了。

這個(gè)過(guò)程我們?cè)诎俣染W(wǎng)盤上是經(jīng)歷過(guò)的,那些年大家在卷網(wǎng)盤的時(shí)候,我今天給你10G的免費(fèi)空間,明天100G,后天給1T,再后天說(shuō)無(wú)限空間永久免費(fèi),當(dāng)你說(shuō)無(wú)限空間永久免費(fèi)的時(shí)候,大家也會(huì)說(shuō)這怎么能夠持續(xù)呢?這一定是不可持續(xù)的。

但是某一段時(shí)期,可能有個(gè)一兩年左右,大家這樣不理性的去打價(jià)格戰(zhàn),慢慢就一個(gè)一個(gè)退出,那為什么百度沒(méi)有退出呢?因?yàn)槲腋掖蜓?,我的技術(shù)、存儲(chǔ)成本低,所以最終還是說(shuō)誰(shuí)的技術(shù)好,誰(shuí)的效率高,誰(shuí)會(huì)勝出。

陳茜:

剛才說(shuō)這個(gè)價(jià)格來(lái)的時(shí)間比你想象中的早很多,也比我想象中的早很多,這個(gè)才一年半的時(shí)間,已經(jīng)開始打價(jià)格戰(zhàn)了,但你覺(jué)得價(jià)格戰(zhàn)會(huì)持續(xù)多久呢?可能大家有一些人就覺(jué)得說(shuō)技術(shù)不行,沒(méi)油水我要退出了,可能就最后的市場(chǎng)贏家會(huì)浮現(xiàn)出來(lái)。

李彥宏:

這個(gè)很難講,現(xiàn)在有些創(chuàng)業(yè)公司是玩家,但是也有很大型的這種互網(wǎng)平臺(tái)公司是玩家,那么燒錢的話,其實(shí)理論上講是可以燒很長(zhǎng)時(shí)間的,但我覺(jué)得,燒錢不是這個(gè)事情的本質(zhì),本質(zhì)仍然是誰(shuí)的技術(shù)更好、誰(shuí)的效率更高,當(dāng)你的技術(shù)好、效率高的時(shí)候,你就不怕去打價(jià)格戰(zhàn),所以多長(zhǎng)時(shí)間都OK,最終它會(huì)是優(yōu)勝劣汰的這樣一個(gè)過(guò)程。

陳茜:

你覺(jué)得在中國(guó)市場(chǎng)會(huì)是一個(gè)贏家通吃的局面嗎?還是說(shuō)等價(jià)格戰(zhàn)之后會(huì)剩下幾個(gè)主要的?可能還有一些更小模型這樣的生態(tài)?

李彥宏:

我是這樣想的,這次生成式AI,它是對(duì)于整個(gè)IT技術(shù)棧的一個(gè)大的變革,我們一般認(rèn)為,過(guò)去的IT技術(shù)棧,就是芯片層、操作系統(tǒng)層、應(yīng)用層或軟件層,就這三層。到生成式AI之后,我們認(rèn)為IT的技術(shù)棧變成了四層,芯片層、框架層(深度學(xué)習(xí)框架)、模型層、然后是應(yīng)用層,我認(rèn)為在每一層可能都會(huì)誕生至少2~3個(gè)大玩家。

那到應(yīng)用層的話,可能數(shù)以百萬(wàn)計(jì),甚至千萬(wàn)的各種各樣的應(yīng)用都會(huì)出來(lái),也會(huì)逐步的出現(xiàn)超級(jí)應(yīng)用。當(dāng)然根據(jù)“超級(jí)”的定義來(lái)看,它是不會(huì)很多,可能是三五個(gè)之類的。

模型層我覺(jué)得也許兩三個(gè)就足夠了,因?yàn)樽詈筮€是大家比拼的是效率嘛,你的效率如果不夠高的話,慢慢就覺(jué)得,還不如用別人的,去在這之上,再去開發(fā)更多的應(yīng)用,是更劃算的。

所以在每一層其實(shí)都有機(jī)會(huì),但是不同的層發(fā)展規(guī)律,需要的專業(yè)知識(shí)什么的都不太一樣。

陳茜:

非常同意您的說(shuō)法,之前我問(wèn)Dario Amodei from Anthropic(百度前高管)他也說(shuō)過(guò),他當(dāng)時(shí)在做語(yǔ)言還有翻譯方面的工作,剛剛從斯坦福畢業(yè)之后在百度,他說(shuō)在國(guó)際市場(chǎng),可能最后也就剩四個(gè)左右的大模型,因?yàn)槠渌赡芏寂懿怀鰜?lái),就是跟您的想法非常一致。

02 商業(yè)落地:AI企業(yè)需求比互聯(lián)網(wǎng)時(shí)期大得多

楊宇東:

你說(shuō)過(guò),大模型對(duì)于B端的影響會(huì)超過(guò)互聯(lián)網(wǎng),你為什么認(rèn)為,大模型對(duì)B端的改造,比互聯(lián)網(wǎng)對(duì)B端的影響更大?

李彥宏:

其實(shí)你想一想,互聯(lián)網(wǎng)對(duì)C端的改造,我們都是感同身受的,是非常徹底的,是顛覆性的。

但是互聯(lián)網(wǎng)對(duì)B端的改造,其實(shí)我覺(jué)得一般般吧,雖然不能說(shuō)沒(méi)有,但是“互聯(lián)網(wǎng)+”其實(shí)最后,可能只是一個(gè)信息化、或者數(shù)據(jù)化的過(guò)程,用的技術(shù)比較簡(jiǎn)單,產(chǎn)生的增益也沒(méi)有那么明顯。

但是大模型確實(shí)不一樣,各種AI應(yīng)用,比如說(shuō)小說(shuō)創(chuàng)作,讀小說(shuō)叫做C端,小說(shuō)創(chuàng)作就可以當(dāng)做是B端,法律援助其實(shí)在幫助律師在提升效率。

我們接觸到的一些能源電力行業(yè),生產(chǎn)制造業(yè)等等,都有類似的需求,比如說(shuō)像現(xiàn)在國(guó)內(nèi)電動(dòng)車卷的也很厲害,車?yán)镱^對(duì)話系統(tǒng),很多也在用文心大模型,使用量也不小,但是對(duì)于百度來(lái)說(shuō),這就是一個(gè)To B的應(yīng)用,我們不直接提供給用戶,它是經(jīng)過(guò)了OEM,經(jīng)過(guò)了車廠,他們的集成之后,把這個(gè)應(yīng)用提供給了終端消費(fèi)者。

這種事情其實(shí)非常多,而且我們就看調(diào)用量,如果調(diào)用量上的很快,這就說(shuō)明我們的客戶需要這些東西,B端靠著這個(gè)大模型,靠著AI原生應(yīng)用產(chǎn)生了價(jià)值。

楊宇東:

最近我跑制造業(yè)比較多,你前面說(shuō)的有些像車企它直接調(diào)用了,直接把文心一言或者大模型調(diào)用了,在制造業(yè)里面,很多企業(yè)家說(shuō),我們覺(jué)得未來(lái)AI對(duì)于我們高端制造業(yè),智能制造顯然是重要的價(jià)值,是一種革命性的突破,但是一直就搞不明白,比如說(shuō)通用大模型,和我自己的行業(yè)垂直領(lǐng)域,垂直大模型,它將來(lái)到底是什么樣的關(guān)系,你說(shuō)的OEM,他們也希望,到底是什么樣的供應(yīng)商,和你們這樣平臺(tái)型的大廠商之間,形成什么樣的業(yè)務(wù)鏈條,這個(gè)問(wèn)題是制造業(yè),尤其是先進(jìn)制造業(yè)特別關(guān)注的。

李彥宏:

這個(gè)問(wèn)題確實(shí)很重要,實(shí)際上大模型在各個(gè)垂直的場(chǎng)景里怎么用,我們也經(jīng)過(guò)了探索過(guò)程,最初我們的想法是,我把基礎(chǔ)模型做得越來(lái)越強(qiáng)大,大家叫通用人工智能(AGI),在什么場(chǎng)景我都能做得很好。

后來(lái)發(fā)現(xiàn)這件事情沒(méi)有那么容易,每個(gè)場(chǎng)景都有它自己的道,而且要求也不太一樣,有些地方,大模型思考兩分鐘再給結(jié)果也OK,只要給出來(lái)的結(jié)果是準(zhǔn)確的、是全面的就可以了。但是有些場(chǎng)景,如果你一秒鐘不出結(jié)果,用戶就放棄了,所以這兩個(gè)場(chǎng)景對(duì)大模型要求是不一樣的。

今天即使是最強(qiáng)大的模型,還不能做到反應(yīng)又快又準(zhǔn),所以當(dāng)應(yīng)用場(chǎng)景需要反應(yīng)快的時(shí)候,我們需要更小的模型,它由于沒(méi)有大模型通用的能力,所以在垂直場(chǎng)景當(dāng)中,還要對(duì)它做精調(diào),就是做SFT(監(jiān)督微調(diào)),把你行業(yè)的數(shù)據(jù)灌進(jìn)去,再經(jīng)過(guò)各種各樣的調(diào)教,在這個(gè)場(chǎng)景里的效果,能夠跟大模型相比差不多。

類似這種場(chǎng)景,我們也見了很多,去年10月份,我們發(fā)了文心4.0之后,主要精力在做什么呢?根據(jù)最強(qiáng)大的模型,去裁剪各種體量的小模型,比如說(shuō)十億量級(jí)的模型,百億量級(jí)的模型,千億量級(jí)的模型。

這個(gè)模型也許擅長(zhǎng)角色扮演,那個(gè)模型也許擅長(zhǎng)邏輯推理等等,根據(jù)客戶的不同使用場(chǎng)景不同的要求,出來(lái)各種各樣的模型。

這些模型的大多數(shù)速度都比文心EB4要快,推理成本比它要低,所以這種應(yīng)用是大家更愛用的。

即使到今天,我剛才講的5億的調(diào)用量,調(diào)用量最大的,一定不是最強(qiáng)大的模型,大家都覺(jué)得,反應(yīng)太慢了,成本太高了。

但是隨著時(shí)間推移,成本會(huì)下降,反應(yīng)速度也會(huì)提升,比如說(shuō)前幾天剛剛發(fā)布EB4的Turbo,Turbo就是在EB4的基礎(chǔ)上,效果有提升,但更重要的是,響應(yīng)速度比以前快了很多,成本下降了很多,因?yàn)槭裁茨兀?/p>

我們發(fā)現(xiàn)真正的市場(chǎng)需求,是要求你響應(yīng)速度一定要足夠的快,成本一定要足夠的低,這樣我才能用起來(lái),至于說(shuō)下一代的大模型,到底有多強(qiáng)大,在哪些場(chǎng)景能夠用到,那是我們會(huì)繼續(xù)去探索的過(guò)程,但是今天你要看市場(chǎng)需求的話,規(guī)模更小一點(diǎn)的模型,市場(chǎng)需求量是更大的。

楊宇東:

幫我們介紹一下,大模型在B端的應(yīng)用比較成功的商業(yè)案例,或者是商業(yè)模式、產(chǎn)品形態(tài)。

李彥宏:

除了我剛才舉了小說(shuō)創(chuàng)作,還有比如電商的數(shù)字人直播,通過(guò)大模型來(lái)生成直播的話術(shù),很多數(shù)據(jù)人不容易記得特別清楚,比如說(shuō)我要賣一個(gè)營(yíng)養(yǎng)品,這個(gè)營(yíng)養(yǎng)品在哪一年,哪一個(gè)大學(xué),哪一個(gè)教授做了多少實(shí)驗(yàn),實(shí)驗(yàn)出來(lái)之后結(jié)果是什么樣子,讓自然人去記這些東西,他記不住的,但是這些數(shù)據(jù)恰恰能夠很好的說(shuō)明,這個(gè)產(chǎn)品到底有什么作用,這些東西靠數(shù)字人把它表達(dá)出來(lái),靠大模型把它生成出來(lái),很多時(shí)候比真人的直播效果反而要更好,幾乎任何一個(gè)行業(yè),我們都可以取出來(lái)類似的東西。

陳茜:

現(xiàn)在企業(yè)們,他們對(duì)AI調(diào)用成本怎么去看?我們幫企業(yè)去算一下賬,我花100塊錢,買各種各樣的AI服務(wù),我可能要乘以五,我要賺500塊錢,我的商業(yè)才能跑得通?,F(xiàn)在企業(yè)們是否會(huì)愿意去為AI去付費(fèi),你在跟一些企業(yè)客戶交流的時(shí)候,他們的態(tài)度是什么樣子的?

李彥宏:

這個(gè)問(wèn)題特別好,當(dāng)你處在市場(chǎng)經(jīng)濟(jì)環(huán)境當(dāng)中的時(shí)候,這些企業(yè)其實(shí)是非常理性的,尤其是中小企業(yè),它賬是算得非常精的,如果這件事情能夠讓我降本增效,能夠讓我賺到更多的錢,那我就會(huì)用它,如果不能,你再吹破天,我也不會(huì)用。

其實(shí)市場(chǎng)會(huì)告訴你,大模型到底有沒(méi)有用,我們看到調(diào)用量的迅速提升,確實(shí)是因?yàn)樵谟脩魝?cè),在客戶側(cè),它為這個(gè)企業(yè)確實(shí)產(chǎn)生了降本增效的作用。

我再舉個(gè)例子,比如招聘場(chǎng)景,雇主要找一個(gè)具備什么技能的人,對(duì)于技能的描述,它可以是千差萬(wàn)別的,在這種情況下,用大模型去理解這是一個(gè)什么人,理解老板要招什么樣的人,去進(jìn)行匹配的話,大模型的效率就會(huì)高很多。

過(guò)去是HR坐在那,一份一份簡(jiǎn)歷篩查,然后一個(gè)一個(gè)人去面試,面試100個(gè)人,最后篩出來(lái)10個(gè)人來(lái),這個(gè)效率是非常非常低的,但是大模型進(jìn)來(lái)之后,它可以非常明顯的去提升這方面的效率,有了這樣的場(chǎng)景之后,你去算一算模型的推理成本,其實(shí)幾乎是可以忽略不計(jì)的。

尤其在國(guó)內(nèi),現(xiàn)在大模型價(jià)格戰(zhàn)是非常厲害的,所以像一些比較輕量級(jí)的模型,百度的輕量級(jí)模型都是免費(fèi)的,這個(gè)免費(fèi)不僅僅指的是模型免費(fèi),實(shí)際上算力也送你了,你本來(lái)要有電腦,我得要有帶寬等等,這些都沒(méi)有了,你只要來(lái)用就好。

陳茜:

后面的推理也很便宜是嗎?

李彥宏:

推理是免費(fèi)的。

陳茜:

有一個(gè)比較好奇的問(wèn)題,在SaaS時(shí)期,在互聯(lián)網(wǎng)時(shí)期,SaaS在中國(guó)To B沒(méi)有做出來(lái),為什么您會(huì)覺(jué)得在AI時(shí)期,AI as a service可以在中國(guó)做起來(lái)呢?To B方面的話。

李彥宏:

我覺(jué)得在SaaS時(shí)期,之所以沒(méi)有做起來(lái),更多的是因?yàn)?,比如像互?lián)網(wǎng)大的平臺(tái),它既做了To C的事,也做了To B的事。

像在美國(guó)的話,每一個(gè)商家都有一個(gè)自己的電商網(wǎng)站,用戶也可以到它網(wǎng)站上去購(gòu)物,在中國(guó)的話,大家都到電商平臺(tái)去購(gòu)物,商家所需要的To B能力,電商平臺(tái)都替他做了,所以他不需要這種東西了,但是在美國(guó)的話,你自己比如說(shuō)你要建立一個(gè)自己的網(wǎng)站,上面要能夠賣東西,要有各種各樣的這種功能,要對(duì)自己的用戶進(jìn)行了解,那是需要做很多投入的。

所以在某種意義上講,其實(shí)中國(guó)并不是沒(méi)有這樣的需求,而是說(shuō)這些需求,被更大的平臺(tái)所滿足掉了。

但是在AI時(shí)代,我覺(jué)得情況又發(fā)生了變化。剛才也講了,它不是從0到1的、大家過(guò)去從來(lái)沒(méi)有見過(guò)的這個(gè)業(yè)態(tài),它先誕生的恰恰是對(duì)于現(xiàn)有業(yè)態(tài)的一個(gè)增強(qiáng),所以當(dāng)現(xiàn)有業(yè)態(tài)被增強(qiáng)效率越來(lái)越高的時(shí)候,他可能就更能夠抵御,類似于互聯(lián)網(wǎng)平臺(tái)這樣的公司,對(duì)他的這種業(yè)務(wù)的侵蝕,所以這方面我是我倒是覺(jué)得,AI的這種ToB的需求,在中國(guó)會(huì)比互聯(lián)網(wǎng)To B的需求要要大很多。

03 開源vs閉源:大模型商業(yè)化路徑的選擇

陳茜:

在國(guó)際上對(duì)開源閉源大家也爭(zhēng)論的很厲害,比如說(shuō)馬斯克他噴OpenAI, 說(shuō)你這么閉源,你要不然就叫CloseAI好了,我們看到馬斯克的xAI也開源了,Meta的Llama也是開源的,為什么你對(duì)閉源這么堅(jiān)持呢?

李彥宏:

我覺(jué)得開源其實(shí)是一種智商稅,你仔細(xì)想一想,我們?yōu)槭裁匆龃竽P??它能夠有?yīng)用,這些應(yīng)用在各種場(chǎng)景下,能夠?yàn)榭蛻魹橛脩籼嵘剩档统杀?,產(chǎn)生過(guò)去產(chǎn)生不了的作用。

所以當(dāng)你理性的去想,大模型能夠以什么樣的成本,給我?guī)?lái)什么價(jià)值的時(shí)候,你就會(huì)發(fā)現(xiàn)你永遠(yuǎn)應(yīng)該選擇閉源模型。

今天閉源的無(wú)論是ChatGPT也好,文心一言也好,以及各種各樣的模型,你看一下它的平均水平,一定是比開源模型要更強(qiáng)大的,它的推理成本它一定是比這個(gè)開源模型更低的。

尤其在國(guó)內(nèi)的話,我們連算力都送你了,所以當(dāng)你想要一個(gè)開源模型的時(shí)候,你得把這個(gè)模型拿過(guò)來(lái),根據(jù)你的場(chǎng)景去做這個(gè)SFT(監(jiān)督微調(diào)),很有可能還要做這種安全上的對(duì)齊,就是哪些風(fēng)險(xiǎn)要去進(jìn)行規(guī)避,你還要根據(jù)自己的場(chǎng)景,去準(zhǔn)備各種各樣的數(shù)據(jù),去一輪一輪的去迭代,最后剛才說(shuō)的買算力,你要把它放上去,由于是你自己獨(dú)有的一個(gè)模型,你還沒(méi)有辦法,跟別的應(yīng)用去共享這個(gè)算力,最高峰的時(shí)候用多少,那就要準(zhǔn)備多少算力,這個(gè)是非常非常不經(jīng)濟(jì)的。

反過(guò)來(lái)你用閉源的模型,算力可以和大家共享,這些個(gè)能力在同等的參數(shù)下,閉源模型一定比開源模型的量更強(qiáng),那同等能力下,由于閉源模型可能參數(shù)規(guī)模會(huì)更小一點(diǎn),它的推理成本就會(huì)更低。所以長(zhǎng)久來(lái)看,我覺(jué)得閉源模型,它使用一定是非常大的比例,會(huì)超過(guò)開源模型。

當(dāng)然,我也不能說(shuō)開源模型沒(méi)有存在的價(jià)值,從學(xué)術(shù)研究的角度,你是一個(gè)科學(xué)家,你想研究大模型的原理是啥,因?yàn)闃I(yè)界其實(shí)也一直在抱怨就是說(shuō),大模型的不可解釋對(duì)吧,你怎么解釋大模型為什么會(huì)具有這種能力,或者說(shuō)你是一個(gè)高校學(xué)生,你想學(xué)這些東西,你想拿來(lái)練練手,那開源大模型我覺(jué)得有它的價(jià)值。

但如果你是一個(gè)企業(yè),要的就是大模型能夠帶來(lái)價(jià)值上的增益,你只要一算賬,就會(huì)發(fā)現(xiàn)開源模型是沒(méi)有機(jī)會(huì)的。

陳茜:

我看百度是用的公有云的方式對(duì)吧,就是閉源大模型,但再加一個(gè)公有云,上面有集合了不同的閉源和開源的模型,供客戶去調(diào)用,那我看比如說(shuō)亞馬遜云科技,還有微軟他們其實(shí)也是采取這樣的一個(gè)方式。所以百度本身大模型閉源加公有云,你對(duì)這樣的一套的打法,對(duì)企業(yè)的客戶來(lái)說(shuō)有什么考量嗎?

李彥宏:

我覺(jué)得ToB的客戶要選擇一個(gè)模型,對(duì)他來(lái)說(shuō)性價(jià)比最好的,一方面模型要對(duì)他的這個(gè)應(yīng)用能夠產(chǎn)生價(jià)值,另外一方面就是成本要足夠的低。

很多時(shí)候就是你看著有用,一算成本不劃算,那么客戶就放棄了,這是為什么我剛才講,開源模型打不過(guò)閉源模型,你只要理性的去看待,你的收益是啥、成本是啥,你就會(huì)發(fā)現(xiàn),最好還是去選擇閉源模型。

當(dāng)然,閉源模型不是一個(gè)模型,它是一系列的模型,根據(jù)你的使用場(chǎng)景,你去平衡一下,到底要多好的效果,要多快的推理速度,要多低的成本,所以我的模型非常多的變種,可以根據(jù)用戶的需求,讓他來(lái)選擇。

而這些相對(duì)來(lái)說(shuō)規(guī)模更小的模型,都是從最大最強(qiáng)的模型裁剪出來(lái)的,這也是我覺(jué)得開源模型不具備的一個(gè)優(yōu)勢(shì),當(dāng)最先進(jìn)的模型是閉源的時(shí)候,我根據(jù)閉源往下去裁剪,裁剪出來(lái)一些規(guī)模更小的模型,仍然比那些同樣規(guī)模的開源模型效果更好。

我們也看到一些參數(shù)規(guī)模比較大的這種開源模型,其實(shí)這個(gè)就更沒(méi)有道理了,當(dāng)規(guī)模越大的時(shí)候,你會(huì)發(fā)現(xiàn)他的推理速度變得更慢了,如果不在乎推理速度的話,你就用最強(qiáng)大的閉源模型,那它效果一定是更好的。

而且參數(shù)規(guī)模越大意味著什么?意味著對(duì)算力的消耗也越大,也就是說(shuō)你得準(zhǔn)備更多服務(wù)器,來(lái)伺候這個(gè)大模型,其實(shí)這東西是根本不劃算的,越往上走,越應(yīng)該去共享這個(gè)算力,這樣才能算過(guò)來(lái)賬。

所以我覺(jué)得大家只要是不是在那兒坐而論道,而是真的說(shuō),我對(duì)模型有需求的時(shí)候,你就會(huì)發(fā)現(xiàn)幾乎是無(wú)需思考,不可能去選擇開源模型。

04 AI超級(jí)應(yīng)用:AI時(shí)代不再卷日活10億?

楊宇東:

由ChatGPT掀起的熱潮已經(jīng)一年多了,你也曾經(jīng)表達(dá)過(guò),接下來(lái)超級(jí)應(yīng)用什么時(shí)候出現(xiàn)。我們看到國(guó)內(nèi)面向C端的大模型產(chǎn)品形態(tài),看起來(lái)差不多都是搜索框問(wèn)答這種模式,你怎么看?有沒(méi)有可能產(chǎn)生一種差異化的競(jìng)爭(zhēng)?什么樣好的產(chǎn)品會(huì)出現(xiàn)?

李彥宏:

準(zhǔn)確的講,我倒不是一定在等待一個(gè)超級(jí)應(yīng)用的出現(xiàn),我更覺(jué)得在基礎(chǔ)模型之上,在大模型之上,應(yīng)該能夠誕生數(shù)以百萬(wàn)計(jì)的、各種各樣的應(yīng)用。

這些應(yīng)用有些是很小的領(lǐng)域,大家可能不太容易想到的應(yīng)用,但是它對(duì)于那個(gè)領(lǐng)域的問(wèn)題,解決得就比以前好很多。也有可能是用戶量龐大,用戶使用時(shí)長(zhǎng)非常長(zhǎng)的,類似于移動(dòng)互聯(lián)網(wǎng)的超級(jí)應(yīng)用。

確切的講,我覺(jué)得現(xiàn)在還沒(méi)有看到,能夠比肩移動(dòng)互聯(lián)網(wǎng)時(shí)期超級(jí)應(yīng)用的AI原生應(yīng)用,但是已經(jīng)看到,越來(lái)越多、各種各樣場(chǎng)景,尤其是ToB(對(duì)企業(yè))場(chǎng)景,利用大模型提升效果,提升效率,產(chǎn)生更多的收入,或者說(shuō)能夠節(jié)省更多的成本的情況出現(xiàn)。

尤其是今年以來(lái),我們看到在各個(gè)領(lǐng)域,各行各業(yè)都有AI的應(yīng)用場(chǎng)景出現(xiàn)了,它的出現(xiàn)使得我們大規(guī)模節(jié)省了人力成本,或者是效率大規(guī)模的提升,也許對(duì)于投資者、創(chuàng)業(yè)者,他們沒(méi)有覺(jué)得這個(gè)東西很令人興奮。

因?yàn)榇蠹叶荚谙?,我能不能有一天,?到1做出一個(gè)人們想也沒(méi)想到過(guò)的東西,變成一個(gè)DAU(日活用戶)10億的超級(jí)應(yīng)用,這個(gè)當(dāng)然很重要,假以時(shí)日也一定會(huì)出現(xiàn),但是目前已經(jīng)看到的,甚至是更重要的是,大模型在各個(gè)領(lǐng)域、各個(gè)場(chǎng)景的應(yīng)用。

這方面從百度文心一言的日調(diào)用量來(lái)看,已經(jīng)是非常明顯了。我們?cè)?月份的時(shí)候,曾經(jīng)公布過(guò)一個(gè)數(shù)據(jù),文心一言的調(diào)用量,每天有兩億次,到最近一次,前幾天我們?cè)诠嫉臅r(shí)候,文心一言調(diào)用量已經(jīng)到了5億次,也就是說(shuō)兩個(gè)月的時(shí)間,調(diào)用量翻倍。

調(diào)用增長(zhǎng)背后意味著什么?意味著它在給應(yīng)用產(chǎn)生價(jià)值,因?yàn)闆](méi)有價(jià)值的話,人家也不會(huì)花錢去做這種調(diào)用。所以這種增長(zhǎng)速度,還是非常令人興奮的。大模型對(duì)于實(shí)體產(chǎn)業(yè),對(duì)于各行各業(yè)的提效降本這些作用現(xiàn)在已經(jīng)非常明顯了。

楊宇東:

你更多是談到了在垂直的行業(yè),我們想百度還是有很強(qiáng)C端基因的公司,作為一個(gè)普通的消費(fèi)者和使用者,我們也想請(qǐng)您聊一聊,C端用戶會(huì)有什么樣很好的場(chǎng)景?包括我們說(shuō)端側(cè),甚至最后手機(jī)上的APP,可以被手機(jī)硬件去調(diào)用,而不是經(jīng)過(guò)一個(gè)APP,這個(gè)你怎么看?

李彥宏:

我覺(jué)得分兩類,一類是大家比較關(guān)注的,過(guò)去從來(lái)沒(méi)有的應(yīng)用,現(xiàn)在比較流行的,類似于ChatGPT這樣的,我們把它叫做ChatBot(聊天機(jī)器人)。

國(guó)內(nèi)每一個(gè)大模型公司,都會(huì)推出一個(gè)相應(yīng)的APP,或者是網(wǎng)站來(lái)做ChatBot,它的作用也比較明顯,如果你有一個(gè)很具體的問(wèn)題,丟給它的話,它就會(huì)給你一個(gè)還不錯(cuò)的答案,而且準(zhǔn)確率也越來(lái)越高了,很多人逐步的對(duì)這種ChatBot產(chǎn)生了依賴。

對(duì)于現(xiàn)有的這些ToC(對(duì)消費(fèi)者)的應(yīng)用,其實(shí)它信息增益作用也是非常大的。我們?cè)?月份的時(shí)候,公布過(guò)一個(gè)數(shù)據(jù),就是百度搜索,今天有11%的搜索結(jié)果會(huì)由AI來(lái)生成的,這個(gè)比例還在不斷的提升。

也就是說(shuō),現(xiàn)有大家比較常見的應(yīng)用,其實(shí)也越來(lái)越多的,在被大模型、生成式AI所改造。

另外一個(gè)例子,比如說(shuō)百度文庫(kù),過(guò)去是一個(gè)大家在上面找現(xiàn)成的文檔,比如中學(xué)老師要備課了,初中的物理課,他要找一找人大附中的老師,最優(yōu)秀的老師,他的教案是什么樣子,去找現(xiàn)成的文檔。

今天百度文庫(kù)經(jīng)過(guò)大模型改造之后,已經(jīng)更多的變成了,生成式AI這種應(yīng)用,也就是說(shuō),不管你想要產(chǎn)生什么樣的文檔,是PowerPoint,是論文的格式,還是什么各種各樣的,甚至是漫畫這樣的,它都可以根據(jù)你的要求來(lái)生成。

而且不僅它的用戶量比較廣,這個(gè)產(chǎn)品它是收費(fèi)的,今年以來(lái)已經(jīng)有大約2600萬(wàn)付費(fèi)用戶,你如果說(shuō)用超級(jí)應(yīng)用的標(biāo)準(zhǔn)來(lái)看的話,它也沒(méi)有到超級(jí)應(yīng)用的水準(zhǔn),但是你要是看它實(shí)際產(chǎn)生價(jià)值的話,有那么多人愿意為這個(gè)產(chǎn)品付費(fèi),那還是很厲害的。

這些產(chǎn)品都是過(guò)去已經(jīng)存在的,只是說(shuō)你經(jīng)過(guò)了大模型的改造之后,它的能力跟以前完全不一樣了,人們對(duì)它的認(rèn)知也在不斷的迭代,不斷的在加深。

楊宇東:

因?yàn)樗芰Φ奶嵘蠹腋敢飧顿M(fèi)了,而原來(lái)只是免費(fèi)搜索。

李彥宏:

是的。

陳茜:

我特別同意您最近在多個(gè)場(chǎng)合強(qiáng)調(diào)的,去卷AI的原生應(yīng)用,這樣的話,大模型才有意義。同時(shí)我也有一點(diǎn)小困惑,比如說(shuō)OpenAI它的GPT-4,在8個(gè)月之前就推出來(lái)了,當(dāng)時(shí)大家都會(huì)覺(jué)得,AI應(yīng)用時(shí)刻要爆發(fā)了,但是8個(gè)月之后的今天,我們看到還沒(méi)有爆發(fā),可能很多應(yīng)用出來(lái)也不太盡人意。

最近最火的Perplexity,這個(gè)AI搜索現(xiàn)在是2000萬(wàn)美元的ARR(年度經(jīng)常性收入),2000萬(wàn)用戶的量級(jí),其實(shí)也還沒(méi)有到所謂的Super app(超級(jí)應(yīng)用),或者是killer app(殺手級(jí)應(yīng)用),所以我的問(wèn)題或者疑惑在于說(shuō),如果基于GPT-4的模型能力,是不是我們現(xiàn)在還沒(méi)有到去卷應(yīng)用的時(shí)候,這個(gè)時(shí)刻還沒(méi)到?

李彥宏:

剛才你提到了GPT,以及perplexity,還是我剛才說(shuō)的第一類,過(guò)去從來(lái)沒(méi)有過(guò)的東西,它是從0到1去做的。

超級(jí)應(yīng)用確實(shí)現(xiàn)在還沒(méi)有出現(xiàn),即使是ChatGPT的話,它的DAU也沒(méi)有過(guò)億,還算不上一個(gè)真正的超級(jí)應(yīng)用,但是對(duì)于現(xiàn)有產(chǎn)品的改造,無(wú)論是中國(guó)也好,美國(guó)也好,我們都看到了實(shí)實(shí)在在的增益。

比如美國(guó)的話,微軟的Copilot,它已經(jīng)收到了很多付費(fèi),美國(guó)更多的是ToB(對(duì)企業(yè))的行業(yè),Palantir、Snowflake這些,都是通過(guò)軟件被大模型、被生成式AI加持了之后,他們的業(yè)績(jī)得到實(shí)實(shí)在在的增長(zhǎng)。

所以從這個(gè)意義上講,大模型應(yīng)用其實(shí)已經(jīng)逐步在浮現(xiàn)出來(lái),它對(duì)于現(xiàn)有業(yè)態(tài)的改造作用,比從0到1顛覆,作用更早到來(lái)、更明顯,甚至我覺(jué)得也能夠創(chuàng)造更多價(jià)值。

以前Satya(微軟CEO)說(shuō)過(guò),他說(shuō)過(guò)去互聯(lián)網(wǎng)叫做AutoPilot,意思就是,你自己就都把這個(gè)結(jié)果給弄出來(lái)了,現(xiàn)在的生成式AI叫Copilot,它實(shí)際上是人和機(jī)器共創(chuàng)的過(guò)程。

這個(gè)過(guò)程一開始大家覺(jué)得沒(méi)有那么性感,但是它對(duì)于人的工作效率的提升,對(duì)于成本的下降,對(duì)于打開新的可能性,產(chǎn)生的促進(jìn)作用,其實(shí)是比那些從0到1的應(yīng)用,反而要更大。

如果僅僅是從0到1,你可能會(huì)希望出現(xiàn)某幾個(gè)Super app,那它也就是公司從中受益,但是今天幾乎各行各業(yè)所有的公司,被大模型加持之后,它都能受益,這種影響力,對(duì)于整個(gè)社會(huì),對(duì)于人類來(lái)說(shuō),無(wú)疑是更大的。

只是大家好像覺(jué)得,這個(gè)東西我以前見過(guò)嘛?所以沒(méi)有那種新鮮感,或者他更多誕生在生產(chǎn)力場(chǎng)景,他的受眾群體,或者單一應(yīng)用受眾群體,不會(huì)過(guò)億、過(guò)十億那樣,尤其在C端,在公眾層面體感沒(méi)有那么集中,這是大家現(xiàn)在一直想找一個(gè)Super app的原因。

楊宇東:

你的問(wèn)題是挑戰(zhàn)Robin,Robin說(shuō)要卷起來(lái),你說(shuō)怎么沒(méi)看到卷,我總結(jié)下來(lái),我的感覺(jué),聽完Robin講完之后,我就知道了,我們理解的超級(jí)這兩個(gè)字,在Robin概念里面,一個(gè)是數(shù)以百萬(wàn)計(jì)的應(yīng)用已經(jīng)開始起來(lái)了,第二個(gè),所謂的超級(jí)反而是在垂直的,在一些局部的領(lǐng)域,它有非常顯著的加速度或者是增益。

陳茜:

或者是“超級(jí)”這個(gè)定義在互聯(lián)網(wǎng)時(shí)代跟在AI時(shí)代是不一樣的。

李彥宏:

是不一樣的。在互聯(lián)網(wǎng)時(shí)代可能是某一個(gè)單一的從0到1,或者是到100這樣的應(yīng)用,今天所謂的超級(jí)應(yīng)用,它是對(duì)現(xiàn)有場(chǎng)景的一種加持,這種加持還在早期,我必須得承認(rèn),它逐步會(huì)改變現(xiàn)有產(chǎn)品的形態(tài)。

我再舉一個(gè)例子,小說(shuō)創(chuàng)作、網(wǎng)文,這個(gè)在國(guó)內(nèi)是特別火的行業(yè),過(guò)去就是人肉,靠自己的能力、想象,不斷的去更新一篇文章,或者是一個(gè)小說(shuō),這個(gè)效率是很低的。現(xiàn)在有了大模型的加持,基本上有一個(gè)構(gòu)思,它就會(huì)給你相應(yīng)的文檔,你給的再豐富一點(diǎn),它就生成的再豐富一點(diǎn),你說(shuō)文風(fēng)太溫柔了,要不要強(qiáng)悍一點(diǎn),根據(jù)你的想法,它可以不斷的去調(diào)整。

這樣的東西,在用戶看來(lái),我仍然在讀一篇網(wǎng)文,在讀一篇小說(shuō),但是這個(gè)小說(shuō)的生產(chǎn)成本生產(chǎn)效率,它的內(nèi)容豐富度,可讀性,優(yōu)良率等等,都是跟以前不一樣的。所以這樣的例子,其實(shí)我們?cè)趲缀跞魏涡袠I(yè)都能夠看到。

05 AI Agent智能體:門檻一定要夠低

楊宇東:

我們前面聊的總結(jié)一下叫卷應(yīng)用,接下來(lái)還有一個(gè)關(guān)鍵詞叫智能體,你說(shuō)過(guò)好多次,AI時(shí)代最看好的是智能體,但是目前來(lái)看好像也沒(méi)有特別強(qiáng)大的爆發(fā)。你為什么認(rèn)為智能體是AI時(shí)代未來(lái)的趨勢(shì)呢?

李彥宏:

我覺(jué)得智能體正在爆發(fā),只是說(shuō)它現(xiàn)在基數(shù)還比較小的時(shí)候,大家的體感沒(méi)有那么強(qiáng)烈,但是你要看業(yè)界大模型公司,都在做智能體,業(yè)界這些意見領(lǐng)袖,基本上算是共識(shí),一般大家都會(huì)說(shuō),我看好智能體。

智能體為什么代表未來(lái)?基礎(chǔ)模型它本身是需要靠應(yīng)用才能顯現(xiàn)出來(lái)的價(jià)值,智能體就是,一個(gè)幾乎可以放之四海而皆準(zhǔn)的、基于大模型的應(yīng)用。

什么意思呢?根據(jù)我自己的場(chǎng)景,我設(shè)定一個(gè)角色人設(shè),我連編程都不用,我只要把我想要做的事情跟它講清楚,當(dāng)然有時(shí)候要把自己的私有知識(shí)庫(kù)對(duì)接進(jìn)來(lái),或者把自己做事情的套路給它說(shuō)清楚,這個(gè)專業(yè)術(shù)語(yǔ)叫做工作流,把工作流套進(jìn)去,它就是一個(gè)非常有用的、跟基礎(chǔ)模型不一樣的東西。

今天不能說(shuō)所有,但是大多數(shù)AI的原生應(yīng)用,你用智能體的方式都可以做出來(lái),做出來(lái)之后效果也不錯(cuò)。

由于它的門檻足夠低了,可能你連編程都不用編,就可以做出來(lái)一個(gè)效果不錯(cuò)的智能體,就意味著越來(lái)越多的人可以做出他想要的智能體。

這個(gè)有點(diǎn)像什么呢?有點(diǎn)像90年代中期的時(shí)候,互聯(lián)網(wǎng)的網(wǎng)站,這個(gè)網(wǎng)站你可以把它做得非常復(fù)雜,當(dāng)時(shí)比如說(shuō)雅虎也是很厲害的網(wǎng)站,但是仍然在學(xué)校里讀書的大學(xué)生,他也可以做一個(gè)自己的HomePage,他把他常用的幾個(gè)網(wǎng)站鏈接鏈在那,比如說(shuō)Java學(xué)習(xí)攻略這些東西,做幾個(gè)鏈接,就是他自己的網(wǎng)站,其實(shí)很簡(jiǎn)單。

由于做網(wǎng)站很簡(jiǎn)單,所以在90年代的時(shí)候,從中期到末期,就是誕生了數(shù)以百萬(wàn)計(jì)的網(wǎng)站,這種大浪淘沙,最終會(huì)出來(lái)一些非常優(yōu)秀的網(wǎng)站,像Google、Facebook,這當(dāng)然是若干年之后才出現(xiàn),但是早期看的話,你可能看到的都是,這些網(wǎng)站怎么都是亂糟糟的,一個(gè)大學(xué)生就能做一個(gè)網(wǎng)站出來(lái),這有啥價(jià)值呀?

但是你必須得門檻足夠低的時(shí)候,讓更多人進(jìn)來(lái),他們發(fā)揮聰明才智,指不定哪條路跑通了,它就是一個(gè)Super app,這就是為什么,我覺(jué)得智能體代表未來(lái),我特別看好的一個(gè)新興的業(yè)態(tài)。

陳茜:

智能體AI Agent它是特別重要的概念,包括在美國(guó)硅谷也是這樣的,在業(yè)界大家對(duì)AI Agent,它的定義還是有一點(diǎn)不同的探討,我看到有些人說(shuō),比如說(shuō)GPTs,也都是一些智能體,有些人會(huì)說(shuō),可能更加高級(jí)一點(diǎn)的Agent才算智能體,我的Agent要調(diào)取不同的工具,要成為一個(gè)虛擬世界的機(jī)器人,它可能才叫Agent,你對(duì)Agent的定義是什么樣子的?

李彥宏:

我首先要考慮這個(gè)門檻要足夠的低,就一個(gè)小白,比如說(shuō)大一的學(xué)生,他也可以很方便的能夠制作一個(gè)智能體出來(lái)。

當(dāng)然在此之上,可以有各種各樣比較有趣的玩法,剛才你講的調(diào)用工具、反思呀、長(zhǎng)期的記憶等等,這些能力會(huì)逐步的加進(jìn)去。

這個(gè)跟90年代時(shí)候的網(wǎng)站誕生過(guò)程,也有類似之處,我們一開始的網(wǎng)站,都是很簡(jiǎn)單的,后來(lái)我可以用Java把一些動(dòng)態(tài)的東西放在一個(gè)網(wǎng)站里,再后來(lái)我可以加上cookie,這樣從一個(gè)網(wǎng)頁(yè)轉(zhuǎn)到下一個(gè)網(wǎng)頁(yè)的時(shí)候,我還記得上一個(gè)網(wǎng)頁(yè)你干了什么,這些東西在早期的時(shí)候,網(wǎng)站生態(tài)里頭是沒(méi)有的,但是一旦有越來(lái)越多的人在生產(chǎn)網(wǎng)站,技術(shù)就會(huì)跟進(jìn)說(shuō),你有什么需求,我去解決你的問(wèn)題。

Agent是一樣的,不是說(shuō)用了最先進(jìn)的,剛才講的這些能力之后,它才叫一個(gè)AI Agent,我反而覺(jué)得我們要把這個(gè)門檻降的足夠低,讓大家覺(jué)得說(shuō),我也可以搞一個(gè)AI Agent,進(jìn)來(lái)之后隨著時(shí)間的推移,隨著你遇到新問(wèn)題,解決問(wèn)題的過(guò)程,會(huì)把各種各樣最先進(jìn)的技術(shù)用進(jìn)來(lái)。

說(shuō)實(shí)話,我認(rèn)為現(xiàn)在AI Agent用到的這些能力,仍然是非常初級(jí)的,未來(lái)還會(huì)產(chǎn)生我們今天想也想不到的Agent能力。

但是這些能力的誕生,反而要依賴數(shù)以百萬(wàn)計(jì)的開發(fā)者,去開發(fā)各種各樣的應(yīng)用,在他們使用的過(guò)程當(dāng)中,產(chǎn)生新的需求,這些需求被解決的過(guò)程,就是一個(gè)創(chuàng)新的過(guò)程,就是AI Agent進(jìn)化的過(guò)程,這個(gè)我還是非常期待的。

陳茜:

百度有什么比較有意思的AI Agent的案例可以給我們分享一下嗎?

李彥宏:

有很多,國(guó)內(nèi)高考是一個(gè)非常大的事件,不僅是學(xué)生,還有家長(zhǎng)都非常重視。過(guò)去大模型在干什么事呢?高考有個(gè)作文題,我們用大模型來(lái)寫一個(gè)作文,看它能得多少分。

其實(shí)你想一想,這個(gè)東西在哪用呢?不可能讓考生帶著大模型去參加高考嘛,但是高考完了之后,你要估分,你要報(bào)志愿,你要選擇學(xué)校,你要選擇專業(yè),可能有人在乎說(shuō),這個(gè)宿舍里頭,一個(gè)宿舍要住幾個(gè)人,那個(gè)人在乎這個(gè)學(xué)校有沒(méi)有游泳池,或者說(shuō)哪個(gè)專業(yè)更適合我未來(lái)發(fā)展,每個(gè)人的情況都是不一樣的,每個(gè)人的問(wèn)題也都是不一樣的。這種情況下,哪有一個(gè)全能的輔導(dǎo)老師可以告訴你說(shuō),你最適合的是哪個(gè)學(xué)校哪個(gè)專業(yè),但是AI Agent就可以干這個(gè)事情。

所以過(guò)去大家來(lái)百度或者到其他地方去搜索,都是找世界上已經(jīng)存在的內(nèi)容,他沒(méi)有專門為這個(gè)人、這個(gè)時(shí)刻、這個(gè)地點(diǎn)、這樣的環(huán)境生產(chǎn)內(nèi)容。

而今天的AI,尤其是智能體,它就可以做到,你告訴我你是什么情況,你的情況可以不用一句話就說(shuō)清楚,你用十句話也可以,我都記得,這樣的例子非常非常多。

陳茜:

而且它會(huì)非常個(gè)人化的給你很多的規(guī)劃,包括我看到你們跟新加坡旅游局也是有合作的。

李彥宏:

是的。你自己消費(fèi)水平是多少、有多長(zhǎng)時(shí)間、有什么喜好、愛吃什么、不愛吃什么,每個(gè)人都是不一樣的,它可以完全根據(jù)你的情況來(lái)生成你要的答案。

06 AGI與Scaling Law:值得長(zhǎng)期奮斗的信仰

楊宇東:

我們說(shuō)Scaling Law,以前大家都覺(jué)得沒(méi)問(wèn)題,但是最近開始不同的聲音出來(lái)了,那確實(shí)我看很多行業(yè),做一些速度更快,效率更高的小模型,那Scaling Law會(huì)不會(huì)這么快又被顛覆掉了?

李彥宏:

Scaling Law本身可能還會(huì)有若干年的生命周期,但與此同時(shí)的話,就是在此之上會(huì)疊加出來(lái)各種各樣的創(chuàng)新。

剛才講的智能體、它的反思能力、它的進(jìn)化的能力等等,其實(shí)跟Scaling Law已經(jīng)有點(diǎn)分離了,它是兩個(gè)路線在發(fā)展,但是它仍然是基于Transformer這類大模型在往上在做。

那未來(lái)再過(guò)一兩年,還會(huì)出現(xiàn)什么新的技術(shù)創(chuàng)新,在此基礎(chǔ)上再去疊加,我們也不知道,大家都在探索。

換句話說(shuō),我覺(jué)得Scaling Law短期之內(nèi)倒不會(huì)被顛覆,但是在Scaling Law之上會(huì)疊加出來(lái)很多很多、現(xiàn)在還無(wú)法想象的創(chuàng)新。

楊宇東:

你個(gè)人認(rèn)為AGI實(shí)現(xiàn)的標(biāo)準(zhǔn)是什么?還有哪些路徑可以讓我們更快的去通向AGI?

李彥宏:

我覺(jué)得這個(gè)問(wèn)題確實(shí)業(yè)界沒(méi)有一個(gè)標(biāo)準(zhǔn)答案,以前大家覺(jué)得,通過(guò)圖靈測(cè)試就實(shí)現(xiàn)AGI了,實(shí)際上現(xiàn)在大模型已經(jīng)通過(guò)了圖靈測(cè)試,但是人們所說(shuō)的AGI,其實(shí)大多數(shù)時(shí)候已經(jīng)不是只通過(guò)圖靈測(cè)試。

那什么叫AGI?在我的心目當(dāng)中,AGI就是說(shuō)是機(jī)器、或者AI,它能夠具備人在任何場(chǎng)景下所具備的能力,就是general intelligence(普遍能力)是通用的,我不管在什么場(chǎng)景,我的能力都是跟人是一樣的,這是一個(gè)很高的要求。

其實(shí)今天你看像我們做這個(gè)無(wú)人駕駛,做了有11年的時(shí)間了,仍然不能說(shuō)這個(gè)技術(shù)成熟,它還是只一個(gè)專用場(chǎng)景,AI都做不到非常成熟,你不能容錯(cuò)的話這個(gè)就不行了。

所以,真正要實(shí)現(xiàn)AGI,我認(rèn)為確實(shí)是還需要很多很多年。但是業(yè)界有人說(shuō)AGI可能再過(guò)2年,或者5年就能實(shí)現(xiàn),但是我自己的判斷是10年以上,也許10年,也許20年,也許更長(zhǎng)的時(shí)間。

我們聽到很多人在講,AGI是一種信仰,當(dāng)你把它當(dāng)做信仰的時(shí)候,誰(shuí)的信仰會(huì)明年就實(shí)現(xiàn)?這是自相矛盾的。如果是一個(gè)信仰,它就是值得為之長(zhǎng)期奮斗的目標(biāo),啥叫長(zhǎng)期呢?但是如果連10年都沒(méi)有的話,不能把它叫做信仰。

陳茜:

太容易了就不能叫信仰。

李彥宏:

對(duì)呀。

陳茜:

現(xiàn)在大家其實(shí)都在等GPT-5,但是GPT-5一直在延后,所以我在周圍聽到的擔(dān)憂的聲音也是越來(lái)越高,就怕說(shuō)比如說(shuō)5~10萬(wàn)億這樣的參數(shù)加上去,但是最后大家發(fā)現(xiàn)它的效果并沒(méi)有躍升這么多,是不是會(huì)打擊一些人們對(duì)Scaling Law的信仰,可能我們的AGI沒(méi)有辦法用Scaling Law的這個(gè)方式去帶我們?nèi)?shí)現(xiàn)了,你對(duì)這個(gè)有擔(dān)憂嗎?

李彥宏:

我不是很擔(dān)心這件事情,我覺(jué)得大家應(yīng)該更關(guān)注應(yīng)用,而不是關(guān)注基礎(chǔ)模型,某種意義上講,基礎(chǔ)模型迭代速度稍微放緩一點(diǎn)不是壞事,就是今天的這些應(yīng)用的開發(fā)者,他有一個(gè)相對(duì)穩(wěn)定的base(基礎(chǔ)),來(lái)開發(fā)應(yīng)用的話,其實(shí)是效率更高一些的,如果模型天天在那兒練,他每天都要重寫一遍過(guò)去的這個(gè)代碼,那是很累的。

但是在現(xiàn)有基礎(chǔ)模型基礎(chǔ)上不斷的去做微調(diào),去做一些漸進(jìn)式的迭代和和創(chuàng)新,其實(shí)你看到它是一直在發(fā)生的,無(wú)論是OpenAI不斷在推的東西,還是我們百度的turbo模型、更小量級(jí)的模型等等,都是在根據(jù)市場(chǎng)需求做迭代。

但是長(zhǎng)遠(yuǎn)來(lái)講,我確實(shí)認(rèn)為下一代的大模型,一定會(huì)比現(xiàn)在這一代模型強(qiáng)大的多。什么時(shí)候推出來(lái)我不是很著急,我覺(jué)得應(yīng)該多看一下真實(shí)的市場(chǎng)需求是啥,然后我們下一代模型迭代的時(shí)候,根據(jù)市場(chǎng)需求來(lái)迭代。

如果我們認(rèn)為AGI 10年都達(dá)不到,下一代模型離AGI其實(shí)還有很遠(yuǎn)的距離,也就是說(shuō)他有他擅長(zhǎng)的、也有不擅長(zhǎng)的地方,如果擅長(zhǎng)的恰好不是市場(chǎng)需求的,那這個(gè)意義是不大的,如果他不擅長(zhǎng)的恰好是市場(chǎng)需求的,那我們浪費(fèi)了很多資源,去做一些不該做的事情。

這是為什么我更關(guān)注應(yīng)用,我想知道市場(chǎng)上(的需求)。比如說(shuō)我是一個(gè)賣車的銷售,我用什么樣的話術(shù),能夠說(shuō)服進(jìn)店的這個(gè)人來(lái)買我的車,而不是說(shuō)我怎么能夠考過(guò)高考數(shù)學(xué)。這就是市場(chǎng)需求,當(dāng)不是很清楚的時(shí)候拼命往前跑,去做一個(gè)名義上更強(qiáng)大的模型,其實(shí)很有可能是會(huì)走彎路,是浪費(fèi)資源的。

陳茜:

我非常同意,那你覺(jué)得接下來(lái)大家在卷應(yīng)用之余,會(huì)不會(huì)開始卷一些中小模型,比如說(shuō)國(guó)際上Mistral這樣的中小模型,也是受很多開發(fā)者歡迎的。那接下來(lái)你覺(jué)得百度在對(duì)于中小模型上,還有一些模型蒸餾上有什么樣的這個(gè)策劃?

李彥宏:

我覺(jué)得我們看到的真實(shí)需求,確實(shí)在絕大多數(shù)情況下都不是最大的模型,它都要求這個(gè)模型變小,變小意味著什么?速度快,成本低。比如說(shuō)我干這個(gè)事兒,總共能夠給我?guī)?lái)每年100萬(wàn)的增益,我一算,最大的模型要120萬(wàn)的成本,那我肯定不干了嘛。

那我給你這個(gè)大模型公司提的要求,就是說(shuō)你能把成本給我降到80萬(wàn),甚至降到8萬(wàn),那我們就得想,怎么最強(qiáng)大的模型蒸餾到足夠小,也就是成本足夠足夠低的時(shí)候,仍然能夠滿足你這個(gè)場(chǎng)景的需求。

我覺(jué)得這一方面,閉源模型仍然有優(yōu)勢(shì),因?yàn)殚]源有最強(qiáng)大的基礎(chǔ)模型,那他根據(jù)這個(gè)模型蒸餾或者裁剪出來(lái)的小模型,會(huì)比那些開源模型蒸餾的會(huì)更好。畢竟你的基礎(chǔ)沒(méi)有人家好,做出來(lái)的東西在競(jìng)爭(zhēng)力上也會(huì)顯得劣勢(shì)。

所以這方面我們看到真實(shí)的需求確實(shí)是非常非常多的,我們也覺(jué)得這方面的機(jī)會(huì),仍然在閉源不在開源。

以上就是我們與李彥宏的采訪內(nèi)容,這次采訪其實(shí)對(duì)我個(gè)人理解市場(chǎng)很有幫助,因?yàn)檫@讓我理解到,企業(yè)家是如何去思考大模型商業(yè)化落地這件事情,特別是在大廠們?nèi)菀赘鞣N卷的中國(guó)市場(chǎng)。

當(dāng)全球的生成式AI公司們,無(wú)論是科技巨頭還是創(chuàng)業(yè)公司,都耗費(fèi)大量資源、算力、金錢和人力去押注“Scaling Law是人類未來(lái)發(fā)展的正確途徑”的時(shí)候,總是有種聲音在提醒我們,我們需要算賬,這件事情如何以更經(jīng)濟(jì)、更合理的方式去發(fā)展。

飛往上海采訪李彥宏的前一個(gè)周末,在硅谷的一個(gè)聚會(huì)上,一位資深人士給我算了一筆賬:

全球芯片用于AI上的支出是4000億美元,這相當(dāng)于1.1萬(wàn)億美元的數(shù)據(jù)中心支出,如果我們要求 25%的ROIC(投資資本回報(bào)率),這相當(dāng)于企業(yè)們需要產(chǎn)生1.4萬(wàn)億美元的成本節(jié)省。

1.4萬(wàn)億美元是全球技術(shù)工人工資的5%,全球總工資的3%,也是全球EBIT(息稅前利潤(rùn))的5%?;蛘撸绻覀兗僭O(shè)利潤(rùn)率為50%,則需要企業(yè)們用AI去創(chuàng)造2.8萬(wàn)億美元的收入,即全球上市公司收入的3%,或全球GDP的2%。

這樣算起來(lái)的話,是不是可以說(shuō),以現(xiàn)在的投入量,只要AI能讓全球企業(yè)們創(chuàng)造2.8萬(wàn)億美元的收入,那么發(fā)展AI這筆賬就是能算得過(guò)來(lái)的,到底什么時(shí)候能打平這筆帳呢?

反正我看高盛是預(yù)測(cè),生成式AI可能會(huì)在10年內(nèi)推動(dòng)全球 GDP 增長(zhǎng)7%,也就是接近7萬(wàn)億美元,并將生產(chǎn)率增長(zhǎng)提高1.5個(gè)百分點(diǎn)。

所以,你會(huì)怎么去算AI發(fā)展的這筆帳呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。