文 | 巨潮 荊玉
最近一段時間,生成式AI賽道受關(guān)注的程度,用“烈火烹油”來形容都不過分。
2022年11月ChatGPT誕生。憑借背后強大的技術(shù),ChatGPT可以完成流暢對答、寫腳本、寫方案、寫代碼等各項功能,更展現(xiàn)出了此前AI無法實現(xiàn)的“創(chuàng)造”能力,讓C端用戶都驚喜不已。因此其僅用了兩個月用戶數(shù)便已突破1億,成為史上躥紅最快的應(yīng)用。
隨后谷歌、Meta、亞馬遜等巨頭企業(yè)也迅速跟進(jìn),探索生成式AI技術(shù)與自身業(yè)務(wù)的結(jié)合;小型的AI初創(chuàng)公司也由此迎來了新一輪的投資熱潮。生成式AI的熱度之高,讓人恍惚有回到移動互聯(lián)網(wǎng)創(chuàng)業(yè)熱潮中的感覺。
AIGC(即AI Generated Content,國內(nèi)對于生成式AI的另一個稱呼)已徹底成了中國互聯(lián)網(wǎng)領(lǐng)域的新風(fēng)口。過去一個月內(nèi),百度、阿里、騰訊、京東等廠商先后宣布了自身在AIGC方面的技術(shù)布局和未來計劃。
國內(nèi)AIGC玩家中,最被給予厚望的還是百度。在“All in AI”戰(zhàn)略下,百度在過去10年的研發(fā)投入超過1100億元,在大模型領(lǐng)域有一定積累。其也被一些業(yè)內(nèi)人士認(rèn)為是“最有可能做出中國版ChatGPT的企業(yè)”。
3月10日,百度正式官宣了旗下的類ChatGPT聊天機器人——“文心一言”的消息。據(jù)其官方微博消息,百度計劃于3月16日14時在北京總部召開新聞發(fā)布會,主題圍繞“文心一言”。
然而,截至目前全球還沒有能與ChatGPT抗衡的大模型,業(yè)內(nèi)的普遍共識是差距在兩年以上。因此百度“匆忙”發(fā)布一款ChatGPT的競品,也被不少行業(yè)觀察者質(zhì)疑——屆時百度會不會拿出一款不夠智能和有創(chuàng)造力的平庸產(chǎn)品?
這個問題上,百度曾經(jīng)的對標(biāo)谷歌已經(jīng)吃了虧。后者的類ChatGPT產(chǎn)品Bard在首秀發(fā)布會上出現(xiàn)了明顯錯誤,這導(dǎo)致谷歌當(dāng)日股價重挫7%,市值下跌1000億美元,也給用戶留下了技不如人的印象。
而百度新產(chǎn)品的情況似乎也并不比谷歌樂觀多少。據(jù)外媒華爾街日報近日報道,文心一言的發(fā)布準(zhǔn)備工作極為倉促和匆忙,數(shù)百名員工一直在夜以繼日地工作。截至發(fā)布會一周前,“這款聊天機器人的一些基本功能仍未完成?!币恍┭邪l(fā)員工對文心一言也缺乏信心,“他們已經(jīng)在其推出之前賣掉了該公司部分股票。”
01 百度的關(guān)鍵一戰(zhàn)
ChatGPT甚至能夠產(chǎn)出“有創(chuàng)造力”的內(nèi)容,這確實是之前AI從未展現(xiàn)出的能力。
在2015年之前,人工智能基本是小模型的天下。此前蘋果Siri、微軟小冰、百度小度,以及各個平臺的客服機器人背后都是小模型,其系統(tǒng)中包含多個具體程序單元,一個專門負(fù)責(zé)負(fù)責(zé)聊對話聊天、一個專門負(fù)責(zé)詩詞生成、一個專門負(fù)責(zé)代碼生成等。
如果需要增加新功能,只需要訓(xùn)練一個新的程序單元。如果用戶的問題超出了既有程序的范圍,那么語音助手就會從人工智能變?yōu)槿斯ぶ钦稀?/p>
但ChatGPT采取了不同的“大模型+Prompting(提示詞)”的模式,其背后是一個經(jīng)過海量數(shù)據(jù)喂養(yǎng)的大的程序單元來解決用戶的所有問題。因而其表現(xiàn)更智能更有創(chuàng)造性,更加接近科幻電影中無所不知的通用型人工智能。
因此,ChatGPT的誕生是一個標(biāo)志性的事件,標(biāo)志著人工智能的“技術(shù)奇點”正在逐漸臨近。
前微軟CEO比爾·蓋茨對ChatGPT評價為“不亞于互聯(lián)網(wǎng)誕生”,現(xiàn)微軟CEO薩提亞·納德拉將其盛贊為“堪比工業(yè)革命”。就連埃隆·馬斯克都評價道:“ChatGPT好得驚人,我們離危險的強人工智能不遠(yuǎn)了。”
一個具備如此顛覆性和革命性的技術(shù),自然也具備著巨大的商業(yè)價值。知名機構(gòu)紅杉資本在一篇名為《生成式AI:一個充滿創(chuàng)造力的新世界》的報告中表示,生成式AI讓機器開始大規(guī)模涉足知識類和創(chuàng)造性工作,這涉及數(shù)十億人的工作,未來預(yù)計能夠產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價值。
面對ChatGPT,國內(nèi)的AI專業(yè)人士卻普遍感受到了與國外技術(shù)發(fā)展的巨大差距,內(nèi)心五味雜陳、感慨萬千。在社交網(wǎng)絡(luò)上,就此事引發(fā)的關(guān)于中美科技發(fā)展的對比討論,也充滿了對中國AI企業(yè)短視的批評,以及對中國自主大模型的殷切期待之情。
在此背景下,在AI領(lǐng)域布局較深的百度無疑就成為了那個“全村的希望”。機構(gòu)IDC 2月發(fā)布的《2022中國大模型發(fā)展白皮書》顯示,在國內(nèi)9家主流廠商的大模型當(dāng)中,百度文心大模型位于第一梯隊,產(chǎn)品能力、生態(tài)能力、應(yīng)用能力全面領(lǐng)先。
對于百度來說,AI大模型也是一個逆襲的絕佳機會。
此前,由于錯過了移動互聯(lián)網(wǎng)時代,百度被甩出“BAT”陣營,在收入、市值上也已掉隊多年。而在即將到來的“堪比互聯(lián)網(wǎng)誕生和工業(yè)革命”的新時代,百度如能掌握先機,快人一步,自然也就有了逆襲的機會。
由于AI算力的高投入和高技術(shù)門檻,中國能做語言類大模型的團(tuán)隊非常有限。英諾天使基金合伙人王晟認(rèn)為,加上大廠、一些科研機構(gòu)和創(chuàng)業(yè)公司,總體數(shù)量可能不超過十個團(tuán)隊。而百度無疑將是其中極具競爭力的玩家之一。
且AI大模型關(guān)系到未來的信息分發(fā)方式和數(shù)億人的工作,關(guān)系到未來公民信息和國家數(shù)據(jù)的安全,因此中國必須要有自主的“大模型”,甚至必須被建設(shè)和運行在國產(chǎn)化的存儲、算力、操作系統(tǒng)等基礎(chǔ)平臺上——這意味著,百度也許并不需要和ChatGPT正面競爭,只要在技術(shù)和應(yīng)用上領(lǐng)先國內(nèi)同行一個身位,就能夠最大化享受中國市場的紅利,就如同當(dāng)初的搜索業(yè)務(wù)一樣。
不夸張地說,如果百度能夠在AIGC領(lǐng)域占據(jù)中國市場的先機,“追趕騰訊阿里,重回BAT陣營”就并不遙遠(yuǎn)。
這或許也是李彥宏為何如此著急推出文心一言的原因——據(jù)媒體36氪報道,多位百度員工向其證實,高層下了死命令,要在一個月時間內(nèi)看到產(chǎn)品。
02 “有目的的賭博”
為抓緊時間趕在最后期限前推出產(chǎn)品,百度一直在爭分奪秒,與時間賽跑。李彥宏這種“急就章”的決策被外媒評價為“有目的的賭博”。
據(jù)悉,2020年的時候,百度就已經(jīng)開發(fā)出了有16億個參數(shù)的、類似ChatGPT的通用對話生成模型PLATO-2——與當(dāng)時的GPT-2的參數(shù)量(15億)基本處于同一個級別。
但在ChatGPT躥紅之前,百度并沒有將人工智能的研發(fā)重點放在類似ChatGPT的大型語言模型開發(fā)上。如今ChatGPT的參數(shù)量已經(jīng)達(dá)到了1750億,數(shù)據(jù)量高達(dá)45TB。如前文所言,百度能否在短時間內(nèi)快速訓(xùn)練模型實現(xiàn)追趕,存在著很大的不確定性。
國內(nèi)輿論場上,從百度內(nèi)部員工、到行業(yè)觀察者、新聞評論區(qū),都不乏對百度過早推出類ChatGPT產(chǎn)品的看空的聲音。
有百度NLP(自然語言處理)部門的員工在接受媒體華爾街見聞采訪時表示,ChatGPT背后框架龐大復(fù)雜,現(xiàn)有技術(shù)單模型解決起來有一定難度,公司以前沒做出來過,現(xiàn)在突然說幾個月之內(nèi)就能搞定,很擔(dān)心新項目會步“希壤”后塵。
谷歌的失敗也打擊了部分行業(yè)觀察者對于百度的信心。如上文所言,就連谷歌推出的類ChatGPT產(chǎn)品也翻了車。而谷歌是Transformer/T5/PaLM模型的提出者,旗下的Deepmind也被普遍認(rèn)為是最有可能挑戰(zhàn)OpenAI的公司。如果谷歌不能在短時間內(nèi)復(fù)現(xiàn)ChatGPT的能力,那么其他AI公司也很難做到。
今年二月,有網(wǎng)友爆料,其在試用百度AI文生圖產(chǎn)品“文心一格”時發(fā)現(xiàn),百度的文心一格AI對于語義的理解存在問題。
巨潮記者嘗試著分別在文心一格和OpenAI旗下的DALLE網(wǎng)站上分別輸出“皮卡丘大戰(zhàn)犬夜叉”,得到的圖片結(jié)果顯示,文心一格生成的圖片中并未包含犬夜叉的影像。顯然其對于中文語義的理解仍然存在著一定的問題。
盡管存在以上看空和擔(dān)憂的聲音,實際運行效果仍未完全明朗,但百度的公關(guān)宣傳卻十分高調(diào)。
有媒體統(tǒng)計,截至2月末,已有上百家媒體、多家汽車品牌、營銷機構(gòu)、企業(yè)服務(wù)商、金融服務(wù)商以及互聯(lián)網(wǎng)公司宣布“接入文心一言”,成為首批生態(tài)合作伙伴,連少林寺都來了,儼然已經(jīng)形成了一個生態(tài)圈,吊足了外界的胃口。
選擇官宣與文心一言的合作,不同類型的公司需求各異,如媒體和營銷公司要用文心一言幫助生產(chǎn)內(nèi)容,汽車廠商想借助其提升人車交互;但據(jù)媒體報道,文心一言的可用程度如何,能達(dá)到怎樣的效果,這些官宣合作的廠商目前實際上也并不清楚。
從品牌營銷的角度來看,部分行業(yè)觀察者也擔(dān)憂,百度在前期如此高調(diào)的宣傳,給予投資者和C端用戶太高的預(yù)期,如果實際產(chǎn)品與ChatGPT存在太大差距,有可能遭遇反噬,反而傷害了品牌和口碑。
03 風(fēng)物長宜放眼量
從中短期來看,文心一言的發(fā)布其實很難給百度帶來收益的改善。
AI大模型實在太燒錢了。正如此前海通證券科技行業(yè)首席分析師鄭宏達(dá)對美團(tuán)聯(lián)合創(chuàng)始人王慧文的嗆聲所言,大模型訓(xùn)練一次就花500萬美元,5000萬美元只夠訓(xùn)練10次。此外,還得面臨高昂的硬件采購成本和日常運營成本。
《財經(jīng)十一人》分析指出,生成式AI的投資規(guī)模高達(dá)百億元,但ChatGPT只是對話機器人,商業(yè)應(yīng)用場景展示暫時有限。因此,其中短期內(nèi)不僅無法盈利,還要虧更多錢。
對于百度而言,另一方面的因素則是原搜索業(yè)務(wù)可能遭遇的沖擊——搜索廣告的本質(zhì)是給用戶展現(xiàn)更多的結(jié)果頁面,可ChatGPT則是更精準(zhǔn)、更有邏輯地推送答案,兩者結(jié)合之后自然會影響到廣告的投放。
ChatGPT的智能化和創(chuàng)造力對于搜索市占率不到5%的微軟必應(yīng)來說,是搶占用戶和市場的利器;但對于國內(nèi)搜索市占率超過70%的百度來說,則可能是一種不小的沖擊。
對于生成式AI的持續(xù)投入的效果,最終將作用于未來。如前文紅杉資本的報道所言,生成式AI讓機器開始大規(guī)模涉足知識類和創(chuàng)造性工作,未來預(yù)計能夠產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價值。
以通用的大模型為基礎(chǔ),AIGC可細(xì)分為文本生成、音頻生成、圖像生成、視頻生成、跨模態(tài)生成等技術(shù)場景,可以應(yīng)用到文案、營銷、設(shè)計、行業(yè)研究等文化傳媒領(lǐng)域,還有醫(yī)療+AI,教育+AI,數(shù)字人,游戲等各行各業(yè)中。
因此,僅僅訓(xùn)練出高質(zhì)量的大模型是不夠的,還要建立起一個完整的應(yīng)用生態(tài)。這或許也是李彥宏冒著“可能遠(yuǎn)不及ChatGPT”的風(fēng)險也要爭分奪秒發(fā)布文心一言的原因之一。
一旦能夠搶占先機,形成圍繞大模型的應(yīng)用生態(tài),建立起在to B領(lǐng)域的先發(fā)優(yōu)勢,百度也就真正坐穩(wěn)了國內(nèi)生成式AI賽道的頭把交易,并成為未來社會不可替代的基礎(chǔ)設(shè)施。
只不過在國內(nèi)AI大模型上落后美國兩年左右的整體背景下,即使要搶占國內(nèi)市場的先機,百度也實在不必如此操之過急——競爭對手即使已經(jīng)在做大模型的研發(fā),一時間也很難拿出可落地的產(chǎn)品。
而百度更需要做的是穩(wěn)扎穩(wěn)打,將文心一言的效果打磨到最好。否則一旦產(chǎn)品不行,當(dāng)下官宣合作的廠商,最后大概率都都會逃跑。
風(fēng)物長宜放眼量??紤]到國內(nèi)AI大模型的整體發(fā)展階段,幾天后百度發(fā)布的文心一言將只是一場摸底考,讓外界得以知悉百度AI大模型的實力幾何。
站在長期主義的視角來看,國內(nèi)生成式AI賽道的競爭實際上才剛剛開始。未來誰能在最短時間內(nèi)復(fù)現(xiàn)ChatGPT的能力,才是賽道的第一個轉(zhuǎn)折點。