文 | 智東西編輯部
智東西3月16日?qǐng)?bào)道,剛剛,百度推出新一代大語(yǔ)言模型文心一言(ERNIE Bot),即日起開啟測(cè)試,同時(shí)宣布已有超650家伙伴加入文心一言生態(tài),打響全球互聯(lián)網(wǎng)大廠應(yīng)戰(zhàn)ChatGPT的第一槍。
文心一言能做什么?百度創(chuàng)始人兼董事長(zhǎng)李彥宏在現(xiàn)場(chǎng)進(jìn)行的激情演示,圍繞文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五方面大秀“肌肉”:能幫劉慈欣續(xù)寫《三體》,會(huì)幫公司寫新聞,讀得懂“洛陽(yáng)紙貴”的古文梗,解得了難倒ChatGPT的“雞兔同籠”問(wèn)題,還能分分鐘幫智能交通峰會(huì)生成海報(bào)和宣傳視頻……
▲百度創(chuàng)始人兼董事長(zhǎng)李彥宏在演示文心一言
李彥宏稱,文心一言對(duì)個(gè)人的改變也會(huì)是巨大的,有機(jī)構(gòu)預(yù)測(cè),到2030年,人工智能可以將每一個(gè)知識(shí)工作者的生產(chǎn)力提高4倍以上。很多人的工作性質(zhì)會(huì)發(fā)生不可逆轉(zhuǎn)的改變。
會(huì)上,百度CTO王海峰宣布,3月16日起,首批用戶即可通過(guò)邀請(qǐng)測(cè)試碼在文心一言官網(wǎng)體驗(yàn)產(chǎn)品;百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務(wù),3月16日起正式開放預(yù)約。這意味了文心一言將立馬接受廣大受眾的真實(shí)測(cè)評(píng)。
▲百度CTO王海峰在講解文心一言相關(guān)技術(shù)
李彥宏說(shuō):“十月懷胎,一朝分娩”。那么文心一言究竟長(zhǎng)什么樣?能為各行各業(yè)帶來(lái)什么樣的變化?背后又有什么樣的技術(shù)邏輯和產(chǎn)業(yè)真相?智東西在文心一言發(fā)布現(xiàn)場(chǎng)為大家?guī)?lái)第一手消息。
01.文心一言初體驗(yàn),五大能力現(xiàn)場(chǎng)演示
一開場(chǎng),李彥宏就談道自己近期不斷被問(wèn),為什么現(xiàn)在發(fā)布文心一言,真的Ready了嗎?
他說(shuō),實(shí)際上百度過(guò)去十幾年一直堅(jiān)持AI投入,2019年就推出了第一個(gè)版本文心大模型,此后每年更新一代。文心一言是百度多年努力的自然延續(xù)。
在簡(jiǎn)短介紹了文心一言的誕生背景后,李彥宏迅速進(jìn)入正題,他從文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五大方面進(jìn)行了演示。1、文學(xué)創(chuàng)作:給《三體》寫總結(jié),還能幫大劉寫一個(gè)續(xù)集
首先文心一言展示了文學(xué)創(chuàng)作能力,《三體》是非常知名的科幻小說(shuō),李彥宏與文心一言就以下五個(gè)問(wèn)題進(jìn)行了五輪對(duì)話(為了方便讀者朋友看清,我們對(duì)動(dòng)圖做了降速處理,文心一言實(shí)際的碼字速度飛快~):
《三體》的作者是哪里人?可以總結(jié)一下《三體》的核心內(nèi)容嗎?如果要續(xù)寫的話,可以從哪些角度出發(fā)?
如何從哲學(xué)的角度續(xù)寫?
電視劇《三體》演員都有誰(shuí)?于和偉和張魯一有哪些共同點(diǎn)?于和偉和張魯一誰(shuí)更高?
可以看到,這一演示體現(xiàn)了文心一言的總結(jié)、分析能力,以及內(nèi)容創(chuàng)作生成能力。
大家知道,生成式AI在回答事實(shí)性問(wèn)題時(shí)有時(shí)會(huì)出錯(cuò),我們看到文心一言在幾個(gè)實(shí)時(shí)信息問(wèn)題的回答上是正確的。李彥宏說(shuō),文心一言延續(xù)了百度知識(shí)增強(qiáng)的大模型理念,大幅度提升了事實(shí)性問(wèn)題的準(zhǔn)確率。而“于和偉和張魯一有哪些共同點(diǎn)”等問(wèn)題難度更高,體現(xiàn)的是文心一言的推理能力。2、商業(yè)文案創(chuàng)作:給公司起名、腦暴Slogan、秒寫新聞稿
再來(lái)試試文心一言在商業(yè)文案創(chuàng)作方向的能力,以常見的公司起名字、寫slogan、寫新聞稿為例。李彥宏向文心一言提了以下問(wèn)題:
如果要成立一個(gè)用大模型服務(wù)中小企業(yè)數(shù)字化升級(jí)的科技服務(wù)公司,可以起個(gè)什么公司名?
數(shù)智云圖這個(gè)名稱不錯(cuò),給我起一個(gè)公司的服務(wù)Slogan,表達(dá)共贏的概念。
幫我生成一篇公司成立的新聞稿,數(shù)智云圖以共贏的服務(wù)理念用大模型服務(wù)中小企業(yè)數(shù)字化升級(jí)。字?jǐn)?shù)600字。
剛才的演示,展現(xiàn)了文心一言連續(xù)三次內(nèi)容創(chuàng)作生成。
AI要寫好一篇稿子,除了需要準(zhǔn)確理解我們的意圖,還要有清晰的表達(dá)能力。這背后有一個(gè)基礎(chǔ),就是龐大的數(shù)據(jù)規(guī)模。人類常說(shuō)“讀萬(wàn)卷書”,而AI可以說(shuō)是 “讀書破千億卷”。文心一言大模型的訓(xùn)練數(shù)據(jù)就包括,萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù),數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù),百億級(jí)的語(yǔ)音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等,這讓百度在中文語(yǔ)言的處理上,能夠處于獨(dú)一無(wú)二的位置。
有研究表明,數(shù)據(jù)規(guī)模足夠大,參數(shù)達(dá)到千億級(jí),大模型就可能發(fā)生“智能涌現(xiàn)”,即使在沒(méi)有專門訓(xùn)練過(guò)的領(lǐng)域,也能涌現(xiàn)出知識(shí)理解和邏輯推理能力。3、數(shù)理邏輯推算:搞定“雞兔同籠”,ChatGPT曾在此“翻車”
我們接下來(lái)看文心一言對(duì)數(shù)理邏輯推算任務(wù)做的怎么樣。
雞兔同籠是鍛煉人類邏輯思維的經(jīng)典題,這個(gè)對(duì)生成式AI同樣有挑戰(zhàn)。李彥宏問(wèn)了以下幾個(gè)問(wèn)題:
下面我們來(lái)玩一個(gè)雞兔同籠的游戲。1只雞有2只腳1個(gè)頭,1只兔子有4只腳1個(gè)頭。那么,如果有一個(gè)籠子里有9個(gè)頭,40只腳,應(yīng)該有多少只雞,多少只兔子?
對(duì)于第一道題,文心一言經(jīng)過(guò)演算,認(rèn)為可能是題出錯(cuò)了。于是李彥宏又重新問(wèn)了一遍,文心一言不但給出了正確結(jié)果,還詳細(xì)給出解題步驟。
可以看出,文心一言能理解題意,并有正確的解題思路,進(jìn)而像學(xué)生做題一樣,按正確的步驟,一步步算出正確答案。
李彥宏說(shuō),文心一言已具備了一定的思維能力,能夠?qū)W會(huì)數(shù)學(xué)推演及邏輯推理這類相對(duì)復(fù)雜任務(wù)。當(dāng)然,現(xiàn)階段準(zhǔn)確率還不是100%,我們還需要給它更多的時(shí)間來(lái)學(xué)習(xí)和成長(zhǎng)。4、中文理解:讀懂“洛陽(yáng)紙貴”、解釋經(jīng)濟(jì)理論、寫藏頭詩(shī)
前面三個(gè)例子,李彥宏演示了大語(yǔ)言模型比較常見的優(yōu)勢(shì)和能力。下面是關(guān)于文心一言的中文理解能力,主要問(wèn)題如下:
“洛陽(yáng)紙貴”是什么意思?當(dāng)時(shí)洛陽(yáng)的紙到底有多貴?
這個(gè)成語(yǔ)在現(xiàn)在的經(jīng)濟(jì)學(xué)原理里,對(duì)應(yīng)的理論是什么?用洛陽(yáng)紙貴四個(gè)字寫一首藏頭詩(shī)。
“洛陽(yáng)紙貴”,“藏頭詩(shī)”,這很考驗(yàn)AI對(duì)中文和中國(guó)文化的理解。作為扎根于中國(guó)市場(chǎng)的大語(yǔ)言模型,文心一言盡力展示了在中文上的優(yōu)勢(shì)。
同時(shí)李彥宏坦言,文心一言目前對(duì)英文語(yǔ)種、代碼場(chǎng)景的訓(xùn)練還不夠多,表現(xiàn)還不夠好,接下來(lái)百度還要加緊訓(xùn)練,不斷完善這些能力。
5、多模態(tài)生成:秒做海報(bào)和視頻,還能講四川話
下面是多模態(tài)生成方向的案例,要知道ChatGPT在升級(jí)GPT-4之后才具備多模態(tài)功能,文心一言本次也對(duì)次進(jìn)行了演示。李彥宏的主要要求如下:
請(qǐng)為2023世界智能交通大會(huì)創(chuàng)作一張海報(bào)。你認(rèn)為智能交通最適合哪個(gè)城市發(fā)展?請(qǐng)用四川話將以上內(nèi)容講出來(lái)。
請(qǐng)將以上內(nèi)容生成視頻。于是文心一言生成了以下視頻:
可以看到,在這一段演示中,文心一言生成了文本、圖片、音頻和視頻,展示了多模態(tài)生成能力。
李彥宏稱,目前的版本已經(jīng)能夠生成文字、圖片和語(yǔ)音。生成視頻因?yàn)槌杀颈容^高,還沒(méi)有對(duì)所有用戶開放,未來(lái)百度會(huì)逐步接入。但是熟悉百家號(hào)創(chuàng)作的朋友,應(yīng)該都體驗(yàn)過(guò)這個(gè)功能了,每天有幾萬(wàn)篇文章通過(guò)這個(gè)能力轉(zhuǎn)成視頻內(nèi)容在百度分發(fā)。多模態(tài)是生成式AI一個(gè)明確的發(fā)展趨勢(shì),未來(lái)文心一言的多模態(tài)生成能力也會(huì)不斷提升。
02.650家伙伴加入文心一言生態(tài)背后六大技術(shù)解讀
會(huì)上,百度CTO王海峰宣布,3月16日起首批用戶即可通過(guò)邀請(qǐng)測(cè)試碼,在文心一言官網(wǎng)體驗(yàn)產(chǎn)品。百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務(wù),3月16日起正式開放預(yù)約。同時(shí),王海峰公布了文心產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型全景圖。
王海峰介紹了文心一言的六項(xiàng)核心技術(shù),分別是有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)、對(duì)話增強(qiáng)。
其中前三個(gè)都是大型語(yǔ)言模型普遍具備的能力,后面三個(gè)技術(shù),則有助于解決AI“胡言亂語(yǔ)”的問(wèn)題。
知識(shí)增強(qiáng)包括知識(shí)內(nèi)化和知識(shí)外用,把5500億知識(shí)圖譜的事實(shí)疊加到生成式大模型,不僅將知識(shí)融入模型參數(shù),而且模型可以用外部知識(shí),能夠檢查生成內(nèi)容與事實(shí)是否相符。
檢索增強(qiáng)將檢索系統(tǒng)與生成模型結(jié)合,先檢索內(nèi)容,再用有用的部分進(jìn)行生成。對(duì)話增強(qiáng)涉及記憶機(jī)制、上下文理解、對(duì)話規(guī)劃等技術(shù)積累。
李彥宏說(shuō),剛才展示的這些例子,如果在其他模型上試,很容易出錯(cuò),但在文心一言上試都對(duì)了。他昨天問(wèn)文心一言“怎么看GPT-4”,文心一言非常及時(shí)地總結(jié)出來(lái)相關(guān)信息和內(nèi)容。
根據(jù)官方數(shù)據(jù),自2月7日以來(lái),已有650家伙伴宣布加入文心一言生態(tài),AI市場(chǎng)有望迎來(lái)迎來(lái)新一波爆發(fā)。
以文心一言為代表的大模型產(chǎn)品的誕生,也有望更深刻的改變IT領(lǐng)域的技術(shù)范式。
李彥宏談道,傳統(tǒng)IT是“芯片層-框架層-應(yīng)用層”三層,進(jìn)入AI時(shí)代,IT技術(shù)棧變?yōu)榱诵酒瑢?框架層-模型層-應(yīng)用層四層,以后應(yīng)用層的搜索、智能信控等各種應(yīng)用將基于模型來(lái)進(jìn)行開發(fā)。生成式AI是非常耗費(fèi)算力,四層架構(gòu)之間相互協(xié)同,不斷優(yōu)化將使得效率大大提升,降低成本。尤其是框架層和模型層的協(xié)同,百度在過(guò)去幾個(gè)月體會(huì)到了其中收益。
03.生成式AI開啟新型云計(jì)算帶來(lái)三大產(chǎn)業(yè)機(jī)會(huì)
李彥宏認(rèn)為,生成式AI將催生新產(chǎn)品、新業(yè)態(tài),會(huì)有很多創(chuàng)業(yè)和投資機(jī)會(huì)。
具體來(lái)說(shuō),生成式大模型的問(wèn)世會(huì)帶來(lái)新型云計(jì)算、行業(yè)模型精調(diào)、應(yīng)用開發(fā)三大方面機(jī)會(huì)。
第一類是新型云計(jì)算公司,其主流商業(yè)模式從IaaS(基礎(chǔ)設(shè)施即服務(wù))變?yōu)镸aaS(模型即服務(wù))。文心一言,將根本性地改變?cè)朴?jì)算行業(yè)的游戲規(guī)則。之前企業(yè)選擇云廠商更多看算力、存儲(chǔ)等基礎(chǔ)云服務(wù)。未來(lái),更多會(huì)看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用這四層之間的協(xié)同。
第二類是進(jìn)行行業(yè)模型精調(diào)的公司,這是通用大模型和企業(yè)之間的中間層,他們具有行業(yè)Know how,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。文心大模型已經(jīng)在電力、金融、媒體等領(lǐng)域,發(fā)布了10多個(gè)行業(yè)大模型。在各行各業(yè)都有機(jī)會(huì)。
第三類是基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商。今天,基于文本生成、圖像生成、音頻生成、視頻生成、數(shù)字人、3D等場(chǎng)景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司,他們可能就是未來(lái)的新巨頭。這里面的機(jī)會(huì)非常多,可以說(shuō)每家企業(yè)在現(xiàn)在這個(gè)階段都有機(jī)會(huì)。
李彥宏說(shuō):“我們相信,人工智能會(huì)徹底改變我們今天的每一個(gè)行業(yè)?!盇I的長(zhǎng)期價(jià)值,對(duì)各行各業(yè)的顛覆性改變,才剛剛開始。未來(lái),將會(huì)有更多的殺手級(jí)應(yīng)用、現(xiàn)象級(jí)產(chǎn)品出現(xiàn),將會(huì)有更多的里程碑事件發(fā)生。
文心一言發(fā)布之后,將建立起真實(shí)用戶反饋、開發(fā)者調(diào)用和模型迭代之間的飛輪,效果會(huì)迅速提升,給你“士別三日,當(dāng)刮目相看”的驚喜。
李彥宏認(rèn)為,文心一言對(duì)每一個(gè)企業(yè)和每一個(gè)人都可能產(chǎn)生巨大的影響,文心一言的定位是一個(gè)基礎(chǔ)大模型,在上面可以開發(fā)出適合千行百業(yè)的行業(yè)大模型。它不僅僅會(huì)影響到搜索和互聯(lián)網(wǎng)公司,由于超強(qiáng)的自然語(yǔ)言理解、表達(dá)、推理能力,讓任何一家公司離自己的客戶更近,從而做出更好的客戶體驗(yàn),建立更強(qiáng)的競(jìng)爭(zhēng)優(yōu)勢(shì)。
04.結(jié)語(yǔ):國(guó)產(chǎn)類ChatGPT密集開測(cè)生成式AI熱潮爆發(fā)
隨著百度文心一言大模型正式發(fā)布,其與此前清華技術(shù)成果轉(zhuǎn)化的公司智譜AI推出了基于千億基座模型的ChatGLM、復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室的對(duì)話式AI模型MOSS一起,推動(dòng)國(guó)產(chǎn)類ChatGPT生成式AI熱潮爆發(fā)。
李彥宏坦言:“從文心一言的表現(xiàn)看,某種程度上它具有了對(duì)人類意圖的理解能力,回答的準(zhǔn)確性、邏輯性、流暢性,都逐漸接近人類水平。但整體而言,這類大語(yǔ)言模型還遠(yuǎn)未到發(fā)展完善的階段,它們有時(shí)候會(huì)有很驚艷的表現(xiàn),但不少場(chǎng)景下,細(xì)究起來(lái)還有明顯的bug,進(jìn)步空間很大。未來(lái)這段時(shí)間文心一言有望飛速發(fā)展,通過(guò)定向微調(diào),可以在百度內(nèi)外部各類產(chǎn)品上逐步展示出驚人的親和力,讓每一個(gè)產(chǎn)品離自己的用戶和客戶更近。”
生成式AI已成為當(dāng)下AI領(lǐng)域的一個(gè)兵變必爭(zhēng)之地,技術(shù)的產(chǎn)業(yè)化落地和商業(yè)應(yīng)用將成為決勝關(guān)鍵。在國(guó)外,微軟旗下OpenAI的ChatGPT、谷歌旗下的PaLM都已開放API,面向辦公協(xié)同工具、社交文娛、智能終端等行業(yè)推動(dòng)落地集成,這在國(guó)內(nèi)也有望掀起一陣趨勢(shì),從而帶來(lái)算法、算力及數(shù)據(jù)等多個(gè)產(chǎn)業(yè)鏈環(huán)節(jié)的爆發(fā)。