文|數(shù)智前線 游勇 石兆
編輯|趙艷秋
《狂飆》里的高啟強說,風(fēng)浪越大,魚越貴?,F(xiàn)在,這正在類ChatGPT大模型市場發(fā)生。相比于在消費端的熱鬧,企業(yè)級市場的商戰(zhàn)也已經(jīng)打響。
數(shù)智前線獲悉,微軟已帶著OpenAI旗下ChatGPT等服務(wù),開始拜訪國內(nèi)行業(yè)企業(yè)。而一家央企相關(guān)負(fù)責(zé)人告訴數(shù)智前線,百度創(chuàng)始人李彥宏不久前剛帶隊拜訪了他們,討論大模型與其核心場景的結(jié)合及應(yīng)用。此前,百度宣布將于3月份推出新一代大語言模型“文心一言”,這將是國內(nèi)第一家正式推出對標(biāo)ChatGPT的產(chǎn)品。百度智能云也已官宣,將對外提供“文心一言”的調(diào)用服務(wù)。
2月22日李彥宏在財報發(fā)布后給員工的內(nèi)部信中說,AI技術(shù)已經(jīng)發(fā)展到一個臨界點,各行各業(yè)都不可避免地被改變。中國AI市場即將迎來爆發(fā)性的需求增長,其商業(yè)價值的釋放將是前所未有的、指數(shù)級的。
各行業(yè)客戶也開始了行動,有的已與有大模型能力的企業(yè)開始了初步接洽,有的甚至參與了大模型的內(nèi)測?!癈hatGPT類的應(yīng)用看似先在消費端展開,但估計最后變現(xiàn)主要靠toB,現(xiàn)在在ChatGPT的刺激下,國內(nèi)各行業(yè)都動起來了,很可能趟出一條大模型toB路線。”一位行業(yè)人士對數(shù)智前線稱。
01 ChatGPT引發(fā)商業(yè)暗戰(zhàn)
國內(nèi)互聯(lián)網(wǎng)大廠們都感受到了來自ChatGPT的沖擊和機遇。
一位百度人士告訴數(shù)智前線,百度上下都在緊鑼密鼓地做準(zhǔn)備,公司內(nèi)的工作強度很高,來公司咨詢的企業(yè)和機構(gòu)也非常多。這些日子,百度也密集官宣了與行業(yè)企業(yè)、機構(gòu)以及合作伙伴的合作。據(jù)悉,已有互聯(lián)網(wǎng)、媒體、金融、汽車、企業(yè)軟件等近300家頭部企業(yè)加入“文心一言”生態(tài),其中甚至包括了少林寺,而一些客戶已開始內(nèi)測。
阿里、字節(jié)跳動、華為也都在推進(jìn)生成式大模型。阿里達(dá)摩院正在研發(fā)該類產(chǎn)品,并計劃與釘釘?shù)壬a(chǎn)力工具深度結(jié)合。字節(jié)在去年底已在內(nèi)部幾次開會討論。一位金融行業(yè)人士告訴數(shù)智前線,字節(jié)旗下火山引擎不久前向他們推銷了內(nèi)容生成式模型的服務(wù),“但都是寫文案,做素材,覺得有用,但不是質(zhì)變”。華為也在跟進(jìn),這件事對華為相關(guān)方面有很大觸動,公司相關(guān)專家第一時間坦承OpenAI所帶來的啟發(fā)。
相比于業(yè)內(nèi)的狂熱,騰訊系顯得比較謹(jǐn)慎。數(shù)智前線獲悉,微信張小龍在不久前的年會上發(fā)言說,對這種熱點要保持警惕,不能一窩蜂去追。事實上,騰訊目前也未在此事上過多宣傳,只是說有技術(shù)儲備。據(jù)悉,企業(yè)微信也預(yù)留了接口,具備可接入ChatGPT這類模型的能力。
值得關(guān)注的是,這次并不是“剃頭挑子一頭熱”,除了大模型企業(yè)和云計算公司感到興奮外,ChatGPT幾乎引發(fā)了所有行業(yè)的思考,它所代表的通用大模型正變成一個生產(chǎn)力工具,往行業(yè)場景里深入,行業(yè)接受度之廣,令人難以想象。
電力行業(yè)某技術(shù)專家告訴數(shù)智前線,ChatGPT的熱潮在央國企里引起關(guān)注,他所在的企業(yè)已開始打算投入部分資源,期望聯(lián)合平臺企業(yè)的大模型,來訓(xùn)練電力調(diào)度場景的小模型,他們認(rèn)為就像云一樣,大模型未來也會是一種基礎(chǔ)設(shè)施。
柳州鋼鐵冷軋廠上個月開始,嘗試用類ChatGPT產(chǎn)品來處理技術(shù)文檔。廠長陸兆剛有一個很痛的需求,他每天需要看各種文案以及為了解決各類故障的技術(shù)文檔。他希望用ChatGPT把需要的技術(shù)文檔,從海量數(shù)據(jù)中準(zhǔn)確地找出來,提高工作效率。
當(dāng)然,相比于淺層的尋找技術(shù)文檔的需求,工業(yè)領(lǐng)域的應(yīng)用還有更大的想象空間。一位百度智能云人士告訴數(shù)智前線,電影《流浪地球》里有一個情節(jié),大家在月球上制造地球發(fā)動機,其實就是人工智能推進(jìn)下的3D打印。未來,通用大模型可進(jìn)行工業(yè)設(shè)計,推動智能制造。此外,工業(yè)互聯(lián)網(wǎng)當(dāng)下有一個巨大的痛點,是有太多的接口協(xié)議,如何去實現(xiàn)互聯(lián)和對接。未來,通過通用大模型帶來的智能,它如果能自動去識別硬件的協(xié)議并進(jìn)行匹配,這將是件影響行業(yè)的大事。
在家裝行業(yè),一位家裝平臺負(fù)責(zé)人告訴數(shù)智前線,他們正在和大模型廠商洽談合作,希望將人工智能大模型的模塊內(nèi)置到設(shè)計師的設(shè)計工具里。以前設(shè)計師做出了效果圖,跟客戶確認(rèn),對方通常會提出新的需求,而設(shè)計師更新一版效果圖需要兩三天時間。現(xiàn)在如果能直接在設(shè)計工具里接入大模型的能力,設(shè)計出效果圖之后,可以直接跟用戶在場景里面聊,然后快速修改出效果圖,對設(shè)計師的簽單和用戶的體驗上都會有很好的提升。
這位負(fù)責(zé)人補充道,未來在家裝設(shè)計上,“大模型可能會超過50%的一般設(shè)計師水平”。他們也已經(jīng)嘗試了一段時間,“現(xiàn)在還是有一些挑戰(zhàn)”,主要是這些生成式人工智能對素材和數(shù)據(jù)的要求比較高,不是簡單輸入就能得到很好的效果。
金融業(yè)一向是利用技術(shù)紅利的先鋒軍,對大模型也表現(xiàn)出濃厚興趣?!敖鹑诒kU領(lǐng)域本來都是NLP(自然語言處理)的大用戶,不過很多用的是傳統(tǒng)或上一代的NLP,經(jīng)常達(dá)不到業(yè)務(wù)部門的要求。用GPT可以大幅提高產(chǎn)品能力?!币晃唤鹑跇I(yè)人工智能資深人士告訴數(shù)智前線,“而且,GPT會逐步進(jìn)入核心環(huán)節(jié)。”
另一位資深人士說,金融業(yè)有大量數(shù)據(jù)分析工作,大模型如果可以按照數(shù)據(jù)分析師的思路和方式,實現(xiàn)大部分?jǐn)?shù)據(jù)分析和處理的工作,將會提高業(yè)務(wù)的效率?!爱?dāng)然,這要看未來人工智能是否能成長出一種能力,能識別金融數(shù)據(jù)和渠道信息的真實性?!币晃辉趪秀y行從事大數(shù)據(jù)業(yè)務(wù)的資深人士告訴數(shù)智前線。
在生物科技領(lǐng)域,天壤此前將人工智能模型用于蛋白質(zhì)的研究,比如大分子藥、酶的改造。以前的通用做法是,拿一個長度一兩百的天然蛋白質(zhì),對某些地方進(jìn)行局部改造,變成一個新的蛋白質(zhì),不僅耗時耗力,且未必成功。因為有非常多的可能,它需要人工不停地去試,花大量時間去驗證?,F(xiàn)在在大模型的幫助下,能夠非??焖?、準(zhǔn)確地認(rèn)識一個蛋白質(zhì),需要哪一塊核心結(jié)構(gòu)就保留下來,然后通過生成式大模型生成一個新的蛋白質(zhì)。
不僅如此,通過生成式AI技術(shù),甚至可以生成自然界中不存在的蛋白質(zhì)。據(jù)估計,人類目前已知的天然蛋白質(zhì)數(shù)量為10^15,而未知空間中還有很多可能解決醫(yī)療健康、能源環(huán)保等挑戰(zhàn)的功能蛋白質(zhì)沒有被觸及。這些工作都需要更大的模型、更多的算力和海量數(shù)據(jù)支持才能得以實現(xiàn)。
在教育領(lǐng)域,一位從業(yè)者告訴數(shù)智前線,他們在暢想包括真正的人機對話語言學(xué)習(xí);給定關(guān)鍵詞,讓AI寫故事和畫繪本;出考題試卷等應(yīng)用場景。雖然人機對話之前就運用多年,包括智能音箱和各類語音助手,但普遍表現(xiàn)得不太智能。如果能用大模型優(yōu)化體驗,能帶來很大的想象空間。
02 “等待國內(nèi)大模型”
盡管OpenAI的ChatGPT在消費端得到了熱情追捧,但在國內(nèi)的行業(yè)商業(yè)落地上表現(xiàn)得不盡如人意。
一家企業(yè)稱,上周微軟的人到他們公司推廣OpenAI的服務(wù),是toB類的。但這項服務(wù)存在一些比較突出的問題:一是不允許私有化部署,只能使用微軟提供的API接口。中美在應(yīng)用部署上的習(xí)慣不盡相同,比如美國的很多客戶,包括政府機構(gòu)都習(xí)慣使用公有云,但中國很多大中客戶出于安全等考慮,會要求私有化部署。
二是成本較高,不算運行訓(xùn)練成本,相關(guān)服務(wù)的平均價格大約為每次調(diào)用2美分。智能客服企業(yè)云蝠智能創(chuàng)始人魏佳星也告訴數(shù)智前線,上個月他們試運行了ChatGPT,感覺“一般場景很難負(fù)擔(dān)得起”。他分析說,智能客服業(yè)務(wù),每一通電話對客戶的收費才0.12元,利潤在2分錢左右,當(dāng)這項產(chǎn)品的調(diào)用成本降到1分錢人民幣時,行業(yè)里才可能會像用水用電一樣使用起來。
上述家裝平臺負(fù)責(zé)人也表達(dá)了類似的看法,“ChatGPT用在家裝設(shè)計環(huán)節(jié),節(jié)省設(shè)計師兩三天時間,花這個錢還是很合算。但如果是客服就不太劃算,調(diào)用成本太高?!?/p>
三是OpenAI提供的API接口目前還比較單一,只能提供幾個功能,更無法與企業(yè)業(yè)務(wù)流深度綁定,更像一個大外掛。
鑒于上述原因,多家行業(yè)企業(yè)人士告訴數(shù)智前線,“真正應(yīng)用需要等國內(nèi)的大模型起來了”。畢竟大多數(shù)公司都不會自己做訓(xùn)練大模型這樣的燒錢規(guī)劃,只有等待國內(nèi)類似ChatGPT的大模型出來后,看推廣深度,有沒有私有化部署和改造的機會。
無論是從商業(yè)模式還是成本上,行業(yè)企業(yè)都希望國內(nèi)能出現(xiàn)比較能打的類GPT大模型。期望他們提供更切合中國企業(yè)習(xí)慣的服務(wù),也能夠在價格上更符合國情。
“再過一年,大模型的成本肯定會降下來,GPU的算力在往上漲,推理的速度會更快。而且模型本身還有很多地方可以優(yōu)化,工程上做得也更加緊縮?!眹鴥?nèi)做通用人工智能的創(chuàng)業(yè)公司天壤創(chuàng)始人薛貴榮告訴數(shù)智前線。
除了上述之外,市場調(diào)研公司IDC高級分析師盧言霞對數(shù)智前線分析,大語言模型的商業(yè)化落地還面臨兩方面的挑戰(zhàn):安全和技術(shù)。安全方面在于ChatGPT生成的內(nèi)容產(chǎn)生的版權(quán)問題,內(nèi)容造成的虛假宣傳問題如何管控,以及倫理問題。目前有些廠商在發(fā)力數(shù)字水印,向數(shù)據(jù)多媒體添加數(shù)字信息來達(dá)到文件的版權(quán)保護(hù),人機內(nèi)容生成的辨別等。
在技術(shù)方面,主要是目前問題回答的準(zhǔn)確度仍然不夠,模型數(shù)據(jù)無法實時更新,造成的答案內(nèi)容不及時,中文語料庫不足,導(dǎo)致ChatGPT在回答中”水土不服”等技術(shù)問題。不過,隨著預(yù)訓(xùn)練大模型的廣泛應(yīng)用和升級,準(zhǔn)確度和效率會有所改善。
而一家制造型企業(yè)的數(shù)字化資深人士告訴數(shù)智前線,實體企業(yè)最關(guān)心的還是業(yè)務(wù)層面的問題,包括供應(yīng)鏈、產(chǎn)能、良率、交付時間,“新技術(shù)如果能在這些要素上取得收益才會去考慮,否則都是炒作概念,無法落地?!?/p>
讓AI大模型跑出來,需要與真實場景方方面面匹配,讓客戶可以更低門檻、更有效率、更低成本地應(yīng)用AI大模型,如何讓AI大模型從巨頭的參數(shù)游戲,成為產(chǎn)業(yè)的普惠技術(shù),也是巨頭必須要做的事情。
03 中國企業(yè)路在何方
ChatGPT走紅之后,國內(nèi)大企業(yè)的熱情徹底被點燃,百度、阿里、騰訊、字節(jié)、華為、快手、小米等紛紛表態(tài),自家有類ChatGPT的技術(shù)或即將推出相關(guān)產(chǎn)品。
由于中文比英文難理解太多,這涉及技術(shù)、漢字信息熵比英文字母高很多、互聯(lián)網(wǎng)中文信息質(zhì)量等問題,初心資本李可佳對數(shù)智前線說,國內(nèi)第一版出來后,遭遇的挑戰(zhàn)會更多,但好處是知道這里面的差距在哪里,再慢慢地跟上?!岸恳淮蝺r值鏈的重構(gòu),都是一次巨大的商業(yè)機會。”
不過,一些人士認(rèn)為,中外企業(yè)在大模型上的差距正在拉大,對中國企業(yè)能不能在技術(shù)商業(yè)上迎頭趕上,有一定疑慮。但以目前聚焦最多、外界給予壓力最大的百度來分析,客觀來講,中國企業(yè)已具備必要條件。
ChatGPT給用戶帶來驚艷的背后是大語言模型的功勞,而訓(xùn)練大模型主要是三大要素——算法、數(shù)據(jù)和算力。百度、阿里、華為、浪潮都有超大模型的訓(xùn)練和實戰(zhàn)經(jīng)驗。比如,2021年底,百度已發(fā)布文心ERNIE,參數(shù)規(guī)模為2600億,與海外大模型處于同等數(shù)量級上。它還可實現(xiàn)文字生圖,具備了多模態(tài)的技能。這也是人們猜測OpenAI隨時可能發(fā)布的GPT-4,極有可能做的一件事。
不過,百度技術(shù)委員會主席吳華此前表示,雖然在百度文心大模型中,涉及各種理解和生成的能力都有,但ChatGPT是在展現(xiàn)方式上使用戶能更加容易、以自然語言的方式去實現(xiàn)交互,是一個革新性的認(rèn)識,對自己有很大啟發(fā)。而根據(jù)用戶反饋,也會快速優(yōu)化大模型。
高質(zhì)量的數(shù)據(jù)投喂是訓(xùn)練大模型的另一個關(guān)鍵要素。雖然ChatGPT未公布訓(xùn)練數(shù)據(jù)集,但根據(jù)GPT-3的描述,大約有31億個網(wǎng)頁內(nèi)容、書籍、維基百科,之后還添加了代碼托管平臺Github的各種代碼。此外,英語約占46%, 德、日、中文等則各占大概5%,總體為3000億單詞的語料。
業(yè)界人士告訴數(shù)智前線,中文的處理方式不能照搬。國內(nèi)企業(yè)在中文數(shù)據(jù)處理上有更多經(jīng)驗,在中文語料上更豐富,也可借助英文語料進(jìn)行優(yōu)化補充。而關(guān)鍵的是,融入對中國文化理解的本土化AI模型,對市場和用戶是最好的。國研新經(jīng)濟(jì)研究院創(chuàng)始院長朱克力告訴數(shù)智前線:據(jù)他了解,百度“文心一言”GPT模型目前在版本更新上已有較大進(jìn)步,針對中文語料上做了大量調(diào)整,在快速迭代和語義準(zhǔn)確方面能夠發(fā)揮得更優(yōu)。
除了上述行業(yè)因素,百度已形成了全棧布局,從底層的人工智能通用芯片昆侖芯,到人工智能框架飛槳,到大模型文心,最后是上層應(yīng)用如搜索、小度、Apollo智艙系列產(chǎn)品等,都在“文心一言”生態(tài)圈,這四層能實現(xiàn)端到端優(yōu)化,形成更高效的大模型 。而大模型訓(xùn)練有非常高的成本,全棧能力也意味著,任何一層的改進(jìn),都可能會優(yōu)化和降低成本。
而大模型的發(fā)展,也會反過來推動企業(yè)的業(yè)務(wù)晉級。比如,OpenAI在GPT模型上導(dǎo)入了至少1萬個英偉達(dá)GPU,大模型應(yīng)用意味著需要更多的算力。百度自研的通用人工智能芯片昆侖芯已更新了兩代產(chǎn)品。昆侖芯科技告訴數(shù)智前線,大模型對計算的要求主要體現(xiàn)在算力、互聯(lián)和成本三方面,而算力的核心就是人工智能芯片。就大模型而言,他們已做了布局優(yōu)化,也有切實落地,在研的下一代產(chǎn)品會有進(jìn)一步提升。
云業(yè)務(wù)也是這個邏輯。OpenAI的ChatGPT是通過微軟云對外提供服務(wù),“文心一言”則將通過百度智能云對外提供服務(wù),行業(yè)可以通過API和基礎(chǔ)設(shè)施,搭建AI模型和應(yīng)用。
隨著企業(yè)進(jìn)入深度用云階段,智能服務(wù)已成為行業(yè)的必選項。百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖曾介紹,之前企業(yè)選擇云廠商更多是看算力、存儲等基礎(chǔ)云服務(wù),以后企業(yè)對云的需求會更加聚焦智能服務(wù),會更多看框架好不好、模型好不好,以及芯片-框架-模型-應(yīng)用這四層架構(gòu)之間的協(xié)同是否高效。
某種程度上,大模型等AI產(chǎn)品將改變云行業(yè)的格局。這一趨勢已在美國云廠商中顯現(xiàn)。2022年,美國云廠商實現(xiàn)高增長,以微軟Azure云分析,自動駕駛、醫(yī)療制藥、智能制造等需求增長,使其AI算力營收增速超過100%。AI計算正成為美國云廠商的競爭焦點。在國內(nèi),各家云廠商去年投入汽車云,也是看重自動駕駛等AI計算帶來的高增長。隨著AI計算、AI算法和軟件、AI大模型等爆發(fā)式增長,云服務(wù)將從數(shù)字時代躍遷到智能時代,這將為云打開發(fā)展空間。這對百度智能云是有利的。此前,它已連續(xù)四年穩(wěn)居AI云服務(wù)市場第一,讓制造、交通、能源等傳統(tǒng)行業(yè)受益。根據(jù)財報,2022年,百度智能云全年總營收177億,同比增長23%。
而未來比拼的關(guān)鍵是,誰能降低大模型的應(yīng)用門檻,誰能以更低成本提供AI產(chǎn)品,將大模型進(jìn)行行業(yè)普惠。百度此前在文心大模型推出時,針對開發(fā)者發(fā)布了一系列開發(fā)套件、API和開發(fā)平臺,同時為增加人們對大模型的認(rèn)知,也實踐建立文心·旸谷社區(qū)。而百度智能云也在推進(jìn)AI基礎(chǔ)設(shè)施和大量通用AI產(chǎn)品。這些實踐對接下來文心一言的行業(yè)普惠都很關(guān)鍵。
這些天,一些中國創(chuàng)業(yè)團(tuán)隊也宣布將加入通用大模型的競爭中來,這為市場帶來更多活力。但大模型動輒千萬美金起步的基礎(chǔ)設(shè)施建設(shè)投入和海量的訓(xùn)練數(shù)據(jù)需求,注定了它極高的研發(fā)門檻。有業(yè)內(nèi)人士稱,未來3年是巨頭之間的競爭。
除了具有先發(fā)優(yōu)勢的百度,中國具有大模型能力的大企業(yè)隨后也將有可能官宣進(jìn)入該市場,而人工智能和大模型在行業(yè)市場上的開發(fā)、落地和普惠,將會是科技界下一個階段的競爭焦點。