文|數(shù)智前線 游勇 石兆
編輯|周路平
GPT大模型帶來的人工智能熱沒有降溫的意思,各家都在展示在人工智能技術(shù)上的積累。而相比于海外在基礎(chǔ)研究層面的創(chuàng)新,國內(nèi)人工智能的發(fā)展總體上更偏重應(yīng)用和落地。
01 互聯(lián)網(wǎng)再次風(fēng)起云涌
機(jī)會有多大,焦慮就有多大。ChatGPT有多火,國內(nèi)大廠和人工智能創(chuàng)業(yè)者就有多焦慮。
上周,OpenAI的多模態(tài)大模型GPT-4發(fā)布,ChatGPT遷移到GPT-4之后,一本正經(jīng)胡說八道的情況明顯減少,學(xué)習(xí)和進(jìn)步速度之快,令人驚嘆。與此同時(shí),微軟將GPT4的能力全面接入Office全家桶,打工人也能用大模型的能力,比如Word寫論文、素材直接生成PPT、表格也不用再記公式,這些之前令人頭疼的場景,現(xiàn)在都能用人工智能解決。
微軟描繪的這一幕讓國內(nèi)網(wǎng)民興奮不已的同時(shí),大家不免都在疑惑,國內(nèi)企業(yè)有沒有類似可以比肩的人工智能技術(shù)?
很多國內(nèi)互聯(lián)網(wǎng)大廠都在面臨類似的靈魂拷問。數(shù)智前線獲悉,國內(nèi)幾家大型互聯(lián)網(wǎng)公司和人工智能企業(yè)接到了客戶密集的問詢,了解ChatGPT和大模型相關(guān)的內(nèi)容。尤其是行業(yè)龍頭和大企業(yè),都有一種焦慮:國內(nèi)的大模型進(jìn)展如何,技術(shù)是否跟得上,與業(yè)務(wù)有哪些契合點(diǎn)等等。
“過去,大家普遍認(rèn)為,國內(nèi)與海外在人工智能方面的進(jìn)展,相差不大,但ChatGPT出來之后,大家有點(diǎn)措手不及。”一位互聯(lián)網(wǎng)大廠人士告訴數(shù)智前線,大模型參數(shù)超過千億之后,實(shí)現(xiàn)了質(zhì)變,讓人工智能初步具備了邏輯和推理能力。
ChatGPT帶來的這種緊迫感無處不在。王慧文、李開復(fù)等人都親自下場,組團(tuán)隊(duì),搞人工智能項(xiàng)目。甚至連圈外的俞敏洪都說,企業(yè)家如果沒玩過ChatGPT,沒資格談高科技發(fā)展。
事實(shí)上,盡管效果上與ChatGPT還有很大差距——即便是谷歌和Facebook等海外巨頭,在大模型上的表現(xiàn)也不如OpenAI——但國內(nèi)大廠在人工智能大模型上的布局早已經(jīng)開始。包括阿里的M6大模型、百度的文心大模型、華為的盤古大模型、騰訊的混元大模型以及智源的悟道大模型,其參數(shù)量都在千億規(guī)模以上,而且都是多模態(tài)。
國內(nèi)廠商在人工智能領(lǐng)域的努力有目共睹。百度在過去幾個(gè)月,加班加點(diǎn),追趕ChatGPT的進(jìn)度。3月中旬,百度推出的類ChatGPT產(chǎn)品“文心一言”已經(jīng)對外開放測試,盡管在效果上不如ChatGPT,但也引起了國內(nèi)用戶和企業(yè)的積極嘗試,數(shù)萬家企業(yè)申請調(diào)用API服務(wù),服務(wù)器一度被擠爆。
AI四小龍之一的曠視科技創(chuàng)始人印奇則透露,曠視接下來會在大模型的技術(shù)能力上非常堅(jiān)定的投入,曠視甚至專門有個(gè)小組,只做核心的模型設(shè)計(jì)。
騰訊也在公開回應(yīng)中明確表示,騰訊在相關(guān)方向上已有布局,專項(xiàng)研究也在有序推進(jìn)。3月22日的騰訊財(cái)報(bào)會上,總裁劉熾平也回應(yīng)了投資者關(guān)切,稱騰訊將積極投入資源來構(gòu)建基礎(chǔ)模型,并在未來將其應(yīng)用到騰訊的每一個(gè)業(yè)務(wù)線中。
騰訊做事一向比較低調(diào),但其實(shí)騰訊在人工智能上的布局并不少,時(shí)間也不短。據(jù)數(shù)智前線獲悉,目前騰訊旗下主要有三大人工智能實(shí)驗(yàn)室:優(yōu)圖實(shí)驗(yàn)室主打計(jì)算機(jī)視覺和產(chǎn)業(yè)AI應(yīng)用,WeChat AI專注開發(fā)語音AI,AI Lab則專注于基礎(chǔ)研究和應(yīng)用探索的結(jié)合。
在騰訊云智能之前披露的“四級加速架構(gòu)”里,不僅有最底層的算力(自研AI芯片加速算力效能),也有開發(fā)層的混元大模型,并通過騰訊云TI平臺提供多元行業(yè)大模型精調(diào)解決方案,上面還有即插即用的標(biāo)準(zhǔn)化應(yīng)用行業(yè)和行業(yè)解決方案,已經(jīng)形成了一套從基礎(chǔ)算力到算法模型到上層應(yīng)用完整的鏈條。
具體到外界非常關(guān)注的模型層,騰訊在2022年對外公布過AI大模型“混元”,取”混沌初始“之意,包含了CV(機(jī)器視覺)大模型,NLP(自然語言處理)大模型以及多模態(tài)大模型,覆蓋了業(yè)內(nèi)主流的研究方向,先后在中文語言理解權(quán)威評測集合CLUE 與 VCR、MSR-VTT,MSVD等多個(gè)權(quán)威多模態(tài)數(shù)據(jù)集榜單中登頂,實(shí)現(xiàn)跨模態(tài)領(lǐng)域的大滿貫。
混元大模型的優(yōu)勢在于,一是騰訊在人工智能領(lǐng)域的技術(shù)積累和儲備,讓其在多個(gè)細(xì)分賽道獲得了突破。比如在NLP領(lǐng)域,依托于騰訊的太極機(jī)器學(xué)習(xí)平臺,騰訊在去年推出了萬億中文NLP預(yù)訓(xùn)練模型HunYuan-NLP-1T,這個(gè)模型在最新的自然語言理解任務(wù)榜單CLUE上斬獲三個(gè)榜首。
二是騰訊有海量應(yīng)用場景。除常規(guī)公開數(shù)據(jù)集之外,“混元”大模型還學(xué)習(xí)了商業(yè)領(lǐng)域特有的文本數(shù)據(jù)集。相較于業(yè)界其他AI大模型,“混元”能夠更好地理解各種長度文本信息,應(yīng)對搜索、廣告、新聞、問答等多樣化的場景任務(wù),在閱讀理解、知識圖譜相關(guān)的下游任務(wù)中也更加具有優(yōu)勢。
如今,在ChatGPT的聲浪中,國內(nèi)大廠們正在加速行動。據(jù)數(shù)智前線獲悉,算力和數(shù)據(jù)作為大模型的關(guān)鍵要素之一,國內(nèi)不少企業(yè)在大量購買英偉達(dá)GPU,同時(shí)也有些巨頭正在尋找高質(zhì)量的中文數(shù)據(jù),為訓(xùn)練效果更佳的大模型做準(zhǔn)備。
“最重要的事情就是現(xiàn)在能把GPT-3.5復(fù)現(xiàn)出來?!庇∑嬲f,“GPT-3.5是更重要的點(diǎn),至少讓大家在共同的基準(zhǔn)上,這樣后續(xù)無論是應(yīng)用的創(chuàng)新、對技術(shù)的創(chuàng)新各方面至少有感覺。”
正如任正非在不久前的座談會上所言,未來AI大模型賽道會風(fēng)起云涌,不只是微軟一家。
02 中美AI的差異在哪里?
至少在GPT大模型出現(xiàn)之前,國內(nèi)人工智能產(chǎn)業(yè)的發(fā)展看起來并沒有與美國之間有太大差距,從機(jī)器學(xué)習(xí)到深度學(xué)習(xí)一步步都能跟得上。
國內(nèi)大廠在2012年前后廣泛成立了人工智能相關(guān)的實(shí)驗(yàn)室,后來,主打機(jī)器視覺的AI四小龍也相繼出現(xiàn)。海外出現(xiàn)的新技術(shù),國內(nèi)幾乎同時(shí)出現(xiàn),在全球技術(shù)榜單上也不乏中國企業(yè)的身影。
比如2016年,谷歌的AlphaGo在人工智能圈大放異彩,戰(zhàn)勝了圍棋冠軍,其在科技圈掀起的人工智能熱潮不亞于今天的ChatGPT。而像騰訊AI Lab也在同年初就開始研發(fā)圍棋人工智能程序“絕藝”,并且在后續(xù)一年中對頂尖職業(yè)棋手取得59連勝,甚至后來以讓二子的情況下,戰(zhàn)勝了世界冠軍柯潔。
不難發(fā)現(xiàn),國內(nèi)企業(yè)在人工智能等相關(guān)領(lǐng)域的技術(shù)布局并沒有落下。正如創(chuàng)新工場的李開復(fù)不久前表示:“美國仍是全球突破性的創(chuàng)新者。”但中國的互聯(lián)網(wǎng)巨頭,如阿里巴巴集團(tuán)和騰訊,“都在建立與OpenAI、微軟和谷歌相媲美的大型模型?!?/p>
但問題在于,一些重大的底層技術(shù)上的創(chuàng)新,往往先來自美國。在業(yè)界看來,海外大廠有充足的資金以及創(chuàng)新的氛圍,更愿意在基礎(chǔ)研發(fā)上投入,而不那么看重短期的商業(yè)效益。
OpenAI和DeepMind是全球人工智能領(lǐng)域最頂尖的兩個(gè)團(tuán)隊(duì)。而被谷歌收購以來,DeepMind累計(jì)虧損超過了20億英鎊,且在2020年之前一直虧損。但這些都是由財(cái)大氣粗的谷歌買單。OpenAI同樣如此,這家含著金鑰匙出生的機(jī)構(gòu),在2022年的凈虧損額達(dá)到5.45億美元,而營收還不足3000萬美元。不難發(fā)現(xiàn),優(yōu)秀成績的背后是不計(jì)虧損的巨額投入。
曠視科技創(chuàng)始人印奇坦言,中國AI公司不可能擁有OpenAI和DeepMind那樣奢侈的條件,因此,國內(nèi)一方面要用最艱苦樸素、奮斗的狀態(tài)來攻堅(jiān)核心AI技術(shù),另外中國 AI 公司想活得長,必須要把大模型商業(yè)化。
“相對于美國不計(jì)代價(jià)的純技術(shù)創(chuàng)新,中國AI公司還是要面臨相對短周期、商業(yè)化的壓力。我們要有極強(qiáng)的危機(jī)感?!庇∑嬲f。
這也造成了中國和美國在人工智能發(fā)展路徑上的側(cè)重差異。國內(nèi)人工智能的發(fā)展更為重視應(yīng)用落地。
馬化騰曾多次表示:“騰訊AI布局注重場景應(yīng)用,而不是為了研究而研究?!彬v訊云智能負(fù)責(zé)人吳運(yùn)聲此前也表示,優(yōu)圖實(shí)驗(yàn)室在成立之初就強(qiáng)調(diào),不只做基礎(chǔ)研究,而是要堅(jiān)持研究和產(chǎn)業(yè)落地兩條腿并行的策略。
而產(chǎn)業(yè)落地的需求最早往往源于內(nèi)部。比如十年前,優(yōu)圖就將視覺AI技術(shù)用于QQ空間,通過圖像顯著性內(nèi)容的檢測,就能拿自動找出圖片中最能代表圖像的區(qū)域。后來,優(yōu)圖通過活體檢測技術(shù),服務(wù)微眾銀行解決網(wǎng)上交易視頻驗(yàn)證身份的難題。如今,這套視覺AI的能力被用在了工業(yè)質(zhì)檢上,騰訊云將這個(gè)場景里的實(shí)踐,通過拆解算法里的每一個(gè)流程,將其沉淀到騰訊云TI平臺上,最終形成了一個(gè)對外輸出的面向工業(yè)質(zhì)檢場景的產(chǎn)品化平臺。
騰訊在人工智能領(lǐng)域的每個(gè)動作背后,都有相應(yīng)的落地路徑。比如微信AI實(shí)驗(yàn)室主打的語音,也是與社交業(yè)務(wù)緊密相關(guān),微信有大量語音轉(zhuǎn)文字和語音輸入的需求。騰訊的多模態(tài)大模型則是先在騰訊內(nèi)部的廣告業(yè)務(wù)開始應(yīng)用。騰訊云的數(shù)智人是整合了騰訊在語音交互、自然語言理解、圖像識別等領(lǐng)域幾乎所有的AI能力,再根據(jù)對行業(yè)需求的理解,以不同形象服務(wù)于金融、傳媒、文旅、出行等行業(yè)。
“AI將成為騰訊未來業(yè)務(wù)增長的放大器。”劉熾平說,生成式AI和基礎(chǔ)模型技術(shù)可以補(bǔ)充優(yōu)化騰訊的社交、通訊和游戲等業(yè)務(wù),“但不會對這些業(yè)務(wù)造成威脅”。例如,利用生成式AI,可以幫助小程序開發(fā)者更高效地開發(fā)小程序,而像聊天機(jī)器人服務(wù),也非常容易整合到微信和QQ中,讓它受益于騰訊廣泛的分發(fā)和用戶觸達(dá)。
國內(nèi)的AI企業(yè)大多在遵循相似的邏輯。曠視科技的企業(yè)業(yè)務(wù)負(fù)責(zé)人趙康表示,“如果沒有百業(yè)的捶打,AI永遠(yuǎn)是空中樓閣”。曠視的算法研發(fā)從早期開始也結(jié)合了落地,從算法交付到AIoT交付,逐步走入產(chǎn)業(yè)核心場景。甚至京東云也表示,旗下言犀人工智能應(yīng)用平臺將整合過往產(chǎn)業(yè)實(shí)踐和技術(shù)積累,推出產(chǎn)業(yè)版ChatGPT。
而除了科研環(huán)境的因素,中美人工智能的差異也是由各自的產(chǎn)業(yè)環(huán)境所導(dǎo)致。
國內(nèi)無論是政企,還是大大小小的行業(yè)客戶,正在如火如荼地進(jìn)行數(shù)字化升級改造,像工業(yè)、礦山、金融、營銷等領(lǐng)域,給了人工智能技術(shù)大量的落地機(jī)會,質(zhì)檢、核身等場景應(yīng)用在國內(nèi)已經(jīng)非常成熟。
相比之下,美國的企業(yè)信息化進(jìn)行得較早,新技術(shù)在行業(yè)場景落地時(shí)面臨著更高的成本。而國內(nèi)基于全球產(chǎn)業(yè)鏈,世界工廠的基礎(chǔ),能找到更多積極、寬松的應(yīng)用環(huán)境,也使得新技術(shù)得到更多反饋,迭代也更快。
所以說,中美在人工智能領(lǐng)域展現(xiàn)出的差距和差異,并不是一個(gè)非此即彼的關(guān)系,更多是路徑和階段的不同。只不過對于國內(nèi)企業(yè)而言,在需求和應(yīng)用出發(fā)之外,如何一步步縮小底層技術(shù)上的時(shí)間差異是不得不面對的挑戰(zhàn)。
“我們的策略是追求以正確的方式發(fā)展,而非速度。我們希望確?;A(chǔ)模型是正確且穩(wěn)固的。”劉熾平認(rèn)為,聊天機(jī)器人只是未來多款應(yīng)用的其中之一,“這是一個(gè)隨著時(shí)間推移逐漸建立起來的業(yè)務(wù)機(jī)會,而非我們當(dāng)下需要立刻解決的業(yè)務(wù)威脅?!彼?,騰訊能夠集中資源,以可持續(xù)性的方式建立相關(guān)能力和模型。
03 大模型也不是萬能的
當(dāng)大模型被捧上神壇時(shí),人們下意識認(rèn)為其無所不能。事實(shí)上,大模型正在與不少行業(yè)有了結(jié)合的可能,但真的在行業(yè)落地應(yīng)用時(shí),大模型也面臨著自身的問題。
比如大模型是否會取代行業(yè)小模型,后者是當(dāng)下很多企業(yè)在采用的方式。
業(yè)內(nèi)資深人士稱,這要以“解決問題優(yōu)先”的態(tài)度來考量。很多應(yīng)用場景,原來垂類模型用得很好,就沒必要去趕熱度?!爱吘勾竽P蛯蛻魜碇v,是有額外成本的,這是我們的大原則?!卑俣仍瀑Y深人士也告訴數(shù)智前線,像門口的閘機(jī),準(zhǔn)確率已高達(dá)99%,就沒有必要再去用一個(gè)大模型,“這是個(gè)適度問題”。
但在一些方面,大模型將替代垂類模型。比如,智能客服系統(tǒng),原來要靠人工進(jìn)行大量數(shù)據(jù)標(biāo)注。業(yè)界都知道,這是最消耗成本的部分,很多企業(yè)要耗費(fèi)數(shù)千萬甚至幾個(gè)億?,F(xiàn)在,大模型將開發(fā)范式進(jìn)行顛覆,僅需要少量數(shù)據(jù)。
“我們后面應(yīng)該更多探討,在成本適當(dāng)增加后收益如何,在考慮ROI、性價(jià)比的情況下,把大模型的技術(shù)和效果發(fā)揮出來?!鄙鲜鋈耸糠Q,業(yè)界的核心訴求是如何取得大模型的最優(yōu)解。
其次,人工智能已被企業(yè)寄予了為業(yè)務(wù)降本增效的厚望,但它的應(yīng)用落地卻門檻高、投入大、周期長,大模型就更有挑戰(zhàn)性了,像GPT3一個(gè)訓(xùn)練周期就要34天,還用了1000多張英偉達(dá)最先進(jìn)的A100 GPU卡,這些嚴(yán)重提高了模型產(chǎn)出的門檻。
智源研究院總工林詠華稱,如果把大模型類比一座冰山,它的落地更要關(guān)注冰山之下那些層層的技術(shù)棧?!皼]有這些從底到上的技術(shù)棧,是露不出冰山一角的?!?/p>
這些在應(yīng)用落地時(shí)遇到的難題,也在場景不斷打磨中得以改進(jìn)。比如,針對人工智能落地流程長、其中任何一個(gè)環(huán)節(jié)出問題都會影響落地,百度采用了人工智能開發(fā)運(yùn)營一體化標(biāo)準(zhǔn),類似軟件開發(fā)運(yùn)營DevOps,將AI開發(fā)落地的流程和實(shí)踐標(biāo)準(zhǔn)化,以保障質(zhì)量混合效率。騰訊云也用了類似的方法,依托大模型,結(jié)合實(shí)踐經(jīng)驗(yàn)封裝成一個(gè)全棧式人工智能開發(fā)服務(wù)平臺——TI平臺,它貫通了從數(shù)據(jù)獲取、模型訓(xùn)練、模型評估、模型部署到 AI 應(yīng)用開發(fā)等的全鏈路,簡化AI工程化。
這樣的路徑異曲同工。以騰訊TI平臺中下的TI-OCR為例,在企業(yè)實(shí)際應(yīng)用的場景中,單據(jù)識別是不少銀行日常處理最多的業(yè)務(wù),比如各類申請表單、交易票據(jù)等。TI-OCR是這個(gè)場景下的專業(yè)訓(xùn)練平臺。它支持了5000多種版式,泛化準(zhǔn)確率能達(dá)到90%。而且,對于新版式,拿5張樣本就能快速訓(xùn)練,準(zhǔn)確率達(dá)到95%以上。這避免了每次算法工程師要用大量數(shù)據(jù)進(jìn)行訓(xùn)練的問題。
伴隨人工智能成為企業(yè)必不可少的技術(shù),業(yè)界有了模型即服務(wù)(MaaS),算法也是基礎(chǔ)設(shè)施的趨勢,這樣的人工智能開發(fā)一體化平臺將降低AI落地的門檻,并保障質(zhì)量。
而下一個(gè)發(fā)展階段,大模型訓(xùn)練成本也會降低。最近斯坦福已提出一次算法訓(xùn)練600美元,而且效果達(dá)到GPT3.5,如果實(shí)際中真達(dá)到這樣的成本,將為大模型的落地進(jìn)一步掃清障礙。
再次,針對中國企業(yè)極為關(guān)注的私有化部署,百度云人士認(rèn)為這不是問題。騰訊云則告訴數(shù)字前線,騰訊云基于分布式云遨馳,公有云和私有云是同樣一套解決方案,想采用私有化部署沒有問題,私有化部署方案可以把能力1:1復(fù)制到專有云。“很多國內(nèi)客服用到大模型,期望私有化的同時(shí),還能低成本,需要壓縮模型,效果不能影響太多?!?/p>
而業(yè)界對大模型的落地考慮得越來越細(xì)化。比如,國內(nèi)市場在端側(cè)的場景非常多。人工智能落地的時(shí)候,哪些放在端側(cè)計(jì)算,哪些在云側(cè)計(jì)算,端側(cè)計(jì)算部分怎么保證模型小型化,滿足端側(cè)的低功耗要求,面向邊緣場景如何提升研發(fā)落地和運(yùn)營效率。再如,無論多么大的模型,總會有概率出現(xiàn)一些問題,如何進(jìn)行大模型的狀態(tài)監(jiān)控,如何更快地去調(diào)優(yōu)這個(gè)模型,也是業(yè)界在做的事情了。
上述騰訊資深人士告訴數(shù)智前線,AI落地產(chǎn)業(yè)已走入深水區(qū),AI應(yīng)用已被企業(yè)融入到他們業(yè)務(wù)流程中。業(yè)界正在加速提供AI標(biāo)準(zhǔn)化應(yīng)用,也包括依托底層大模型讓生產(chǎn)環(huán)節(jié)、業(yè)務(wù)環(huán)節(jié)更好地用上AI技術(shù),期望實(shí)現(xiàn)大模型等技術(shù)應(yīng)用的最優(yōu)解。
不難發(fā)現(xiàn),盡管國內(nèi)在GPT等大模型技術(shù)上還有差距,但國內(nèi)對人工智能的研發(fā)熱情以及背后廣泛的場景需求,使得這一技術(shù)在國內(nèi)的前景依然被看好。甚至從場景需求出發(fā)來,最終反哺底層技術(shù)的投入,也不失為一種更加符合國情的策略。