文 | Tech星球 王琳 陳橋輝 楊曉鶴
最近,360創(chuàng)始人周鴻祎又點(diǎn)評(píng)了互聯(lián)網(wǎng)圈:在ChatGPT領(lǐng)域美國(guó)領(lǐng)先了我們,中國(guó)公司和科研人員要奮起直追。
ChatGPT確實(shí)讓國(guó)內(nèi)外互聯(lián)網(wǎng)公司有點(diǎn)上火。2月8日,為了抵御ChatGPT帶來(lái)的沖擊,谷歌倉(cāng)促推出人工智能聊天機(jī)器人Bard。國(guó)內(nèi)這邊,百度宣布在3月初推出“文心一言”,其他家互聯(lián)網(wǎng)公司也爭(zhēng)先恐后。
截止2月10日,宣布有類ChatGPT技術(shù)儲(chǔ)備、準(zhǔn)備發(fā)布和已經(jīng)發(fā)布類ChatGPT產(chǎn)品服務(wù)的國(guó)內(nèi)大廠有:阿里巴巴、騰訊、華為、字節(jié)跳動(dòng)、京東、360、科大訊飛、快手、網(wǎng)易有道等,超過(guò)10余家互聯(lián)網(wǎng)大廠進(jìn)軍火熱的ChatGPT。
風(fēng)口之下,泥沙混雜。國(guó)內(nèi)最早官宣進(jìn)軍ChatGPT的互聯(lián)網(wǎng)企業(yè),其實(shí)是二手奢侈品交易平臺(tái)寺庫(kù),ChatGPT概念股讓其股價(jià)應(yīng)聲上漲120%。很多網(wǎng)友吐槽,不是寺庫(kù)主動(dòng)發(fā)聲,還想不起來(lái)寺庫(kù)對(duì)消費(fèi)者的欠款。
此外,互聯(lián)網(wǎng)垂類賽道企業(yè)也有參與者,Tech星球獨(dú)家獲悉,好未來(lái)將在未來(lái)引入類ChatGPT技術(shù),目前正著手籌備研發(fā)ChatGPT的教育項(xiàng)目。商湯也正在探索搭建通用型AIGC模型,該項(xiàng)目由商湯研究院牽頭。
中小科技公司在蹭熱度,大公司也并非輕松掌控“ChatGPT”。諸如谷歌Bard發(fā)布時(shí),演示視頻中犯了一個(gè)事實(shí)性錯(cuò)誤,首秀大“翻車”,致使谷歌股價(jià)大跌,目前市值已經(jīng)跌去了1700億美元。
放眼國(guó)內(nèi)互聯(lián)網(wǎng)企業(yè),誰(shuí)更有科研實(shí)力做ChatGPT?誰(shuí)在真刀真槍的投入研發(fā),誰(shuí)在追風(fēng)口、蹭熱點(diǎn)概念?
扎堆入局ChatGPT競(jìng)賽
在搜索和AI領(lǐng)域積累最深的百度,自然被市場(chǎng)寄予厚望。
百度計(jì)劃在今年3月推出與ChatGPT類似的人工智能聊天機(jī)器人服務(wù),該項(xiàng)目名字確定為“文心一言”,英文名ERNIE Bot,3月份完成內(nèi)測(cè)后,將面向公眾開放。不同的是,最初版本將嵌入其搜索服務(wù)中。這項(xiàng)工具將允許用戶獲得對(duì)話式的搜索結(jié)果。
去年9月,百度CEO李彥宏判斷人工智能發(fā)展在“技術(shù)層面和商業(yè)應(yīng)用層面,都有方向性改變”。據(jù)推測(cè),百度那時(shí)候就開始做“文心一言”,另按照谷歌和微軟節(jié)奏,“文心一言”開放內(nèi)測(cè)還有可能提前。
盡管沒有率先發(fā)布ChatGPT,但在相關(guān)技術(shù)方面,百度同時(shí)具備人工智能需要的算力、算法和數(shù)據(jù),在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局,是國(guó)內(nèi)少數(shù)的具備AI全棧能力的企業(yè)。
相比百度的技術(shù)研發(fā)儲(chǔ)備,阿里和字節(jié)跳動(dòng)可能是另外兩個(gè)較早布局的玩家。
2月9日,阿里內(nèi)測(cè)中的達(dá)摩院版ChatGPT提前曝光。新產(chǎn)品可實(shí)現(xiàn)的功能包括知識(shí)問(wèn)答、AI繪畫、代碼生成、小說(shuō)續(xù)寫、文案撰寫、寫詩(shī)作詞等。從人工問(wèn)答的水平看,達(dá)摩院版ChatGPT也實(shí)現(xiàn)了相對(duì)真實(shí)的回答,而且也實(shí)現(xiàn)了多輪問(wèn)答。
實(shí)際上,在2022年5月份,在超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的發(fā)布之后,阿里就曾公布過(guò)相應(yīng)的能力,在AIGC方面,生成的實(shí)景圖片已經(jīng)十分逼真。
根據(jù)介紹,M6將模型參數(shù)規(guī)模擴(kuò)展到了十萬(wàn)億,平均單卡可承載200億參數(shù)。據(jù)阿里方面公布的數(shù)據(jù)顯示,M6在同等參數(shù)規(guī)模能耗僅為此前業(yè)界標(biāo)桿的1%,極大降低大模型訓(xùn)練門檻。
字節(jié)在研發(fā)ChatGPT的道路上,雖然全棧技術(shù)不是很突出,但在商用方面走的比較靠前。Tech星球了解到,從去年年底開始,字節(jié)就在研發(fā)類ChatGPT項(xiàng)目,目前已在內(nèi)部上線了測(cè)試插件,由AI Lab主導(dǎo),當(dāng)前還在探索當(dāng)中。并且在此前,字節(jié)的AML團(tuán)隊(duì)內(nèi)部開發(fā)了火山引擎大模型訓(xùn)練框架veGiantModel。這一模型類似于為ChatGPT提供支持的GPT-3.5系列模型。
而在GPT-3.5之前,一位火山引擎的前開發(fā)人員告訴Tech星球,字節(jié)很早就著手研究基于GPT2、GPT3的訓(xùn)練模型和產(chǎn)品,并且字節(jié)旗下的火山引擎也在NLP(自然語(yǔ)言處理)應(yīng)用方面有研究積累。
目前,字節(jié)對(duì)話機(jī)器人、機(jī)器翻譯、機(jī)器寫作上有不少研究,特別是針對(duì)內(nèi)容創(chuàng)作這一塊。在ChatGPT被用作寫文章前,字節(jié)跳動(dòng)就研發(fā)了Xiaomingbot自動(dòng)寫稿平臺(tái),自2016年上線以來(lái),已經(jīng)累計(jì)寫了60萬(wàn)篇文章,覆蓋了17項(xiàng)的體育賽事,支持6種語(yǔ)言。
近日,快手也對(duì)外表示,正在開展大規(guī)模語(yǔ)言模型(LLM Large Language Model)相關(guān)研究,并啟動(dòng)了相應(yīng)專項(xiàng),覆蓋LLM模型訓(xùn)練、文案自動(dòng)創(chuàng)作與生成、對(duì)話系統(tǒng)開發(fā)等領(lǐng)域。
此外,京東云言犀也宣布將推出產(chǎn)業(yè)版ChatGPT:ChatJD,預(yù)計(jì)參數(shù)量為千億級(jí),主要應(yīng)用在零售和金融2個(gè)領(lǐng)域。
國(guó)內(nèi)大廠為何沒能搶得先機(jī)?
大廠扎堆涌入,但有實(shí)力的玩家并不多。
有研究估測(cè),訓(xùn)練1750億參數(shù)語(yǔ)言大模型GPT-3,需要有上萬(wàn)個(gè)CPU/GPU24小時(shí)不間輸入數(shù)據(jù),所需能耗相當(dāng)于開車往返地球和月球,且一次運(yùn)算就要花費(fèi)450萬(wàn)美元(約合3000萬(wàn)元)。
高昂的研發(fā)成本意味著,主流的大模型只能由大型科技公司或是少數(shù)研究機(jī)構(gòu)掌握。
從參數(shù)數(shù)量來(lái)說(shuō),百度的文心大模型有2600億參數(shù),遠(yuǎn)高于GPT-3的1700億參數(shù)。但參數(shù)數(shù)量并不代表模型結(jié)果。國(guó)內(nèi)并不缺數(shù)據(jù),百度、字節(jié)跳動(dòng)這樣的公司都有海量的數(shù)據(jù)積累,不過(guò)后續(xù)包括數(shù)據(jù)清洗、標(biāo)注以及模型的結(jié)構(gòu)設(shè)計(jì),訓(xùn)練、推理等都需要時(shí)間積累。這可能是國(guó)內(nèi)大模型表現(xiàn)結(jié)果不如國(guó)外驚艷的重要原因。
拉開差距的關(guān)鍵時(shí)間點(diǎn)是在2020年年中,也就是GPT3.0剛出來(lái)時(shí)。一份流傳的專家紀(jì)要顯示,當(dāng)時(shí)可能很多人覺得GPT3.0不僅是技術(shù),體現(xiàn)了AI模型的發(fā)展新理念,因?yàn)镃hatGPT的開發(fā)商OpenAI對(duì)這一塊有技術(shù)的獨(dú)到見解,也領(lǐng)先了國(guó)外的Google,大概Google比OpenAI差了半年到一年的時(shí)間,國(guó)內(nèi)公司差了兩年的時(shí)間。
這與國(guó)內(nèi)外很多科技企業(yè)認(rèn)為,ChatGPT并不是革命性的技術(shù)也有關(guān)系。ChatGPT是OpenAI對(duì)其2020年發(fā)布的GPT-3模型微調(diào)后開發(fā)出的對(duì)話機(jī)器人,嚴(yán)格來(lái)說(shuō),ChatGPT并未實(shí)現(xiàn)底層模型的顯著突破,它巧妙地采用了理解、生成和交互相結(jié)合的方式,基于人類反饋進(jìn)行強(qiáng)化訓(xùn)練,在體驗(yàn)上帶給人智能的感覺。
Meta首席人工智能科學(xué)家Yann LeCun,不久前在一次小型媒體和高管在線聚會(huì)上發(fā)表了自己對(duì)ChatGPT的看法:“就底層技術(shù)而言,ChatGPT并沒有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開展同樣的工作?!?/p>
一位百度員工告訴Tech星球,其實(shí)國(guó)內(nèi)很多大廠做了很久,但都不是GPT方向,而是其他產(chǎn)業(yè)方向。2022年很多開發(fā)者基于百度文心做的應(yīng)用,多是心理咨詢、尋醫(yī)問(wèn)藥、高考志愿等場(chǎng)景。阿里「通義」大模型也覆蓋200+服務(wù)場(chǎng)景,包括AIGC,智能對(duì)話也有,但不是很強(qiáng)。
沒有意識(shí)到ChatGPT對(duì)現(xiàn)有搜索模式的顛覆,沒有準(zhǔn)確預(yù)測(cè)到ChatGPT對(duì)腦力勞動(dòng)者產(chǎn)生替代的關(guān)系。問(wèn)題的關(guān)鍵在于,很多互聯(lián)網(wǎng)企業(yè)認(rèn)為“chat”這是一個(gè)很淺的應(yīng)用,從現(xiàn)在的場(chǎng)景上,就是一個(gè)更強(qiáng)的聊天機(jī)器人,有一定的問(wèn)答屬性,暫時(shí)看不到商用的點(diǎn)。
有著上述相同看法的一位字節(jié)NPL算法工程師告訴Tech星球,ChatGPT是一種不確定性極高的項(xiàng)目,國(guó)內(nèi)沒有成功先例,如果真的All-in去做,上面并不一定會(huì)提供資源,更別說(shuō)提上優(yōu)先級(jí)。另外,國(guó)內(nèi)的技術(shù)確實(shí)是能力有限,比如想做一個(gè)大模型,缺少的不僅僅是資金,還有人力和基礎(chǔ)模型,對(duì)于互聯(lián)網(wǎng)大廠這種商業(yè)公司而言,有著較大的難度。
不僅認(rèn)知層面存在局限,技術(shù)上的局限也有。
目前,ChatGPT的信息截止到了2021年,這意味著如果把它當(dāng)做搜索工具使用,顯然無(wú)法獲得實(shí)時(shí)信息。一位百度員工表示,百度現(xiàn)在正在解決信息實(shí)時(shí)性的問(wèn)題。同時(shí),ChatGPT已經(jīng)在準(zhǔn)備推出基于GPT-4的迭代產(chǎn)品,國(guó)內(nèi)企業(yè)又有新的目標(biāo)需要追趕。
跟風(fēng)熱潮中,誰(shuí)在硬蹭熱點(diǎn)?
“有大模型的企業(yè)能做ChatGPT,沒有的則是在蹭熱點(diǎn)?!?/p>
前阿里云大模型負(fù)責(zé)人楊紅霞犀利點(diǎn)評(píng)了當(dāng)下互聯(lián)網(wǎng)公司,蜂擁扎堆做ChatGPT的現(xiàn)狀。她認(rèn)為:“大模型只有達(dá)到了100B以上的水平,才有GOT能力(或者提供較難推理問(wèn)題的回答)。”
從這方面看,百度有20多萬(wàn)企業(yè)用戶的飛槳平臺(tái),也有文心大模型,預(yù)計(jì)能做出最接近ChatGPT水平的對(duì)話產(chǎn)品;阿里有“通義”大模型,目前已經(jīng)實(shí)現(xiàn)萬(wàn)億參數(shù)訓(xùn)練,在產(chǎn)業(yè)端M6開發(fā)的應(yīng)用場(chǎng)景也比較豐富;華為則是在2020年對(duì)大模型開始有布局,2021年發(fā)布了鵬城盤古大模型,是業(yè)界首個(gè)千億級(jí)生成和理解中文NLP大模型。
相比之下,目前宣布進(jìn)軍ChatGPT的一些互聯(lián)網(wǎng)企業(yè),技術(shù)研發(fā)和進(jìn)度則處在第二梯隊(duì)。比如,360有深度學(xué)習(xí)平臺(tái)Xlearning,但沒有相關(guān)大模型。同樣宣布進(jìn)軍ChatGPT的網(wǎng)易有道,是AI芯片、深度學(xué)習(xí)框架、AI大模型都沒有,只是有應(yīng)用場(chǎng)景在線教育,這與傳出要參與ChatGPT的學(xué)而思類似,企業(yè)只是有學(xué)習(xí)機(jī)的應(yīng)用場(chǎng)景,但沒有相關(guān)技術(shù)儲(chǔ)備。
還有一些企業(yè)則被認(rèn)為是追風(fēng)口概念。漢王科技受益于ChatGPT概念股,在1月30日開始的七個(gè)漲停板。根據(jù)2022年半年報(bào)顯示,其接近c(diǎn)hatGPT的文本大數(shù)據(jù)業(yè)務(wù)營(yíng)收為7797.95萬(wàn),僅占總營(yíng)收的14%,不僅營(yíng)收占比較小,還同比下滑7.14%。企業(yè)發(fā)展困難,卻借助ChatGPT概念實(shí)現(xiàn)了股價(jià)一飛沖天。
這還不算最引人注目的,2月6日,寺庫(kù)宣布將探索將AIGC和ChatGPT技術(shù)應(yīng)用于奢侈品相關(guān)業(yè)務(wù)。當(dāng)天,寺庫(kù)每股股價(jià)上漲124.4%。實(shí)際這家企業(yè)已經(jīng)被納入“老賴”名單,很多供應(yīng)商欠款和消費(fèi)者退款都沒即時(shí)結(jié)算,多次被市場(chǎng)監(jiān)管總局登上失信名單。
與這些主動(dòng)蹭ChatGPT的熱度企業(yè)不同,也有什么都沒做的企業(yè),借助ChatGPT躺贏。2月8日,微軟集成ChatGPT技術(shù)的新版必應(yīng)上線,回答內(nèi)容中有不少答案來(lái)自知乎,當(dāng)天午后知乎股價(jià)一度漲超56%。由于ChatGPT可能會(huì)對(duì)社區(qū)問(wèn)答產(chǎn)生顛覆,所以知乎對(duì)ChatGPT相關(guān)事宜一直保持沉默。但也被市場(chǎng)熱捧,送上了股價(jià)增長(zhǎng)列車。
當(dāng)然,有行業(yè)人士表示,很多中小企業(yè)沒有技術(shù)實(shí)力,也可借助開源的Transformer大模型,一定程度實(shí)現(xiàn)ChatGPT功能服務(wù)。
不過(guò),達(dá)摩院專家告訴Tech星球,現(xiàn)在大規(guī)模預(yù)訓(xùn)練的Transformer-based模型雖然能夠很好地解決感知智能相關(guān)任務(wù),但缺乏精心設(shè)計(jì)的純Transformer模型,基本無(wú)法完成對(duì)于實(shí)現(xiàn)認(rèn)知智能的嘗試。
正如字節(jié)跳動(dòng)的情況,Tech星球向火山引擎的售前支持人員咨詢火山引擎是否有類ChatGPT的產(chǎn)品?對(duì)方表示,平臺(tái)并沒有該產(chǎn)品,但是可以通過(guò)“機(jī)器學(xué)習(xí)平臺(tái)”結(jié)合自家產(chǎn)品,經(jīng)過(guò)二次開發(fā),能夠?qū)崿F(xiàn)類ChatGPT的效果。
Tech星球還發(fā)現(xiàn),在ChatGPT爆火后,前美團(tuán)“2號(hào)人物”王慧文疑似復(fù)出,宣稱要帶資5000萬(wàn)美元入局人工智能。同時(shí),與NPL、AIGC等相關(guān)的崗位被不少人關(guān)注,算法崗成為了新的求職熱門。在脈脈的職位熱度榜單中,前十位中,有8個(gè)是和算法相關(guān)的崗位。
包括騰訊、阿里、字節(jié)、小紅書、菜鳥等互聯(lián)網(wǎng)公司,已經(jīng)在NPL算法工程師等相關(guān)招聘崗位中,加入了從業(yè)者需了解熟悉GPT-3等相關(guān)模型的要求。而招聘的月薪多在4萬(wàn)元左右,最高可達(dá)10萬(wàn)元。
2023年,ChatGPT點(diǎn)燃的這把火,可以淬煉出真金的企業(yè)和人才,也可以蒸發(fā)掉虛妄的概念。