文|數(shù)智前線 趙艷秋 徐鑫
編輯|周路平
春節(jié)前,人工智能組織OpenAI推出的大模型ChatGPT,在國內(nèi)業(yè)界引起了不小的轟動。
一名AI從業(yè)者告訴數(shù)智前線,人工智能每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。但這兩次大家的心態(tài)迥然不同,當谷歌的AI下棋戰(zhàn)勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。一個月里,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是AI第一次大規(guī)模的自傳播。
數(shù)智前線獲悉,除了感嘆于ChatGPT的驚艷體驗外,國內(nèi)業(yè)界也在迅速反思和行動:我們的差距在哪里?我們將如何正視和改進不足?哪些是中國從業(yè)者的機會?
一名從業(yè)人士告訴數(shù)智前線,ChatGPT出現(xiàn)后,行業(yè)重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。
01、差距在哪里?
在ChatGPT推出后,一位百度資深人士告訴數(shù)智前線,他“沒有興趣”談?wù)揅hatGPT,言語之間,五味雜陳。一位人工智能企業(yè)創(chuàng)始人稱,面對ChatGPT的驚艷表現(xiàn),心癢癢也迷茫,失眠了。他坦承,從模型的規(guī)模到效果,差距還比較遠。
有人用同樣的問題向國內(nèi)某廠商的大模型和ChatGPT同時發(fā)問,ChatGPT從回答的邏輯性和完整度上都遠超國內(nèi)大模型,國內(nèi)大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內(nèi)容。而且,在回復(fù)速度上,ChatGPT也領(lǐng)先一截。
從事數(shù)字人研發(fā)的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的大模型,業(yè)界共識是差距在兩年以上。國內(nèi)先不談彎道超車,趁早追趕反而是更重要的。
雖然一些人工智能資深人士認為,在ChatGPT所涉及的技術(shù)上,中美是“平級”的,但華為諾亞方舟實驗室語音語義首席科學家劉群,在黃大年茶思屋的討論中坦承,中國在技術(shù)上還是有差距的。其中一個是基礎(chǔ)模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的?!拔夜烙嫷浆F(xiàn)在為止,沒有哪個模型能吃GPT那么多數(shù)據(jù)?!?/p>
清華大學計算機科學與技術(shù)系長聘副教授黃民烈提到,在GPT-3之后,OpenAI所有的模型都沒有開源,但它提供了API調(diào)用。在這個過程中,它干了一件事,就是建立起了真實的用戶調(diào)用和模型迭代之間的飛輪,它非常重視真實世界數(shù)據(jù)的調(diào)用,以及這些數(shù)據(jù)對模型的迭代。當然,在此過程中,它也養(yǎng)活了美國一大幫創(chuàng)業(yè)公司,建立了一個生態(tài)。
“你看我們國內(nèi)的大模型研究,是A公司訓練了一個,B公司也訓練了一個,打個廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把數(shù)據(jù)和模型的飛輪完整轉(zhuǎn)起來。所以,我覺得這是我們趕超ChatGPT的難點。”一位業(yè)內(nèi)人士坦言。
除此之外,業(yè)界人士都提到了算力問題。由于GPU芯片等問題,在一定程度上,國內(nèi)算力已經(jīng)到瓶頸了了。即使國內(nèi)頭部公司,從算力上跟谷歌等相比,差距也是比較明顯的。
從數(shù)據(jù)質(zhì)量來說,整個互聯(lián)網(wǎng)的中文數(shù)據(jù)質(zhì)量,相比于英文還是有明顯差距?!拔覀兛赡芤朕k法,做中英文不同語言之間的數(shù)據(jù)互補?!庇袠I(yè)內(nèi)人士稱。
此外,幾乎所有受訪人士都提到了OpenAI這家人工智能組織,所體現(xiàn)的純碎創(chuàng)新精神和長期主義。“其實從原理和方法看,他們所做的東西業(yè)界都是了解的,倒沒有說什么是美國做得了、我們做不了的?!痹浦暥麻L梁家恩對數(shù)智前線說,但像OpenAI和DeepMind,他們可能是業(yè)界唯二的兩家機構(gòu),無論在創(chuàng)新性、投入、決心,還是在頂尖人才儲備上,都是一如既往堅持的?!拔覀兛吹降氖浅晒?,但里面可能已經(jīng)有很多失敗的嘗試?!?/p>
有資深A(yù)I從業(yè)者認為,在看不到前景和沒有明顯效果的階段,OpenAI非常堅定地做了投入,相反國內(nèi)傾向于在技術(shù)出現(xiàn)突破后,快速追隨。“國內(nèi)大家第一步想的是,我們現(xiàn)在怎么用起來,但在不能用的時候,人家就在長期投入?!?/p>
“這件事其實是值得我們學習的,我們真的需要有足夠多的錢,有這么一幫熱血的人才,能夠在一個方向上這樣持續(xù)積累發(fā)力,我覺得這是一個非常必要的條件?!秉S民烈稱。
最近一段時間,業(yè)界也在討論中國企業(yè)能否超越。容聯(lián)云AI研究院院長劉杰告訴數(shù)智前線,圍繞業(yè)務(wù),尤其是國內(nèi)的場景,是有超越機會的。在局部應(yīng)用中開始超越,這也是業(yè)界的共識。
02、對中國人工智能界有何啟發(fā)
ChatGPT是一種大模型。在它推出之前,國內(nèi)外實際上已有不少大模型。相比其他大模型,它有了業(yè)界意料之外的突破,也給國內(nèi)業(yè)界帶來啟發(fā)。
首先,ChatGPT有一個非常強大的技術(shù)底座,也就是InstructGPT模型。但這個模型的論文剛發(fā)出來時,沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。梁家恩也告訴數(shù)智前線,此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型路線一直沒放棄,模型參數(shù)和數(shù)據(jù)規(guī)模越做越大,最終結(jié)合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。因此,業(yè)內(nèi)公司正在關(guān)注投入更大精力到GPT模型路線上,技術(shù)路線交替競爭,在業(yè)內(nèi)是常態(tài)。
其次,ChatGPT引入了強化學習機制。容聯(lián)云劉杰告訴數(shù)智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標注的數(shù)據(jù)去學習,還在新版本上引入了人工標注的數(shù)據(jù),通過人類的反饋,有針對性地進行優(yōu)化?!斑@是ChatGPT一個重要的進展,給了我們很大的啟發(fā)?!?/p>
“這是它核心的一點?!比A為終端云服務(wù)搜索與地圖BU總裁趙世奇稱,“今天,我們的模型越來越大,它就像一股洪荒之力,有人會害怕未來它會不會控制人類?但引入了這種強化學習機制后,就相當于給洪荒之力一個引導(dǎo),讓大模型的產(chǎn)出朝著可控的方向走,生成符合預(yù)期的結(jié)果?!北热?,你去問它一些倫理安全的敏感話題,它都能答得很好。
這里的難度是建立怎樣的強化學習機制。此前,在下圍棋的AI中,強化學習是用勝負做反饋。但對于ChatGPT如此開放的系統(tǒng),是沒有明確的反饋機制的。黃民烈稱,過去大家也嘗試了強化學習機制,但很多都不太成功。ChatGPT在這件事上取得了突破。
第三,它在數(shù)據(jù)質(zhì)量和多樣性上非常講究。OpenAI雇傭了一個數(shù)十人的數(shù)據(jù)團隊,其實ChatGPT強化學習的數(shù)據(jù)量并不大,但對數(shù)據(jù)多樣性、標注體系都有精巧的設(shè)計,讓數(shù)據(jù)發(fā)揮出了強大的作用。業(yè)內(nèi)認為,這確實是值得我們借鑒的地方。
當然,ChatGPT也有明顯的不足。大家公認的,是它善于一本正經(jīng)地胡說八道。劉杰告訴數(shù)智前線,ChatGPT是一個黑盒計算,當下在內(nèi)容的可信性和可控性上有一定局限?!拔覀円o它足夠正確的知識,再引入知識圖譜這類知識管理和信息注入技術(shù),還要限定它的數(shù)據(jù)范圍和應(yīng)用場景,使得它生成的內(nèi)容更為可靠,這是我們在做的。”
ChatGPT在AI的技術(shù)路線和訓練方式上的變革,讓人關(guān)注它對產(chǎn)業(yè)帶來的改變。特看科技CEO樂乘預(yù)計,很多單點環(huán)節(jié)里,用不用大模型會有天壤之別。沒用大模型,只基于自己上一代小模型做產(chǎn)品的企業(yè),跟應(yīng)用了大模型且還做了業(yè)務(wù)垂直化的公司,將無法競爭。
多名創(chuàng)業(yè)者談及,這兩年創(chuàng)業(yè)市場垂頭喪氣,所有人都在探尋能夠大幅度提升生產(chǎn)力的技術(shù)是什么?!癈hatGPT其實提供了一種新的范式。垂頭喪氣、青黃不接的狀態(tài)可能會成為過去。這個領(lǐng)域出幾家千億級別的公司是完全有可能的?!睒烦苏f。
03、中國企業(yè)的動作
ChatGPT推出后,很多人在講谷歌、百度的焦慮。但大多數(shù)中國業(yè)內(nèi)人士認為,目前ChatGPT還是一個對AI技術(shù)范式的探索,它并不能代替搜索。ChatGPT當下一個很大的弊端是無法實時獲取互聯(lián)網(wǎng)信息。由于它只是一個端到端的生成模型,能夠自我構(gòu)造虛假答案,這些都是它替代搜索的障礙。而如果以目前每一條幾美分的成本來看,它會讓商業(yè)搜索引擎公司入不敷出。
它作為搜索引擎的補充是有機會的,因為搜索引擎也講求“所問即所答”,但這還有一個發(fā)展過程。
劉杰認為,ChatGPT主要的產(chǎn)業(yè)化路徑,目前可能性比較大的首先還是在C端。由于ChatGPT展現(xiàn)出的大模型的創(chuàng)造性,以及對長篇上下文的理解能力,它可能會聚焦于一些開放性、創(chuàng)意性和通用性的任務(wù)上。
不過,中國企業(yè)在行業(yè)市場的探索已經(jīng)開啟。比如,在智能客服領(lǐng)域,云蝠智能CEO魏佳星告訴數(shù)智前線,上個月他們在一些場景嘗試引入ChatGPT來做外呼的Demo測試,調(diào)用ChatGPT來回復(fù)客戶的問題。
“在智能客服領(lǐng)域應(yīng)用這項技術(shù),核心點在大模型的NLP(自然語言處理)能力和此前企業(yè)里已有的NLP之間怎么結(jié)合?!蔽杭研钦f。例如幫助順豐去做回訪的快遞通知體系,是基于幾個標準動作而進行,在這個封閉條件下應(yīng)該優(yōu)先企業(yè)已有的技術(shù),滿足客戶當下的核心需求。
在這個需求之外,此前智能客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語料信息不充分時,AI沒辦法對問題做出反應(yīng),ChatGPT大模型能夠補全這方面的能力。魏佳星反饋,云蝠智能外呼的Demo測試效果較好。在其他行業(yè)里這項技術(shù)可能仍處于娛樂狀態(tài),但在智能客服領(lǐng)域,ChatGPT已具備商用潛力。
從事通訊及數(shù)字化服務(wù)的上市企業(yè)容聯(lián)云,從2021年圍繞著人機智能對話,做核心技術(shù)和產(chǎn)品研發(fā),比如智能客服。目前,在研發(fā)與ChatGPT類似的人工智能內(nèi)容生成產(chǎn)品。
但就模型的規(guī)模,劉杰有不同的看法?!癈hatGPT的優(yōu)勢是它的大帶來的,但在應(yīng)用落地上,由于它過大,也帶來了挑戰(zhàn)和局限?!彼嬖V數(shù)智前線,“脫離場景去談大和小是沒有意義的。在特定應(yīng)用場景、特定條件約束下、在特定的數(shù)據(jù)上,去訓練規(guī)模適宜的模型,是我們努力的目標。”
劉杰還稱,AI是一個鏈條比較長的產(chǎn)品技術(shù),如果沒有建立一個好的反饋機制,在部署運營階段,從最前線發(fā)現(xiàn)的問題,就很難有效定位解決,所以要讓模型去持續(xù)成長和優(yōu)化,“它不是靜態(tài)的,不是交付了就不再管它?!?/p>
云知聲梁家恩告訴數(shù)智前線,他們一直密切跟進業(yè)內(nèi)最前沿的算法,是最早把BERT和GPT2模型方法用到實際業(yè)務(wù)系統(tǒng)的團隊之一,“現(xiàn)在相當于是把基于BERT的技術(shù)框架做個升級,目前已納入云知聲今年的技術(shù)升級目標規(guī)劃中?!绷杭叶髡f,ChatGPT的優(yōu)勢是意圖理解、上下文對話管理和高質(zhì)量內(nèi)容生成,技術(shù)升級后,預(yù)計會帶來顯著的體驗提升。
與其他企業(yè)一樣,云知聲的目標是先走通,之后在既有的業(yè)務(wù)比如在IoT智能語音交互對話,以及醫(yī)療行業(yè)應(yīng)用中落地。梁家恩也提到了模型的規(guī)模問題,考慮商業(yè)化成本,實用模型的參數(shù)量最終可能要壓到10億量級。
商湯科技數(shù)字文娛事業(yè)部總經(jīng)理欒青告訴數(shù)智前線,團隊更多是利用GPT等生成式內(nèi)容進行短視頻等創(chuàng)作,讓大家在創(chuàng)作的過程當中,把生產(chǎn)效率提升,“這是我們的核心點”。同時,商湯已訓練了超過300億量級超大基模型。
出門問問創(chuàng)始人李志飛則告訴數(shù)智前線,出門問問從2019年底開始做生成式應(yīng)用,2020年GPT-3出來后一直在跟蹤大模型。目前發(fā)力的一個行業(yè)應(yīng)用是寫文案。
某游戲人工智能的資深開發(fā)者告訴數(shù)智前線,這項技術(shù)在游戲的用戶互動環(huán)節(jié)和制作環(huán)節(jié)能看到應(yīng)用前景。比如用戶和NPC(一種角色)互動對話時調(diào)用,由于ChatGPT對自然語言的優(yōu)秀理解能力,用戶和NPC互動的開放性能大幅提升。另外在制作環(huán)節(jié)里,應(yīng)用ChatGPT,可通過關(guān)鍵詞生成故事線,能給策劃在劇情走向設(shè)計時提供參考。
另外,在數(shù)字人領(lǐng)域,特看科技CEO樂乘告訴數(shù)智前線,大模型讓數(shù)字人的內(nèi)容生產(chǎn)和交互方式發(fā)生了變化。
在沒有引入大模型之前,數(shù)字人說話和行動基本要靠真人行為去驅(qū)動。有了大模型之后,內(nèi)容的輸出可以通過大模型來完成。以直播帶貨為例,數(shù)字人公司先給本地生活、知識付費和直播商家等建立一個數(shù)字人的虛擬主播形象,而后可以將大模型接入,讓大模型輔助撰寫數(shù)字人直播帶貨的話術(shù)和腳本,“未來在我們關(guān)注的泛生活和電商賽道,可能有30%內(nèi)容能夠通過大模型生成來完成。”樂乘說。
04、ChatGPT在行業(yè)落地難
不過,業(yè)界資深人士提出,當下ChatGPT在行業(yè)里要真正落地還面臨困難。
“商業(yè)模型上跑不通?!蔽杭研菍?shù)智前線說。ChatGPT目前調(diào)用一次的費用在幾美分,智能客服一天的問答場景,通??赡芤{(diào)用幾十萬次?!拔覀円煌娫捠召M才1.2毛,利潤可能也就2分錢,現(xiàn)在的成本使得它根本跑不起來?!拔杭研钦J為,當這項產(chǎn)品的調(diào)用成本降到1分錢時,行業(yè)里可能就會大范圍使用起來。
游戲行業(yè)的開發(fā)者們也坦言,調(diào)用ChatGPT的成本和它當下所帶來的回報可能并不成正比。幾美分只是調(diào)用費用,還不算運營費用?!皼]有一個老板能接受,NPC回復(fù)一句話要花掉幾毛錢,即使它說得再好?!倍脩舻挠螒蝮w驗是個系統(tǒng)工程,文本互動只是其中的一環(huán)。當下即使有廠商愿意不顧高成本使用ChatGPT,最終的用戶體驗也依然可能無法有質(zhì)的飛躍。
在游戲制作環(huán)節(jié),ChatGPT可能也只能作為策劃和游戲設(shè)計環(huán)節(jié)的參考,“乍看中規(guī)中矩要素齊全,但細品會發(fā)現(xiàn)缺少靈魂,在觀念性的創(chuàng)造上仍有待提升”。
不過,樂乘對ChatGPT的成本問題相對樂觀。OpenAI公司自己也是初創(chuàng)團隊,沒有那么有錢。隨著競爭加劇,大模型會像水電煤一樣,是大家都用得起的狀態(tài)。
刨除成本考量,在對企業(yè)的落地中,ChatGPT這類大模型,也有典型的問題。
容聯(lián)云劉杰舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對資源要求高,當前不太可能實現(xiàn)私有化部署。其次,這些大模型在一些特定行業(yè)或特定任務(wù)上,專業(yè)性是欠缺的,需要去適配。而對于ChatGPT這類非開源的大模型應(yīng)用來說,對它在下游任務(wù)上的微調(diào),如何兼顧成本、靈活性和數(shù)據(jù)隱私則是一個關(guān)鍵問題。這些問題也造成,這種模型還沒有走到服務(wù)企業(yè)級客戶,尤其是大型企業(yè)客戶那一步。
除此之外,現(xiàn)在人工智能技術(shù)都在與企業(yè)的核心業(yè)務(wù)流程做深度融合,而像ChatGPT這個基于大模型的應(yīng)用服務(wù),更像一個獨立的外掛,如何深度綁定,這也成為企業(yè)使用它的一個待解決問題。
業(yè)界人士期望ChatGPT未來在商業(yè)模式上有更好的呈現(xiàn)方式。目前ChatGPT對外提供的API還非常單一,影響了應(yīng)用。
05、創(chuàng)業(yè)公司會被ChatGPT吞噬嗎?
大家在期待OpenAI的下一個版本。GPT-3大模型發(fā)布于2020年, ChatGPT則基于它的改進版本創(chuàng)建。此前盛傳,GPT-4將于今年一季度或下半年推出,不過OpenAI的首席執(zhí)行官 Sam Altman在1月份回應(yīng),沒有具體的時間表。
一些創(chuàng)業(yè)者已經(jīng)開始關(guān)注到,隨著大模型被越來越多地應(yīng)用,細分賽道的創(chuàng)業(yè)公司在大模型的強大推力加持下,如何尋找自己的生存空間。
它涉及到兩點,首先是如何深化對垂直行業(yè)的認知,真正把大模型融入到企業(yè)的創(chuàng)新業(yè)務(wù)流中。特看科技樂乘認為,垂直行業(yè)的小模型,考驗的是創(chuàng)業(yè)公司對垂直行業(yè)的know-how。創(chuàng)業(yè)公司需要基于對行業(yè)的認知深度,采集足夠多的場景數(shù)據(jù),并基于這些細分數(shù)據(jù)更好服務(wù)用戶。用戶越多,反饋越多,最終形成數(shù)據(jù)反饋的閉環(huán)。
創(chuàng)業(yè)公司在小模型的競爭終局比拼的是,誰家的小模型跟業(yè)務(wù)結(jié)合得緊,且能解決好跟大模型結(jié)合的問題。
另一點是,大模型被充分使用、喂得很肥后,是否會成為最強大的AI,最終吞噬細分賽道上小創(chuàng)業(yè)公司的發(fā)展空間。
海外初創(chuàng)公司Jasper的命運頗能反映這種境況。Jasper是一家基于GPT-3大模型來生成營銷文案的AI服務(wù)商,去年10月它宣布以15億美元的估值獲得1.25億美元A輪融資。一個月后,基于GPT-3改進版本搭建的ChatGPT大火,智能程度更泛化的ChatGPT徹底蓋過了Jasper的風頭。
“對創(chuàng)業(yè)者而言,在充分利用已有大模型的情況下,也要盡可能要把小模型的閉環(huán)數(shù)據(jù)保護好?!碧乜纯萍紭烦苏f,這也是他們公司未來會重點攻克的方向。
不過,當下底層大模型還在高速迭代階段,行業(yè)內(nèi)都在等 GPT-4 出來。樂乘認為,從GPT-3到GPT-4的變遷,很像移動互聯(lián)網(wǎng)早期 iPhone 1和 iPhone4 階段iOS的升級速度,它的發(fā)展速度也許會超出大家的認知。
一些人士猜測, GPT-4將在多模態(tài)上有進展,也就是會引入視頻、音頻等。國內(nèi)某游戲人工智能的資深開發(fā)則告訴數(shù)智前線,他們關(guān)注的是下一代的大模型能不能在理解上下文上有突破?!叭绻竽P湍茏屓斯ぶ悄艽蜈A辯論賽,那么它的能力就算是有質(zhì)的突破了?!?/p>
“短期內(nèi)可能大家會高估這個東西,但長期可能有很多人會低估這個東西。”這名游戲AI資深開發(fā)評價。