文|新眸 吳明燦
編輯|桑明強(qiáng)
最近的科技圈狂歡,屬于ChatGPT。
自從OpenAI公司公開了ChatGPT的公測平臺后,ChatGPT就迅速霸占了國內(nèi)各平臺的科技榜單,短短一周,用戶量已經(jīng)突破了1百萬人。但事實(shí)上,它不是一個(gè)新概念,確切的說,他算是介于GPT-3和GPT-4中間的一個(gè)彩蛋,而且,GPT-3已經(jīng)是現(xiàn)象級的AI產(chǎn)品了。
在ChatGPT之前,OpenAI推出了GPT-3,同樣是對人類語言的理解,GPT-3對比ChatGPT來說就顯得冰冷。后來,在GPT-3的基礎(chǔ)上,ChatGPT引入了人類偏好學(xué)習(xí)機(jī)制,讓他的回答更貼近人類,不僅如此,ChatGPT學(xué)會了糾正提問中的錯誤,并對一些敏感的問題做出回避。
在一些業(yè)內(nèi)人士看來,ChatGPT的出現(xiàn)對傳統(tǒng)的搜索引擎是一個(gè)沖擊。無論是谷歌還是百度,用的都是一套“推薦制”的搜索方式,而ChatGPT跳過了網(wǎng)頁瀏覽和整合這個(gè)步驟,直接給你一個(gè)答案,而這樣的搜索結(jié)果顯然更加效率,能大量節(jié)省用戶瀏覽和比對的時(shí)間。
更有人預(yù)言,ChatGPT會顛覆現(xiàn)在已有的產(chǎn)業(yè)業(yè)態(tài),就像當(dāng)年互聯(lián)網(wǎng)對線下商業(yè)的沖擊一樣。那么,事實(shí)真的如此嗎?這篇文章我們來好好聊一聊。
01 ChatGPT帶來了什么改變?
大約在6年前,一篇大名鼎鼎的論文《Attention Is All You Needed》正式發(fā)表,它第一次提出了注意力機(jī)制(Attention),并且在Attention的基礎(chǔ)上創(chuàng)造了一個(gè)全新的NLP(自然語言處理)模型Transformer。
Transformer是GPT和BERT的前身。谷歌和OpenAI在自然語言處理技術(shù)上的優(yōu)化,都是基于這個(gè)模型。
后來,從2018年開始,GPT技術(shù)基本上是一年迭代一次,所使用的參數(shù)量從初代GPT的1.17億,增加到GPT-3的1750億。優(yōu)化的背后,是OpenAI巨額的研發(fā)經(jīng)費(fèi)投入。據(jù)相關(guān)數(shù)據(jù)顯示,GPT-3訓(xùn)練一次的費(fèi)用是460萬美元,總訓(xùn)練成本達(dá)到了1200萬美元,不僅測試成本非常高,GPT技術(shù)對算力的要求也是目前AIGC技術(shù)領(lǐng)域最高的。
各項(xiàng)技術(shù)算力需求,圖源國盛證卷
與此同時(shí),在大算力的驅(qū)動下,AIGC生成的結(jié)果會更優(yōu)質(zhì),更效率。從第一代的GPT技術(shù)到現(xiàn)在的ChatGPT,如今的技術(shù)已經(jīng)可以讓AI跟人進(jìn)行自然的交流。因此,它也就具有了更多的應(yīng)用場景,比如搜索引擎、電商客服等。
有趣的是,最近大家都在擔(dān)憂谷歌會不會被ChatGPT替代掉的問題。關(guān)于這個(gè)問題,我們先來看一個(gè)應(yīng)用場景:我從旅游景點(diǎn)推薦的方向,分別問了ChatGPT這樣幾個(gè)問題,它給出的答案如下:
ChatGPT問答測試,圖源新眸自制
以往我們需要查找一項(xiàng)攻略的時(shí)候,需要經(jīng)歷四個(gè)步驟才能得到答案:輸入、檢索、整理、結(jié)果,而ChatGPT跳過了中間的兩個(gè)步驟,實(shí)現(xiàn)了從輸入到結(jié)果的新搜索方式。
總結(jié)起來,就是ChatGPT技術(shù)已經(jīng)可以替代部分的搜索引擎功能,大幅提高了用戶的檢索效率。再回到ChatGPT的核心技術(shù)上,GPT的全稱是生成式預(yù)訓(xùn)練模型(Generative Pre-Training Transformer),ChatGPT也就是在無監(jiān)督無標(biāo)記,這種更符合日常溝通的條件下,識別人的語言并進(jìn)行對話。
某種程度上,NLP技術(shù)的優(yōu)劣,決定了AI對人類意圖的理解能力,如果AI能理解人類的意圖,就能生產(chǎn)更符合人類需求、更優(yōu)質(zhì)的產(chǎn)品。
作為AIGC賽道上重要的一個(gè)階段,NLP技術(shù)的升級是整個(gè)AIGC技術(shù)更新的第一步。
ChatGPT在原來GPT的模型基礎(chǔ)上加入了人類反饋學(xué)習(xí)的機(jī)制,也就意味著,新的GPT技術(shù)將更好的理解人類的自然語言。
用建筑設(shè)計(jì)領(lǐng)域舉個(gè)例子,AIGC技術(shù)如果能完美的理解設(shè)計(jì)師的意圖,就能免去很多繁瑣和重復(fù)的工作,在提高效率的同時(shí),也能釋放勞動力的潛力,創(chuàng)作者可以逃離重復(fù)的工作,利用多余的時(shí)間進(jìn)行自我提升。
從GPT-1到如今的ChatGPT,在NLP技術(shù)上的優(yōu)化和迭代,讓AIGC技術(shù)有能力開拓更多的應(yīng)用場景。如果將優(yōu)化后的AIGC技術(shù)落實(shí)在企業(yè)應(yīng)用端,也會進(jìn)一步提高企業(yè)效率,釋放更多的人力成本。
AIGC應(yīng)用場景,圖源紅杉資本
02 焦慮是留給其余AI企業(yè)的
在技術(shù)圈和投資者們都為AIGC技術(shù)狂歡的同時(shí),感到焦慮的是大部分AI企業(yè)。對于AI賽道上的其他企業(yè)來說,OpenAI和它們之間已經(jīng)形成了很大的差距。
在ChatGPT發(fā)布之前,不是沒有人挑戰(zhàn)OpenAI的技術(shù)。
自從OpenAI發(fā)布了GPT-3并創(chuàng)開創(chuàng)了AIGC大算力的發(fā)展前景的時(shí)候,不少工程師開始研究對NLP過程進(jìn)行瘦身,在保證運(yùn)行效果不變的情況下,通過降低算力和參數(shù)量的需求,開發(fā)Transformer模型在應(yīng)用端的潛力,目的在于希望小企業(yè)也能有能力運(yùn)用NLP的新技術(shù),但其實(shí)這是比較難實(shí)現(xiàn)的,尤其是參數(shù)量的需求對于AIGC技術(shù)來說是剛需,越多的參數(shù)量,所產(chǎn)出的AIGC作品也就更優(yōu)質(zhì)。
就像一位分析師在李rumor公眾號中所提出的問題:“如果商用智能作為公司助手,你是會選擇高價(jià)但是能精準(zhǔn)提高效率的,還是低價(jià)但是準(zhǔn)確率只有70%-80%的產(chǎn)品呢?”從長期投資的角度來看,企業(yè)是會傾向更精準(zhǔn)的機(jī)器的。
最典型的例子是,在GPT-3發(fā)布之后不久,Meta AI推出了OPT技術(shù)。
OPT和GPT-3的運(yùn)行效果幾乎沒有什么區(qū)別,參數(shù)量也是很巧合的1750億。不僅如此,Meta AI還將OPT技術(shù)做了開源,提供給所有需要的企業(yè)和個(gè)人作為研發(fā)的基礎(chǔ)技術(shù)。
那么問題來了,推特上的一位數(shù)字科技的風(fēng)險(xiǎn)投資人Andrew Steinwold這樣評論GPT-4技術(shù),他說:“GPT-3需要1750億參數(shù),GPT-4明顯會擁有100萬億的參數(shù)量,你們想用GPT-4做出什么樣的東西來呀?”
也許GPT-3對參數(shù)和算力的要求還能被一些比較大的企業(yè)滿足,如果換做是參數(shù)量翻了幾百倍的GPT-4,能跑得動巨額參數(shù)的企業(yè)也只能是鳳毛麟角了。
AIGC未來對算力和規(guī)模的要求,對于進(jìn)入賽道尚且年輕的企業(yè)來說更是不可能超越的。某種意義上,OpenAI憑借著大規(guī)模和大算力,在同行和自己之間構(gòu)建了足夠厚的技術(shù)壁壘,而這份研發(fā)投入,是非常難超越的。在全球市場排在頭部的企業(yè)也就幾家,能做到微軟這個(gè)量級的企業(yè)就更少了。
這也是OpenAI開發(fā)GPT技術(shù)讓人感到害怕的地方。
對于AIGC這個(gè)賽道來說,算力、算法、數(shù)據(jù)都是促使它優(yōu)化的主要因素,而GPT技術(shù)的迭代升級,將大數(shù)據(jù)的重要性放到了一個(gè)空前的位置。在大算力、大投資、大規(guī)模的要求下,后來的AIGC企業(yè)想要做出更好的技術(shù),只會變得更難。
也有人會問,為什么國內(nèi)做不出ChatGPT這樣的產(chǎn)品?是創(chuàng)新力不夠嗎?其實(shí),創(chuàng)新力是一個(gè)因素,但不是全部。
03 我們距離ChatGPT還有多遠(yuǎn)?
我們從融資、科研投入、技術(shù)三個(gè)方面分別聊聊國內(nèi)的情況。
國內(nèi)企業(yè)有很多從事AIGC研究的企業(yè),例如盜夢師、TIAMAT等,但是國內(nèi)的投資人對AIGC的狂熱度遠(yuǎn)不及海外。在海外獨(dú)角獸公司Jasper和Stability AI在今年10月相繼獲得了1.25億美元和1.01億美元的融資后,國內(nèi)的AIGC企業(yè)目前只有TIAMAT完成了百萬美元的天使輪的融資。
先不看投資人的金錢實(shí)力,單憑投資邏輯,對于國內(nèi)投資市場來說,投資人更關(guān)心AIGC的商業(yè)化落地問題。百度集團(tuán)副總裁吳甜就曾針對AI的深度學(xué)習(xí)說過這樣的話:“深度學(xué)習(xí)技術(shù)已經(jīng)開始向多個(gè)行業(yè)進(jìn)行大規(guī)模地滲透推廣,但目前AI大生產(chǎn)仍處于起步階段?!边@也意味著,其實(shí)企業(yè)內(nèi)部也對AIGC的商業(yè)化程度不夠自信。
再比如PICO這樣的元宇宙系列產(chǎn)品,最近也面臨著銷售瓶頸,這樣的情況時(shí)國內(nèi)很多高科技企業(yè)都會面臨的問題,技術(shù)是好的,但落實(shí)在產(chǎn)品銷售上就賣的不好,從某種程度上也會抵消企業(yè)內(nèi)部對一個(gè)新產(chǎn)品的信心。
由于國內(nèi)的AI企業(yè)在核心技術(shù)門檻上并不具備先天的優(yōu)勢,如果想實(shí)現(xiàn)凈利潤的提升,最終總會走向技術(shù)商業(yè)化。筆者此前針對科大訊飛的商業(yè)模式做過一些了解,對于科大訊飛來說,語音技術(shù)門檻被突破,單純做技術(shù)不能賺錢的話,它會先選擇賣產(chǎn)品掙錢,先將技術(shù)在產(chǎn)品端落地了,有一份收入來源,剩下的就邊走邊看。
在這樣的邏輯下,國內(nèi)AI企業(yè)就會更關(guān)注一項(xiàng)技術(shù)能不能實(shí)現(xiàn)快速實(shí)現(xiàn)商業(yè)化,是否可以在產(chǎn)品端落實(shí)之后帶來收益。
但是OpenAI的思路明顯和國內(nèi)的大部分企業(yè)都不一樣,OpenAI之前獲得了微軟的20億投資,進(jìn)行GPT的開發(fā)。GPT-4技術(shù)需要的大算力和大規(guī)模,顯然在近幾年是不能回本的。光是GPT-3在測試階段就花出去了千萬美金,作為算力要求翻了幾百倍的GPT-4技術(shù),在開銷方面也只會成百倍的增加。
總結(jié)起來,這也是國內(nèi)外科研邏輯的不同。相比國外,國內(nèi)更追求商業(yè)產(chǎn)品的落地,投資人在對一些概念性的產(chǎn)品進(jìn)行投資時(shí)也更加謹(jǐn)慎。然而,在大算力的新競爭生態(tài)下,融資投入的增加對于AIGC企業(yè)來說非常重要。
其次,是研發(fā)人員待遇的問題,根據(jù)市場調(diào)研數(shù)據(jù),國內(nèi)的企業(yè)研發(fā)人員相比于美國的企業(yè),收入更依賴工齡和學(xué)歷。
中美兩國研發(fā)人員收入對比,圖源OECD
最后從國內(nèi)AIGC相關(guān)的技術(shù)發(fā)展方面,根據(jù)Gartner數(shù)據(jù)統(tǒng)計(jì),國內(nèi)的數(shù)字化技術(shù)還集中在發(fā)展階段。而美國的大部分技術(shù)都已經(jīng)可以平穩(wěn)發(fā)展。還有一個(gè)現(xiàn)象就是,在國內(nèi)很多技術(shù)就算發(fā)展了5-10年也還是分布在創(chuàng)新孵化階段,然而美國的很多技術(shù)在發(fā)展了1-2年后就能進(jìn)入成熟階段。從這個(gè)個(gè)統(tǒng)計(jì)結(jié)果來看,美國的企業(yè)相比于國內(nèi),研發(fā)效率明顯更高。
綜上來看,國內(nèi)企業(yè)想要發(fā)展AIGC技術(shù),首先要解決的就是資金問題。按照國內(nèi)高科技投資的邏輯,AIGC技術(shù)在獲得大量融資前,應(yīng)該先讓投資者看到它的應(yīng)用前景。但是現(xiàn)在的AIGC賽道,雖然應(yīng)用場景很多,但是商業(yè)前景還不夠明朗。
04 談?wù)凙IGC這門生意
實(shí)際上,盡管AIGC的技術(shù)一直在迭代升級,AIGC的商業(yè)化推進(jìn)其實(shí)是困難的。首先,AIGC對于算力的要求越來越大,不是一般企業(yè)可以負(fù)擔(dān)的起的,也只有一些大的B端企業(yè)可以負(fù)擔(dān)AIGC的大規(guī)模和大運(yùn)算需求,這樣一來將來能使用AIGC技術(shù)做應(yīng)用的公司并不多。
其次,AIGC的應(yīng)用路線還很模糊,就拿搜索引擎這一應(yīng)用場景來說,ChatGPT還不足以取代傳統(tǒng)的搜索引擎。
網(wǎng)絡(luò)上關(guān)于ChatGPT擊敗傳統(tǒng)搜索引擎的論調(diào)很多,我們回到前文提到的旅游推薦的應(yīng)用場景去說,當(dāng)我提問ChatGPT能不能給我一些旅游建議的時(shí)候,它直接給出了答案,搜索效率是提上去了,但是這個(gè)答案一定就是我需要的嗎?未必。
比如,我問它圣誕節(jié)倫敦有哪些值得去的地方。它給我列出了5個(gè)城市,現(xiàn)實(shí)的情況是,英國的圣誕活動各地都有,它直接給我列出的5個(gè)城市,一定程度上也減少了我的選擇。
ChatGPT現(xiàn)在的問題在于,他給出的答案往往是大眾性質(zhì)的、普適化的,而非個(gè)性化的。
在用戶剛開始做檢索的時(shí)候,大部分情況下對自己的需求是沒有很明確的認(rèn)知的。而在使用傳統(tǒng)瀏覽器的時(shí)候,往往是在檢索過程中才能進(jìn)一步縮小自己的需求范圍,而ChatGPT是直接將用戶能看到的答案范圍進(jìn)行了縮減,它給出的答案是正確的,但不一定就是最合適用戶的。
就現(xiàn)在的情況看,AIGC的應(yīng)用前景并不明朗,盡管AIGC可以運(yùn)用在多種場景中,但好的技術(shù),不一定能在商業(yè)上迅速落地。
盡管OpenAI用錢燒出了GPT技術(shù)的迭代,但是這一做法也有它的市場局限性,在大算力的要求下,沒有多少企業(yè)可以承擔(dān)得起GPT-3 的運(yùn)作,就算是面向大眾測試的ChatGPT,它的參數(shù)量要求也很大,將來如果運(yùn)用在B端市場,對于多數(shù)的企業(yè)來說是個(gè)不小的負(fù)擔(dān)。ChatGPT的出現(xiàn)也只是AIGC的一次技術(shù)迭代升級罷了,它的應(yīng)用前景還不明朗,現(xiàn)在就談到勞動力替代和技術(shù)壟斷,還太早了。