文|Alter
ChatGPT走紅的速度,顯然超過了許多人的預(yù)期。
即使是在中文互聯(lián)網(wǎng)上,和ChatGPT有關(guān)的報道、討論,早已超過了其他科技概念,甚至萌生出了“ChatGPT概念股”的說法,不少與AI、大模型、NLP相關(guān)的中概股,短期內(nèi)的漲幅“意外”達到了50%以上。
每一次有“科技大事件”上演時,都有人蠢蠢欲動,有人借勢起風(fēng),ChatGPT掀起的浪潮似乎也是如此。
可當(dāng)我們在討論ChatGPT的時候,到底在討論什么?顛覆式創(chuàng)新的技術(shù)洗禮,抑或是對人工智能前景的樂觀,還是在潛移默化中被有心人帶了風(fēng)向。厘清這些問題的答案,遠比討論ChatGPT本身更有價值。
01 一場自上而下的“出圈”
和2016年的AlphaGo一樣,ChatGPT的“火”也呈現(xiàn)出了自上而下的軌跡。
答案就隱藏在一篇篇10W+的爆款文章中。和ChatGPT相關(guān)的文章可謂盈千累萬,除了大批科技和財經(jīng)類自媒體的分析與報道,就連旅游博主們都開始以ChatGPT為主題,而且內(nèi)容特別貼地氣:
大多是博主與ChatGPT的對話截圖,其中問題本身就相當(dāng)有話題性,截取的問答同樣吸引眼球,再稍微關(guān)聯(lián)下AI取代人的宏大話題,以及可能存在的應(yīng)用場景,短時間即可炮制出一篇大眾喜聞樂見的文章。
追熱點向來是自媒體們的“天職”,以爆紅的ChatGPT為題也無可厚非,問題恰恰出現(xiàn)在信息的不對稱上。
從2022年11月底上線運營,到2023年1月末的上億月活,ChatGPT用兩個月的時間就刷新了用戶增長的歷史記錄。只是在注冊體驗ChatGPT嘗鮮過程中,對中文互聯(lián)網(wǎng)的用戶相當(dāng)不友好。
想要打開OpenAI的網(wǎng)址,前提是有“科學(xué)上網(wǎng)”的工具,而且ChatGPT并未對中國開放注冊,必須要用海外的手機用來接收驗證碼……可以說人為增加了重重壁壘。在這樣的注冊機制下,和ChatGPT“暢聊”的國內(nèi)網(wǎng)民注定是“少數(shù)派”,大多數(shù)網(wǎng)民對ChatGPT的理解,是從別人口中“聽”來的。
正是在這樣的語境下,ChatGPT的“神奇能力”被不斷放大。個中原因離不開人們對對話式機器人的特殊情愫。
無論是誕生于2014年的微軟小冰,以“智能助手”自居的Siri,還是主打語音交互的智能音箱,都曾吸引無數(shù)人的好奇心,在特定時間內(nèi)引發(fā)了現(xiàn)象級的討論。畢竟早在上個世紀(jì)初,圖靈就提出“對話”是測試機器是否有人類智慧的有效場景。
沿循類似的邏輯,ChatGPT的“出圈”是注定的結(jié)果。背靠千億級大模型GPT-3,ChatGPT的自然語言理解能力遠超早期的微軟小冰和Siri,和用戶對話時不會根據(jù)一兩個關(guān)鍵詞機械地輸出結(jié)果,而是理解用戶的“語義”,輸出的準(zhǔn)確性和關(guān)聯(lián)性不可同日而語,并在很大程度上刷新了人們的認知。
然而目前的ChatGPT還是大規(guī)模離線語料進行訓(xùn)練的版本:無法將即時信息納入自己的回答中;經(jīng)常給出一些看似合理但不正確的答案;對話中涵蓋的因果關(guān)系,仍缺乏很好的理解能力;缺少人類舉一反三的能力......并不能像朋友一樣自由對話。
陰謀論一些的話,在ChatGPT走紅的這些日子里,并不缺少一些“炒作”的痕跡。比如讓人摸不著頭腦的“ChatGPT概念股”,至今還沒看到哪家中概股與OpenAI開展合作,所謂的概念股,多半是在蹭文本生成、信息抽取、知識抽取、機器問答等技術(shù)的熱度,屬于典型的“借事說事”。
而就當(dāng)前的態(tài)勢來看,ChatGPT的熱度還將持續(xù)一段時間,但被刻意營造的期待值,就像是鼓吹起來的氣泡,再美麗也有被刺破的一天。與其去討論ChatGPT的短期效應(yīng),不如將視角放在對行業(yè)的長期影響上。
02 ChatGPT的偶然與必然
或許ChatGPT的“躥紅”有些偶然因素,可類似產(chǎn)品的出現(xiàn)卻是必然的結(jié)果。
可以佐證的是,在ChatGPT熱度空前的局面下,競品們正在加速追趕:谷歌CEO 桑達爾·皮查伊在2月7日凌晨宣布將推出一款名為 Bard 的實驗性對話 AI 服務(wù),并將在幾周內(nèi)向部分開發(fā)者開放。
幾乎和谷歌同一時間,百度官宣將推出類似ChatGPT的人工智能聊天機器人,項目名字被命名為“文心一言”,英文名“ERNIE Bot”,預(yù)計在3月份完成公測,或?qū)⒅苯咏尤氚俣人阉飨蚬婇_放。
人工智能初創(chuàng)公司元語智能連忙推出了功能型對話產(chǎn)品 ChatYuan;阿里達摩院牽頭的類ChatGPT對話機器人被曝正處于內(nèi)測階段;昆侖萬維宣布將與奇點智源合作年內(nèi)發(fā)布中國版類 ChatGPT 代碼開源……還有更多產(chǎn)品在官宣的路上,不排除會出現(xiàn)畫虎不成反類犬的尷尬場面。
一種流行的解釋是:ChatGPT將取代搜索引擎。其中被引用最多的Gmail創(chuàng)建者之一Paul Buchheit的觀點:“像ChatGPT這種AI聊天機器人將摧毀谷歌,就像當(dāng)年搜索引擎徹底干掉黃頁電話簿一樣,時間上就是這一兩年。”內(nèi)在的商業(yè)邏輯在于,一旦搜索引擎確定的信息檢索方式被顛覆,整個互聯(lián)網(wǎng)商業(yè)都將重新洗牌,沒有哪家互聯(lián)網(wǎng)巨頭想要錯過在新格局中占有一席之地的可能。
或許還有另外一種解釋,即ChatGPT的誕生是一種方向性的探索。OpenAI率先驗證了對話AI的可行性,然后谷歌、百度等快速跟進。之所以能夠在短時間內(nèi)推出類似ChatGPT的產(chǎn)品,原因還要從大模型說起。
時間撥回到2017年,當(dāng)時還在谷歌任職的Ashish Vaswani等人提出了Transformer架構(gòu),讓深度學(xué)習(xí)的參數(shù)達到了上億的規(guī)模;2018年谷歌推出了基于Transformer的雙向深層預(yù)訓(xùn)練模型Bert,參數(shù)首次超過了3億規(guī)模;OpenAI同年提出了生成式預(yù)訓(xùn)練Transformer模型GPT,進一步推動了大模型的發(fā)展。
但直到2020年,大模型才真正進入到大眾視野,誘因正是著名的GPT-3,擁有1750億個參數(shù)量,是傳統(tǒng)深度學(xué)習(xí)小模型的一萬倍以上,同時讓外界看到了“大力出奇跡”的一幕:常見小模型需要對不同的任務(wù)使用不同模型分別訓(xùn)練解決,而GPT-3先使用海量數(shù)據(jù)預(yù)訓(xùn)練大模型,然后將模型參數(shù)初始化后再進行訓(xùn)練,實現(xiàn)了作詩、聊天、答題、翻譯、寫代碼等一系列能力。
一場千億級大模型的軍備競賽由此拉開帷幕。
僅在2021年,國內(nèi)的華為、智源、浪潮、阿里云、百度等企業(yè)先后發(fā)布了自家的大模型產(chǎn)品,而后不斷從NLP延伸出了雙語、CV、跨模態(tài)等大模型。據(jù)OpenBMB開源社區(qū)的統(tǒng)計,目前全球超千億參數(shù)的大模型中,中國貢獻了1/3,美國貢獻了1/2,世界其他國家或組織貢獻了剩下的1/6。和歷史上的許多次“軍備競賽”一樣,耗費了大量真金白銀的大模型,最終也需要找到一個商業(yè)化出口。
有趣的地方在于,不管是GPT-3,還是ChatGPT,OpenAI兩次站在了新舊交替的臨界點上,第一次掀起了大模型熱,讓全球科技大廠們冒險一試,這一次能為大模型的商業(yè)化帶來生機嗎?
03 大模型商業(yè)化的“火炬”
大模型的性能表現(xiàn)不可謂不性感,代價則是訓(xùn)練大模型非常燒錢。
根據(jù)公開數(shù)據(jù)顯示,GPT-3訓(xùn)練的硬件和電力成本高達1200萬美元;谷歌在訓(xùn)練包含5400 億參數(shù)的 PaLM 時用了6144塊TPU……坊間由此出現(xiàn)了對盲目“煉大模型”的質(zhì)疑,資本市場因為大模型的應(yīng)用問題遲遲不肯下注,“多才多藝,身兼多職”的大模型們距離“生存危機”越來越近。
并非是大模型缺少商業(yè)化故事。按照大規(guī)模預(yù)訓(xùn)練的思路,大模型+細分場景微調(diào)在某種程度上給出了人工智能在長尾場景落地的最優(yōu)解,而且在小樣本訓(xùn)練的情況下,大模型也有著比較好的提升。
大模型也不缺少落地的場景。AIGC在2022年就已經(jīng)走紅,投資機構(gòu)紅杉在2022年發(fā)布的一篇分析文章中特意提到,生成式AI有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟價值,進一步增強了相關(guān)創(chuàng)業(yè)者的信心。
可在2023年以前,很少看到資本市場對大模型的關(guān)注,僅有智譜AI等為數(shù)不多的企業(yè)拿到了融資,與之形成鮮明對比的是,AIGC賽道里初創(chuàng)企業(yè)早已是資本寵兒。資本寧愿在應(yīng)用層的AIGC賽道試錯,也不愿燒錢給大模型。
誠如熊彼特在《經(jīng)濟發(fā)展理論》中的觀點:資本是創(chuàng)新的杠桿。倘若只是企業(yè)和研究院在花大價錢“煉”大模型,缺少資本產(chǎn)生的杠桿作用,大模型的價值和應(yīng)用場景恐怕很難脫離“學(xué)術(shù)”二字。
ChatGPT的出圈就像是一把火炬,不但徹底吸引了外界的注意力,也可能為大模型的商業(yè)化照亮方向。
直接的例子就是微軟“反常行為”。先是100億美元投資OpenAI,而后宣布將ChatGPT融入旗下全線產(chǎn)品,比爾?蓋茨和納德拉頻頻為ChatGPT站臺,再到ChatGPT版的必應(yīng)和Edge瀏覽器,甚至裁撤工業(yè)元宇宙部門為ChatGPT讓路,儼然擺出了一副All in AI的新姿態(tài)。微軟的真實動機還不得而知,映射到外界眼中的卻是:微軟正在開啟AI的商用之戰(zhàn),大模型迎來了商業(yè)化元年。
OpenAI也在不斷釋放好消息:2月1日宣布推出付費訂閱版ChatGPT Plus,每個月向用戶收取20美元的費用;同時OpenAI預(yù)計2023年的收入將達到2億美元,2024年收入有望超過10億美元。
其實早在2020年的時候,OpenAI就已經(jīng)開始為商業(yè)化謀局,GPT-3不再完全開源代碼,但提供了商用API,允許開發(fā)者調(diào)用大模型的部分能力,并逐步為Dall·E2、Whisper等大模型開放了API接口??蛻粽{(diào)用OpenAI的API,以獲取圖像、語言、代碼生成等能力,進而趕上AIGC的順風(fēng)車,OpenAI從中收取接口費,初步形成了模型研發(fā)、應(yīng)用開發(fā)到消費的完整產(chǎn)業(yè)鏈。
故事講到這里,似乎讓人看到了大模型的可觀前景:當(dāng)國內(nèi)大大小小的互聯(lián)網(wǎng)企業(yè)爭相推出各種版本的ChatGPT時,勢必會將注意力盯向提供底層能力的大模型,為國內(nèi)的大模型市場注入一股活水。
再樂觀一些的話,即便ChatGPT的潮水會褪去,只要在不斷地試錯中摸索出大模型的商業(yè)化路徑,資本的注意力終將會聚集到底層技術(shù)上,并將注意力轉(zhuǎn)變?yōu)樵丛床粩嗟耐顿Y,賦予大模型可持續(xù)的驅(qū)動力量。
04 寫在最后
現(xiàn)實的殘酷在于,新物種崛起的時候,會習(xí)慣性吹起一層層泡沫,特別是在過去幾年中,泡沫被戳破的時間周期越來越短。
2021年初爆火的Clubhouse,故事在一個多季度后就宣告“破產(chǎn)”;2022年初的元宇宙,下半年就被AIGC搶去了風(fēng)頭;ChatGPT引起的新風(fēng)口,會是一個例外嗎?就情感上而言,我們希望ChatGPT帶來的是一場熊熊烈火,引燃人工智能的產(chǎn)業(yè)革命。
可惜當(dāng)前的所有設(shè)想,都還建立在理想的假設(shè)上,現(xiàn)實中仍存在太多的不確定性,還需要跨越一座又一座山丘。