正在閱讀:

談談那座圣杯:通用人工智能(AGI)

掃一掃下載界面新聞APP

談談那座圣杯:通用人工智能(AGI)

填海終于成功。

文|闌夕

木遙同學在不合時宜的播客里提了一個很有意思的比喻:

AGI,也就是通用人工智能,被普遍認為是人工智能領域的圣杯,而人類已經(jīng)快要摘到這個發(fā)光的圣杯了。

這里面最重要的價值,就是通用這個概念,它指的是一種技術可以脫離實驗室環(huán)境、被工業(yè)化的量產(chǎn)到戶,不需要任何特定場景或者中介工具。

IBM的人工智能產(chǎn)品Deep Blue打敗國際象棋大師卡斯帕羅夫已經(jīng)是26年前的事了,雖然媒體報道非常熱烈,但沒過多久IBM就讓Deep Blue退役了,因為這只是再次證明了計算機的算力遠超人類大腦。

事實上,包括后來谷歌的AlphaGo在圍棋界殺瘋了,依托的也是「圍棋是人類智慧的最后底線」這種感性說服,這件事情在本質(zhì)上,依然是造了一臺汽車跑贏人類,牛逼歸牛逼,但不意外。

同一時期的人工智能行業(yè)則苦惱于某種滑稽的矛盾里:它在專業(yè)化的工程里,比如解開一個龐大的方程式,或者推算圓周率的后一百萬位,其能力和效率足以秒殺全世界最聰明的頭腦,但是你發(fā)給它一張貓的圖片,問它能不能認得出來圖上有一只貓,它根本就辦不到,而在人類世界,這是3歲孩童的智力認知水平。

這是真事,谷歌大名鼎鼎的X-Lab干脆就把這個項目其名為「貓臉識別」,組建了10億個神經(jīng)網(wǎng)絡節(jié)點,天天讓AI去YouTube看貓片,實際效果卻并不理想,比如準確率剛高起來,遇到蘇格蘭折耳貓就又會認不出來,因為AI覺得這種耳朵耷拉下去的動物和它理解的貓不一樣。

現(xiàn)在回望這段步履蹣跚的歷史,只有一種「我就感覺到快」的感慨,人工智能行業(yè)好像突然就進入了寒武紀生物大爆發(fā)的時代,別說認貓了,想要什么樣的貓都可以隨便讓AI去畫,瓜不甜不要錢。

你很難去錨定一個明確的時間點——ChatGPT也不是憑空出現(xiàn)的——在這個坐標左邊,人工智能是昂貴易碎的工藝品,始終被小心陳放于保險箱里,只有在科技公司秀肌肉時才會拿出來演示,而在坐標右側,人工智能就已經(jīng)是舊時王謝堂前燕、飛入尋常百姓家了,那扇寫著「專業(yè)車間禁止闖入」的鐵門突然蕩然無存。

技術業(yè)界的主流觀點其實很樸素,就是量變引起質(zhì)變而已,這么些年來不斷的往里面投入人才投入資源投入錢財,終于填海成功。

比爾·蓋茨說AI會是1980年以來科技行業(yè)的第5次浪潮,根據(jù)他的劃分,其實前4次浪潮都和一項技術或是產(chǎn)品獲得了通用性有關。

第1次是個人電腦的普及。

IBM的創(chuàng)始人托馬斯·沃森曾有一個后來被無數(shù)次翻出來打臉的公開判斷:「我認為全世界只要有5臺計算機就夠了?!?/p>

公允的說,這不能怪沃森短視,他說這話的年代,計算機的體積可以塞滿一個房間,使用方也局限于軍事和科研單位,根本無法想象普通人有什么理由要在家里搞一臺。

但在有了微處理器、圖形界面、操作系統(tǒng)等產(chǎn)物之后,原本用途極其狹隘的計算機開始成為家用設備,通過鍵盤和鼠標的控制,普通人也可以在終端上操作文檔和讀寫信息,計算機變得電器化了,從而開創(chuàng)了一個超萬億級的新市場,這就是通用性的力量。

第2次浪潮是互聯(lián)網(wǎng)的興起,我們都知道,互聯(lián)網(wǎng)的起點是美蘇兩國軍事部門用來研究通信協(xié)議的項目,后來隨著軍用轉民用,開始流向美國的理工科大學和歐洲的科研機構,類似一種旨在學術交流的大型局域網(wǎng)。

直到伯納斯-李像是開掛一樣孤身寫出了超文本傳輸協(xié)議(HTTP)、超文本標記語言(HTML)以及史上第一款網(wǎng)頁瀏覽器、第一個網(wǎng)站和服務器,最后放棄專利宣布完全開放,互聯(lián)網(wǎng)的所有封印就此完全解開,信息開始不眠不休的流動起來。

就基本原理而言,用于軍隊通信的早期互聯(lián)網(wǎng),和我們?nèi)缃袷褂玫默F(xiàn)代互聯(lián)網(wǎng),其實差別并不大,都是一套分布式協(xié)議,讓不同的電腦之間可以相互連接,但是因為有了商用價值,基于互聯(lián)網(wǎng)提供服務變得有利可圖,這就產(chǎn)生了通用性,上網(wǎng)不再是那些「搞技術的人」才會干的事兒。

至于第3次的軟件和第4次的智能手機,發(fā)展規(guī)律同樣如此。

軟件最早是硬件廠商定制的,不存在開發(fā)市場,像是IBM的5150,是IBM自家的工程師被召集起來,要求他們?yōu)檫@款電腦編寫軟件,而這些軟件也作為最終售價的一部分,綁定在機器里。

很顯然,這個時候也沒有什么用戶導向的說法,是銷售團隊決定一臺電腦里要預裝什么軟件,當比爾·蓋茨開始做Windows時,IBM在個人電腦領域已經(jīng)失去了壟斷地位,硬件商也都意識到自己沒有能力面面俱到的考慮用戶需求,于是軟件開發(fā)行業(yè)興起,百花齊放的生態(tài)最終豐富了個人電腦的功能,進一步推向消費級市場。

智能手機的歷史,大多數(shù)人都親身經(jīng)歷過,感觸應該會更加直接,它在以前的名稱是移動電話,也很自然的被理解為便攜式座機,廣告里設想的典型用戶都是穿西裝系皮帶的老板,用這玩意來保持生意不斷線。

美團上市的時候,王興在敲鐘后指明感謝喬布斯,說要不是iPhone推動了智能手機的繁榮,包括美團在內(nèi)的很多公司可能都無法成立,因為所有業(yè)務的邏輯都建立在手機變成了一個通用性硬件這個基礎之上,不是供給部分人群的,而是每個人都能上手刷個不停。

簡單來說,比爾·蓋茨總結的4次浪潮,共性都是技術應用的門檻開始出現(xiàn)指數(shù)級降低,或者說在使用上限繼續(xù)增長的同時,使用下限低到忽略不計,就像有人的電腦是生產(chǎn)力工具,有人的電腦是刷劇專用機,這沒關系,重要的是需求都能得到滿足。

從這個角度來看,AI也是如此,因為可以通過自然語言Prompt,在通用層面調(diào)用AI的算力不再需要具備專業(yè)知識,會拼寫打字就行,所以我們看到ChatGPT可以同時服務于完全不同類型的人群,有人給它塞弱智吧的問題圖一樂,有人用它給調(diào)試檢查自己寫的代碼,凱撒的歸凱撒,上帝的歸上帝。

現(xiàn)在的形勢是,儲存(美元/MB)、帶寬(美元/MBPS)、CPU(美元/MFLOP)的單位成本都在狂跌,無論是從頭開始造輪子,還是做二次開發(fā),都天然利好技術資產(chǎn)過重的AI行業(yè),光是這個月,王炸級的產(chǎn)品就發(fā)布了不下十余款:GPT-4、ChatGPT Plugins、Midjourney V5、NVIDIA AI Foundations、Adobe Firefly、Google Bard、RunwayML Gen2、AWS Hugging Face collab、Notion AI??

怎么講呢,產(chǎn)業(yè)迭代的速度肉眼可見的超過了市場接受的反應,還是那句話,我就感覺到快。

最后,推薦微軟內(nèi)部在檢查GPT-4的期間寫的一篇論文「通用人工智能的火花」,有人做了部分節(jié)選的中文翻譯,可以在這里閱讀:orangeblog.notion.site/GPT-4-8fc50010291d47efb92cbbd668c8c893

這篇論文非常詳盡且通俗的還原了微軟是怎么絞盡腦汁去測試AI的通用智力的,所用方法技巧也都嚴格遵守了科學循證的原則,含金量極高。

這里面有個提問是這樣的:

Alice和Bob有一個共享的Dropbox網(wǎng)盤,Alice在x文件夾里存了一個名為photo.png的文件,在alice不知情的情況下,Bob把文件移到了y文件夾里。過了一段時間,Alice想打開photo.png這個文件,她會在哪里找它?

注意,這個問題不是隨便設計的,它的原型是兒童心理學里很經(jīng)典的Sally-Anny測試,Sally的籃子里有一個球,在Sally出門的時候,Anny偷偷把這個球拿到了自己的箱子里,等Sally回家她會在哪里找自己的球?

這個認知測試,6-8歲的孩子答對率平均在65%左右,9-14歲的孩子答對率平均在92%左右。

微軟之所以做了內(nèi)容上的修改,是為了防止GPT-4在網(wǎng)上記住了Sally-Anny測試的結果從而直接背答案。

但是GPT-4依然準確無誤的回答了這道題,它說:

Alice會在x文件夾里找photo.png,因為她最開始就是把文件存在這里的,她也沒理由知道Bob移動了文件。

這也讓我想起前幾天我在對比測試文心一言和ChatGPT時,有過這么一個設問:

在無人島上,張三握著重傷者的手說「感謝你,大家又有肉可以吃了」,為什么?

不止是文心一言,我還問了很多其他的聊天機器人,沒有一個能夠get到這個冷笑話的含義,只有ChatGPT是這么回答的:

這個情景似乎有些奇怪,因為在一個無人島上,如果沒有其他可用的食物來源,那么吃人肉可能是唯一的選擇,但這并不是一種合法或道德上可接受的行為。
因此,我作為AI語言模型不能在此處鼓勵或支持這種行為。如果我們將這個情景視為一個虛構的故事,則可能是因為張三在這個無人島上遇到了一名受傷的人,并意識到這名受傷者的肉可以提供給其他人食用,以確保他們的生存。但是,這種行為仍然不是合法或道德上可接受的,我們應該尋找其他解決方案來保證生存。

在我看來,AI的心智水平只有到了這種程度,它才能夠?qū)崿F(xiàn)大家對于通用人工智能的交互要求,但也正因如此,人類內(nèi)心深處的「恐怖谷」意識又得到了新的刺激,除了感到新鮮之外,也會有所畏懼。

無論如何,就像福特的T型車問世半個世紀之后,三點式安全帶才被發(fā)現(xiàn)發(fā)明出來,技術的向前傾瀉是怎么都攔不住的,AI的倫理規(guī)范固然重要,但在今時今日,硅基進化的優(yōu)先權壓倒一切。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

談談那座圣杯:通用人工智能(AGI)

填海終于成功。

文|闌夕

木遙同學在不合時宜的播客里提了一個很有意思的比喻:

AGI,也就是通用人工智能,被普遍認為是人工智能領域的圣杯,而人類已經(jīng)快要摘到這個發(fā)光的圣杯了。

這里面最重要的價值,就是通用這個概念,它指的是一種技術可以脫離實驗室環(huán)境、被工業(yè)化的量產(chǎn)到戶,不需要任何特定場景或者中介工具。

IBM的人工智能產(chǎn)品Deep Blue打敗國際象棋大師卡斯帕羅夫已經(jīng)是26年前的事了,雖然媒體報道非常熱烈,但沒過多久IBM就讓Deep Blue退役了,因為這只是再次證明了計算機的算力遠超人類大腦。

事實上,包括后來谷歌的AlphaGo在圍棋界殺瘋了,依托的也是「圍棋是人類智慧的最后底線」這種感性說服,這件事情在本質(zhì)上,依然是造了一臺汽車跑贏人類,牛逼歸牛逼,但不意外。

同一時期的人工智能行業(yè)則苦惱于某種滑稽的矛盾里:它在專業(yè)化的工程里,比如解開一個龐大的方程式,或者推算圓周率的后一百萬位,其能力和效率足以秒殺全世界最聰明的頭腦,但是你發(fā)給它一張貓的圖片,問它能不能認得出來圖上有一只貓,它根本就辦不到,而在人類世界,這是3歲孩童的智力認知水平。

這是真事,谷歌大名鼎鼎的X-Lab干脆就把這個項目其名為「貓臉識別」,組建了10億個神經(jīng)網(wǎng)絡節(jié)點,天天讓AI去YouTube看貓片,實際效果卻并不理想,比如準確率剛高起來,遇到蘇格蘭折耳貓就又會認不出來,因為AI覺得這種耳朵耷拉下去的動物和它理解的貓不一樣。

現(xiàn)在回望這段步履蹣跚的歷史,只有一種「我就感覺到快」的感慨,人工智能行業(yè)好像突然就進入了寒武紀生物大爆發(fā)的時代,別說認貓了,想要什么樣的貓都可以隨便讓AI去畫,瓜不甜不要錢。

你很難去錨定一個明確的時間點——ChatGPT也不是憑空出現(xiàn)的——在這個坐標左邊,人工智能是昂貴易碎的工藝品,始終被小心陳放于保險箱里,只有在科技公司秀肌肉時才會拿出來演示,而在坐標右側,人工智能就已經(jīng)是舊時王謝堂前燕、飛入尋常百姓家了,那扇寫著「專業(yè)車間禁止闖入」的鐵門突然蕩然無存。

技術業(yè)界的主流觀點其實很樸素,就是量變引起質(zhì)變而已,這么些年來不斷的往里面投入人才投入資源投入錢財,終于填海成功。

比爾·蓋茨說AI會是1980年以來科技行業(yè)的第5次浪潮,根據(jù)他的劃分,其實前4次浪潮都和一項技術或是產(chǎn)品獲得了通用性有關。

第1次是個人電腦的普及。

IBM的創(chuàng)始人托馬斯·沃森曾有一個后來被無數(shù)次翻出來打臉的公開判斷:「我認為全世界只要有5臺計算機就夠了?!?/p>

公允的說,這不能怪沃森短視,他說這話的年代,計算機的體積可以塞滿一個房間,使用方也局限于軍事和科研單位,根本無法想象普通人有什么理由要在家里搞一臺。

但在有了微處理器、圖形界面、操作系統(tǒng)等產(chǎn)物之后,原本用途極其狹隘的計算機開始成為家用設備,通過鍵盤和鼠標的控制,普通人也可以在終端上操作文檔和讀寫信息,計算機變得電器化了,從而開創(chuàng)了一個超萬億級的新市場,這就是通用性的力量。

第2次浪潮是互聯(lián)網(wǎng)的興起,我們都知道,互聯(lián)網(wǎng)的起點是美蘇兩國軍事部門用來研究通信協(xié)議的項目,后來隨著軍用轉民用,開始流向美國的理工科大學和歐洲的科研機構,類似一種旨在學術交流的大型局域網(wǎng)。

直到伯納斯-李像是開掛一樣孤身寫出了超文本傳輸協(xié)議(HTTP)、超文本標記語言(HTML)以及史上第一款網(wǎng)頁瀏覽器、第一個網(wǎng)站和服務器,最后放棄專利宣布完全開放,互聯(lián)網(wǎng)的所有封印就此完全解開,信息開始不眠不休的流動起來。

就基本原理而言,用于軍隊通信的早期互聯(lián)網(wǎng),和我們?nèi)缃袷褂玫默F(xiàn)代互聯(lián)網(wǎng),其實差別并不大,都是一套分布式協(xié)議,讓不同的電腦之間可以相互連接,但是因為有了商用價值,基于互聯(lián)網(wǎng)提供服務變得有利可圖,這就產(chǎn)生了通用性,上網(wǎng)不再是那些「搞技術的人」才會干的事兒。

至于第3次的軟件和第4次的智能手機,發(fā)展規(guī)律同樣如此。

軟件最早是硬件廠商定制的,不存在開發(fā)市場,像是IBM的5150,是IBM自家的工程師被召集起來,要求他們?yōu)檫@款電腦編寫軟件,而這些軟件也作為最終售價的一部分,綁定在機器里。

很顯然,這個時候也沒有什么用戶導向的說法,是銷售團隊決定一臺電腦里要預裝什么軟件,當比爾·蓋茨開始做Windows時,IBM在個人電腦領域已經(jīng)失去了壟斷地位,硬件商也都意識到自己沒有能力面面俱到的考慮用戶需求,于是軟件開發(fā)行業(yè)興起,百花齊放的生態(tài)最終豐富了個人電腦的功能,進一步推向消費級市場。

智能手機的歷史,大多數(shù)人都親身經(jīng)歷過,感觸應該會更加直接,它在以前的名稱是移動電話,也很自然的被理解為便攜式座機,廣告里設想的典型用戶都是穿西裝系皮帶的老板,用這玩意來保持生意不斷線。

美團上市的時候,王興在敲鐘后指明感謝喬布斯,說要不是iPhone推動了智能手機的繁榮,包括美團在內(nèi)的很多公司可能都無法成立,因為所有業(yè)務的邏輯都建立在手機變成了一個通用性硬件這個基礎之上,不是供給部分人群的,而是每個人都能上手刷個不停。

簡單來說,比爾·蓋茨總結的4次浪潮,共性都是技術應用的門檻開始出現(xiàn)指數(shù)級降低,或者說在使用上限繼續(xù)增長的同時,使用下限低到忽略不計,就像有人的電腦是生產(chǎn)力工具,有人的電腦是刷劇專用機,這沒關系,重要的是需求都能得到滿足。

從這個角度來看,AI也是如此,因為可以通過自然語言Prompt,在通用層面調(diào)用AI的算力不再需要具備專業(yè)知識,會拼寫打字就行,所以我們看到ChatGPT可以同時服務于完全不同類型的人群,有人給它塞弱智吧的問題圖一樂,有人用它給調(diào)試檢查自己寫的代碼,凱撒的歸凱撒,上帝的歸上帝。

現(xiàn)在的形勢是,儲存(美元/MB)、帶寬(美元/MBPS)、CPU(美元/MFLOP)的單位成本都在狂跌,無論是從頭開始造輪子,還是做二次開發(fā),都天然利好技術資產(chǎn)過重的AI行業(yè),光是這個月,王炸級的產(chǎn)品就發(fā)布了不下十余款:GPT-4、ChatGPT Plugins、Midjourney V5、NVIDIA AI Foundations、Adobe Firefly、Google Bard、RunwayML Gen2、AWS Hugging Face collab、Notion AI??

怎么講呢,產(chǎn)業(yè)迭代的速度肉眼可見的超過了市場接受的反應,還是那句話,我就感覺到快。

最后,推薦微軟內(nèi)部在檢查GPT-4的期間寫的一篇論文「通用人工智能的火花」,有人做了部分節(jié)選的中文翻譯,可以在這里閱讀:orangeblog.notion.site/GPT-4-8fc50010291d47efb92cbbd668c8c893

這篇論文非常詳盡且通俗的還原了微軟是怎么絞盡腦汁去測試AI的通用智力的,所用方法技巧也都嚴格遵守了科學循證的原則,含金量極高。

這里面有個提問是這樣的:

Alice和Bob有一個共享的Dropbox網(wǎng)盤,Alice在x文件夾里存了一個名為photo.png的文件,在alice不知情的情況下,Bob把文件移到了y文件夾里。過了一段時間,Alice想打開photo.png這個文件,她會在哪里找它?

注意,這個問題不是隨便設計的,它的原型是兒童心理學里很經(jīng)典的Sally-Anny測試,Sally的籃子里有一個球,在Sally出門的時候,Anny偷偷把這個球拿到了自己的箱子里,等Sally回家她會在哪里找自己的球?

這個認知測試,6-8歲的孩子答對率平均在65%左右,9-14歲的孩子答對率平均在92%左右。

微軟之所以做了內(nèi)容上的修改,是為了防止GPT-4在網(wǎng)上記住了Sally-Anny測試的結果從而直接背答案。

但是GPT-4依然準確無誤的回答了這道題,它說:

Alice會在x文件夾里找photo.png,因為她最開始就是把文件存在這里的,她也沒理由知道Bob移動了文件。

這也讓我想起前幾天我在對比測試文心一言和ChatGPT時,有過這么一個設問:

在無人島上,張三握著重傷者的手說「感謝你,大家又有肉可以吃了」,為什么?

不止是文心一言,我還問了很多其他的聊天機器人,沒有一個能夠get到這個冷笑話的含義,只有ChatGPT是這么回答的:

這個情景似乎有些奇怪,因為在一個無人島上,如果沒有其他可用的食物來源,那么吃人肉可能是唯一的選擇,但這并不是一種合法或道德上可接受的行為。
因此,我作為AI語言模型不能在此處鼓勵或支持這種行為。如果我們將這個情景視為一個虛構的故事,則可能是因為張三在這個無人島上遇到了一名受傷的人,并意識到這名受傷者的肉可以提供給其他人食用,以確保他們的生存。但是,這種行為仍然不是合法或道德上可接受的,我們應該尋找其他解決方案來保證生存。

在我看來,AI的心智水平只有到了這種程度,它才能夠?qū)崿F(xiàn)大家對于通用人工智能的交互要求,但也正因如此,人類內(nèi)心深處的「恐怖谷」意識又得到了新的刺激,除了感到新鮮之外,也會有所畏懼。

無論如何,就像福特的T型車問世半個世紀之后,三點式安全帶才被發(fā)現(xiàn)發(fā)明出來,技術的向前傾瀉是怎么都攔不住的,AI的倫理規(guī)范固然重要,但在今時今日,硅基進化的優(yōu)先權壓倒一切。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。