文|烏鴉智能說 林白
這兩天,諾貝爾獎逐步公布,AI成了最大贏家。
10月8日,瑞典皇家科學(xué)院宣布,2024年諾貝爾物理學(xué)獎授予美國科學(xué)家約翰·霍普菲爾德(John J. Hopfield)和英裔加拿大科學(xué)家杰弗里·辛頓(Geoffrey E. Hinton),以表彰他們利用物理學(xué)工具,開發(fā)出了當(dāng)今強(qiáng)大機(jī)器學(xué)習(xí)技術(shù)的基礎(chǔ)方法。
一天之后,瑞典皇家科學(xué)院又宣布,將2024 年諾貝爾化學(xué)獎授予大衛(wèi)·貝克(David Baker)、戴米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper),以表彰他們用AI在蛋白質(zhì)設(shè)計(jì)和蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域作出的貢獻(xiàn)。
你可以簡單理解為,諾獎評委們把諾貝爾物理學(xué)獎頒給了機(jī)器學(xué)習(xí),而諾貝爾化學(xué)獎頒給了AI預(yù)測蛋白質(zhì)結(jié)構(gòu)和蛋白質(zhì)設(shè)計(jì)。
為什么AI突然能拿下兩座諾貝爾大獎?AI站上諾貝爾獎舞臺背后,到底隱藏著一個什么趨勢?
/ 01 / AI連下兩座諾貝爾大獎
先說下諾貝爾物理學(xué)獎的獲得者霍普菲爾德和辛頓。
霍普菲爾德在1982年創(chuàng)造出聯(lián)想神經(jīng)網(wǎng)絡(luò),現(xiàn)在通稱為霍普菲爾德網(wǎng)絡(luò)(Hopfield network),可以存儲并重現(xiàn)圖像和其他數(shù)據(jù)模式的關(guān)聯(lián)記憶技術(shù)。
簡單來說,霍普菲爾德網(wǎng)絡(luò)解決的問題是:人是如何進(jìn)行聯(lián)想記憶的,也就是如何通過某一部分的記憶聯(lián)想起整個記憶。比如,你聽到一個人的名字,就能聯(lián)系他的長相。
而作為深度學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物,辛頓的最大貢獻(xiàn)在于,開發(fā)了一種新的神經(jīng)網(wǎng)絡(luò):玻爾茲曼機(jī)。
在我們大腦中,神經(jīng)元之間會相互作用,有些神經(jīng)元的決策是可以影響另一部分的神經(jīng)元。借用知乎上產(chǎn)品二姐的比方:
有些神經(jīng)元的決策是可以表現(xiàn)出來的,比如某些人看了《長安三萬里》這部動畫片。但又有些神經(jīng)元的表現(xiàn)是不可見的,比如某些人看《長安三萬里》是因?yàn)橄矚g唐詩,有些人看是因?yàn)橄矚g追光動畫,還有些人是因?yàn)榕阆矚g的人一起看。
而玻爾茲曼機(jī)所要做的事,就是搞清楚這些可見和不可見神經(jīng)元之間互相影響的關(guān)系。
玻爾茲曼機(jī)的出現(xiàn),很大程度推動了機(jī)器學(xué)習(xí)的快速發(fā)展。特別是在深度學(xué)習(xí)發(fā)展早期,波爾茲曼機(jī)被用來預(yù)訓(xùn)練深層神經(jīng)網(wǎng)絡(luò),幫助網(wǎng)絡(luò)在進(jìn)行更復(fù)雜學(xué)習(xí)任務(wù)之前,找到合適的權(quán)重初始狀態(tài)。
說完物理學(xué)獎,再來說說諾貝爾化學(xué)獎。
其中,諾貝爾化學(xué)獎獲獎?wù)咧坏拇笮l(wèi)·貝克,率先開發(fā)了設(shè)計(jì)和預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的方法,創(chuàng)造出了全新的蛋白質(zhì),基于創(chuàng)新的軟件、算法解決醫(yī)學(xué)難題。
而戴米斯·哈薩比斯和約翰·江珀,則參與創(chuàng)造的AI蛋白質(zhì)結(jié)構(gòu)分析工具AlphaFold,直接把蛋白質(zhì)預(yù)測這事帶到了一個新紀(jì)元。
如果將生命體比作一個拼好的樂高積木,那蛋白核酸等大分子就像一個個獨(dú)立的樂高零件。在過去的五十年里,理解每一個樂高零件的形狀就是結(jié)構(gòu)生物學(xué)家的主要工作。
但這事并不容易,蛋白質(zhì)是由20種不同的氨基酸按特定序列連接形成的多聚體,這些不同的氨基酸通常會折疊成某一個特定的形狀。所以,想要真正地理解蛋白質(zhì)如何發(fā)揮作用,科學(xué)家們就必須準(zhǔn)確地掌握蛋白質(zhì)的空間結(jié)構(gòu)。
蛋白質(zhì)結(jié)構(gòu)從簡單到復(fù)雜,總共分為4級。一級結(jié)構(gòu)比較容易確定,簡單的生物實(shí)驗(yàn)如質(zhì)譜法即可,但涉及到二級以上結(jié)構(gòu)如何折疊的,結(jié)構(gòu)生物學(xué)家往往需要利用X射線、核磁共振、電游儀、冷凍電鏡來檢測。
這些方法耗時(shí)耗力、人工成本也極高,比如電泳儀只能間接進(jìn)行測量,實(shí)驗(yàn)中還受較多因素干擾,因而會影響對蛋白質(zhì)結(jié)構(gòu)的分析與理解。而能高分辨率解析的冷凍電鏡則極為昂貴,一臺約1億人民幣左右。截至今年,我國的冷凍電鏡也只有60多臺。
AlphaFold厲害的地方在于,通過深度學(xué)習(xí)模型來預(yù)測蛋白質(zhì)更高結(jié)構(gòu),不僅非???,而且相當(dāng)準(zhǔn)確,大大提高了蛋白質(zhì)研究的效率。
2021年,AlphaFold就預(yù)測了35萬個蛋白質(zhì)結(jié)構(gòu),這包括了98.5%的人類蛋白質(zhì),并將這些蛋白質(zhì)結(jié)構(gòu)放到了AlphaFold-EBI數(shù)據(jù)庫中。到了2022年,這個數(shù)據(jù)庫中的蛋白質(zhì)數(shù)超過了2億,幾乎包含了地球上所有可能存在的蛋白質(zhì)。
可以說,AlphaFold幾乎一個人把預(yù)測蛋白質(zhì)結(jié)構(gòu)這事給做了,這對人類探索自身的生命密碼尤其重要。
/ 02 / 知識的盡頭是AI
雖然機(jī)器學(xué)習(xí)拿下諾貝爾物理學(xué)獎這事有很大爭議,但另一個已成的事實(shí)是,AI已經(jīng)幾乎滲透到所有的學(xué)科,并產(chǎn)生了不可忽視的影響。
原因很簡單,AI的學(xué)習(xí)效率比人強(qiáng)太多。在之前很長時(shí)間里,辛頓一直認(rèn)為,人的智慧比AI更高。但這幾年,辛頓看法開始轉(zhuǎn)變,因?yàn)樗l(fā)現(xiàn),AI在知識傳播效率、學(xué)習(xí)機(jī)制、能源效率方面都比人強(qiáng)。
就拿知識傳播來說,當(dāng)一個AI智能體掌握了某個知識,所有的AI智能體都能立刻學(xué)會這個知識。相反,人類只能通過觀察和復(fù)制教師行為來學(xué)習(xí),這個過程時(shí)間更長且效率更低。
再說學(xué)習(xí)機(jī)制,人類的大腦里有100萬億個連接,而GPT只有一萬億個,數(shù)量遠(yuǎn)遠(yuǎn)低于人類。但一個GPT用1700多億的參數(shù),居然就記住了人類所有的知識和文明,而且還可以進(jìn)行抽象的思考。
這意味著,AI比人類更擅長將大量知識放在1萬億的連接中。換句話說,AI可能找到了比人類更好的學(xué)習(xí)方法。
在AI強(qiáng)大的學(xué)習(xí)能力之下,知識正在迅速貶值。OpenAI早期投資人Vinod Khosla曾預(yù)測,未來幾乎所有的專業(yè)知識都將被AI免費(fèi)化。
持有類似觀點(diǎn)的還有牛津大學(xué)教授Nick Bostrom。他的觀點(diǎn)更極端,本科和博士課程將加速貶值,傳統(tǒng)20-30年以知識傳遞為核心的人力資本投資將看不到任何回報(bào)。
但與此同時(shí),跨學(xué)科知識的重要性可能被進(jìn)一步提升,即使用計(jì)算機(jī)工具,以及與其他學(xué)科的理論,去幫助其它學(xué)科(物理,化學(xué),材料,生物,醫(yī)藥)攻克學(xué)術(shù)難題。
也就是說,未來學(xué)好人工智能,很有可能會比拒絕人工智能的人,能更有效的工作,形成新的重要發(fā)現(xiàn),甚至爭奪各個方向的諾貝爾獎。
甚至有一天,一個拿GPT-X寫文章的人,或許也能夠獲得諾貝爾文學(xué)獎。