正在閱讀:

DIKW金字塔,AI爬到第幾層了?

掃一掃下載界面新聞APP

DIKW金字塔,AI爬到第幾層了?

將知識運(yùn)用在機(jī)器智能當(dāng)中,并不是什么新鮮事。早在上個(gè)世紀(jì),人類就開始了探索知識計(jì)算的步伐,并廣泛應(yīng)用到工作和生活當(dāng)中。

文|腦極體

你可能沒聽說過DIKW金字塔,但你一定曾被按在這座塔的鄙視鏈上摩擦過。

曾有某個(gè)游戲主播形容自己的預(yù)判:觀眾只看到了第二層,想到了第一層,實(shí)際上我在第五層。于是,網(wǎng)友們形容一些讓人意想不到的操作,“這波啊,這波是在大氣層”。

這種說法雖然有些戲謔,但還真有點(diǎn)科學(xué)道理。

DIKW金字塔,是一個(gè)關(guān)于人類理解、推理和解釋的層次結(jié)構(gòu),分別是:數(shù)據(jù)(原始的事實(shí)集合)、信息(可被分析測量的結(jié)構(gòu)化數(shù)據(jù))、知識(需要洞察力和理解力進(jìn)行學(xué)習(xí))、智慧(指導(dǎo)行動(dòng))。

站在DIKW金字塔尖的人,相當(dāng)于全部通關(guān)的頂級選手,掌握了數(shù)據(jù)、整理成信息、理解為知識、轉(zhuǎn)化成智慧,才能讓行動(dòng)如有神助。足智多謀如諸葛亮,錦囊妙計(jì)用的那叫一個(gè)信手拈來,絕對是“站在大氣層的男人”。

DIKW金字塔適用于人,也適用于AI嗎?答案是肯定的。

如果AI也有鄙視鏈,那么基于數(shù)據(jù)的AI,一定會(huì)被基于知識的AI碾壓。

這是因?yàn)?,AI Is A Knowledge Technology,AI就是一種由知識驅(qū)動(dòng)的技術(shù)。因此,從初級人工智能向高級人工智能、通用人工智能發(fā)展的過程,也是一個(gè)攀爬DIKW金字塔的過程。

近年來,AI領(lǐng)域的諸多學(xué)術(shù)力量、產(chǎn)業(yè)力量,從強(qiáng)調(diào)“數(shù)據(jù)出奇跡”的蠻力計(jì)算,向著“知識金字塔”的更高層級進(jìn)發(fā),推動(dòng)知識計(jì)算引領(lǐng)AI應(yīng)用的未來潮流。

可以說,我們正處于一個(gè)向基于知識的AI過渡的關(guān)鍵階段。AI已經(jīng)影響著你我生活的方方面面,所以有必要來聊一聊,AI沿著DIKW金字塔向上攀爬,將會(huì)帶來怎樣的變化?

回歸的鐘擺:理性主義的復(fù)興

將知識運(yùn)用在機(jī)器智能當(dāng)中,并不是什么新鮮事。早在上個(gè)世紀(jì),人類就開始了探索知識計(jì)算的步伐,并廣泛應(yīng)用到工作和生活當(dāng)中。

AI誕生的那一刻起,就是理性主義和經(jīng)驗(yàn)主義兩大流派的交相輝映、此消彼長。它們的共同之處,都認(rèn)為機(jī)器智能首先要擁有知識,知識是智能的核心;分歧在于,對于知識的理解和獲取途徑不同。

而伴隨著這兩大流派的發(fā)展,知識與AI的結(jié)合,也就表現(xiàn)為兩種方式。

一種是理性主義的結(jié)合,人提供知識,機(jī)器負(fù)責(zé)計(jì)算。

理性主義認(rèn)為人的智能是先天遺傳的,要實(shí)現(xiàn)機(jī)器智能,就要理解人腦的運(yùn)行機(jī)制,將這個(gè)東西總結(jié)成知識,再由人來告訴機(jī)器怎么做。

典型應(yīng)用就是專家系統(tǒng)。

人類專家總結(jié)出知識,計(jì)算機(jī)根據(jù)專家系統(tǒng)知識庫進(jìn)行學(xué)習(xí),這種方式可解釋性非常高。從1968年世界上第一個(gè)專家系統(tǒng)——化學(xué)專家系統(tǒng)DENDRAL研制成功之后,針對某個(gè)單一領(lǐng)域、模仿專家進(jìn)行推理分析的早期專家系統(tǒng)開始流行起來,廣泛應(yīng)用于工農(nóng)業(yè)、醫(yī)療、氣象、交通、軍事等眾多產(chǎn)業(yè)計(jì)算場景之中。

不過,專家機(jī)只能在一些特定領(lǐng)域發(fā)揮作用,建構(gòu)成本非常高。并且,受限于專家的認(rèn)知上限,如果人都沒有找到那個(gè)知識,或者表述不出來的話,機(jī)器就更不可能學(xué)會(huì)了。

于是從九十年代到現(xiàn)在,另一種AI與知識的結(jié)合模式就占據(jù)了主流,那就是經(jīng)驗(yàn)主義。

由人手工打造一個(gè)分類器,開發(fā)人員不必提前知道答案,機(jī)器可以不依賴那些人類專家描述不出來、“只可意會(huì)不可言傳”的知識,按照自己的運(yùn)作機(jī)制,從數(shù)據(jù)中來挖掘知識,通過大規(guī)模數(shù)據(jù)訓(xùn)練出模型參數(shù),表現(xiàn)出超過人類的智能。

最具代表性的就是深度學(xué)習(xí)。

依靠強(qiáng)大的數(shù)據(jù)、算力和神經(jīng)網(wǎng)絡(luò),谷歌大腦可以不需要人類的幫助,在不知道“貓”這個(gè)詞的前提下,通過訓(xùn)練將數(shù)據(jù)轉(zhuǎn)化為知識,看過數(shù)百萬張圖片后,自己提煉出貓的基本特性,知道貓是一種毛茸茸的(此處省略一堆形容詞)生物,然后成功在一堆照片中識別出貓。

基于龐大的數(shù)據(jù),AI雖然并不真正理解和掌握相關(guān)知識,也就是“知其然不知其所以然”,不可能真的取代人類專家,但可以將復(fù)雜的模式識別問題分解成更簡單的模式識別問題,在一些特定任務(wù)中表現(xiàn)得比人類更好、效率更高,取得了長足的發(fā)展。深度學(xué)習(xí)也被視為經(jīng)驗(yàn)主義的高峰,成為推動(dòng)第三次AI浪潮的核心。

但是,基于數(shù)據(jù)的AI,和基于知識的AI,還是有本質(zhì)區(qū)別的。著名的莫拉維克悖論,早就指出過這個(gè)問題,因?yàn)闄C(jī)器無法像人一樣將隱性知識融入思想和行動(dòng)之中,形成高階智慧,所以成了邏輯的巨人、常識的矮子,在一些困難的問題如下圍棋上能超越人類,但在很簡單的認(rèn)知問題上,表現(xiàn)反而不如四五歲的人類小孩兒。

而解決思路之一,就是理性主義所推崇的,讓機(jī)器能夠如同真正的人類一樣理解知識并進(jìn)行思考。

就像丘吉在《鐘擺擺得太遠(yuǎn)》(A Pendulum Swung Too Far)所預(yù)測的那樣,AI已經(jīng)偏離經(jīng)驗(yàn)主義太遠(yuǎn),將來回歸理性主義的速度就會(huì)越快,理性主義復(fù)興的步伐正在到來。

產(chǎn)業(yè)的呼喚:數(shù)智化浪潮與知識之光

或許你會(huì)認(rèn)為,經(jīng)驗(yàn)主義和理性主義,只是學(xué)術(shù)界的流派之爭,跟普通人和工業(yè)界沒什么關(guān)系。

實(shí)際上,在產(chǎn)業(yè)智能化的浪潮中,有越來越多的行業(yè)和組織,開始呼喚基于知識的AI,這是因?yàn)椤?/p>

模型設(shè)計(jì)階段,需要基于知識的理解。

我們知道,AI已經(jīng)開始走出實(shí)驗(yàn)室和象牙塔,走向千行百業(yè),開始與物理世界和生物世界結(jié)合,而這些領(lǐng)域的數(shù)據(jù)并不是全部由1和0所構(gòu)成。

比如AI預(yù)測蛋白質(zhì)結(jié)構(gòu),每個(gè)蛋白質(zhì)都不是一個(gè)簡單的圖像數(shù)據(jù),它的背后是有具體意義的。不同的分子關(guān)系如何、怎樣相互作用、靠什么原理組合在一起等,有一整套生物學(xué)邏輯和知識體系支撐的,如果缺乏對藥學(xué)知識的了解,用純數(shù)據(jù)驅(qū)動(dòng)的方法來設(shè)計(jì)模型,很可能做出來的模型無法發(fā)揮效用。

因此,想要AI模型真正能夠在產(chǎn)業(yè)端發(fā)揮價(jià)值,要結(jié)合實(shí)際工作的機(jī)理模型、專家知識等,轉(zhuǎn)化為AI可理解、可處理、可分析的數(shù)學(xué)語言。

模型訓(xùn)練階段,需要基于知識的數(shù)據(jù)。

在產(chǎn)業(yè)AI中,數(shù)據(jù)中往往存在大量的信息,也就是沒有或無法被表征的知識,往往體現(xiàn)為專家經(jīng)驗(yàn)或師徒傳承。想要訓(xùn)練出效果更好的產(chǎn)業(yè)模型,不僅需要大量、完備的數(shù)據(jù),還要能夠精準(zhǔn)描述出數(shù)據(jù)之間的知識關(guān)系,這樣才能夠從數(shù)據(jù)中挖掘出更多有用的知識。

就拿我們?nèi)粘6紩?huì)碰到的推薦算法來說,傳統(tǒng)的推薦算法是用戶喜歡什么就推薦什么,很容易陷入信息繭房。而國內(nèi)某科研團(tuán)隊(duì),將食品營養(yǎng)科學(xué)的知識圖譜與推薦算法相結(jié)合,根據(jù)用戶反饋數(shù)據(jù),比如點(diǎn)擊量、興趣偏好、身體數(shù)據(jù)等等,結(jié)合健康知識來進(jìn)行組合搭配與推薦。

基于知識的數(shù)據(jù),能夠幫助打造高質(zhì)量、更懂人性的算法。就拿前面提到的推薦系統(tǒng)來說,相比不斷迎合用戶的算法,提供了一種既滿足口味喜好、又符合健康管理要求的選擇。再設(shè)想一下,如果AI能夠?qū)⑼赓u配送員的行為數(shù)據(jù)與人的常識性知識結(jié)合到一起,或許無限擠壓配送時(shí)間導(dǎo)致的內(nèi)卷困境,也有望被解決了。

模型落地階段,需要基于知識的信任。

AI模型落地應(yīng)用,在很大程度上取決于其可靠性:一是可信度,結(jié)果是否被人所信任,深度學(xué)習(xí)受限于可解釋性問題,在醫(yī)療等專精領(lǐng)域不如人類專家被信任;二是可靠性,能否在被干擾的情況下也能表現(xiàn)出較好的性能,也就是解決魯棒性問題。

中科院院士、清華大學(xué)人工智能研究院院長張鈸教授曾提出,在產(chǎn)業(yè)落地應(yīng)用的人工智能,需要符合五個(gè)條件:豐富數(shù)據(jù)或知識、完全信息、確定性信息、靜態(tài)環(huán)境、特定領(lǐng)域或單一任務(wù)。這五個(gè)條件只要有一個(gè)不滿足,AI產(chǎn)業(yè)化落地都非常困難。

而改變困境的思路之一,就是知識計(jì)算,讓AI系統(tǒng)能夠讀懂知識、學(xué)會(huì)常識推理,從而讓模型變得可信任、高可靠。

此前,谷歌為了提高搜索引擎結(jié)果的可信度和說服力,就將NLP與知識圖譜相結(jié)合來進(jìn)行學(xué)習(xí)。如果搜索者發(fā)現(xiàn)一些文章提到“XX曾在中國工作過”的信息,這些信息與知識庫融合在一起,顯示出XX曾為對華貿(mào)易委員會(huì)工作,而該組織在北京設(shè)有辦事處,那么“XX曾在中國工作過”的可信度就會(huì)大大提高。

同樣,如果自動(dòng)駕駛系統(tǒng)從大規(guī)模文本信息中提取并學(xué)習(xí)到一些出行常識,比如“大卡車擋住了前方的視線,應(yīng)該小心一點(diǎn),說不定突然過來一個(gè)人就可能撞到”,對常識性知識的理解無疑會(huì)大大增加人們對自動(dòng)駕駛安全性的信心。

模型應(yīng)用階段,需要基于知識的計(jì)算。

當(dāng)前產(chǎn)業(yè)智能化的一大瓶頸是高成本的算力。龐大的深度神經(jīng)網(wǎng)絡(luò)系統(tǒng)需要大量計(jì)算資源來處理復(fù)雜任務(wù)。一份來自馬薩諸塞大學(xué)的研究顯示,常見的幾種大型 AI 模型,訓(xùn)練過程會(huì)排放超過 626000 磅二氧化碳,幾乎是普通汽車壽命周期排放量的五倍。

拉踩一下,人類在思考(也是一種知識計(jì)算)時(shí)就十分節(jié)省能耗,心理學(xué)家卡尼曼在《思考,快與慢》中就提出,人腦既可以通過系統(tǒng)2進(jìn)行較慢的理性思考,也可以經(jīng)由系統(tǒng)1,基于已經(jīng)內(nèi)化的知識,實(shí)現(xiàn)無意識的、近似于肌肉記憶的快速運(yùn)算,大腦能量消耗極少。

未來,打造基于知識的AI模型,如同激活腦區(qū)一樣,將成為綠色計(jì)算的重要方法,保證產(chǎn)業(yè)智能的可持續(xù)發(fā)展。

不難發(fā)現(xiàn),行業(yè)知識與AI計(jì)算的結(jié)合,既是理論上技術(shù)發(fā)展的必然階段,也是事實(shí)上產(chǎn)業(yè)AI化所不可或缺的一步。

作為一種致用技術(shù),AI只有真正接納并融合行業(yè)知識,讓計(jì)算與知識轉(zhuǎn)變成新時(shí)代的生產(chǎn)力,才能凝結(jié)出技術(shù)的長期價(jià)值,推動(dòng)第三次人工智能浪潮繼續(xù)向前奔涌。

艱難的攀爬:從數(shù)據(jù)層到知識層總共分幾步?

拋開應(yīng)用條件談技術(shù)前景的都是“畫餅”,基于知識的AI同樣少不了前提條件。需要具備至少幾個(gè)特征:

1. 知識表征的準(zhǔn)確性。

要讓AI理解并利用知識來解決復(fù)雜的現(xiàn)實(shí)問題,首先需要將這些內(nèi)容轉(zhuǎn)化為數(shù)學(xué)語言,變成AI可解的數(shù)據(jù)化路徑。

不過,一個(gè)AI系統(tǒng)中需要被表示的知識類型有很多,想要全面且準(zhǔn)確地表示出來并不容易。

其中,既有容易被表征的陳述性知識,如何做某事的程序性知識;也有不易被描述出來的知識,像是基于某個(gè)領(lǐng)域的專家經(jīng)驗(yàn)所總結(jié)的啟發(fā)性知識,就未必全是正確的;以及表示概念關(guān)系的結(jié)構(gòu)知識,比如分子和分子的相互作用,目前人類了解得還不夠全面。

知識表征的準(zhǔn)確性,將直接影響到機(jī)器是否能像人類一樣智能。

2.知識推理的多樣性。

推理能力是人類與其他物種最大的不同,尤其是創(chuàng)造性思維。而知識計(jì)算的核心能力正是推理能力,根據(jù)現(xiàn)有的表征結(jié)構(gòu)產(chǎn)生相對應(yīng)的新知識,為產(chǎn)業(yè)側(cè)提供創(chuàng)造性見解。

完全可以想象這樣一個(gè)場景:建立一個(gè)龐大的知識庫,儲(chǔ)存著人類完成各種任務(wù)所需要的知識, AI不再需要對每一個(gè)特定場景、特定數(shù)據(jù)集進(jìn)行專門訓(xùn)練,可以像一個(gè)真正的聰慧人類一樣,觸類旁通、舉一反三,輕松地完成推理分析,應(yīng)對現(xiàn)實(shí)世界中各種各樣的復(fù)雜任務(wù)。

3. 知識獲取的自動(dòng)化。

建立常識庫并不是件容易的事,也被叫做“AI 的曼哈頓工程”。 尤其是信息爆炸帶來的海量數(shù)據(jù),需要機(jī)器接管將信息轉(zhuǎn)化為知識的工作,要提高知識獲取的效率,自動(dòng)化成為必須啃下的一塊硬骨頭。

使用自動(dòng)化方法來獲取新知識,能夠加快AI知識系統(tǒng)迭代,實(shí)現(xiàn)模型的自動(dòng)更新,縮短構(gòu)建行業(yè)知識圖譜的時(shí)間。

4. 知識應(yīng)用的高效率。

不同行業(yè)的知識沉淀、應(yīng)用、管理方式千差萬別,讓企業(yè)自己去搭建一套個(gè)性化工具并不現(xiàn)實(shí)。因此,知識計(jì)算想要落地行業(yè),還需要一系列標(biāo)準(zhǔn)化工具,提供知識搜索、高性能查詢、可視化分析等功能,提高對知識的挖掘效率。

作為一個(gè)新崛起的技術(shù)方向,需要有前瞻眼光的平臺化科技企業(yè)與組織來做好基礎(chǔ)設(shè)施建設(shè),并將能力接口向各行各業(yè)企開放。

數(shù)據(jù)和信息描述世界,知識和智慧理解世界。從這個(gè)角度說,AI在DIKW金字塔上的層次越高,能力就越強(qiáng),距離強(qiáng)人工智能也就越近。這條攀爬之路并不好走,卻是AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化的必經(jīng)之路。

最后的最后,當(dāng)AI登上金字塔尖的那一刻,獲得真正的智慧,屆時(shí)我們已經(jīng)不能確定,AI會(huì)不會(huì)是地球上最聰明的物體了?;蛘哒f,人類還在智慧的最高層嗎?

正如艾略特在詩中所寫的:“我們在哪里丟失了知識中的智慧?又在哪里丟失了信息中的知識?”(Where is the wisdom we have lost in knowledge?/ Where is the knowledge we have lost in information?)

曾幾何時(shí),智慧是人類所特有的東西,是人作為萬物之靈長的代表。很多人正在數(shù)字時(shí)代,越來越少地掌握知識、主動(dòng)思考,越來越多地沉浸于支離破碎的數(shù)據(jù)和信息汪洋之中。

或許,當(dāng)我們見證AI向金字塔尖攀爬的時(shí)候,更重要的是,對人類向金字塔底部的滑落保持一點(diǎn)警醒。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

DIKW金字塔,AI爬到第幾層了?

將知識運(yùn)用在機(jī)器智能當(dāng)中,并不是什么新鮮事。早在上個(gè)世紀(jì),人類就開始了探索知識計(jì)算的步伐,并廣泛應(yīng)用到工作和生活當(dāng)中。

文|腦極體

你可能沒聽說過DIKW金字塔,但你一定曾被按在這座塔的鄙視鏈上摩擦過。

曾有某個(gè)游戲主播形容自己的預(yù)判:觀眾只看到了第二層,想到了第一層,實(shí)際上我在第五層。于是,網(wǎng)友們形容一些讓人意想不到的操作,“這波啊,這波是在大氣層”。

這種說法雖然有些戲謔,但還真有點(diǎn)科學(xué)道理。

DIKW金字塔,是一個(gè)關(guān)于人類理解、推理和解釋的層次結(jié)構(gòu),分別是:數(shù)據(jù)(原始的事實(shí)集合)、信息(可被分析測量的結(jié)構(gòu)化數(shù)據(jù))、知識(需要洞察力和理解力進(jìn)行學(xué)習(xí))、智慧(指導(dǎo)行動(dòng))。

站在DIKW金字塔尖的人,相當(dāng)于全部通關(guān)的頂級選手,掌握了數(shù)據(jù)、整理成信息、理解為知識、轉(zhuǎn)化成智慧,才能讓行動(dòng)如有神助。足智多謀如諸葛亮,錦囊妙計(jì)用的那叫一個(gè)信手拈來,絕對是“站在大氣層的男人”。

DIKW金字塔適用于人,也適用于AI嗎?答案是肯定的。

如果AI也有鄙視鏈,那么基于數(shù)據(jù)的AI,一定會(huì)被基于知識的AI碾壓。

這是因?yàn)?,AI Is A Knowledge Technology,AI就是一種由知識驅(qū)動(dòng)的技術(shù)。因此,從初級人工智能向高級人工智能、通用人工智能發(fā)展的過程,也是一個(gè)攀爬DIKW金字塔的過程。

近年來,AI領(lǐng)域的諸多學(xué)術(shù)力量、產(chǎn)業(yè)力量,從強(qiáng)調(diào)“數(shù)據(jù)出奇跡”的蠻力計(jì)算,向著“知識金字塔”的更高層級進(jìn)發(fā),推動(dòng)知識計(jì)算引領(lǐng)AI應(yīng)用的未來潮流。

可以說,我們正處于一個(gè)向基于知識的AI過渡的關(guān)鍵階段。AI已經(jīng)影響著你我生活的方方面面,所以有必要來聊一聊,AI沿著DIKW金字塔向上攀爬,將會(huì)帶來怎樣的變化?

回歸的鐘擺:理性主義的復(fù)興

將知識運(yùn)用在機(jī)器智能當(dāng)中,并不是什么新鮮事。早在上個(gè)世紀(jì),人類就開始了探索知識計(jì)算的步伐,并廣泛應(yīng)用到工作和生活當(dāng)中。

AI誕生的那一刻起,就是理性主義和經(jīng)驗(yàn)主義兩大流派的交相輝映、此消彼長。它們的共同之處,都認(rèn)為機(jī)器智能首先要擁有知識,知識是智能的核心;分歧在于,對于知識的理解和獲取途徑不同。

而伴隨著這兩大流派的發(fā)展,知識與AI的結(jié)合,也就表現(xiàn)為兩種方式。

一種是理性主義的結(jié)合,人提供知識,機(jī)器負(fù)責(zé)計(jì)算。

理性主義認(rèn)為人的智能是先天遺傳的,要實(shí)現(xiàn)機(jī)器智能,就要理解人腦的運(yùn)行機(jī)制,將這個(gè)東西總結(jié)成知識,再由人來告訴機(jī)器怎么做。

典型應(yīng)用就是專家系統(tǒng)。

人類專家總結(jié)出知識,計(jì)算機(jī)根據(jù)專家系統(tǒng)知識庫進(jìn)行學(xué)習(xí),這種方式可解釋性非常高。從1968年世界上第一個(gè)專家系統(tǒng)——化學(xué)專家系統(tǒng)DENDRAL研制成功之后,針對某個(gè)單一領(lǐng)域、模仿專家進(jìn)行推理分析的早期專家系統(tǒng)開始流行起來,廣泛應(yīng)用于工農(nóng)業(yè)、醫(yī)療、氣象、交通、軍事等眾多產(chǎn)業(yè)計(jì)算場景之中。

不過,專家機(jī)只能在一些特定領(lǐng)域發(fā)揮作用,建構(gòu)成本非常高。并且,受限于專家的認(rèn)知上限,如果人都沒有找到那個(gè)知識,或者表述不出來的話,機(jī)器就更不可能學(xué)會(huì)了。

于是從九十年代到現(xiàn)在,另一種AI與知識的結(jié)合模式就占據(jù)了主流,那就是經(jīng)驗(yàn)主義。

由人手工打造一個(gè)分類器,開發(fā)人員不必提前知道答案,機(jī)器可以不依賴那些人類專家描述不出來、“只可意會(huì)不可言傳”的知識,按照自己的運(yùn)作機(jī)制,從數(shù)據(jù)中來挖掘知識,通過大規(guī)模數(shù)據(jù)訓(xùn)練出模型參數(shù),表現(xiàn)出超過人類的智能。

最具代表性的就是深度學(xué)習(xí)。

依靠強(qiáng)大的數(shù)據(jù)、算力和神經(jīng)網(wǎng)絡(luò),谷歌大腦可以不需要人類的幫助,在不知道“貓”這個(gè)詞的前提下,通過訓(xùn)練將數(shù)據(jù)轉(zhuǎn)化為知識,看過數(shù)百萬張圖片后,自己提煉出貓的基本特性,知道貓是一種毛茸茸的(此處省略一堆形容詞)生物,然后成功在一堆照片中識別出貓。

基于龐大的數(shù)據(jù),AI雖然并不真正理解和掌握相關(guān)知識,也就是“知其然不知其所以然”,不可能真的取代人類專家,但可以將復(fù)雜的模式識別問題分解成更簡單的模式識別問題,在一些特定任務(wù)中表現(xiàn)得比人類更好、效率更高,取得了長足的發(fā)展。深度學(xué)習(xí)也被視為經(jīng)驗(yàn)主義的高峰,成為推動(dòng)第三次AI浪潮的核心。

但是,基于數(shù)據(jù)的AI,和基于知識的AI,還是有本質(zhì)區(qū)別的。著名的莫拉維克悖論,早就指出過這個(gè)問題,因?yàn)闄C(jī)器無法像人一樣將隱性知識融入思想和行動(dòng)之中,形成高階智慧,所以成了邏輯的巨人、常識的矮子,在一些困難的問題如下圍棋上能超越人類,但在很簡單的認(rèn)知問題上,表現(xiàn)反而不如四五歲的人類小孩兒。

而解決思路之一,就是理性主義所推崇的,讓機(jī)器能夠如同真正的人類一樣理解知識并進(jìn)行思考。

就像丘吉在《鐘擺擺得太遠(yuǎn)》(A Pendulum Swung Too Far)所預(yù)測的那樣,AI已經(jīng)偏離經(jīng)驗(yàn)主義太遠(yuǎn),將來回歸理性主義的速度就會(huì)越快,理性主義復(fù)興的步伐正在到來。

產(chǎn)業(yè)的呼喚:數(shù)智化浪潮與知識之光

或許你會(huì)認(rèn)為,經(jīng)驗(yàn)主義和理性主義,只是學(xué)術(shù)界的流派之爭,跟普通人和工業(yè)界沒什么關(guān)系。

實(shí)際上,在產(chǎn)業(yè)智能化的浪潮中,有越來越多的行業(yè)和組織,開始呼喚基于知識的AI,這是因?yàn)椤?/p>

模型設(shè)計(jì)階段,需要基于知識的理解。

我們知道,AI已經(jīng)開始走出實(shí)驗(yàn)室和象牙塔,走向千行百業(yè),開始與物理世界和生物世界結(jié)合,而這些領(lǐng)域的數(shù)據(jù)并不是全部由1和0所構(gòu)成。

比如AI預(yù)測蛋白質(zhì)結(jié)構(gòu),每個(gè)蛋白質(zhì)都不是一個(gè)簡單的圖像數(shù)據(jù),它的背后是有具體意義的。不同的分子關(guān)系如何、怎樣相互作用、靠什么原理組合在一起等,有一整套生物學(xué)邏輯和知識體系支撐的,如果缺乏對藥學(xué)知識的了解,用純數(shù)據(jù)驅(qū)動(dòng)的方法來設(shè)計(jì)模型,很可能做出來的模型無法發(fā)揮效用。

因此,想要AI模型真正能夠在產(chǎn)業(yè)端發(fā)揮價(jià)值,要結(jié)合實(shí)際工作的機(jī)理模型、專家知識等,轉(zhuǎn)化為AI可理解、可處理、可分析的數(shù)學(xué)語言。

模型訓(xùn)練階段,需要基于知識的數(shù)據(jù)。

在產(chǎn)業(yè)AI中,數(shù)據(jù)中往往存在大量的信息,也就是沒有或無法被表征的知識,往往體現(xiàn)為專家經(jīng)驗(yàn)或師徒傳承。想要訓(xùn)練出效果更好的產(chǎn)業(yè)模型,不僅需要大量、完備的數(shù)據(jù),還要能夠精準(zhǔn)描述出數(shù)據(jù)之間的知識關(guān)系,這樣才能夠從數(shù)據(jù)中挖掘出更多有用的知識。

就拿我們?nèi)粘6紩?huì)碰到的推薦算法來說,傳統(tǒng)的推薦算法是用戶喜歡什么就推薦什么,很容易陷入信息繭房。而國內(nèi)某科研團(tuán)隊(duì),將食品營養(yǎng)科學(xué)的知識圖譜與推薦算法相結(jié)合,根據(jù)用戶反饋數(shù)據(jù),比如點(diǎn)擊量、興趣偏好、身體數(shù)據(jù)等等,結(jié)合健康知識來進(jìn)行組合搭配與推薦。

基于知識的數(shù)據(jù),能夠幫助打造高質(zhì)量、更懂人性的算法。就拿前面提到的推薦系統(tǒng)來說,相比不斷迎合用戶的算法,提供了一種既滿足口味喜好、又符合健康管理要求的選擇。再設(shè)想一下,如果AI能夠?qū)⑼赓u配送員的行為數(shù)據(jù)與人的常識性知識結(jié)合到一起,或許無限擠壓配送時(shí)間導(dǎo)致的內(nèi)卷困境,也有望被解決了。

模型落地階段,需要基于知識的信任。

AI模型落地應(yīng)用,在很大程度上取決于其可靠性:一是可信度,結(jié)果是否被人所信任,深度學(xué)習(xí)受限于可解釋性問題,在醫(yī)療等專精領(lǐng)域不如人類專家被信任;二是可靠性,能否在被干擾的情況下也能表現(xiàn)出較好的性能,也就是解決魯棒性問題。

中科院院士、清華大學(xué)人工智能研究院院長張鈸教授曾提出,在產(chǎn)業(yè)落地應(yīng)用的人工智能,需要符合五個(gè)條件:豐富數(shù)據(jù)或知識、完全信息、確定性信息、靜態(tài)環(huán)境、特定領(lǐng)域或單一任務(wù)。這五個(gè)條件只要有一個(gè)不滿足,AI產(chǎn)業(yè)化落地都非常困難。

而改變困境的思路之一,就是知識計(jì)算,讓AI系統(tǒng)能夠讀懂知識、學(xué)會(huì)常識推理,從而讓模型變得可信任、高可靠。

此前,谷歌為了提高搜索引擎結(jié)果的可信度和說服力,就將NLP與知識圖譜相結(jié)合來進(jìn)行學(xué)習(xí)。如果搜索者發(fā)現(xiàn)一些文章提到“XX曾在中國工作過”的信息,這些信息與知識庫融合在一起,顯示出XX曾為對華貿(mào)易委員會(huì)工作,而該組織在北京設(shè)有辦事處,那么“XX曾在中國工作過”的可信度就會(huì)大大提高。

同樣,如果自動(dòng)駕駛系統(tǒng)從大規(guī)模文本信息中提取并學(xué)習(xí)到一些出行常識,比如“大卡車擋住了前方的視線,應(yīng)該小心一點(diǎn),說不定突然過來一個(gè)人就可能撞到”,對常識性知識的理解無疑會(huì)大大增加人們對自動(dòng)駕駛安全性的信心。

模型應(yīng)用階段,需要基于知識的計(jì)算。

當(dāng)前產(chǎn)業(yè)智能化的一大瓶頸是高成本的算力。龐大的深度神經(jīng)網(wǎng)絡(luò)系統(tǒng)需要大量計(jì)算資源來處理復(fù)雜任務(wù)。一份來自馬薩諸塞大學(xué)的研究顯示,常見的幾種大型 AI 模型,訓(xùn)練過程會(huì)排放超過 626000 磅二氧化碳,幾乎是普通汽車壽命周期排放量的五倍。

拉踩一下,人類在思考(也是一種知識計(jì)算)時(shí)就十分節(jié)省能耗,心理學(xué)家卡尼曼在《思考,快與慢》中就提出,人腦既可以通過系統(tǒng)2進(jìn)行較慢的理性思考,也可以經(jīng)由系統(tǒng)1,基于已經(jīng)內(nèi)化的知識,實(shí)現(xiàn)無意識的、近似于肌肉記憶的快速運(yùn)算,大腦能量消耗極少。

未來,打造基于知識的AI模型,如同激活腦區(qū)一樣,將成為綠色計(jì)算的重要方法,保證產(chǎn)業(yè)智能的可持續(xù)發(fā)展。

不難發(fā)現(xiàn),行業(yè)知識與AI計(jì)算的結(jié)合,既是理論上技術(shù)發(fā)展的必然階段,也是事實(shí)上產(chǎn)業(yè)AI化所不可或缺的一步。

作為一種致用技術(shù),AI只有真正接納并融合行業(yè)知識,讓計(jì)算與知識轉(zhuǎn)變成新時(shí)代的生產(chǎn)力,才能凝結(jié)出技術(shù)的長期價(jià)值,推動(dòng)第三次人工智能浪潮繼續(xù)向前奔涌。

艱難的攀爬:從數(shù)據(jù)層到知識層總共分幾步?

拋開應(yīng)用條件談技術(shù)前景的都是“畫餅”,基于知識的AI同樣少不了前提條件。需要具備至少幾個(gè)特征:

1. 知識表征的準(zhǔn)確性。

要讓AI理解并利用知識來解決復(fù)雜的現(xiàn)實(shí)問題,首先需要將這些內(nèi)容轉(zhuǎn)化為數(shù)學(xué)語言,變成AI可解的數(shù)據(jù)化路徑。

不過,一個(gè)AI系統(tǒng)中需要被表示的知識類型有很多,想要全面且準(zhǔn)確地表示出來并不容易。

其中,既有容易被表征的陳述性知識,如何做某事的程序性知識;也有不易被描述出來的知識,像是基于某個(gè)領(lǐng)域的專家經(jīng)驗(yàn)所總結(jié)的啟發(fā)性知識,就未必全是正確的;以及表示概念關(guān)系的結(jié)構(gòu)知識,比如分子和分子的相互作用,目前人類了解得還不夠全面。

知識表征的準(zhǔn)確性,將直接影響到機(jī)器是否能像人類一樣智能。

2.知識推理的多樣性。

推理能力是人類與其他物種最大的不同,尤其是創(chuàng)造性思維。而知識計(jì)算的核心能力正是推理能力,根據(jù)現(xiàn)有的表征結(jié)構(gòu)產(chǎn)生相對應(yīng)的新知識,為產(chǎn)業(yè)側(cè)提供創(chuàng)造性見解。

完全可以想象這樣一個(gè)場景:建立一個(gè)龐大的知識庫,儲(chǔ)存著人類完成各種任務(wù)所需要的知識, AI不再需要對每一個(gè)特定場景、特定數(shù)據(jù)集進(jìn)行專門訓(xùn)練,可以像一個(gè)真正的聰慧人類一樣,觸類旁通、舉一反三,輕松地完成推理分析,應(yīng)對現(xiàn)實(shí)世界中各種各樣的復(fù)雜任務(wù)。

3. 知識獲取的自動(dòng)化。

建立常識庫并不是件容易的事,也被叫做“AI 的曼哈頓工程”。 尤其是信息爆炸帶來的海量數(shù)據(jù),需要機(jī)器接管將信息轉(zhuǎn)化為知識的工作,要提高知識獲取的效率,自動(dòng)化成為必須啃下的一塊硬骨頭。

使用自動(dòng)化方法來獲取新知識,能夠加快AI知識系統(tǒng)迭代,實(shí)現(xiàn)模型的自動(dòng)更新,縮短構(gòu)建行業(yè)知識圖譜的時(shí)間。

4. 知識應(yīng)用的高效率。

不同行業(yè)的知識沉淀、應(yīng)用、管理方式千差萬別,讓企業(yè)自己去搭建一套個(gè)性化工具并不現(xiàn)實(shí)。因此,知識計(jì)算想要落地行業(yè),還需要一系列標(biāo)準(zhǔn)化工具,提供知識搜索、高性能查詢、可視化分析等功能,提高對知識的挖掘效率。

作為一個(gè)新崛起的技術(shù)方向,需要有前瞻眼光的平臺化科技企業(yè)與組織來做好基礎(chǔ)設(shè)施建設(shè),并將能力接口向各行各業(yè)企開放。

數(shù)據(jù)和信息描述世界,知識和智慧理解世界。從這個(gè)角度說,AI在DIKW金字塔上的層次越高,能力就越強(qiáng),距離強(qiáng)人工智能也就越近。這條攀爬之路并不好走,卻是AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化的必經(jīng)之路。

最后的最后,當(dāng)AI登上金字塔尖的那一刻,獲得真正的智慧,屆時(shí)我們已經(jīng)不能確定,AI會(huì)不會(huì)是地球上最聰明的物體了。或者說,人類還在智慧的最高層嗎?

正如艾略特在詩中所寫的:“我們在哪里丟失了知識中的智慧?又在哪里丟失了信息中的知識?”(Where is the wisdom we have lost in knowledge?/ Where is the knowledge we have lost in information?)

曾幾何時(shí),智慧是人類所特有的東西,是人作為萬物之靈長的代表。很多人正在數(shù)字時(shí)代,越來越少地掌握知識、主動(dòng)思考,越來越多地沉浸于支離破碎的數(shù)據(jù)和信息汪洋之中。

或許,當(dāng)我們見證AI向金字塔尖攀爬的時(shí)候,更重要的是,對人類向金字塔底部的滑落保持一點(diǎn)警醒。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。