界面新聞記者 | 戴晶晶
“ChatGPT主要是對于語言的處理能力,是‘缸中之腦’,如果想要通用人工智能真正發(fā)揮出力量,未來需要具身(Embodied)的實體,讓它能夠同真實的物理世界相交互來完成各種任務(wù),這樣才能夠帶來更大的價值?!?/p>
8月18日,在2023世界機器人大會上,2000年圖靈獎獲得者、中國科學(xué)院院士、清華大學(xué)交叉信息研究院院長姚期智指出,具身通用人工智能最理想的身體形式,應(yīng)該就是人形機器人。
通用人工智能(AGI)又被稱為強AI,即具有高效強大的自主學(xué)習(xí)、自我進(jìn)化等能力,能像人類一樣思考和決策的AI。去年年底面世的ChatGPT就是自學(xué)習(xí)人工智能的重大進(jìn)步,被認(rèn)為是AGI的一種早期形式。
具身智能是一種擁有實體并且能夠進(jìn)行實體互動的智能體,機器人是其中一種形態(tài)。在接受界面新聞等媒體采訪時,原IEEE機器人和自動化學(xué)會主席、香港大學(xué)講席教授席寧就表示,超越有限的語言數(shù)據(jù),通過傳感器等對周圍環(huán)境形成無限的感知,是具身智能最關(guān)鍵的一點。
英偉達(dá)CEO黃仁勛等大佬判斷,AI下一個浪潮將是具身智能。在此背景下,AI的熱潮火速燒到了“人形機器人+AI大模型”領(lǐng)域,特斯拉、谷歌、微軟和三星電子等科技巨頭已下場研發(fā)人形機器人。
“以往關(guān)于AI的會議和機器人的會議是完全不同的。但現(xiàn)在可以看到,在機器人相關(guān)的論壇,幾乎大家全在談AI。”新松機器人 (300024.SZ) 首席技術(shù)官張雷在2023世界機器人大會期間向界面新聞感概。
張雷表示,這是因為大家意識到了機器人從原來發(fā)展手臂、腳和眼睛,到了發(fā)展腦,大家在考慮機器人未來會成為真正的機器人。
在今年世界機器人大會上,優(yōu)必選、達(dá)闥科技、小米、追覓和帕西尼感知科技等多家企業(yè)展出了人形機器人,遠(yuǎn)超往屆人形機器人的數(shù)量,其中不乏更為高級的雙足人形機器人模型。
“我們的機器人已接入了ChatGPT大語言模型?!倍嗉移髽I(yè)強調(diào)。還有一家企業(yè)直言,光是一上午,單臺定制價格超50萬元的、面向家庭服務(wù)的人形機器人就拿到了六個訂單。
今年,上海、深圳和北京等地均推出相關(guān)政策,支持人形機器人發(fā)展。例如,8月16日印發(fā)的《北京市促進(jìn)機器人產(chǎn)業(yè)創(chuàng)新發(fā)展的若干措施》就提出,由機器人骨干企業(yè)牽頭,整合國內(nèi)外一流創(chuàng)新資源,組建人形機器人創(chuàng)新中心,開展關(guān)鍵共性技術(shù)研究。
在眾多專家和從業(yè)者看來,人形機器人是人工智能和機器人的發(fā)展方向,將在未來工業(yè)、服務(wù)業(yè)等領(lǐng)域扮演重要的角色。
姚期智認(rèn)為,當(dāng)前人類的社會環(huán)境就是為人類定制的,包括樓梯的結(jié)構(gòu)、門把手高度等等,如果要打造一個有泛應(yīng)用的通用機器人,人形才是最好最合適的形態(tài)。
“生活環(huán)境里面,到處都是符合人體工程學(xué)的事物,人形機器人尤其適合跟我們一起做陪伴,以及工作學(xué)習(xí)生活?!眱?yōu)必選科技創(chuàng)始人、董事長兼CEO周劍也在大會上指出,智能制造將成為人形機器人首個大規(guī)模應(yīng)用的領(lǐng)域,商用服務(wù)場景是人形機器人最快應(yīng)用的市場。
宇樹科技的創(chuàng)始人兼CEO王興興表示,每種工作都開發(fā)一類機器人會浪費時間,人形機器人仍是大家公認(rèn)的最好的通用機器人形態(tài)。
“我個人早幾年不看好人形機器人,因為覺得人類的控制技術(shù)完全沒辦法駕馭這么復(fù)雜的機器人形態(tài),但目前整個AI技術(shù)的發(fā)展已遠(yuǎn)超機器人需要的技術(shù)。”王興興認(rèn)為,通用人形機器人在技術(shù)層面已經(jīng)邁過了鴻溝,如果工程上能夠追上,人形機器人就可以發(fā)揮顛覆性的生產(chǎn)價值,尤其是工業(yè)價值。
????小米集團(tuán)高級副總裁曾學(xué)忠則認(rèn)為,仿人機器人是技術(shù)、制造、服務(wù)三個核心能力的交匯點,也是軟硬件跟AI技術(shù)融合的制高點。按照小米集團(tuán)的考慮,未來的智能制造體系中,自動化設(shè)備、仿人機器人以及人將以7:2:1的“黃金法則”來組成。
但目前人形機器人發(fā)展還面臨著諸多挑戰(zhàn)。
姚期智指出,首先機器人還需要像大語言模型一樣擁有一個具身模型,一步到位做好最底層的控制;其次,在計算能力方面,即使是谷歌的Robotic Transformer模型,也只能達(dá)到三個赫茲水平,距離真正需要的500個赫茲還有很大差距。此外,機器人多模態(tài)的感官感知融合和數(shù)據(jù)收集方面,還有大量的挑戰(zhàn)和問題。
“在AI部分,通用大模型本身并不是給通用人形機器人使用的,即使目前通用大模型已經(jīng)能很好地處理文本或者基本文字邏輯,但是它對環(huán)境的認(rèn)知和感知能力基本是零,無法認(rèn)知物理環(huán)境,也沒法抓取做操作,需要新的模型來訓(xùn)練。”王興興表示。
此外,德國慕尼黑工業(yè)大學(xué)教授AloisC.knoll提及,機器人也會消耗很多能源,因此需要在能源供應(yīng)如電池領(lǐng)域有新的技術(shù)突破。
清華大學(xué)交叉信息研究院助理教授、星動紀(jì)元創(chuàng)始人陳建宇表示,機器人軟硬件還面臨著不少瓶頸。
“目前所有技術(shù)都沒法兼顧力量、速度、精度以及成本,需要不斷地平衡。”陳建宇稱,軟件的問題是仍無法很好兼顧泛化性和控制任務(wù)操作的精巧性。
陳建宇提及,當(dāng)前人形機器人、通用機器人還處于一個剛剛開始的階段,問題不會很快得以解決,這是比較長期的過程,可能是5-10年,也可能更長。
達(dá)闥機器人有限公司創(chuàng)始人兼首席執(zhí)行官黃曉慶則對人形機器人的應(yīng)用十分樂觀。他在會上表示,希望到2025年,可以造出家庭保姆機器人;到2035年,機器人保姆就能夠服務(wù)千家萬戶。