文|智東西 程茜
編輯|心緣
智東西10月26日報(bào)道,上周二,波士頓動(dòng)力的Spot和Atlas機(jī)器人大秀舞技,“復(fù)現(xiàn)”了韓國男團(tuán)BTS的《Permission to Dance》MV,走位、動(dòng)作都栩栩如生。
機(jī)器人開始進(jìn)軍娛樂圈,這是否意味著智能機(jī)器人離主宰地球、統(tǒng)治人類的未來又更進(jìn)了一步?畢竟從它萌芽之初,這樣的擔(dān)憂就一直圍繞在它周圍。
不過波士頓動(dòng)力的機(jī)器狗還只是個(gè)例,像這樣的顧慮現(xiàn)階段仍然是杞人憂天。
畢竟圍觀這么多年機(jī)器人發(fā)展,迄今能走進(jìn)人們?nèi)粘I钪械母魇綑C(jī)器人,不僅跟碳基生物的智商還相差甚遠(yuǎn),而且時(shí)不時(shí)做出一些或笨拙或愚蠢的行為。
就連馬斯克畫了一年的人形機(jī)器人“大餅”,也在10月1日舉行的特斯拉AI Day上被抬著出場,讓不少人感覺,就這?
半解剖裸露電線版特斯拉機(jī)器人,小心翼翼、步履蹣跚地完成了一次驚險(xiǎn)首秀。
這些年來,盡管機(jī)器人技術(shù)一直在進(jìn)步,但走進(jìn)主流視野的典型機(jī)器人們,總是不時(shí)貢獻(xiàn)出一些令人啼笑皆非的槽點(diǎn),特斯拉人形機(jī)器人的驚險(xiǎn)首秀已經(jīng)不算什么了,甚至還有人形機(jī)器人摔倒、掃地機(jī)器人炸家、送貨機(jī)器人翻車、寫作機(jī)器人裝文化……
那么問題來了:為什么機(jī)器人發(fā)展了60多年,卻仍然行動(dòng)遲緩、智商堪憂,并總是存在一些安全隱患?
01.機(jī)器人“翻車”現(xiàn)場:爬不起來、看不清、抓不住,甚至?xí)滤?/h4>
機(jī)器人的發(fā)展速度已經(jīng)非常迅猛,從波士頓動(dòng)力機(jī)器人翻跟頭、跳男團(tuán)舞,到掃地機(jī)器人解放人類雙手、機(jī)械臂在工廠內(nèi)按部就班,不過,看起來突飛猛進(jìn)的機(jī)器人,卻夾雜著各種各樣的翻車事件,令人啼笑皆非。
1、控制差:摔倒后自救困難,只能靠人工幫助
2021年世界人工智能大會(huì)上,人形機(jī)器人Walker X本該自信滿滿地演示快速行走,但沒走幾步,Walker X卻突然蹬腿倒地,直挺挺地趴在地板上,看起來是膝關(guān)節(jié)部位突然伸直使得人形機(jī)器人無法保持平衡,并且Walker X倒地瞬間和人腿部抽筋的狀態(tài)也十分相似。
不光人形機(jī)器人翻車,四條腿的機(jī)器狗也出故障了。
今年8月,一個(gè)“機(jī)器狗買咖啡”的視頻在網(wǎng)上大火,有博主購買了宇樹科技機(jī)器狗Go 1,并讓它前往附近的咖啡店買一杯咖啡,但后續(xù)發(fā)展卻啼笑皆非,本來科技感滿滿又炫酷的視頻變得喜感十足。
在官方發(fā)布的Go 1機(jī)器狗宣傳視頻中,它可以從3米高的地方后空翻落地后繼續(xù)正常起立行走,但視頻中Go 1前往咖啡館時(shí)在本該左轉(zhuǎn)的地方卻一直往前沖還打了個(gè)滾無法起身,不知道它是不是因?yàn)橐庾R(shí)到走錯(cuò)路了,卻沒剎住車,情急之下表演了一項(xiàng)雜技來轉(zhuǎn)移人們的注意力。
機(jī)器狗經(jīng)歷“千難萬險(xiǎn)”后,終于到達(dá)咖啡店買到了咖啡,正式開啟配送之路。但博主為它上面安裝的置物筐竟然沒有固定咖啡的裝置,導(dǎo)致沒走兩步其中一杯咖啡就光榮犧牲了。又因?yàn)榈孛嬗袨⑾碌目Х?,機(jī)器狗就開始在地面滑步,不能正常行走,咖啡“全軍覆沒”,最后只能靠博主來實(shí)施人工救援。
2、小“聾瞎”:離譜避障、摸魚好手,掃地機(jī)“發(fā)糞涂墻”
除了控制外,機(jī)器人的傳感系統(tǒng)出現(xiàn)故障,造成的后果往往令人啼笑皆非。
波士頓動(dòng)力的人形機(jī)器人能翻跟頭、跑酷、跳男團(tuán)舞,誰能想到它也翻過車呢。2017年,在“未來科學(xué)家與技術(shù)領(lǐng)袖大會(huì)”上,波士頓動(dòng)力的人形機(jī)器人Atlas首次亮相,它抱著箱子完美走完一圈后,本來應(yīng)該停下“謝幕”,卻抱著箱子翻下了演示臺(tái)。
不知道它是不是看上了這個(gè)箱子,想要趕緊抱走,結(jié)果走錯(cuò)了路。
人形機(jī)器人即使翻車,但離我們的生活仍然很遙遠(yuǎn),像消殺、導(dǎo)購、掃地機(jī)器人現(xiàn)在幾乎隨處可見,它們遇到故障往往也會(huì)波及人類。
新冠疫情爆發(fā)以來,邊溜達(dá)、邊消毒的消殺機(jī)器人時(shí)常會(huì)出現(xiàn)在商場中,但下圖這個(gè)消殺機(jī)器人在執(zhí)行任務(wù)時(shí),本應(yīng)從開門的位置順利通過,但最后它幾乎是蹭著門的邊緣硬擠過去的。不過,消殺機(jī)器人只要消殺到位,怎么到達(dá)下一個(gè)目的地其實(shí)是不是也不重要。
還有商場里出現(xiàn)很多的導(dǎo)購機(jī)器人,省去了我們問路、導(dǎo)航的繁瑣過程。
不過本來應(yīng)該乘坐直梯或者只在商場的一層內(nèi)工作的福州中防萬寶城導(dǎo)購機(jī)器人,在2020年12月25日,卻試圖乘坐自動(dòng)扶梯下樓,這就顯得有點(diǎn)自不量力了。
剛挨到傳送帶,它就從自動(dòng)扶梯上翻滾而下,還撞到了前方的兩位乘客。正常情況下,導(dǎo)購機(jī)器人的底盤面積遠(yuǎn)遠(yuǎn)大于自動(dòng)扶梯供人站立的面積,因此它應(yīng)該會(huì)主動(dòng)避開這類地點(diǎn),以防自己摔倒。
上面兩類機(jī)器人可能只是看起來有些智障,但下面這個(gè)就是“聞起來”令人絕望了。友情提醒,吃飯時(shí)請忽略下圖,這是一張有味道的圖片。
現(xiàn)如今,能掃、能拖的掃地機(jī)器人已經(jīng)成為我們居家生活的好幫手。但今年6月,北京一男子的掃地機(jī)器人在地板有狗狗大便的情況下,仍然兢兢業(yè)業(yè)的打掃完全屋,而他的另一臺(tái)負(fù)責(zé)拖地的機(jī)器人在識(shí)別到前方的糞便障礙物后就停止工作了。
上面說的可能是機(jī)器人識(shí)別上翻車,而下面這個(gè)機(jī)器人直接在工作時(shí)開始摸魚。網(wǎng)友戲稱:這個(gè)熱狗機(jī)器人像極了上班摸魚的我。
路邊的熱狗機(jī)器人本來是為過路的打工人提供24小時(shí)服務(wù),在饑腸轆轆的時(shí)候能吃到一個(gè)熱氣騰騰的熱狗。但你有經(jīng)歷過買了一個(gè)熱狗,卻只有面包嗎?這個(gè)熱狗機(jī)器人在“組裝”熱狗和面包時(shí),分別將它們放到了兩個(gè)架子上,然后只把面包裝進(jìn)了包裝袋,絲毫不顧及旁邊的熱狗。
不僅熱狗機(jī)器人,能寫一手好字的書法機(jī)器人也開始摸魚了。
2021年11月,機(jī)器人制造企業(yè)ABB在進(jìn)博會(huì)上展示了一個(gè)書寫機(jī)器人,演示過程中它需要模仿中間紙上的“進(jìn)博”二字,它提筆、沾墨、寫字一氣呵成后,紙上卻并沒有出現(xiàn)字?原來是它的筆尖并沒有落到紙上。
隨后,書寫機(jī)器人也立馬補(bǔ)救,寫出了漂亮的字,但人們對(duì)它翻車的關(guān)注明顯更高。
此外,還有一種和導(dǎo)購機(jī)器人形態(tài)類似的安保機(jī)器人,只不過它們的工作場所是在室外。
美國機(jī)器人創(chuàng)企Knightscope的安保機(jī)器人K5,是專門為停車場、校園、醫(yī)院的安保巡邏而設(shè)計(jì),能夠應(yīng)對(duì)復(fù)雜多變的地形。
不過2017年7月,K5在熟悉了華盛頓一處辦公樓附近環(huán)境一周后,卻發(fā)生了掉到噴泉里的慘劇,幾乎被“淹死”。當(dāng)天各大報(bào)紙的頭條都在大開腦洞,試圖為它“自殺”找一個(gè)合理的解釋,又說它是因?yàn)閰捑牍ぷ?,還有說因?yàn)槭ё愕梗瑓s沒有“手臂”支撐它站起來。
美國出租車企業(yè)Uber也聘請了安保機(jī)器人K5進(jìn)行巡邏,但這次事故相比于“淹死機(jī)器人自己”則更為嚴(yán)重。
2016年7月,K5在美國加利福尼亞州的斯坦福購物中心巡邏時(shí)撞到了一個(gè)16個(gè)月大的小朋友,當(dāng)他面朝下摔倒后,機(jī)器人并沒有停下來,而是繼續(xù)開走了,仿佛什么都沒有發(fā)生。
3、失手:機(jī)械化操作,不能靈活變通而傷人
機(jī)器人在實(shí)際應(yīng)用上,本該展示它們高超的自動(dòng)化工藝,或者精湛的下棋、巡邏技藝時(shí),往往會(huì)出現(xiàn)因嚴(yán)格遵循流程,不能靈活應(yīng)對(duì)突發(fā)情況的事件。
今年7月,莫斯科國際象棋公開賽上出現(xiàn)了特殊的選手——象棋機(jī)器人。本來是比拼棋藝的激烈場面,象棋機(jī)器人卻一把夾住對(duì)方棋手的手,導(dǎo)致小朋友手部受傷。原因好像是小朋友本來已經(jīng)下子,卻想調(diào)整一下,而象棋機(jī)器人則不能靈活變通,失手傷人。
不過不得不說,機(jī)器人在遵守規(guī)則方面真的很嚴(yán)格了。
其實(shí)下棋機(jī)器人現(xiàn)在還不常見,但電商倉庫、汽車制造工廠中,為了節(jié)省人力成本,往往會(huì)安裝成百上千臺(tái)機(jī)器人來代替人工完成重復(fù)性工作。
但與上述原因一致,過于遵循預(yù)定的流程,就會(huì)導(dǎo)致突發(fā)變故時(shí)難以及時(shí)調(diào)整機(jī)器人的動(dòng)作。
2021年12月,美國新澤西州亞馬遜倉庫因機(jī)器人發(fā)生了慘案。一個(gè)機(jī)器人在工作過程中戳破了有毒的防熊噴劑,導(dǎo)致80名亞馬遜員工身體不適,24名員工因?yàn)橛卸練庖和庑苟凰歪t(yī)。
在汽車制造工廠中同樣如此,2015年8月,印度汽車配件生產(chǎn)公司SKH Metals的24歲工人Ramji Lal,在工作時(shí)被一名機(jī)器人殺死。
他的同事說:“機(jī)器人經(jīng)過預(yù)先編程,可以焊接由它抬起的金屬板。在生產(chǎn)過程中,一塊金屬板脫臼了,Ramji Lal從機(jī)器人后面伸手去調(diào)整它。但預(yù)編程的機(jī)器人直接用焊條刺穿了他的腹部。”
4、暈頭:多機(jī)協(xié)同無法靈活變通,一臺(tái)故障全部“歇菜”
尤其是大型工廠內(nèi),經(jīng)常會(huì)有很多分揀、配送機(jī)器人來協(xié)同工作,它們每天各司其職,使得貨物分揀、運(yùn)送等工作流程都十分高效。
但2021年7月,英國電商網(wǎng)站Ocado分揀機(jī)器人發(fā)生碰撞后引發(fā)的火災(zāi)足足燃燒了18個(gè)小時(shí)。
5、智障:人機(jī)對(duì)話時(shí)經(jīng)?!半u同鴨講”
安保機(jī)器人還發(fā)生過一件糗事。
諸如下圖的美國加州安保機(jī)器人,在巡邏時(shí),理應(yīng)讓人們獲取幫助時(shí)更加便捷,但一名女士向安保機(jī)器人報(bào)案時(shí),該機(jī)器人非但沒有受理案件,還為她唱了一首歌,不知道是不是當(dāng)時(shí)已經(jīng)到了安保機(jī)器人的下班時(shí)間。
02.機(jī)器人智障背后的秘密軟件、算法要背鍋
回到剛開始的問題,為什么機(jī)器人仍然看起來不夠聰明?想回答這個(gè)問題,我們可以從機(jī)器人是怎么動(dòng)起來的入手。
顧名思義,機(jī)器人就是“機(jī)器”+“人”,如果機(jī)器人的運(yùn)動(dòng)行為難以理解,我們可以先想想自己。當(dāng)眼睛看到前面有石頭,把這一傳遞給大腦,大腦將需要采取行動(dòng)避開障礙物的信號(hào)傳遞給四肢,然后我們抬腿邁過石頭。
我們再放到機(jī)器人系統(tǒng)中來看,機(jī)器人中的傳感系統(tǒng)對(duì)應(yīng)的就是五官,控制系統(tǒng)就是大腦,而驅(qū)動(dòng)和執(zhí)行機(jī)構(gòu)在人體中可能沒有具體對(duì)應(yīng)的位置,但可以近似看作我們的四肢和關(guān)節(jié)等。
▲機(jī)器人四大系統(tǒng)(圖片來源:CSDN)
現(xiàn)在看來,機(jī)器人很多行為表現(xiàn)智障到令人無語。帶著這個(gè)疑問,智東西對(duì)話了機(jī)器人行業(yè)的多位資深人士后,我們發(fā)現(xiàn)背后的原因與上面的四大系統(tǒng)密不可分。
1、控制、驅(qū)動(dòng)系統(tǒng):機(jī)器人已經(jīng)可以平衡控制,特殊場景有待優(yōu)化
小嬰兒最開始學(xué)的就是走路,和機(jī)器人一樣,不論是雙足、四足、輪子和履帶機(jī)器人,最先學(xué)習(xí)的就應(yīng)該是保持機(jī)器人動(dòng)態(tài)平衡。這些形態(tài)的機(jī)器人在保持平衡時(shí)難易程度不同,其中和生命體形態(tài)類似的四足、雙足機(jī)器人是技術(shù)難度較高的。
原因是這類形態(tài)的機(jī)器人足部與地面接觸面積很小,再加上材質(zhì)硬度較高,就好比你穿著滑冰鞋走在地面上時(shí),也很容易失去平衡摔倒。
我們回過頭來看機(jī)器人翻車集錦里的“機(jī)器狗買咖啡”事件,久平科技創(chuàng)始人、CEO王雪松說:“其實(shí)從完整的視頻中可以看到,在機(jī)器狗摔倒之后,它有明顯的自救行為,但可惜因?yàn)榈孛嬗锌Х?,?dǎo)致并沒有自救成功。”
從根源來講,如何在有咖啡等液體的光滑地面正常行走?這個(gè)問題屬于常見情況中的特殊情況,也就是說,我們不可能在剛學(xué)走路時(shí)就學(xué)習(xí)穿著滑冰鞋在冰場里滑行。王雪松談道,未來,機(jī)器人研發(fā)過程中可能會(huì)針對(duì)于這類特定的場景進(jìn)行研發(fā)。
在讓機(jī)器人動(dòng)起來的環(huán)節(jié)中,還有驅(qū)動(dòng)系統(tǒng)的關(guān)鍵部件——驅(qū)動(dòng)電機(jī),顧名思義,就是驅(qū)使機(jī)器人運(yùn)動(dòng)的系統(tǒng)。超級(jí)駱駝聯(lián)合創(chuàng)始人兼智能裝備負(fù)責(zé)人莊子駿談道,對(duì)于機(jī)器人本體來講,現(xiàn)在國內(nèi)機(jī)器人玩家面前的難題還在于驅(qū)動(dòng)電機(jī)的國產(chǎn)化、小型化。其中,波士頓動(dòng)力的機(jī)器人驅(qū)動(dòng)方式采用的是液壓驅(qū)動(dòng),而其他特斯拉、小米等機(jī)器人都采用的是電機(jī)驅(qū)動(dòng),我們可以簡單理解為前者是靠液壓油的壓力勢能,后者是靠電勢能。
就實(shí)現(xiàn)效果而言,機(jī)器人電機(jī)的能力已經(jīng)可以滿足機(jī)器人一般場景下的使用。但在為機(jī)器人提供動(dòng)力的同時(shí),如何使其更加微型化、輕量化,占用較小面積就能達(dá)到相同的功效也十分重要。畢竟體型越大的機(jī)器人體內(nèi)所需的精密零部件也就越多,理想情況下當(dāng)然是部件越小越好了。
▲特斯拉人形機(jī)器人的6種驅(qū)動(dòng)電機(jī)
2、傳感系統(tǒng):純線條不能識(shí)別糞便,模擬人眼構(gòu)建三維視圖
令人印象深刻的機(jī)器人翻車事件莫過于掃地機(jī)器人“發(fā)糞涂墻”了,而這也和機(jī)器人的五官密不可分,除了看到還需要讓它們看清前面是什么,到底能不能清掃,會(huì)不會(huì)搞壞自己。
因此,模擬人眼的3D視覺方案就是目前最有效的。
機(jī)器人的視覺感知系統(tǒng)主要包括激光雷達(dá)、3D視覺兩種。激光雷達(dá)就和智能汽車上的一樣,其工作原理是,向前方的目標(biāo)發(fā)射探測信號(hào),然后將接收到的從目標(biāo)反射回來的信號(hào)進(jìn)行適當(dāng)處理,獲取前方目標(biāo)的相關(guān)信息。
值得注意的是,這種信號(hào)是線條狀的激光束,因此只能讓機(jī)器人感知到前方的物體形狀或者前方有障礙物,并不能明確物體形態(tài)到底是什么。
但是即便單用激光雷達(dá)不能實(shí)現(xiàn)更好的感知,讓機(jī)器人玩家做純視覺方案也很難,這背后的難點(diǎn)在于對(duì)算力、芯片的需求。因此國內(nèi)一些機(jī)器人玩家采用了激光雷達(dá)和3D視覺相結(jié)合的方案來進(jìn)行感知,這樣在算力和感知能力上都得到了一定的提升。
不過,算力、資金在特斯拉面前都不算什么難題,特斯拉的人形機(jī)器人“擎天柱”采用的就是純視覺方案。超節(jié)點(diǎn)創(chuàng)新科技林智賓說:“特斯拉能做機(jī)器人的一個(gè)原因就是,它將做智能汽車的HW3.0系統(tǒng)移植到了機(jī)器人算力系統(tǒng)中,可以支撐起視覺計(jì)算?!?/p>
除了算力要求外,這背后的研發(fā)成本、人才儲(chǔ)備也讓機(jī)器人玩家苦不堪言。林智賓補(bǔ)充道,隨著自動(dòng)駕駛、無人機(jī)、元宇宙等領(lǐng)域?qū)σ曈X人才的需求不斷增多,機(jī)器人玩家在這其中的競爭力稍弱,因此視覺人才的儲(chǔ)備對(duì)于機(jī)器人玩家來說也是一大難題。
這也導(dǎo)致,最近幾年擁有3D視覺的掃地機(jī)器人大多出現(xiàn)在高端掃地機(jī)器人設(shè)備上,如今年3月,iRobot的旗艦掃地機(jī)器人Roomba J7就采用的是視覺避障技術(shù),而這款掃地機(jī)器人的價(jià)格高達(dá)849美元(約人民幣5500元).
此外,即便機(jī)器人通過視覺感知到前方物體,但其識(shí)別事物特征的方式與人類不同,如人類在識(shí)別貓的種類時(shí),可能會(huì)通過毛色、長短、眼睛和耳朵的形狀、叫聲等,但計(jì)算機(jī)也許是通過別的特征來進(jìn)行判斷。
因此,研發(fā)人員可能只能看到其識(shí)別結(jié)果,而無法從精準(zhǔn)優(yōu)化其識(shí)別過程。
3、軟件:機(jī)器人成長還不成熟,無法應(yīng)對(duì)特殊未知情況
再從更加宏觀的技術(shù)角度來看,久平科技創(chuàng)始人、CEO王雪松告訴智東西,機(jī)器人在硬件領(lǐng)域的基礎(chǔ)設(shè)施已經(jīng)相對(duì)成熟,沒有特別大的技術(shù)難點(diǎn),在一些關(guān)鍵零部件上基本成熟?!白叩念濐澪∥〉脑蚋噙€是在軟件、算法上?!?/p>
機(jī)器人的靈活性已經(jīng)可以滿足一般需求,而上面說到的突然摔倒、發(fā)生碰撞等情況,可能和其傳感器突然失靈有關(guān),與其硬件本身的關(guān)系不大。
人在生活、工作時(shí)也會(huì)遇到陌生的環(huán)境不知道如何應(yīng)對(duì),只能是第一次見過后積累經(jīng)驗(yàn),所以對(duì)于機(jī)器人也是一樣,研發(fā)人員不可能在設(shè)計(jì)初期就考慮到所有的情況,因此只能針對(duì)常見的情形對(duì)其優(yōu)化。
“這背后的關(guān)鍵其實(shí)不是機(jī)器人研發(fā)的難點(diǎn),而是機(jī)器人要做什么,也就是通用和專用機(jī)器人的區(qū)分?!蓖跹┧烧劦馈Mㄓ脵C(jī)器人可能是智能化程度極高,可以像人一樣靈活變通,做到“我是一塊磚,哪里需要哪里搬”,王雪松也坦言,他認(rèn)為只有當(dāng)?shù)讓拥乃懔?、算法?shí)現(xiàn)突破,這一愿景才能實(shí)現(xiàn),因此,現(xiàn)階段他更傾向于專用型機(jī)器人。
機(jī)器人作為一項(xiàng)技術(shù),和人工智能、5G等一樣,更多是為現(xiàn)有的一些工具服務(wù),為其進(jìn)行智能化升級(jí),因此,面向細(xì)分場景的機(jī)器人,或者說能夠做到“在其位謀其職”可能是目前更應(yīng)該考慮的發(fā)展方向。
可以看出,目前為止,機(jī)器人的技術(shù)進(jìn)展已經(jīng)走在前面,使得機(jī)械臂、掃地機(jī)器人等能夠在工廠、家庭里幫助人類做很多事情,但軟件層面的不足讓其真正落地、普及還是一大難題,因此,但看機(jī)器人現(xiàn)在的智障行徑,離統(tǒng)治地球、主宰人類還很遙遠(yuǎn)。
03.機(jī)器人研究百花齊放“發(fā)糞涂墻”正在成為過去
雖然機(jī)器人看起來還很智障,但學(xué)界百花齊放的研究成果讓人看到這一產(chǎn)業(yè)正在飛速發(fā)展。
一直以來,模擬各種生物體的仿生機(jī)器人就是各大研究機(jī)構(gòu)青睞的領(lǐng)域。
今年10月,美國耶魯大學(xué)一只兩棲機(jī)器龜(ART)登上了國際學(xué)術(shù)頂刊Nature的封面。作為一只兩棲“動(dòng)物”,它可以變換形態(tài),讓四肢在地面、水里都順暢行動(dòng)。
不過看其在地面行走的時(shí)候,仍然十分笨拙,像剛剛學(xué)會(huì)走路的小嬰兒。
有時(shí)候機(jī)器人在搜救、巡邏時(shí)往往會(huì)面對(duì)范圍特別大的情況,一臺(tái)機(jī)器人想要執(zhí)行搜救任務(wù)就會(huì)費(fèi)時(shí)費(fèi)力,因此,機(jī)器狗間的多機(jī)協(xié)作也是機(jī)器人界的一大研究方向。
今年10月,四足機(jī)器人研發(fā)創(chuàng)企云深處的5臺(tái)絕影X20四足機(jī)器人,自主規(guī)劃、決策,完成了在3000平米未知環(huán)境下對(duì)8個(gè)模擬目標(biāo)的協(xié)同搜索。在搜索過程中,它們還會(huì)及時(shí)“溝通”,避免搜索到重復(fù)區(qū)域,還能共享進(jìn)展,這樣看來,機(jī)器狗搜救不僅能標(biāo)記已搜索點(diǎn),還省去了稍顯古老的對(duì)講機(jī)設(shè)備。
前面說到,軟件是阻礙機(jī)器人智能化的關(guān)鍵,那么如何在短時(shí)間內(nèi)讓機(jī)器人更聰明也就十分重要了。
今年8月,谷歌重磅研究進(jìn)展公布,通過結(jié)合更強(qiáng)大的人工智能大型語言模型,使得機(jī)器人執(zhí)行命令的成功率從61%提高至74%,這項(xiàng)研究讓機(jī)器人從被動(dòng)執(zhí)行向主動(dòng)執(zhí)行、感知跨越了一大步。
這些介紹聽起來可能難以理解,舉個(gè)例子,比如,當(dāng)你問機(jī)器人:“我把飲料灑了,你能幫忙嗎?”谷歌機(jī)器人可以迅速篩出適配指令的合適行動(dòng),然后從廚房拿塊清潔海綿來。但一般機(jī)器人可能只有當(dāng)你完整說出:“我的飲料灑了,你能去廚房拿塊清潔海綿來嗎?”,才有可能理解你的意思。
傳感系統(tǒng)上,我們看到更多的可能還是視覺,但很多研發(fā)人員已經(jīng)將視野拓展到了味覺和觸覺。
今年5月,英國劍橋大學(xué)研發(fā)人員為機(jī)器人增加了“味覺”,機(jī)器人廚師能夠嘗到西紅柿炒雞蛋到底咸不咸,并一步步調(diào)整。
事實(shí)上,機(jī)器人并不是真的嘗到了咸的味道,而是通過基于電導(dǎo)的味覺傳感器的UR5機(jī)械臂的實(shí)驗(yàn)裝置,通過混合食物模擬咀嚼、電流傳導(dǎo)復(fù)現(xiàn)鹽的味道,幫助機(jī)器人品嘗食物的“味道”,也就是用電信號(hào)來表示咸信號(hào)。
觸覺的研發(fā)進(jìn)展則更令人驚艷。工業(yè)機(jī)器人搬箱子、舉重物都不在話下,但它們遇到材質(zhì)輕巧的千紙鶴該怎么辦?
今年4月,英國布里斯托大學(xué)研究人員為機(jī)器人研發(fā)了TacTip(人造指尖),也稱“光觸覺傳感器”,裝上這個(gè)人造指尖,機(jī)器人的手指就可以控制力道,輕輕提起千紙鶴,而不會(huì)只管運(yùn)送不顧千紙鶴是否完好。
……
這些研發(fā)思路對(duì)于機(jī)器人而言都具有極大的積極意義,未來一旦應(yīng)用到機(jī)器人研發(fā)、設(shè)計(jì)、生產(chǎn)上,將會(huì)大大提升其落地應(yīng)用的潛力。
究其根本,這些研發(fā)的方向都離不開機(jī)器人最基礎(chǔ)的傳感、控制、驅(qū)動(dòng)、執(zhí)行四大系統(tǒng)。
在視覺層面,現(xiàn)在味覺、觸覺傳感器距離落地應(yīng)用的機(jī)器人可能還十分遙遠(yuǎn),視覺感覺是目前最為常見的。因此,機(jī)器人如何行動(dòng)的“把關(guān)人”就是視覺,但只有視覺是不夠的,“現(xiàn)在除了視覺外,還需要AI來提高機(jī)器人的估計(jì)能力?!绷种琴e補(bǔ)充道。
我們可以舉一個(gè)最簡單的例子,當(dāng)掃地機(jī)器人識(shí)別到前方有糞便時(shí),它需要做兩件事:識(shí)別到糞便、在合適的地方繞開,如果它遠(yuǎn)遠(yuǎn)地看到糞便就繞開,那么中間很長一段距離就不會(huì)被清理到。因此,估計(jì)掃地機(jī)器人到障礙物的距離、提高AI識(shí)別能力也是各界玩家在研發(fā)的主要方向。
▲雙目視覺的成像原理
現(xiàn)階段最有效的解決方案可能是雙目3D視覺,這其實(shí)就是為了模擬人的兩只眼睛,能夠同時(shí)從多方位、多角度看到物體,這也就是為什么人看到的世界是立體的。利用這種視覺方案,機(jī)器人就可以計(jì)算距離,在合適的位置及時(shí)避開。
為了加快機(jī)器人應(yīng)用落地,機(jī)器人的強(qiáng)化學(xué)習(xí)和虛擬環(huán)境訓(xùn)練進(jìn)程也在加速。
你剛出生的時(shí)候,不會(huì)拿筷子、不會(huì)走路,在日復(fù)一日的積累、觀察下,你掌握了越來越多的技能,而這也就是機(jī)器人的強(qiáng)化學(xué)習(xí),從自己的經(jīng)驗(yàn)和行為中不斷學(xué)習(xí),比單純靠其他人一點(diǎn)點(diǎn)教學(xué)的方式簡單多了。
這種做法不僅能縮減機(jī)器人訓(xùn)練的時(shí)間和成本,在提升其智能化上也更有效,能夠讓機(jī)器人自己驅(qū)動(dòng)、控制關(guān)節(jié)來執(zhí)行指令,甚至產(chǎn)生讓研發(fā)人員意想不到的驚喜。比如,以機(jī)器狗為例,研發(fā)人員初期并沒有將應(yīng)對(duì)濕滑地面作為主要的優(yōu)化方向,但通過機(jī)器狗的自我學(xué)習(xí),也就是買了一次咖啡后,就增加了這個(gè)特殊場景的經(jīng)驗(yàn),之后或許可以及時(shí)識(shí)別前方地面上的液體并及時(shí)避開。
除此以外,機(jī)器人的訓(xùn)練成本其實(shí)非常高,如果在實(shí)際場景中訓(xùn)練,機(jī)器人容易磕碰,研發(fā)人員需要花費(fèi)金錢來維修,如果造價(jià)昂貴只有一臺(tái)的話可能還會(huì)拖慢研發(fā)進(jìn)度,因此,把機(jī)器人搬到虛擬世界中訓(xùn)練的想法就出現(xiàn)了。王雪松談道,他們一直在使用這種方法訓(xùn)練機(jī)器人。
今年10月,Meta(原Facebook)和紐約大學(xué)的研究人員提出了一種訓(xùn)練機(jī)器人的新框架HOLO-DEX,機(jī)器人訓(xùn)練不再需要“真刀真槍”演練,人帶著VR(虛擬現(xiàn)實(shí))頭顯置身虛擬世界,就可以教機(jī)器人“學(xué)習(xí)”。這些VR、AR等技術(shù)與機(jī)器人技術(shù)的結(jié)合,在不斷的碰撞中,又在加速機(jī)器人智能化、靈活性的升級(jí)。
總的來看,機(jī)器人的研發(fā)思路還是要回歸到它到底要做什么這一問題上來,它作為一項(xiàng)技術(shù),需要解決實(shí)際場景中的實(shí)際問題。因此,莊子駿認(rèn)為,未來一定是由場景定義機(jī)器人。這些研發(fā)的進(jìn)展也都遵循著這一觀點(diǎn)。
04.結(jié)語:機(jī)器人的未來是星辰大海
機(jī)器人這一看起來外形炫酷、對(duì)極客而言吸引力巨大的新物種,一直是人們熱議的話題。此次,馬斯克的人形機(jī)器人“擎天柱”更是再次將其推上話題的中心。
但目前而言,人們對(duì)于機(jī)器人的期望仍然過高,即使在硬件層面上已經(jīng)破解了多道技術(shù)難題,但作為未來被寄予厚望的機(jī)器人而言還遠(yuǎn)遠(yuǎn)不夠。夢想可以天馬行空,但技術(shù)進(jìn)步還是得一步一個(gè)腳印。仍有很多懸而未決的技術(shù)難題,有待研究人員和工程師們持續(xù)探索。
特斯拉人形機(jī)器人即便在發(fā)布時(shí)走的顫顫巍巍,但該公司對(duì)機(jī)器人研發(fā)的重視程度,及其在自動(dòng)駕駛領(lǐng)域的技術(shù)積累,都進(jìn)一步提振了這一產(chǎn)業(yè)。不過,想要實(shí)現(xiàn)如馬斯克所言讓機(jī)器人真的走進(jìn)家庭,還是難度很大的一件事。