文|智東西 李水青
編輯|心緣
人形機(jī)器人,正在硬科技圈里掀起一陣新熱潮。
幾天之后,特斯拉的首款人形機(jī)器人,代號Tesla Bot(特斯拉機(jī)器人)或Optimus(擎天柱),將在特斯拉人工智能日上亮相。特斯拉CEO埃隆·馬斯克在科技圈幾乎有“點石成金”的魔力,從智能電動車到Space X和星鏈無一例外。
人形機(jī)器人能否接棒成為下一個產(chǎn)業(yè)風(fēng)口?引起了國內(nèi)智能產(chǎn)業(yè)界的關(guān)注和討論。
人形機(jī)器人也稱仿人機(jī)器人,顧名思義,是指具有類人的外觀、感知、決策、行為和交互能力的機(jī)器人。就像《星際穿越》中的機(jī)器人塔斯,能聊天講笑話、能跑能救人,代表了人們腦海中機(jī)器人的理想形態(tài)。這是一個相當(dāng)高技術(shù)、高投入的綜合性領(lǐng)域,從日本阿西莫到波士頓動力阿特拉斯,每一個機(jī)器人都成本高昂,與商用化落地有一定距離。特斯拉、戴森等科技巨頭的入局,無疑為產(chǎn)業(yè)帶來了新轉(zhuǎn)機(jī)。
當(dāng)下,人形機(jī)器人發(fā)展情況如何?又會因科技巨頭的入局產(chǎn)生什么新變化?相比于國際水平,國產(chǎn)人形機(jī)器人又處于什么段位?近期,我們聯(lián)系到優(yōu)必選科技人形機(jī)器人創(chuàng)新中心負(fù)責(zé)人付春江,與他就這些問題進(jìn)行了深入探討。
創(chuàng)立于2012年的優(yōu)必選科技研發(fā)人形機(jī)器人已超十年之久,是國內(nèi)首家實現(xiàn)人形機(jī)器人商業(yè)化落地的企業(yè)。付春江是人形機(jī)器人產(chǎn)業(yè)10年老兵,曾就職于本田公司阿西莫(ASIMO)團(tuán)隊,那里誕生過全球首臺獨立行走和獨立奔跑的雙足機(jī)器人。
從特斯拉的人形機(jī)器人版圖聊起,付春江為我們帶來了關(guān)于人形機(jī)器人技術(shù)和產(chǎn)業(yè)的更多真相。
01.特斯拉做人形機(jī)器人就像IBM將商用電腦PC化
在去年8月的特斯拉人工智能日上,一個身著白衣、頭戴黑面紗的真人扮演的機(jī)器人登場,用一段滑稽舞蹈,向全世界宣布了特斯拉要“造人”的消息。一年后,在10月1日的新一屆特斯拉AI日,這個特斯拉機(jī)器人就要正式亮相。
根據(jù)預(yù)告,特斯拉機(jī)器人的身材苗條,身高約172cm,重量僅56.6kg,皮膚比人還光滑。按照馬斯克的暢想,其人形機(jī)器人早期定位代替人們從事枯燥、危險性的工作,未來則進(jìn)入千家萬戶,做飯、修剪草坪、照顧老人。
在今年4月一次采訪中,馬斯克直接透露,特斯拉機(jī)器人預(yù)計售價2.5萬美元(約合人民幣17萬元左右),可能比特斯拉汽車便宜得多。
“馬斯克做的事情大都很宏大長遠(yuǎn),并且在科技難度、維度上是有上升的,也往往是一個國家科技部、產(chǎn)業(yè)部布局的方向。發(fā)達(dá)國家缺乏勞動力,馬斯克是對發(fā)展中國家這種豐富勞動力的一種對標(biāo)?!备洞航嬖V智東西,“類似于1981年IBM推出世界上第一臺個人電腦,將電腦從政府軍工市場推向消費市場,特斯拉入局人形機(jī)器人,有望把人形機(jī)器人‘PC 化’?!?/p>
▲機(jī)器人特斯拉機(jī)器人參數(shù)預(yù)告
作為機(jī)器人皇冠上的明珠,人們長期以來期待人形機(jī)器人達(dá)到更高的智能水平。為了滿足需要,人形機(jī)器人第一是不需要重新適應(yīng)人所在的環(huán)境,第二是可以使用人所用的工具,第三是與人進(jìn)行情感交互。顯然,特斯拉的入局讓產(chǎn)業(yè)看到機(jī)器人形態(tài)逼近這一目標(biāo)的更大可能。
根據(jù)特斯拉的預(yù)告,特斯拉機(jī)器人內(nèi)部搭載40個電機(jī),雙腿內(nèi)含力量感應(yīng)裝置,移動速度可達(dá)8公里/小時,可負(fù)重20公斤的物品。
視覺和大腦是人形機(jī)器人的關(guān)鍵系統(tǒng)。按照預(yù)告,特斯拉機(jī)器人將基于特斯拉的FSD(完全自動駕駛)的計算機(jī)模組和方案,面部采用了八個Autopilot 的攝像頭,最遠(yuǎn)監(jiān)測距離可達(dá)250米;“大腦”運用了特斯拉的超級計算機(jī)系統(tǒng)Dojo,通過AI大數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,其核心是算力極強(qiáng)、帶寬超高的“D1”芯片,25個芯片組成一個訓(xùn)練單元,算力可達(dá)9千萬億次。
付春江對此表示期待,他認(rèn)為,特斯拉有望相較同代產(chǎn)品實現(xiàn)較大改進(jìn)。
特拉斯造人形機(jī)器人或許要追溯到四年前,彼時,馬斯克談及了其工廠“過于依賴機(jī)器人”。比如,2018年時絨毛機(jī)器人造成了Model 3量產(chǎn)速度放緩,這是因為絨毛機(jī)器人主要負(fù)責(zé)將絨毛材質(zhì)的玻璃纖維墊放到Model 3電池組頂部,但機(jī)器人并不擅長拾取絨毛,造成產(chǎn)品線常常失靈。
卡內(nèi)基梅隆大學(xué)機(jī)械工程教授Aaron Johnson說,絨毛機(jī)器人是“一個有趣的例子”,它充分說明了一點,即自主性很難推廣,看似簡單的處理柔軟的絨毛材料的任務(wù)會遇到巨大的問題,因為它不像剛性部件那樣可預(yù)測。
迄今為止,特斯拉已經(jīng)雇傭了數(shù)百個專門為生產(chǎn)汽車而設(shè)計的機(jī)器人,但有不少任務(wù)機(jī)器人表現(xiàn)遠(yuǎn)不如人類。特斯拉機(jī)器人如果能解決這些機(jī)器人工作的難題,有望促進(jìn)人形機(jī)器人的產(chǎn)業(yè)化落地向前進(jìn)一大步。
根據(jù)公開信息可知,目前,特斯拉正在瘋狂招聘人形機(jī)器人的工作人員,發(fā)布了大約20個職位,包括設(shè)計“驅(qū)動器”等機(jī)器人關(guān)鍵部件的工作。
其中一份招聘啟事稱:“你編寫的高質(zhì)量代碼將在全球數(shù)百萬人形機(jī)器人上長期運行。”此事透露出來馬斯克將要部署數(shù)百萬臺的人形機(jī)器人,足以看出其對人形機(jī)器人領(lǐng)域的野心和他強(qiáng)大的行動力。
這也解釋了為什么,特斯拉被期待像IBM將商用電腦PC化一樣,促進(jìn)人形機(jī)器人走向廣大消費者。
02.價格低于一輛汽車背后是三大技術(shù)流派融合
售價2.5萬美元,約合人民幣17萬元左右,特斯拉機(jī)器人的預(yù)告定價幾乎低于一輛車的水平。有傳言稱,這一價格最早在2023年投入生產(chǎn)就能實現(xiàn)。
對此,付春江判斷在2025~2030年之間,達(dá)成這個價格的可能性還比較小。
人形機(jī)器人是一個高技術(shù)、綜合性工程,對比市面上熱門的四足機(jī)器人來看——人形機(jī)器人基本上有四十個以上的關(guān)節(jié),四足機(jī)器人可能只有八個關(guān)節(jié);人形機(jī)器人到現(xiàn)在為止還沒有全面開源,四足機(jī)器人有相關(guān)的開源。市面上做四足機(jī)器人的企業(yè)已經(jīng)很多,但產(chǎn)品化的人形機(jī)器人目前仍是少數(shù)玩家的游戲??梢钥吹?,人形機(jī)器人的難度遠(yuǎn)大于四足機(jī)器人。
日本本田公司的阿西莫人形機(jī)器人曾是該公司的形象代言人,但在經(jīng)過20多年的發(fā)展后,仍未商業(yè)化。通用汽車和美國宇航局?jǐn)y手開發(fā)的用于太空探索的人形機(jī)器人R2,也已停止研發(fā)。像Rethink Robotics這樣的幾家機(jī)器人初創(chuàng)公司也因為未能將產(chǎn)品商業(yè)化而倒閉。
人形機(jī)器人研發(fā)需要學(xué)習(xí)人體結(jié)構(gòu),主要涉及人體骨骼系統(tǒng)、人體肌肉系統(tǒng)、大腦和神經(jīng)系統(tǒng)三個層次。付春江說,目前,機(jī)器人大多停留在對人體骨骼系統(tǒng)的簡單模仿上;人體肌肉系統(tǒng)涉及驅(qū)動,當(dāng)下主要用舵機(jī),未來可能會用柔性仿人肌肉的方式;在控制領(lǐng)域,人形機(jī)器人對大腦和神經(jīng)系統(tǒng)有很多借鑒,但目前仍是一個黑箱。
回顧人形機(jī)器人發(fā)展歷程,最早可以追溯到1967年。彼時,日本早稻田大學(xué)加藤一郎教授發(fā)布雙足機(jī)器人WL-1;1992年,本田公司推出仿人機(jī)器人P2則開啟系統(tǒng)高度集成人形機(jī)器人的新時代,其在2000年又推出能上下樓和跳舞的阿西莫(ASIMO)機(jī)器人,代表了當(dāng)時最高水平。進(jìn)入2011年,新一代阿西莫的奔跑速度可達(dá)9km/h,而僅僅2年后的2013年,波士頓動力發(fā)布Atlas則開啟了一個新時代。其采用液壓控制,將高動態(tài)運動推向極致,單腳站立、碎石行走都不成問題。2020年至今更是不斷推出三級跳、前滾翻、倒立等高難度動作。
技術(shù)的發(fā)展往往有一個從特殊到一般的過程,人形機(jī)器人的發(fā)展也不例外。付春江談道,從軟件算法來看,人形機(jī)器人玩家可粗略分為以下三大技術(shù)流派:
1、控制主導(dǎo)。典型代表是最早做出自制型人形機(jī)器人的本田公司,主要基于簡化解析模型控制方法,快速分解各種動作及動作組合,支持人形機(jī)器人運動。在算力受限時代,這一方法能快速實時地處理任務(wù)。
2、優(yōu)化主導(dǎo)。典型代表是波士頓動力公司,它沒有找到可以解析化的分解模型,而是找到了可分解的運動控制規(guī)律經(jīng)驗。但這種方法難以量化與動作組合,因此波士頓動力在推出第一款人形機(jī)器人之后沉寂多年,直到后來采取直接優(yōu)化的方法才重回巔峰。
3、硬件剛?cè)峄旌吓浜蠈W(xué)習(xí)算法。典型代表是美國敏捷動力公司,它沒有采取控制主導(dǎo)與優(yōu)化主導(dǎo)路徑,而是嘗試新的硬件控制程式,通過串并聯(lián)、硬柔軟這種混合結(jié)構(gòu)實現(xiàn)控制。
付春江告訴我們,現(xiàn)在人形機(jī)器人技術(shù)流派正走向融合,這也是特斯拉入局人形機(jī)器人的背后技術(shù)驅(qū)動力。
根據(jù)業(yè)界推測,特斯拉推出的人形機(jī)器人或許會用一套神經(jīng)網(wǎng)絡(luò)搭建一個統(tǒng)一架構(gòu),一統(tǒng)視覺感知、認(rèn)知乃至運動控制系統(tǒng),并依托大算力及智能電動車中積累的視覺感知能力。其控制框架可能很多都上位基于模型預(yù)測控制,下位直接基于全身力控,然后再利用學(xué)習(xí)或者仿真解決一下場景化的問題,從而取得比較好的結(jié)果。
也就是說,特斯拉將可能推出一款將過往幾十年研究成果集大成的跨代產(chǎn)品。
亞利桑那州立大學(xué)人類系統(tǒng)工程學(xué)教授Nancy Cooke認(rèn)為,要想成功,特斯拉需要讓機(jī)器人完成多種無腳本的動作。在沒有明確指示的情況下,人形機(jī)器人很難在現(xiàn)實中自由走動。但特斯拉可以利用其在人工智能和關(guān)鍵芯片方面的專長,大規(guī)模開發(fā)和生產(chǎn)成本更低的智能人形機(jī)器人,促進(jìn)人形機(jī)器人的商品化。
付春江也有類似的期待,特斯拉開發(fā)自動駕駛所積累的神經(jīng)網(wǎng)絡(luò)經(jīng)驗及架構(gòu)、AI算法、數(shù)據(jù),可以遷移到人形機(jī)器人上。“與機(jī)器人相比,自動駕駛處理的任務(wù)對實時性要求更高,速度放到人形機(jī)器人上有性能冗余;但機(jī)器人與人體、與環(huán)境的交互大不相同,在處理觸碰問題時如何將過去的架構(gòu)做調(diào)整,這是令人好奇的?!?/p>
“特斯拉有能力在短時間內(nèi)建一個大規(guī)模的開發(fā)團(tuán)隊,在動作多樣性上加大開發(fā),在算力上加大投入。同時,特斯拉在開發(fā)自動駕駛汽車時開發(fā)了各種芯片、算法平臺化能力,并打造了一體化的生產(chǎn)制造方式,都可以應(yīng)用于人形機(jī)器人;人形機(jī)器人在舵機(jī)、速器、電池?zé)峁芾淼确矫媾c自動駕駛共用產(chǎn)業(yè)鏈,特斯拉的供應(yīng)鏈掌控力也可以復(fù)用。此外,特斯拉在航天衛(wèi)星積累下來的材料優(yōu)勢也可以用于人形機(jī)器人。”
也就是說,除了技術(shù)路線上的前瞻性,特斯拉積累的許多技術(shù)可以被復(fù)用,使其成為扛起人形機(jī)器人創(chuàng)新大旗的不二人選。
03.國內(nèi)產(chǎn)業(yè)鏈或迎來“春天”人形機(jī)器人仍面臨四大挑戰(zhàn)
“特斯拉、戴森等巨頭的入局,對人形機(jī)器人產(chǎn)業(yè)來說是一個重大利好?!备洞航嬖V智東西,“我們知道,過去人形機(jī)器人除了技術(shù)原因方面之外,相關(guān)成本與售價問題也是一個難點。特斯拉等大型企業(yè)進(jìn)來,有望通過造幾十萬臺上百萬臺量級的機(jī)器人,大大帶動上下游的產(chǎn)業(yè)鏈發(fā)展?!?/p>
人形機(jī)器人涉及到電機(jī)、減速器、結(jié)構(gòu)件、電池、傳感器、機(jī)器人殼體等產(chǎn)業(yè)鏈環(huán)節(jié)。以人形機(jī)器人關(guān)節(jié)為例,數(shù)量多達(dá)25-50個,成本占比高達(dá)整機(jī)的50%。電機(jī)作為關(guān)節(jié)里的核心驅(qū)動部件,影響關(guān)節(jié)的輸出力大小和運動性能。根據(jù)中信建投報告,人形機(jī)器人規(guī)模量產(chǎn)有望帶動電機(jī)需求快速爆發(fā),新增電機(jī)市場規(guī)模有望近千億元,這勢必促進(jìn)國內(nèi)廠商生產(chǎn)更加物美價廉的產(chǎn)品。
實際上,面對人形機(jī)器人產(chǎn)業(yè)技術(shù)大融合趨勢,國內(nèi)公司和科研人才也在國內(nèi)看到了產(chǎn)業(yè)新機(jī)會??礈?zhǔn)國內(nèi)經(jīng)濟(jì)實力、科研成果、制造能力條件具備,眾多科技人才紛紛選擇回國發(fā)展。曾就職于本田阿西莫機(jī)器人團(tuán)隊的付春江是其中之一。
“國內(nèi)科研成果方面形成了巨大的蓄水池,提高了整體產(chǎn)業(yè)勢能。比如,現(xiàn)在我們想找一個什么前沿技術(shù),在國內(nèi)基本都能找到。同時,國內(nèi)也有大量的人才資源,各個門類的人才能撐起創(chuàng)新產(chǎn)業(yè)發(fā)展。”付春江說。在過去10年的研究生涯中,付春江主要圍繞人形機(jī)器人的穩(wěn)定性、運動的魯棒性,以及環(huán)境適應(yīng)性、動作多樣性展開研究。
恰逢2021年特斯拉機(jī)器人傳出消息前夕,付春江回國,而后選擇加入有十余年研發(fā)經(jīng)驗的優(yōu)必選科技。資料顯示,優(yōu)必選科技已經(jīng)布局了包括高性能伺服驅(qū)動器、機(jī)械傳動、運動規(guī)劃與控制、計算機(jī)視覺與感知、智能語音交互、SLAM與導(dǎo)航、人機(jī)交互和手眼協(xié)調(diào)等核心技術(shù),同時推出了機(jī)器人操作系統(tǒng)應(yīng)用框架ROSA。2022年,其大型人形機(jī)器人Walker作為中國硬科技的代表,在迪拜世博會中國館累計工作超過1200個小時,完成了1000個場次的接待任務(wù)。
付春江透露,優(yōu)必選科技持續(xù)在攻堅人形機(jī)器人相關(guān)技術(shù),公司正在電子皮膚、并聯(lián)結(jié)構(gòu)、整機(jī)優(yōu)化、降低成本上下功夫。
但他也坦言,國內(nèi)人形機(jī)器人產(chǎn)業(yè)發(fā)展也面臨肉眼可見的挑戰(zhàn)。
首先,人形機(jī)器人需要過技術(shù)產(chǎn)品這一關(guān),最大難點在于讓機(jī)器人靈活地與物體或環(huán)境接觸,在穩(wěn)定性、動作自然性、動作多樣性還有待提高。
在穩(wěn)定性方面,這要求機(jī)器人企業(yè)設(shè)定多級的穩(wěn)定性策略,比如包括步態(tài)周期調(diào)整、腳底接觸面調(diào)整、摔倒爬起機(jī)制等多個策略;在動作自然性方面,需要通過動力學(xué)模型進(jìn)行高維度動作探索;動作多樣性方面,則需要通過模仿人的動作或參考人做動作的相關(guān)依據(jù),促進(jìn)人形機(jī)器人探索更多高難度動作。
動作泛化是另一大人形機(jī)器人產(chǎn)品需要攻克的難題,簡單來說,就是如何讓機(jī)器人舉一反三。從全球人形機(jī)器人發(fā)展格局來看,一個方案是像波士頓動力一樣建立足夠大的庫,調(diào)用各種動作;另一個方案則是取決于大型通用AI的發(fā)展,通過通用AI讓機(jī)器人識別任務(wù),實現(xiàn)各種動作,就不需要建大型的庫。
當(dāng)下,人形機(jī)器人的限制性條件一個是通用AI技術(shù)的發(fā)展,另一個還要回歸到成本。
人形機(jī)器人成本何時能降到接近一輛車的價格?這決定其是否能真正進(jìn)入家庭。目前,大多數(shù)知名人形機(jī)器人產(chǎn)品的成本均在100萬元以上。優(yōu)必選是國內(nèi)首家將硬件成本降至10萬美元/臺的公司,但付春江認(rèn)為,近年有望繼續(xù)降到5萬美元/臺。
在人形機(jī)器人的成本地圖中,成本最高的主要是舵機(jī),包括電機(jī)減速器、編碼器、電機(jī)結(jié)構(gòu)件等,占成本1/3~1/2;另外一部分是各種電子傳感器與算力板,占到將近1/4~1/3;除此之外還有整機(jī)結(jié)構(gòu)件等。付春江談道,隨著量產(chǎn),人形機(jī)器人的整機(jī)結(jié)構(gòu)件和舵機(jī)成本將大大降低,結(jié)構(gòu)件則需要靠材料和加工技術(shù)的升級。他認(rèn)為,量產(chǎn)后整機(jī)成本降低50%是完全有可能實現(xiàn)的。
最后,付春江談及了生態(tài)合作的重要性。
“人形機(jī)器人牽扯的方面非常復(fù)雜,不是一個人、一個團(tuán)隊能做好的事,因此需要覆蓋產(chǎn)學(xué)研的生態(tài)合作,在技術(shù)、資金、實驗平臺、基礎(chǔ)接口等方面都需要進(jìn)行合作,以避免重復(fù)造輪子。”
04.結(jié)語:搶灘人形機(jī)器人賽道考驗長期技術(shù)積累
讓人形機(jī)器人來幫我們做重復(fù)、單調(diào)、危險的工作,是人類科技發(fā)展的星辰大海。如果特斯拉機(jī)器人本次真的驚艷行業(yè),那么星辰大海離我們又近了一步?!暗?025年,人形機(jī)器人在半結(jié)構(gòu)化場景將對一些工作崗位進(jìn)行輔助;2030年,能對很多崗位的人力進(jìn)行替代,讓人們解放出來去做有創(chuàng)造性、感興趣的事情。”付春江說。
當(dāng)下,隨著我國經(jīng)濟(jì)實力、科研實力、制造業(yè)的發(fā)展,技術(shù)蓄水池的積累和創(chuàng)業(yè)熱情吸引一大批科技工作者回國投入新事業(yè)。人形機(jī)器人是一項極其復(fù)雜系統(tǒng)化的工程,這需要企業(yè)具備綜合科技硬實力,也需要整個生態(tài)匯聚力量,甚至由國家推動,堅持通過長期研發(fā)解決成本、通用智能等方面的關(guān)鍵問題。