文 | 數(shù)智界 蘇黎
編輯 | 殷浪浪
在許多科幻電影比如《西部世界》《終結(jié)者》《我,機器人》中,機器人都是以人類或者與人類外形高度相似的面貌出現(xiàn),行為動作與人類并無差別,擁有豐富的表情,甚至有著人類的情感。
我們一直窮盡辦法,希望機器人具有人類的智力和意識,甚至是情感,人形機器人就是對此追求的最高演化。
為了摘下這顆明珠,過去的50年里,一眾科技公司投入了大把的時間、精力和資源,希望將設(shè)想帶進現(xiàn)實。
今年8月,小米發(fā)布了一款人形機器人CyberOne,這是一款全尺寸人形仿生機器人,小米稱其具有聰明的「大腦」、發(fā)達的「小腦」、敏銳的「視覺」、強健的「四肢」。
簡單點來說,CyberOne能感知人類情緒、能協(xié)調(diào)控制自身運動、能看見聽見真實世界。
更早一些,去年8月份,特斯拉首次亮相了人形機器人“擎天柱”O(jiān)ptimus,馬斯克曾表示,Optimus甚至可能比汽車業(yè)務(wù)更重要。
巨頭公司的入場和新進展,總會帶有某種提振作用。比如早前馬斯克宣布即將推出 Optimus 時,鳴志電器的漲幅高達250.10%,京山輕機、川禾科技等10只概念股漲幅均超過100%;小米的 CyberOne 一經(jīng)推出,遠大智能在8月16日至8月22日連續(xù)五個交易日漲停,累計漲幅達74.49%。
但是剝開這層外衣,真正值得關(guān)心的問題是:
-
CyberOne也好,Optimus也罷,它們究竟是不是真正智能的人形機器人?
-
人形機器人是什么?有著怎樣的技術(shù)壁壘?
-
巨頭為什么要爭先布局該賽道?人形機器人的市場前景是怎樣的?
一、歷經(jīng)50年,從“能動”到“會動”
人形機器人,顧名思義,指的是具有人的某些特點或類似構(gòu)造(如感覺系統(tǒng)、運動系統(tǒng)等)的智能機器人,技術(shù)集成度最高、難度最大,是機器人領(lǐng)域的終局幻想,被譽為AI領(lǐng)域的終極形態(tài)。
它包含一套非常復(fù)雜的系統(tǒng)化構(gòu)造,簡單來看可以分為兩點:一個聰明的大腦,一套靈活的肢體關(guān)節(jié)。
目前,對于研發(fā)人形機器人整機的廠商來說,機器人的大腦基本由自己研發(fā),比如特斯拉的軟件主要由自己完成,包括行為決策與運動控制、神經(jīng)網(wǎng)絡(luò)自動訓(xùn)練等。
在肢體關(guān)節(jié)方面,人形機器人對于運動控制能力及感知計算能力要求較高,核心的零部件包括芯片、伺服系統(tǒng)、控制器、減速器和傳感器。
其中,控制器、伺服系統(tǒng)、減速器是三個最為重要的構(gòu)造。
控制器是對機器人的位置、速度、加速度等進行控制,簡單來說,影響著運動能力;伺服系統(tǒng)是使機器人的位置、方位、狀態(tài)等能夠隨著設(shè)定值的變化而變化,影響著機器人的運動精度和穩(wěn)定性;減速器不必多說,直接影響到機器人的運動自由度和安全性。
嚴格意義來講,智能化的人形機器人起步于日本,進入21世紀后美國占據(jù)主導(dǎo)地位,至今發(fā)展歷史只有50年,基本可以歸納成以下三個發(fā)展階段:
第一個階段:起步。時間范圍大致從1960年代后期至2000年。
日本在這一期間的研究成果最為矚目。1973年,日本早稻田大學(xué)研發(fā)出世界上第一款人形機器人WABOT-1;時隔近三十年后的2000年,日本本田公司發(fā)布了人形機器人ASIMO。
不過,當時的人形機器人,還處于初級階段,更多聚焦在運動能力的突破上,比如WABOT-1每走一步需要45秒鐘,而ASIMO已經(jīng)能跑能走、還能上下階梯。
第二個階段:基本功能不斷完善。時間范圍大致從2000年至2015年。
在此期間人形機器人除了運動能力之外,開始具備人機交互的能力,能簡單地與人溝通、協(xié)助人類完成體力勞動及科研工作。
比如2003年,日本工業(yè)技術(shù)研究院推出HRP系列的4C和5P,前者可以說話行走,有豐富的表情,后者則可以代替人類完成重力作業(yè);
再比如2011年本田推出的All-New ASIMO,已經(jīng)具備了利用傳感器避開障礙物等自動判斷并行動的能力,還能用五根手指做手語,或者將水壺里的水倒入紙杯。
第三個階段:應(yīng)用探索。時間范圍自2015年至今。
人形機器人在具備了初步的行動能力、簡單的交互能力之后,開始逐步向特定場景應(yīng)用探索:
-
2016年美國波士頓動力公司發(fā)布的Atlas,能夠承擔危險環(huán)境搜救任務(wù);
-
2017年本田發(fā)布的第三代人形機器人T-HR3,在2020年東京奧運會中與運動員遠程交流;
-
2020年美國敏捷機器人公司推出的Digit,能夠在無人干涉的環(huán)境下搬動貨物,能應(yīng)用在物流、倉儲、工業(yè)等場景;
-
2021年日本豐田推出的Busboy,能夠完成擦地板、拿取玻璃杯等家務(wù)活。
整體來看,目前人形機器人主要應(yīng)用于協(xié)助科學(xué)研究、個人護理、教育、社交等領(lǐng)域,部分產(chǎn)品已實現(xiàn)商業(yè)化。
但是將視角放大,我們不難發(fā)現(xiàn),人形機器人這條賽道盡管理論上有著廣闊的市場空間,但是依然面臨著包括商業(yè)化緩慢在內(nèi)的一系列挑戰(zhàn)。
二、巨頭搶灘,有這三個原因
除了小米和特斯拉之外,同樣切入人形機器人賽道的巨頭公司還有很多,比如亞馬遜。
今年4月,亞馬遜宣布成立工業(yè)創(chuàng)新基金AIIF,計劃投資10億美元來開發(fā)倉儲機器人技術(shù),其中首批投資企業(yè)就包括物流創(chuàng)新企業(yè) Agility Robotics,我們上文提到的Digit 人形機器人,就是這家公司的產(chǎn)品。
巨頭為何紛紛入局人形機器人賽道?在數(shù)智界看來,主要有以下三點原因:
第一,有著廣闊的市場前景。
根據(jù)麥肯錫預(yù)測,長期來看,全球人形機器人市場空間可達120萬億級別,是一個嶄新且空間龐大的藍海市場,并且未來五年營收都有翻倍的空間。
小米總裁王翔此前在接受澎湃新聞采訪時表示,人形機器人在未來有很大的發(fā)展應(yīng)用潛力,未來會持續(xù)在這個品類和周邊產(chǎn)業(yè)投入。
第二,服務(wù)型機器人的應(yīng)用場景在不斷豐富。
智能機器人按用途可分為三類:工業(yè)機器人、服務(wù)機器人和特種機器人,其中,人形機器人是服務(wù)機器人的一種。
我國在人口老齡化趨勢下,醫(yī)療和公共衛(wèi)生需求會持續(xù)旺盛,服務(wù)機器人的市場潛力比較可觀。根據(jù)中國電子學(xué)會,2016-2021年我國服務(wù)機器人銷售額 CAGR 為 36%,高于全球增速,其預(yù)計 2023 年我國服務(wù)機器人市場規(guī)模有望突破 600 億元。
具體到應(yīng)用場景,早期機器人多為掃地機器人和送餐機器人,現(xiàn)在逐步向情感、教育、醫(yī)療機器人等方向拓展。比如,2021年,擅長精細手術(shù)的美國達芬奇手術(shù)機器人在美安裝量高達4,139臺,輔助手術(shù)量達110.9萬例。
疊加疫情影響,全球范圍內(nèi)大量面對面的場景被無接觸服務(wù)替代,催生了對專業(yè)服務(wù)應(yīng)用的新需求,形成了初具規(guī)模的行業(yè)新興增長點,服務(wù)機器人的應(yīng)用場景和服務(wù)模式正在不斷地拓展,推動了市場規(guī)模逆勢增長。
目前,疫情催生的服務(wù)機器人新需求場景包括醫(yī)療與康復(fù)機器人、情節(jié)和消毒機器人、AMR和配送機器人、社交機器人等。
第三,政策利好。
去年年底,工信部等15部門在《“十四五”機器人產(chǎn)業(yè)發(fā)展規(guī)劃》中提出重點推進工業(yè)機器人、服務(wù)機器人和特種機器人重點產(chǎn)品的研制及應(yīng)用,推動產(chǎn)品高端化智能化發(fā)展。
三、最大的掣肘:技術(shù)突破+商業(yè)化
浙商證券在一份研報中指出,波士頓動力開發(fā)的全尺寸人形機器人 Altas 代表著當前科研最高水平:以液壓關(guān)節(jié)和步態(tài)算法為核心的底層技術(shù),實現(xiàn)了接近人類的運動能力,能夠快速越過障礙物、完成快速轉(zhuǎn)身、跳躍等動作。
Atlas 原型機最早于2009年亮相,直到2013年才基本具備在艱苦條件下行走的能力, Atlas 實現(xiàn)這一系列高難度動作的核心在于它的“大腦”,即感知算法的不斷迭代。
近年來,波士頓動力在機器人外觀及機械系統(tǒng)方面并沒有做出重大革新,而在軟件層持續(xù)迭代,將相機、雷達等傳感器接收的數(shù)據(jù)進行分析并對決策制定和動作規(guī)劃提供最有效的支持。
從Atlas的迭代歷程及周期,不難看出,人形機器人的打造絕非易事。
人形機器人的核心難點有兩個:一是雙足技術(shù),二是雙臂控制。
以「雙臂控制」這一難點為例,當前,谷歌、三星、戴森等 IT巨頭,都退而求其次,采用單臂控制的解決方案,因為這樣控制難度會較小。
可能有讀者會問,如今在很多的工廠,機器人代替人工執(zhí)行高精尖工作已經(jīng)不算新鮮,這些機器人很多都是雙臂控制的,那為什么到了人形機器人這里,雙臂控制就變成了一個技術(shù)難點?
原因在于,服務(wù)機器人有兩條手臂,目標距離隨時變化,對傳感器精度、算法和目標跟蹤提出了更高的要求。
要克服技術(shù)難點,并非單憑一家或者幾家科技公司就能做到,而是要看整個產(chǎn)業(yè)鏈上下游的技術(shù)儲備能否跟上。
從這一層面來看,我國與國外仍存在著一定差距,仍在追趕階段。
比如在核心的控制器環(huán)節(jié),目前國內(nèi)外機器人控制器技術(shù)差距主要體現(xiàn)在控制算法上面。
控制算法的迭代需要在下游不斷試錯調(diào)整中進行。國外巨頭因為進入汽車、3C 電子行業(yè)時間較早,對應(yīng)用行業(yè)生產(chǎn)工藝的理解較深,通過根據(jù)下游客戶的問題反饋將自己的算法不斷迭代進化建立了先發(fā)優(yōu)勢。
除了技術(shù)難題,人形機器人還面臨著其他現(xiàn)實問題。
第一,成本高昂且實際的適用場景較少。
日本本田公司研發(fā)的ASIMO價格昂貴,造價高達300-400萬美元;小米的CyberOne,單臺成本也在六七十萬元左右。
在接待、家政服務(wù)等實用場景中,其功能過于簡單,無法完成稍微復(fù)雜的動作、也無法進行語境對話,因此到2022年3月底本田公司不得不讓ASIMO退役。
第二,難以商業(yè)化。
目前,人形機器人已經(jīng)形成以波士頓動力為代表的超越人、以特斯拉為代表的替代人和以小米CyberOne 為代表的服務(wù)人三大主流方向。
從商業(yè)化程度來看,波士頓動力的人形機器人的技術(shù)主要聚焦于科研領(lǐng)域,商用可能性比較小。過去近十年里,這家公司命運坎坷的一部分原因,便在于產(chǎn)品商業(yè)化進展不順。
波士頓動力公司成立于1992年,最初為美國陸軍提供機器人的研究制造服務(wù)。2013年12月,波士頓動力被谷歌母公司Alphabet所收購,在2017年又被谷歌轉(zhuǎn)賣給軟銀集團,2021年6月,現(xiàn)代汽車集團又從軟銀集團手里收購了波士頓動力公司80%的股權(quán),七年換了三個東家。
相比于特斯拉機器人,服務(wù)型機器人與用戶有著良好的交互性,未來可以深入到各類生活場景中,商業(yè)價值較為廣闊。
但在走上商業(yè)化道路之前,廠商們需要邁過兩道極難的坎兒:把技術(shù)提上去、把成本降下來。
四、結(jié)語
1970年,日本機器人專家森政弘提出了著名的“恐怖谷理論”:當機器人與人類達到一定的相似程度,這時候,機器人反而會給人僵硬恐怖的感覺。
恐怖谷理論描述了當人類看到類似人類的物體,特別是機器人時會表現(xiàn)出的消極反應(yīng)。
特斯拉和小米的人形機器人長得并不像人,臉部都是一體化模糊呈現(xiàn),沒有具體的五官,也是最大程度降低人們看該人形機器人產(chǎn)生的不適感。
印第安納人機交互教授 MacDorman 表示,要想加速將機器人應(yīng)用到社會當中,必須解決恐怖谷效應(yīng)。
人形機器人剛一問世就產(chǎn)生了諸多問題,如果說技術(shù)問題終有一天可以得到解決,人形機器人真正和人類共處的時候,心理問題和倫理道德問題恐怕才是真正棘手的問題,而電影中的人機相戀或者人機互相傷害,也就不再只是紙面上的簡單探討。