文 | 星船知造 清波
編輯 | 唐曉園
人形機器人產(chǎn)業(yè)存在一個反直覺現(xiàn)象:
目前人形機器人本體玩家中,竟然既不包括遠近聞名的工業(yè)機器人四大家族(發(fā)那科、ABB、安川、庫卡),也少見國內(nèi)排名靠前的幾大機器人巨頭(埃斯頓、埃夫特、廣數(shù)、新松、匯川、新時達、錢江)的身影。
當下人形機器人本體處于領(lǐng)跑位置的玩家,是汽車行業(yè)大佬,如特斯拉、本田、豐田?;蚴强萍计髽I(yè),如小米、谷歌、亞馬遜。
庫卡等傳統(tǒng)工業(yè)機器人巨頭反而鮮有入局。
但另一方面,當人形機器人概念股迎來井噴時,率先引爆的卻還是工業(yè)機器人老三樣——控制器、伺服電機、精密減速機。比如生產(chǎn)線性關(guān)節(jié)的拓普集團;旋轉(zhuǎn)關(guān)節(jié)的三花智控;空心杯電機的鳴志電器;滑動絲杠、行星滾柱絲杠、空心杯電機的江蘇雷利;伺服電機的匯川科技;諧波減速機的綠的諧波等等,均在人形機器人概念的助力下,有不俗表現(xiàn)。
要解答這個反直覺現(xiàn)象,星船知造還得從人形機器人既傳統(tǒng)硬核(工業(yè)機器人老三樣)、又酷炫前沿(人工智能)的產(chǎn)業(yè)鏈角度進行分析——
1,為什么說人形機器人是屬于明天的產(chǎn)業(yè),如何理解其巨大潛力?2,人形機器人iPhone時刻還遠未到來,是卡在了哪些領(lǐng)域?3,人形機器人產(chǎn)業(yè)鏈各環(huán)節(jié)當下情況4, GPT技術(shù)在人形機器人中的場景應(yīng)用和人形機器人終極猜想
01 人形機器人和具身智能
阿西莫夫的《鋼穴》里有這樣一段對話,大意是:
如果你要管理一座農(nóng)場,你有兩個選擇。一是在拖拉機、收割機、翻土機、汽車、擠奶器這些機械上都裝上一部“電子腦”,讓它們成為智能機械。二是讓收割機、翻土機、汽車、擠奶器都維持原樣,但使用一個擁有“電子腦”的機器人去操作它們。聰明人會怎么選?
我們認為上述這段文字形象的表明了人形機器人的意義和優(yōu)勢:
與其把所有工具全部重新設(shè)計,不如生產(chǎn)出能模仿人類外形和行為方式的機器人。TA完美接入人類現(xiàn)有生活、進入所有人類已經(jīng)存在的場景、使用所有人類正在使用的工具。
一句話,我們一切的生活和生產(chǎn)都不需要為了這種機器人做任何多余、額外的改變。
作為一門集機、電、材料、計算機、傳感器、控制技術(shù)等多門學(xué)科于一體的產(chǎn)業(yè),人形機器人是國家高科技實力和發(fā)展水平的重要標志。全球發(fā)達國家都不惜投入巨資進行開發(fā)研究。
日、美、韓、英等國都在研制仿人形機器人方面進行了大量投入
今年5月的特斯拉股東大會上,馬斯克通過視頻向全世界的投資者展示了Tesla人形機器人的最新進展:
Optimus(擎天柱)已經(jīng)可以完成分類物品的復(fù)雜任務(wù),如撿起物品、環(huán)境發(fā)現(xiàn)和記憶等。較之去年9月底的亮相,其運動控制能力持續(xù)進化,AI能力提升。馬斯克認為特斯拉的未來長期價值可能都是Optimus給予的。
馬斯克總財富已超越法國奢侈品巨頭LVMH總裁,重新奪回世界首富頭銜
日本本田公司最新開發(fā)的新型機器人ASIMO(阿西莫),身高120厘米,體重43公斤,它的走路方式更加接近于人。
source:本田
韓國KAIST 代表產(chǎn)品 HUBO+身高 1.7m,體重 80kg,具有 32 個自由度。
source:KAIST
美國波士頓動力研發(fā)的代表產(chǎn)品 Atlas 身高 1.8m,體重 80kg,具有 28 個關(guān)節(jié),可完成原地起跳轉(zhuǎn)身一周等高難度動作。
硬件結(jié)構(gòu)上,Atlas 擁有輕量級結(jié)構(gòu)件皮膚和足部力控傳感器,雷達與深度相機形成視覺感知,28 個液壓關(guān)節(jié)驅(qū)動完成一系列敏捷動作,本體搭載 3 臺 NUC/工控機負責(zé)整體控制系統(tǒng)的運算。
軟件方面,波士頓動力運用行為庫、實時感知和模型預(yù)測控制(MPC)技術(shù)將相機、雷達等傳感器接收的數(shù)據(jù)進行分析并對決策制定和動作規(guī)劃提供支持。
source:波士頓動力 不得不說,波士頓動力的就是酷
我國人形機器人在科研領(lǐng)域,有國科大研發(fā)的“先行者”機器人,可完成靜態(tài)和動態(tài)步行動作;哈工大推出的“HIT-III”機器人能完成上、下斜坡等動作;清華大學(xué)開發(fā)的“THBIP-II”具有 24 個自由度等。
在產(chǎn)業(yè)領(lǐng)域,深圳優(yōu)必選推出的“Walker”機器人能完成上、下臺階等動作;小米于 2022 年 8 月公布的人形機器人 Cyber One(鐵大),升級后的運動控制算法支配這機器人全身 13 個關(guān)節(jié)和 21 個自由度,實現(xiàn)雙足運動姿態(tài)平衡;電機性能增強10 倍,髖關(guān)節(jié)主要電機的動力扭矩峰值可達 300Nm,峰值扭矩密度 96Nm/kg;之江實驗室展示的人形機器人能借助高精度視覺感知系統(tǒng),定位琴鍵進行高精度手指運動。
深圳優(yōu)必選“Walker”機器人
馬斯克對于機器人市場的判斷并非“空穴來風(fēng)”。IFR數(shù)據(jù),2022年全球機器人市場規(guī)模已經(jīng)達到了513億元的高點,2017-2022 年CAGR 達 14%。
其中工業(yè)機器人市場規(guī)模195億美元,服務(wù)機器人市場規(guī)模達217億美元,特種機器人市場規(guī)模超100億美元。到2024年,全球機器人市場規(guī)模有望超650億美元。
另據(jù)Markets and markets預(yù)測,全球人形機器人市場規(guī)模(僅考慮單機)將從2022年15億美元提升至2027年的173億美元(約合人民幣1038億元),千億市場的容量指日可待。
從零售端的價格來看,此前美國波士頓動力推出的四足機器人Spot Mini定價約為74500美元,上線一年賣出了大約400臺,人形機器人Atlas并未上市。面對高昂的價格,馬斯克曾公開表示,他的人形機器人將以低于2萬美元的價格銷售,并實現(xiàn)大規(guī)模生產(chǎn)。
做一個最為簡單的推算:即使未來Optimus的銷量只有馬斯克所說100億臺的1/100,那么其市場規(guī)模就有2萬*1億=2萬億(美元),這是何其壯觀的數(shù)字。
source:特斯拉
目前人形機器人的iPhone時刻還遠未到來。
從廣義范疇來看,人形機器人在本質(zhì)上并沒有脫離機器的束縛,即便擁有了人體的形狀,但仍然是機器人的一種。只不過,在裝備了感知系統(tǒng)、驅(qū)動系統(tǒng)、末端執(zhí)行系統(tǒng)、能源供應(yīng)系統(tǒng),運算系統(tǒng)及軟件這五大系統(tǒng)之后,在人工智能度上,人形機器人較之我們更為熟悉的工業(yè)機器人有了長足的進步。
傳統(tǒng)工業(yè)機器人更像一臺機器而并非“人”。由于其所運行的軌跡都是被事先編程好,只可以在固定區(qū)域,特定場所,做規(guī)定而重復(fù)的動作,不具備獨立處置突發(fā)(非程序內(nèi))問題的能力,只能被歸類為非智能機器人。
需要與環(huán)境(包括人)發(fā)生交互,做出反應(yīng),就要求人形機器人擁有相當程度的人工智能。用更為規(guī)范的學(xué)術(shù)語言描述,這樣一種人工智能就叫做具身智能。
具身智能(Embodied Intelligence),指的是智能體通過與環(huán)境產(chǎn)生交互后,通過自身的學(xué)習(xí),產(chǎn)生對于客觀世界的理解和改造能力。
能夠產(chǎn)生具身智能的假設(shè)前提是:智能行為可以被具有對應(yīng)形態(tài)的智能體,通過適應(yīng)環(huán)境的方式學(xué)習(xí)到。有鑒于此,地球上所有的生物,都可以說是具身智能。
黃仁勛在2023年ITF世界大會上說:“人工智能和加速計算正在共同改變技術(shù)行業(yè)。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理并與物理世界互動的智能系統(tǒng),即具身智能?!?/p>
具身智能是能夠提升當前“弱人工智能”認知能力的重要方式。亦是產(chǎn)生超級人工智能的一條可能路徑。
具身智能可以理解為人工智能發(fā)展的高階形態(tài),也有可能成為AI的終極形態(tài)。說得更加透徹一點,人形機器人的未來,就是賦能了具身智能的真正智能機器人。
如此智能的人形機器人會是如何接受指令,完成任務(wù)的呢?
首先,機器人的感知系統(tǒng)把機器人的各種“內(nèi)部狀態(tài)信息”和“環(huán)境信息”從“信號”轉(zhuǎn)變?yōu)闄C器人自身或者機器人之間能夠理解和應(yīng)用的“數(shù)據(jù)”和“信息”。也即是說,讓機器人理解周圍的環(huán)境。
科學(xué)家(廠家)在機器人身上安裝各類傳感器,包括光、聲音、溫度、距離、壓力、定位、接觸等等,讓機器人能通過“五官”來接近人類,收集感知外界的信息。
各類傳感器應(yīng)用技術(shù)的突飛猛進,保證了人形機器人得以發(fā)展。
傳感器精度和可靠性的不斷提高是當前亟待解決的難題之一。舉例來說,在進水,進到粉塵或者顛簸之后,相機的校準就容易失效,長期使用之后像素點就容易壞死等硬件問題都會直接導(dǎo)致機器識別率在準確性上的丟失。
其次,機器人的驅(qū)動系統(tǒng)和末端執(zhí)行系統(tǒng)需要協(xié)同工作,各司其職,就如同人類依靠身體各部位上的78個關(guān)節(jié)來行動。
用在機器人上的每一個關(guān)節(jié)的技術(shù)門檻和成本都很高,不僅要求體積小、精度高、重量輕,還同時要求抗摔耐撞。當機器人快速運動時,驅(qū)動力輸出功率很高,要保證不會因為發(fā)熱問題而燒壞,同時具備緩沖能力,保護“機器人關(guān)節(jié)”不怕撞擊。
末端執(zhí)行系統(tǒng)中的“手”,是技術(shù)難度非常高的部分。在實際抓、舉、拿、捏等動作的操作過程中,機器人手指柔軟度與抓握力度的協(xié)同性非常重要:抓輕了東西容易掉,抓得重了則直接破碎。
舉例來說,特斯拉發(fā)布的Optimus展示出了與人手非常相似的機械手:
Optimus擁有11個精細的自由度,結(jié)合控制軟件,能完成像人手一樣復(fù)雜的操作,承擔(dān)約9公斤負重。最新的demo視頻中,我們也能看到特斯拉機器人在硬件上的一定優(yōu)勢,包括能控制力度的抓握很多物品,并且不會打碎雞蛋。
再次,機器人的驅(qū)動系統(tǒng)和能源供應(yīng)系統(tǒng)用于保障其動作的完成。按照波士頓動力官網(wǎng)的描述:Atlas機器人,雖然各種炫技動作很酷,但必須配置功率很大的液壓驅(qū)動。實際上,Atlas配置了28個液壓驅(qū)動器才能讓機器人完成各種爆發(fā)力超強的動作,而這樣的代價也是波士頓動力的老問題了——
制造成本居高不下,難以走出實驗室完成商業(yè)化。
馬斯克在Optimus身上選用了穩(wěn)定性、性價比更高的電機驅(qū)動方案,就是出于成本考慮。也正是因為這樣,才有底氣把Optimus的目標售價定在2萬美元,以此來滿足巨大的潛在市場需求。
最后,用機器人的運算系統(tǒng)及軟件來進行分析思考和對應(yīng)指令的下達。
第一,理解需求和環(huán)境。機器人會通過傳感器了解周圍環(huán)境,搞清楚要做什么。
這一層的難點在于:視覺等環(huán)境識別和理解,包括識別未知物體以及識別物體的未知姿態(tài)。
第二,拆解任務(wù)和進行路徑規(guī)劃。
這一層的難點在于:人工智能輸出時的不穩(wěn)定性。因為在人工智能拆解任務(wù)的時候,每一次的解法可能都不相同,可能導(dǎo)致任務(wù)拆解的不一致,產(chǎn)生意想不到的結(jié)果。
第三,命令驅(qū)動硬件執(zhí)行任務(wù)。需要把運動規(guī)劃轉(zhuǎn)變成機械指令發(fā)到機器人的驅(qū)動系統(tǒng)上,確定能量、動量、速度等合適后,開始執(zhí)行任務(wù)。
這一層的難度在于:目前的人工智能還做不到100%的準確率,同時速度較慢,耗時耗力,但是硬件執(zhí)行任務(wù)的驅(qū)動需要精準控制,要以100%的準確率作為基礎(chǔ),因此業(yè)內(nèi)還是會采用傳統(tǒng)的控制論方式來發(fā)號施令,執(zhí)行任務(wù)。
由此可知,要讓人形機器人身上的這四大硬件,一大軟件系統(tǒng)有機地整合在一起,協(xié)同工作,相互配合,同時還要讓合適的部位有合適的力量、速度和準確性來完成所需的任務(wù),絕非易事。
仍以特斯拉的Optimus來說。2021 年 8 月,馬斯克在特斯拉年度 AI 開放日上首次公開展示了Optimus的想法。僅過一年時間,“擎天柱”原型機就于 9 月30 日特斯拉 AI Day 發(fā)布,硬件方面,“擎天柱”身高 172CM,整體重量 73KG;行走功率500W,坐下功率 100W,整體參數(shù)與 2021 年概念機略有出入(概念機參數(shù):身高172CM,體重 57KG,負載 20KG,行走速度最高可達每小時 8 公里)。
電機驅(qū)動上,Optimus擁有 2.3KWH、52V 電壓的電池組,內(nèi)置電子電器元件的一體單位,支持人形機器人工作一整天;選用 28 個定制關(guān)節(jié)驅(qū)動器,復(fù)用汽車動力總成設(shè)計經(jīng)驗,設(shè)計 6 種關(guān)節(jié)驅(qū)動器,包括 3 種不同規(guī)格的舵機(采用諧波減速器)和 3 種不同規(guī)格的直線執(zhí)行器(采用永磁電機,可抬動 1.5 噸三角鋼琴的),找到成本與效率的最佳組合。
目前特斯拉已把汽車的一些技術(shù)運用到了Optimus上,例如電池組、冷卻系統(tǒng)等,還使用與汽車測試類似的技術(shù)來進行機器人的運動和對外部碰撞模擬。
特斯拉的全自動駕駛系統(tǒng)FSD也直接被應(yīng)用在Optimus上,機器人采用了與汽車一樣的視覺感知,使用攝像頭輸入數(shù)據(jù),以神經(jīng)網(wǎng)絡(luò)進行計算。
未來對特斯拉人形機器人或許還有以下驚喜:
特斯拉在新材料、電子技術(shù)上的研發(fā)能力較強,可能會用到特斯拉在火箭上的技術(shù)積累;給特斯拉帶來持續(xù)爆款話題等。
02 人形機器人的產(chǎn)業(yè)鏈各環(huán)節(jié)分析
先說結(jié)論。未來人形機器人產(chǎn)品之間的競爭,歸根到底是一場各個本體廠家在人工智能(AI)賽道上的競爭。
首先比的是人工智能水平的高低:能否像人一樣,理解外部環(huán)境和內(nèi)部中樞發(fā)出的信息和指令,理解,判斷并做出正確反應(yīng)。
其次比的是各個軟硬件之間的協(xié)同工作能力:哪怕每一個部件都是同類中最好的,但總成不好,搭配不當,同樣發(fā)揮不了最佳實用效果。
再次就是量產(chǎn)后的成本比拼了:人形機器人終究是一種商品,如果其最終成本達不到市場能接受的程度,那做的再好充其量也只是一種沒有商用價值的實驗室產(chǎn)品。
人形機器人,作為機器人領(lǐng)域里新崛起的一個重要分支,其產(chǎn)業(yè)鏈也是由上中下游三個部分組成。
上游為核心軟硬件,硬件包括伺服電機、減速器、控制器、傳感器等;軟件方面主要包括機器視覺、人機交互、機器學(xué)習(xí)、系統(tǒng)控制等。
中游則是人形機器人本體制造商,也就是能把上游的核心軟硬件組合在一起,生產(chǎn)出能走、蹲、跑、跳、能撿東西、能抓物體的人形機器人的廠家。國內(nèi)主要有優(yōu)必選、北京鋼鐵科技、小米等,國外的則包括波士頓動力、美國敏捷機器人、特斯拉、日本豐田、本田等;
下游目前還未有特別成熟的商業(yè)應(yīng)用
制圖:星船知造
從人形機器人當前的產(chǎn)業(yè)鏈狀況來看,雖說馬斯克推出的Optimus早已給期盼它正式上市的人們注入了一劑超級強心劑,然而在現(xiàn)實市場中,其上游產(chǎn)業(yè)鏈走的依然是常規(guī)工業(yè)機器人的路線。
主要硬件部分除了傳感器之外,其他三樣就是工業(yè)機器人的三大核心零部件(控制器、伺服電機和減速機)。由此,也就能發(fā)現(xiàn)即便當下人形機器人的熱度再大,風(fēng)頭再勁,“人”味再濃,最終采用的卻還是工業(yè)機器人的那套基本架構(gòu)。
機器人能夠靈活工作的核心之一在于運動的精確控制,其技術(shù)難度最高的三大核心零部件分別是控制器、伺服電機和精密減速器,這三者成本的占比分別約為15%、20%、35%。
以2022年9月特斯拉發(fā)布的首款人形機器 人Optimus為例:
它擁有28個關(guān)節(jié)驅(qū)動器,使全身能夠產(chǎn)生200個以上不同角度的動作。
手部有五個手指,配備6個驅(qū)動器,擁有人類的靈巧性。
要實現(xiàn)這些功能,上述三大產(chǎn)業(yè)鏈核心零部件的性能必須要達到相當高的要求。
從成本上分析,人形機器人的成本大致可拆分為動力總成系統(tǒng)(占總成本比重的60%)、智能感應(yīng)系統(tǒng)(占20%)、結(jié)構(gòu)件及其他(占20%)三個部分。
其中,動力總成系統(tǒng)包括電池系統(tǒng)、電驅(qū)系統(tǒng)(這里的動力總成定義類似電動車上的“三電系統(tǒng)”),預(yù)計這兩者分別占到總成本的10%、50%。
綜合技術(shù)與成本兩個方面來看,核心零部件的重要性尤為突出。
一方面,人形機器人技術(shù)的本質(zhì)是3D空間中高維度的感知與運動,高性能的核心零部件是實現(xiàn)感知與運動的基礎(chǔ)。
另一方面,控制器、交流伺服電機和精密減速機這三個最重要的核心零部件在成本中所占的比例還是相當之高。
控制器是工業(yè)機器人的大腦,對機器人的性能起著決定性的影響。工業(yè)機器人控制器主要控制機器人在工作空間中的運動位置、姿態(tài)和軌跡,操作順序及動作的時間等;
伺服電機在自動控制系統(tǒng)中,用作執(zhí)行元件,把所收到的電信號轉(zhuǎn)換成電動機軸上的角位移或角速度輸出。機器人每個關(guān)節(jié)運動均需靠伺服電機驅(qū)動,以實現(xiàn)多自由度的運動;
精密減速器則是連接動力源和執(zhí)行機構(gòu)的中間機構(gòu),具有匹配轉(zhuǎn)速和傳遞轉(zhuǎn)矩的作用,也是機器人生產(chǎn)中壁壘最高的零部件,主要包括諧波減速器與RV減速器,但其工作原理和應(yīng)用場景存在較大區(qū)別:
諧波減速器:由波發(fā)生器、柔輪和剛輪組成。當波發(fā)生器被放入柔輪內(nèi)圓時,柔輪產(chǎn)生彈性變形彎曲成橢圓狀。由于柔輪外側(cè)的剛輪比其多2個齒,導(dǎo)致柔輪長軸部分正好可以與剛輪的齒輪嚙合,而短軸部分與剛輪的齒輪呈脫離狀態(tài)。
RV減速器:由兩個減速部構(gòu)成,在第一減速部中,輸入軸的旋轉(zhuǎn)從輸入齒輪傳遞到直齒輪,按齒數(shù)比進行減速;在第二減速部中,有一個曲柄軸與直齒輪相連接,在曲柄軸的偏心部分,通過滾動軸承安裝RV齒輪,曲柄軸會帶動RV減速機做偏心運動。
六軸工業(yè)機器人 source:遨博機器人
除了以上的三大核心部件外,傳感器在人形機器人身上的作用也極其重要。
人形機器人要具備對外界環(huán)境的識別能力,實現(xiàn)導(dǎo)航、避障、交互等功能,就需要使用傳感器識別物體、測距等。
識別外部環(huán)境主要使用攝像頭、激光雷達等傳感器,其傳感器方案和需求場景與自動駕駛存在類似之處,因此價值量較高的自動駕駛類傳感器存在新的機遇。
自動駕駛傳感器廠商、機器視覺廠商都是人形機器人傳感器的參與者。
以三大核心零部件來分類的方式通常更適用于相對粗獷的工業(yè)機器人,要想更好地解析人形機器人,五大系統(tǒng)的分法其實更為科學(xué)。
感知系統(tǒng),也即是傳感器,如攝像頭、麥克風(fēng)、激光雷達、距離感應(yīng)器等等,負責(zé)收集、傳遞信息,相當于人的眼、鼻、耳,即人的“五官”;
驅(qū)動系統(tǒng),比如驅(qū)動輪子的馬達,機械臂上液壓動力系統(tǒng)或氣動系統(tǒng),相當于人的“肌肉”;
末端執(zhí)行系統(tǒng),既可以是機械手,也可以是機械臂上的一把螺絲刀或者噴槍,用以與外界環(huán)境進行物理交互,相當于人的“雙手”或“四肢”;
能源供應(yīng)系統(tǒng),如電源或電池,是機器人的能量供應(yīng)中心;
運算系統(tǒng)及軟件,將上面所有的系統(tǒng)整合起來,完成指定任務(wù),是機器人的“大腦”。 之所以需要用相當大的篇幅來介紹上游產(chǎn)業(yè)鏈中的核心零部件、軟件及系統(tǒng)部分,就是因為它們是人形機器人能夠身輕如燕地跑跳蹲立,靈活自如地抓取捧舉,聰明伶俐地辨物識人,言聽計從地信手拈來的關(guān)鍵所在。 沒有這些部件的縝密配合,外觀再逼真的人形機器人也只能算作是繡花枕頭,中看不中用。
相對于種類繁多的上游產(chǎn)業(yè)鏈,人形機器人的中游產(chǎn)業(yè)鏈顯得簡單明了:就是那些能夠把這些核心零部件及軟件組合在一起,使機器人能夠發(fā)揮出最大仿人效能的本體制造商。
如本文開頭所說,目前人形機器人本體上處于領(lǐng)跑位置的玩家,要么是像特斯拉這樣的汽車行業(yè)大佬,要么是小米這樣的科技企業(yè)。工業(yè)機器人大佬反而鮮有入局。
以筆者的判斷來看,雖然人形機器人脫胎于工業(yè)機器人而來,但由于前者在AI領(lǐng)域方面的要求遠高于后者,所以反而是高科技企業(yè)(尤其是在AI領(lǐng)域有較高建樹的)有后發(fā)優(yōu)勢。
當然,把特斯拉、豐田、本田歸類為汽車企業(yè)未免太過片面,這幾家都是具備了極強科研開發(fā)能力的高科技企業(yè)(尤其是特斯拉在全自動駕駛技術(shù)FSD上的超強實力,已經(jīng)讓人形機器人和汽車擁有了一樣視覺感知:以攝像頭輸入數(shù)據(jù),通過神經(jīng)網(wǎng)絡(luò)進行計算)。
03 ChatGPT實體化和機器人終極猜想
最近舉辦的一場人形機器人比賽中,由OpenAI支持的實體機器人公司1x出品的EVE,擊敗了特斯拉的Optimus機器人。
EVE機器人的部分軟件功能由ChatGPT提供支持,也就是說將ChatGPT實體化,應(yīng)用在現(xiàn)實場景中。
GPT技術(shù)在人形機器人中的場景應(yīng)用打開了新的想象空間,引發(fā)了國內(nèi)資本市場對機器人產(chǎn)業(yè)的高度關(guān)注。
從業(yè)內(nèi)人士的角度來看,GPT大模型技術(shù)應(yīng)用到人形機器人上,可以為機器人提供“常識”,使其具備理解與推理能力。
在邊緣端布局面向機器人作業(yè)的中模型,能夠較為快速處理機器人的傳感信息,結(jié)合機器人端部署的運動規(guī)劃與控制小模型,這樣才能構(gòu)建出“云邊端”一體化的智能機器人系統(tǒng),完成人形機器人的智能閉環(huán)。
由此再次鞏固了我們的判斷——人形機器人產(chǎn)品之間的競爭,歸根到底就是一場各個本體廠家在人工智能(AI)賽道上的競爭。
先拼AI研發(fā)能力,再比各軟硬件之間的協(xié)同工作能力,最后大家一起拼成本。
以筆者之見,人形機器人在不久的將來會有三個發(fā)展趨勢:
一是成本越來越低,進到千家萬戶是大勢所趨。
有鑒于當前人形機器人高昂的零售價格(未量產(chǎn)狀態(tài)),即便其下游的產(chǎn)業(yè)鏈前景被資本市場長期看好,但至少在當下,能夠?qū)崿F(xiàn)商業(yè)化的場景還是屈指可數(shù)。
波士頓動力的Atlas單臺價值為200萬美金,本田Asimo的單臺價值250萬美元,小米Cyber One單臺造價也高達60-70萬人民幣?;径沤^了普通人的購買奢望。
不過,假如Optimus在3-5年后通過量產(chǎn),售價做到2萬美元一臺,且替代人類完成瑣碎復(fù)雜的工作(非簡單重復(fù)型),這樣的下游產(chǎn)業(yè)鏈場景無疑會是相當廣泛且極具商業(yè)價值的。
如馬斯克所描繪的,在量產(chǎn)規(guī)模達到特斯拉汽車的水平(幾百萬臺),各種更加經(jīng)濟實用的替代品被投放到原來昂貴易損的零部件位置之后,2萬美金一臺的價格將只是初級目標。畢竟,卡爾·弗里德里?!け敬模↘arl Friedrich Benz)發(fā)明的世界上第一臺內(nèi)燃機汽車并不足以讓它走入到千家萬戶,量產(chǎn)后的福特T型車才是。
二是智能越來越高,替代復(fù)雜繁瑣的工作是民心所向。
與工業(yè)機器人主要用于取代工廠里簡單、重復(fù)、危險的勞動定位不同,人形機器人更加適合用作替換與人類有直接接觸,相對更為智能、繁瑣、貼身的工作,如導(dǎo)購、接待、看護、喂養(yǎng)寵物等。(更多機器人進入下游應(yīng)用領(lǐng)域,請點擊閱讀星船知造文章:《萬億級機器人賽道里:為什么它最卷?》)
隨著人工智能水平提升,越來越多AI技術(shù)被運用到人形機器人身上,機器人越來越“人性化”,與人類的緊密度和契合度也會越來越高。
三是人工智超越人類的智能會是未來的大概率事件。
無論爆火的ChatGPT還是曾擊敗李世石的AlphaGo都屬于弱人工智能。
強人工智能至今尚未出現(xiàn)。但綜合來看,人工智能在與人腦的對抗中有以下三條優(yōu)勢:
首先是能耗,人工智能思考和解答問題比人腦消耗的能量低得多。大腦是人體能耗最大的一個器官,為什么人類總是討厭學(xué)習(xí)和思考,這是求生本能決定的,為了避免過度思考帶來的身體能量過度的消耗。
其次是存儲,人會遺忘。但人工智能只要信息輸入,就會存儲下來。強人工智能還能通過學(xué)習(xí)關(guān)聯(lián)更多知識和信息。
最后也是最致命的優(yōu)勢就是人工智能的時間效率。這里的效率有兩個方面的理解,一是學(xué)習(xí)效率,相比人類需要娛樂、社交、睡覺等,AI24小時不眠不休的學(xué)習(xí)和進化,昨天還是嬰兒明天就是成人后天就是最強大腦。二是解決問題的效率,人工智能全天候處理問題和工作,未來人工智能會比人類更熟練的使用各類工具,可能你一輩子才精通的操作精密機床的手藝,AI一晚上就學(xué)會了。
最后,讓我們回到阿西莫夫的機器人三部曲。
《鋼穴》里,中年便衣刑警貝萊問機器人丹尼爾,為什么人類那么執(zhí)著要造出有手有腳有腦袋的機器人?為什么他們多多少少總要做得像個人?
丹尼爾的回答很簡單。至今為止一切為人類發(fā)明的東西,人型機器人直接就能用。
所以,是的,一切都是基于經(jīng)濟上的考慮。