正在閱讀:

讓馬斯克瘋狂的人形機(jī)器人!萬億級新藍(lán)海,揭秘背后產(chǎn)業(yè)【附下載】| 智東西內(nèi)參

掃一掃下載界面新聞APP

讓馬斯克瘋狂的人形機(jī)器人!萬億級新藍(lán)海,揭秘背后產(chǎn)業(yè)【附下載】| 智東西內(nèi)參

人形機(jī)器人,AI領(lǐng)域的終極形態(tài)。

文|華西證券  劉澤晶

編輯|智東西內(nèi)參

當(dāng)?shù)貢r間6月3日,特斯拉CEO埃隆·馬斯克在推特上預(yù)告,將在9月30日的特斯拉人工智能日上發(fā)布原型機(jī)。它叫“擎天柱”(Optimus),又被稱為“特斯拉人形機(jī)器人”(Tesla Bot),是特斯拉今年最重要的產(chǎn)品。

人形機(jī)器人的出現(xiàn)可以賦能千行百業(yè),是人工智能場景的下一波浪潮,隨著技術(shù)的不斷成熟和商業(yè)化落地,有望帶來萬億級別的空前藍(lán)海。

01.人形機(jī)器人,AI新篇章

特斯拉或?qū)⒂?2022年9 月 30日推出首款人形機(jī)器人原型機(jī),并將其命名為 ” OPTIMUS”。早在2021年8月19日,馬斯克在特斯拉人工智能日時提出推出人形機(jī)器人,旨意是解決從事重復(fù)性高、單調(diào)枯燥的危險差事。

馬斯克宣布進(jìn)軍AI機(jī)器人領(lǐng)域,意味著特斯拉絕不只是一家電動車公司,而是一家 AI公司。此外馬斯克聲稱特斯拉機(jī)器人有朝一日隨著時間推移將比汽車公司更加重要。

特斯拉機(jī)器人可以簡單拆分2個域,即AI域及技術(shù)域。

AI域: 采用FSD computer作為算力核心,配備8個Autopliot Cameras作為傳感器,支持深度學(xué)習(xí)、大數(shù)據(jù)分析,Dojo訓(xùn)練,自動標(biāo)記等算法。

技術(shù)域:機(jī)器人頭部包含信息屏幕,用來展示信息,此外機(jī)器人由輕質(zhì)材料組成,并且四肢包含40個左右的機(jī)電執(zhí)行器,并通過力反饋感應(yīng)系統(tǒng)來實(shí)現(xiàn)平穩(wěn)和敏捷雙腳行走。

據(jù)馬斯克介紹,該機(jī)器人大約1.73米,體重約56.7千克,可抱起約20.4千克的貨物最快行走速度可約達(dá)8KM/時。

AI域是人形機(jī)器人的核心,因?yàn)闄C(jī)器人只有通過不斷的機(jī)器學(xué)習(xí)的訓(xùn)練,才能完成指定的任務(wù)。此外特斯拉人形機(jī)器人是特斯拉自動駕駛的集大成者,因?yàn)槿诵螜C(jī)器人的核心與智能駕駛共用 FSD系統(tǒng),我們預(yù)計(jì)智能駕駛很多神經(jīng)網(wǎng)絡(luò)系統(tǒng)將會應(yīng)用在人形機(jī)器人中。

數(shù)據(jù)是實(shí)現(xiàn)智能駕駛和智能機(jī)器人的根基,而算力為機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)提供基礎(chǔ)動力,隨著特斯拉所處理的數(shù)據(jù)指數(shù)級的增長,公司由于耗電問題放棄Nvidia A100 GPU作為超級電腦的陣列去做訓(xùn)練,而是憑借自身強(qiáng)大的垂直整合能力,研發(fā)出專注于深度學(xué)習(xí)訓(xùn)練的Dojo D1芯片,于是特斯拉Dojo超級電腦應(yīng)運(yùn)而生。

1、大腦:D1芯片

D1芯片作為 Dojo超級計(jì)算機(jī)的關(guān)鍵單元,實(shí)現(xiàn)了超強(qiáng)算力和超高帶寬,實(shí)現(xiàn)了空間和時間的平衡。該芯片采用分布式結(jié)構(gòu)和7納米工藝,搭載500億個晶體管、354個訓(xùn)練節(jié)點(diǎn),僅內(nèi)部的電路就長達(dá)17.7公里。

Dojo超級計(jì)算機(jī)實(shí)為 ”性能猛獸 ”,算力高達(dá)s 9PFLOPs 。Dojo超級計(jì)算機(jī)的訓(xùn)練模塊由1500個D1芯片組成,共53萬余訓(xùn)練節(jié)點(diǎn),相鄰芯片之間延遲較低,配合特斯拉自創(chuàng)高寬帶、低延遲的連接器,算力高達(dá)9PFLOPs,是世界上首屈一指的超級計(jì)算機(jī)。與業(yè)內(nèi)相比,同成本性能可提升4倍,同能耗性能可提高1.3倍,占比空間節(jié)省五倍。

▲特斯拉DOJO1芯片示意圖

特斯拉 Dojo D1芯片主要可以拆解成4個部分,即CPU、 Switch、 Matmult、 SIMD。

CPU即中央處理器,是計(jì)算機(jī)系列的運(yùn)行和控制核心,是信息處理、程序運(yùn)行的最終指令單元。

Switch即交換器,是計(jì)算機(jī)芯片與芯片之間的橋梁,具有數(shù)據(jù)傳輸功能。

SIMD即單指令流多數(shù)據(jù)流,可以理解成平行計(jì)算,是采用一個控制器來控制多個處理器,介入實(shí)現(xiàn)空間并行性的技術(shù),簡單來說是一個指令可以處理多個數(shù)據(jù)。

Mat mult 即計(jì)算單元,可以專注于神經(jīng)網(wǎng)絡(luò)的計(jì)算,進(jìn)而加速神經(jīng)網(wǎng)絡(luò)的計(jì)算速度,是特斯拉計(jì)算機(jī)實(shí)現(xiàn)算力猛獸的根本原因之一??梢詫⒃撚?jì)算單元可以理解成人工智能芯片,即AI處理器,是一款芯片專門用于機(jī)器學(xué)習(xí)的算法及神經(jīng)網(wǎng)絡(luò)的運(yùn)算,可用于訓(xùn)練和推理。相較于同期的CPU和GPU相比,可以實(shí)現(xiàn)15-30倍的性能提升,以及30-80倍效率(性能)提升。

▲Dojo D1芯片架構(gòu)

2、靈魂:AI機(jī)器視覺

機(jī)器視覺是 AI深度學(xué)習(xí)的一種應(yīng)用與技術(shù)方向,無論是人形機(jī)器人還是智能駕駛都是機(jī)器視覺的落地方向之一。

神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn) AI深度學(xué)習(xí)的一種重要算法,覆蓋人形機(jī)器人從識別到生成指令的全流程。是通過對人腦的基本單元神經(jīng)元的建模和鏈接,探索模擬人腦系統(tǒng)功能的模型,并研發(fā)出的一種具有學(xué)習(xí)、聯(lián)想、記憶和模式識別等具有智慧信息處理功能的人工系統(tǒng)。神經(jīng)網(wǎng)絡(luò)在智能機(jī)器人的應(yīng)用廣泛,主要應(yīng)用在物體識別、規(guī)劃、假設(shè)、訓(xùn)練/ /測試等各個環(huán)節(jié)。

神經(jīng)網(wǎng)絡(luò)最重要的特征是能從環(huán)境中學(xué)習(xí),并把學(xué)習(xí)的結(jié)果分布存儲在網(wǎng)絡(luò)的突觸連接中。神經(jīng)網(wǎng)絡(luò)是學(xué)習(xí)的一個過程。在環(huán)境的刺激下,相繼給網(wǎng)絡(luò)輸入一些樣本模式(input layer),按照一定的學(xué)習(xí)算法調(diào)整網(wǎng)絡(luò)各層的權(quán)值矩陣(hidden layer),待網(wǎng)絡(luò)各層權(quán)值收斂到一定值,學(xué)習(xí)過程會結(jié)束(output layer)。

特斯拉在智能駕駛和人形機(jī)器人在機(jī)器視覺的路徑上具有異曲同工之妙。一套完整的訓(xùn)練、測試( (工作) )運(yùn)動包含傳感器、感知、評估、規(guī)劃、制動器五個部分。

▲特斯拉機(jī)器視覺全流程示意圖

特斯拉最著名的 AI算法是其機(jī)器視覺中的純視覺解決方案,該算法在人形機(jī)器人的制造中將其延續(xù)。

基于圖像的目標(biāo)檢測: 目的是確定圖象中是否存在給定類別的目標(biāo)實(shí)例,可以是動態(tài)或靜態(tài)目標(biāo),如果存在,就返回每個目標(biāo)實(shí)例的空間位置和覆蓋范圍。目標(biāo)檢測是解決分割、場景理解、目標(biāo)追蹤、圖像描述、事件檢測和活動識別等更復(fù)雜更高層次(時間記憶等)的視覺任務(wù)的基礎(chǔ)。

2D物體識別到 3D物體識別的轉(zhuǎn)換 : 特斯拉通過在8個不同位置的攝像頭,得到不同角度的同一物體,在通過神經(jīng)網(wǎng)絡(luò)(類似NeRF算法)渲染出該物體的3D圖像,并記錄該物體的大小及位置;隨后生成一個3D向量空間,通過鳥看圖的方式,通過另一種神經(jīng)網(wǎng)絡(luò)(類似LSTM算法)和物體識別計(jì)算出物體下一時間點(diǎn)出現(xiàn)的位置,至此人形機(jī)器人完成全部的感知步驟,其中包含三維信息及時間維度信息,并將該信息存儲在訓(xùn)練集中,并不斷強(qiáng)化學(xué)習(xí)。

▲特斯拉2D物體識別到3D物體識別的過程示意圖

02.前景廣闊,蓄勢待發(fā)

從智慧城市到智能駕駛 AI浪潮的變化,預(yù)計(jì)人形機(jī)器人為人工智能的下一落地應(yīng)用場景。

大數(shù)據(jù)時代 : 2016年AI戰(zhàn)勝柯潔,同時隨著基礎(chǔ)算力的提升,我國開啟新一輪人工智能熱潮即大數(shù)據(jù)時代。政策、資本先行,應(yīng)用場景逐漸豐富。無人機(jī)、AI翻譯機(jī)等相繼落地。

智能駕駛 : 隨著海量數(shù)據(jù)的陸續(xù)爆發(fā),基礎(chǔ)算力及芯片的陸續(xù)演進(jìn),特斯拉Autopilot憑借完善的功能定義、依靠數(shù)據(jù)不斷學(xué)習(xí)的算法,以及通過OTA實(shí)現(xiàn)的軟件升級,全球正式進(jìn)入智能駕駛時代,同時,谷歌、百度、騰訊、華為等互聯(lián)網(wǎng)巨頭相繼入局,推動智能駕駛加速發(fā)展。疊加政策持續(xù)推動自動駕駛商業(yè)化運(yùn)營落地。如今,我國國內(nèi)廠商在智能座艙、駕駛等發(fā)面都取得實(shí)際性的突破,未來國產(chǎn)化的生態(tài)將大有可為。

人形機(jī)器人 : 未來隨著人形機(jī)器人的落地,枯燥乏味、重復(fù)性高例如買菜、家務(wù)等工作極易被人形機(jī)器人取代,我們認(rèn)為這是人工智能的下一波浪潮,國內(nèi)公司極大可能復(fù)制在智能駕駛領(lǐng)域取得的成果。

▲人工智能浪潮的變化

根據(jù)麥肯錫數(shù)據(jù)稱,隨著AI的不斷進(jìn)步,預(yù)計(jì)2030年全球約有3.75億人口由于AI的技術(shù)突破將重新就業(yè),從數(shù)量上看,我國將有1200萬至1.02億人口需要重新就業(yè)。全球平均被取代的勞動力比率為15%,我國作為人口大國基本與世界保持持平為16%。

此外,據(jù)馬斯克透露人形機(jī)器人的實(shí)際成本不會很高,可能比汽車還低。安德魯預(yù)測是25000美元,約人民幣16萬元。按照特斯拉MODEL3 最低售價約為28萬元,保守估計(jì)Optimus售價為20萬元。長期來看,保守估計(jì),到 2030年全球人形機(jī)器人市場規(guī)??蛇_(dá)萬億規(guī)模,是繼智能駕駛電車后又一 AI的空前藍(lán)海。

人形機(jī)器人的出現(xiàn)可以賦能千行百業(yè),有望取代重復(fù)性高、單調(diào)枯燥的繁瑣工作任務(wù),同時,搜索拯救等一系列危險問題工作有望得到解決,快遞、家政、服務(wù)業(yè)、工業(yè)等一系列場景有望率先得到落地。此外,人形機(jī)器人是 AI場景的下一波浪潮,隨著技術(shù)的不斷成熟和商業(yè)化的落地,有望帶來萬億級的空前藍(lán)海,在我國智能駕駛的生態(tài)逐漸突破和成熟的背景下,人形機(jī)器人勢在必行,國內(nèi)公司極大可能復(fù)制在智能駕駛領(lǐng)域取得的成果。

具備自研 AI處理器的廠商可以為人形機(jī)器人的神經(jīng)網(wǎng)絡(luò)提供算力支撐。人工智能的本質(zhì)及數(shù)據(jù)的海量運(yùn)算,相較于AI算法,數(shù)據(jù)才是重中之重。算力作為數(shù)據(jù)加速處理的動力源泉,其重要性不言而喻。

根據(jù)機(jī)器學(xué)習(xí)的算法步驟,可分為訓(xùn)練和推斷兩個環(huán)節(jié),訓(xùn)練環(huán)節(jié)需要極為龐大的數(shù)據(jù)輸入才能支持一個復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練過程中由于復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和海量訓(xùn)練數(shù)據(jù),運(yùn)算量巨大,因此對于處理器的算力、效率(能耗)要求極大。

AI處理器芯片可以支持深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和加速計(jì)算,相比于 GPU和 CPU擁有成倍的性能提升,和極低的耗電水平。此外,推斷環(huán)節(jié)相較于訓(xùn)練環(huán)節(jié)的計(jì)算量相對較小,但依然會涉及大量的矩陣運(yùn)算,因此,人工智能芯片將發(fā)揮大量作用。

人形機(jī)器人的落地需要下游場景的數(shù)據(jù)融合,具備 AI算法落地的廠商具有比較優(yōu)勢。特斯拉在智能駕領(lǐng)域已經(jīng)實(shí)現(xiàn)了純視覺的解決方案,相關(guān)FSD系統(tǒng)可以直接用于人形機(jī)器人的機(jī)器視覺領(lǐng)域。

然而距離人形機(jī)器人的商業(yè)落地,其數(shù)據(jù)需要和下游細(xì)分場景緊密結(jié)合,通過優(yōu)質(zhì)細(xì)分場景下的數(shù)據(jù)和算法進(jìn)行不斷地迭代訓(xùn)練,最后提供具有價值的商業(yè)服務(wù)。人形機(jī)器人在細(xì)分場景海量數(shù)據(jù)并不可以直接獲得,而具備AI算法商業(yè)化落地的公司本身具備卡位優(yōu)勢,即與下游細(xì)分場景連接密切,雙方可以通過合作共同賦能客戶,進(jìn)而加速人形機(jī)器人的商業(yè)化落地。

智東西認(rèn)為,特斯拉人形機(jī)器人的目標(biāo)是在重復(fù)、枯燥、危險的環(huán)境和工況下應(yīng)用,最終將走向我們的家庭,以徹底解決人工不斷短缺的趨勢。雖然特斯拉在AI、機(jī)器人技術(shù)方面有著雄厚的技術(shù)基礎(chǔ),但是馬斯克的??谑欠衲艹烧?,這可能得到9月才能見分曉。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

讓馬斯克瘋狂的人形機(jī)器人!萬億級新藍(lán)海,揭秘背后產(chǎn)業(yè)【附下載】| 智東西內(nèi)參

人形機(jī)器人,AI領(lǐng)域的終極形態(tài)。

文|華西證券  劉澤晶

編輯|智東西內(nèi)參

當(dāng)?shù)貢r間6月3日,特斯拉CEO埃隆·馬斯克在推特上預(yù)告,將在9月30日的特斯拉人工智能日上發(fā)布原型機(jī)。它叫“擎天柱”(Optimus),又被稱為“特斯拉人形機(jī)器人”(Tesla Bot),是特斯拉今年最重要的產(chǎn)品。

人形機(jī)器人的出現(xiàn)可以賦能千行百業(yè),是人工智能場景的下一波浪潮,隨著技術(shù)的不斷成熟和商業(yè)化落地,有望帶來萬億級別的空前藍(lán)海。

01.人形機(jī)器人,AI新篇章

特斯拉或?qū)⒂?2022年9 月 30日推出首款人形機(jī)器人原型機(jī),并將其命名為 ” OPTIMUS”。早在2021年8月19日,馬斯克在特斯拉人工智能日時提出推出人形機(jī)器人,旨意是解決從事重復(fù)性高、單調(diào)枯燥的危險差事。

馬斯克宣布進(jìn)軍AI機(jī)器人領(lǐng)域,意味著特斯拉絕不只是一家電動車公司,而是一家 AI公司。此外馬斯克聲稱特斯拉機(jī)器人有朝一日隨著時間推移將比汽車公司更加重要。

特斯拉機(jī)器人可以簡單拆分2個域,即AI域及技術(shù)域。

AI域: 采用FSD computer作為算力核心,配備8個Autopliot Cameras作為傳感器,支持深度學(xué)習(xí)、大數(shù)據(jù)分析,Dojo訓(xùn)練,自動標(biāo)記等算法。

技術(shù)域:機(jī)器人頭部包含信息屏幕,用來展示信息,此外機(jī)器人由輕質(zhì)材料組成,并且四肢包含40個左右的機(jī)電執(zhí)行器,并通過力反饋感應(yīng)系統(tǒng)來實(shí)現(xiàn)平穩(wěn)和敏捷雙腳行走。

據(jù)馬斯克介紹,該機(jī)器人大約1.73米,體重約56.7千克,可抱起約20.4千克的貨物最快行走速度可約達(dá)8KM/時。

AI域是人形機(jī)器人的核心,因?yàn)闄C(jī)器人只有通過不斷的機(jī)器學(xué)習(xí)的訓(xùn)練,才能完成指定的任務(wù)。此外特斯拉人形機(jī)器人是特斯拉自動駕駛的集大成者,因?yàn)槿诵螜C(jī)器人的核心與智能駕駛共用 FSD系統(tǒng),我們預(yù)計(jì)智能駕駛很多神經(jīng)網(wǎng)絡(luò)系統(tǒng)將會應(yīng)用在人形機(jī)器人中。

數(shù)據(jù)是實(shí)現(xiàn)智能駕駛和智能機(jī)器人的根基,而算力為機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)提供基礎(chǔ)動力,隨著特斯拉所處理的數(shù)據(jù)指數(shù)級的增長,公司由于耗電問題放棄Nvidia A100 GPU作為超級電腦的陣列去做訓(xùn)練,而是憑借自身強(qiáng)大的垂直整合能力,研發(fā)出專注于深度學(xué)習(xí)訓(xùn)練的Dojo D1芯片,于是特斯拉Dojo超級電腦應(yīng)運(yùn)而生。

1、大腦:D1芯片

D1芯片作為 Dojo超級計(jì)算機(jī)的關(guān)鍵單元,實(shí)現(xiàn)了超強(qiáng)算力和超高帶寬,實(shí)現(xiàn)了空間和時間的平衡。該芯片采用分布式結(jié)構(gòu)和7納米工藝,搭載500億個晶體管、354個訓(xùn)練節(jié)點(diǎn),僅內(nèi)部的電路就長達(dá)17.7公里。

Dojo超級計(jì)算機(jī)實(shí)為 ”性能猛獸 ”,算力高達(dá)s 9PFLOPs 。Dojo超級計(jì)算機(jī)的訓(xùn)練模塊由1500個D1芯片組成,共53萬余訓(xùn)練節(jié)點(diǎn),相鄰芯片之間延遲較低,配合特斯拉自創(chuàng)高寬帶、低延遲的連接器,算力高達(dá)9PFLOPs,是世界上首屈一指的超級計(jì)算機(jī)。與業(yè)內(nèi)相比,同成本性能可提升4倍,同能耗性能可提高1.3倍,占比空間節(jié)省五倍。

▲特斯拉DOJO1芯片示意圖

特斯拉 Dojo D1芯片主要可以拆解成4個部分,即CPU、 Switch、 Matmult、 SIMD。

CPU即中央處理器,是計(jì)算機(jī)系列的運(yùn)行和控制核心,是信息處理、程序運(yùn)行的最終指令單元。

Switch即交換器,是計(jì)算機(jī)芯片與芯片之間的橋梁,具有數(shù)據(jù)傳輸功能。

SIMD即單指令流多數(shù)據(jù)流,可以理解成平行計(jì)算,是采用一個控制器來控制多個處理器,介入實(shí)現(xiàn)空間并行性的技術(shù),簡單來說是一個指令可以處理多個數(shù)據(jù)。

Mat mult 即計(jì)算單元,可以專注于神經(jīng)網(wǎng)絡(luò)的計(jì)算,進(jìn)而加速神經(jīng)網(wǎng)絡(luò)的計(jì)算速度,是特斯拉計(jì)算機(jī)實(shí)現(xiàn)算力猛獸的根本原因之一??梢詫⒃撚?jì)算單元可以理解成人工智能芯片,即AI處理器,是一款芯片專門用于機(jī)器學(xué)習(xí)的算法及神經(jīng)網(wǎng)絡(luò)的運(yùn)算,可用于訓(xùn)練和推理。相較于同期的CPU和GPU相比,可以實(shí)現(xiàn)15-30倍的性能提升,以及30-80倍效率(性能)提升。

▲Dojo D1芯片架構(gòu)

2、靈魂:AI機(jī)器視覺

機(jī)器視覺是 AI深度學(xué)習(xí)的一種應(yīng)用與技術(shù)方向,無論是人形機(jī)器人還是智能駕駛都是機(jī)器視覺的落地方向之一。

神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn) AI深度學(xué)習(xí)的一種重要算法,覆蓋人形機(jī)器人從識別到生成指令的全流程。是通過對人腦的基本單元神經(jīng)元的建模和鏈接,探索模擬人腦系統(tǒng)功能的模型,并研發(fā)出的一種具有學(xué)習(xí)、聯(lián)想、記憶和模式識別等具有智慧信息處理功能的人工系統(tǒng)。神經(jīng)網(wǎng)絡(luò)在智能機(jī)器人的應(yīng)用廣泛,主要應(yīng)用在物體識別、規(guī)劃、假設(shè)、訓(xùn)練/ /測試等各個環(huán)節(jié)。

神經(jīng)網(wǎng)絡(luò)最重要的特征是能從環(huán)境中學(xué)習(xí),并把學(xué)習(xí)的結(jié)果分布存儲在網(wǎng)絡(luò)的突觸連接中。神經(jīng)網(wǎng)絡(luò)是學(xué)習(xí)的一個過程。在環(huán)境的刺激下,相繼給網(wǎng)絡(luò)輸入一些樣本模式(input layer),按照一定的學(xué)習(xí)算法調(diào)整網(wǎng)絡(luò)各層的權(quán)值矩陣(hidden layer),待網(wǎng)絡(luò)各層權(quán)值收斂到一定值,學(xué)習(xí)過程會結(jié)束(output layer)。

特斯拉在智能駕駛和人形機(jī)器人在機(jī)器視覺的路徑上具有異曲同工之妙。一套完整的訓(xùn)練、測試( (工作) )運(yùn)動包含傳感器、感知、評估、規(guī)劃、制動器五個部分。

▲特斯拉機(jī)器視覺全流程示意圖

特斯拉最著名的 AI算法是其機(jī)器視覺中的純視覺解決方案,該算法在人形機(jī)器人的制造中將其延續(xù)。

基于圖像的目標(biāo)檢測: 目的是確定圖象中是否存在給定類別的目標(biāo)實(shí)例,可以是動態(tài)或靜態(tài)目標(biāo),如果存在,就返回每個目標(biāo)實(shí)例的空間位置和覆蓋范圍。目標(biāo)檢測是解決分割、場景理解、目標(biāo)追蹤、圖像描述、事件檢測和活動識別等更復(fù)雜更高層次(時間記憶等)的視覺任務(wù)的基礎(chǔ)。

2D物體識別到 3D物體識別的轉(zhuǎn)換 : 特斯拉通過在8個不同位置的攝像頭,得到不同角度的同一物體,在通過神經(jīng)網(wǎng)絡(luò)(類似NeRF算法)渲染出該物體的3D圖像,并記錄該物體的大小及位置;隨后生成一個3D向量空間,通過鳥看圖的方式,通過另一種神經(jīng)網(wǎng)絡(luò)(類似LSTM算法)和物體識別計(jì)算出物體下一時間點(diǎn)出現(xiàn)的位置,至此人形機(jī)器人完成全部的感知步驟,其中包含三維信息及時間維度信息,并將該信息存儲在訓(xùn)練集中,并不斷強(qiáng)化學(xué)習(xí)。

▲特斯拉2D物體識別到3D物體識別的過程示意圖

02.前景廣闊,蓄勢待發(fā)

從智慧城市到智能駕駛 AI浪潮的變化,預(yù)計(jì)人形機(jī)器人為人工智能的下一落地應(yīng)用場景。

大數(shù)據(jù)時代 : 2016年AI戰(zhàn)勝柯潔,同時隨著基礎(chǔ)算力的提升,我國開啟新一輪人工智能熱潮即大數(shù)據(jù)時代。政策、資本先行,應(yīng)用場景逐漸豐富。無人機(jī)、AI翻譯機(jī)等相繼落地。

智能駕駛 : 隨著海量數(shù)據(jù)的陸續(xù)爆發(fā),基礎(chǔ)算力及芯片的陸續(xù)演進(jìn),特斯拉Autopilot憑借完善的功能定義、依靠數(shù)據(jù)不斷學(xué)習(xí)的算法,以及通過OTA實(shí)現(xiàn)的軟件升級,全球正式進(jìn)入智能駕駛時代,同時,谷歌、百度、騰訊、華為等互聯(lián)網(wǎng)巨頭相繼入局,推動智能駕駛加速發(fā)展。疊加政策持續(xù)推動自動駕駛商業(yè)化運(yùn)營落地。如今,我國國內(nèi)廠商在智能座艙、駕駛等發(fā)面都取得實(shí)際性的突破,未來國產(chǎn)化的生態(tài)將大有可為。

人形機(jī)器人 : 未來隨著人形機(jī)器人的落地,枯燥乏味、重復(fù)性高例如買菜、家務(wù)等工作極易被人形機(jī)器人取代,我們認(rèn)為這是人工智能的下一波浪潮,國內(nèi)公司極大可能復(fù)制在智能駕駛領(lǐng)域取得的成果。

▲人工智能浪潮的變化

根據(jù)麥肯錫數(shù)據(jù)稱,隨著AI的不斷進(jìn)步,預(yù)計(jì)2030年全球約有3.75億人口由于AI的技術(shù)突破將重新就業(yè),從數(shù)量上看,我國將有1200萬至1.02億人口需要重新就業(yè)。全球平均被取代的勞動力比率為15%,我國作為人口大國基本與世界保持持平為16%。

此外,據(jù)馬斯克透露人形機(jī)器人的實(shí)際成本不會很高,可能比汽車還低。安德魯預(yù)測是25000美元,約人民幣16萬元。按照特斯拉MODEL3 最低售價約為28萬元,保守估計(jì)Optimus售價為20萬元。長期來看,保守估計(jì),到 2030年全球人形機(jī)器人市場規(guī)??蛇_(dá)萬億規(guī)模,是繼智能駕駛電車后又一 AI的空前藍(lán)海。

人形機(jī)器人的出現(xiàn)可以賦能千行百業(yè),有望取代重復(fù)性高、單調(diào)枯燥的繁瑣工作任務(wù),同時,搜索拯救等一系列危險問題工作有望得到解決,快遞、家政、服務(wù)業(yè)、工業(yè)等一系列場景有望率先得到落地。此外,人形機(jī)器人是 AI場景的下一波浪潮,隨著技術(shù)的不斷成熟和商業(yè)化的落地,有望帶來萬億級的空前藍(lán)海,在我國智能駕駛的生態(tài)逐漸突破和成熟的背景下,人形機(jī)器人勢在必行,國內(nèi)公司極大可能復(fù)制在智能駕駛領(lǐng)域取得的成果。

具備自研 AI處理器的廠商可以為人形機(jī)器人的神經(jīng)網(wǎng)絡(luò)提供算力支撐。人工智能的本質(zhì)及數(shù)據(jù)的海量運(yùn)算,相較于AI算法,數(shù)據(jù)才是重中之重。算力作為數(shù)據(jù)加速處理的動力源泉,其重要性不言而喻。

根據(jù)機(jī)器學(xué)習(xí)的算法步驟,可分為訓(xùn)練和推斷兩個環(huán)節(jié),訓(xùn)練環(huán)節(jié)需要極為龐大的數(shù)據(jù)輸入才能支持一個復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練過程中由于復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和海量訓(xùn)練數(shù)據(jù),運(yùn)算量巨大,因此對于處理器的算力、效率(能耗)要求極大。

AI處理器芯片可以支持深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和加速計(jì)算,相比于 GPU和 CPU擁有成倍的性能提升,和極低的耗電水平。此外,推斷環(huán)節(jié)相較于訓(xùn)練環(huán)節(jié)的計(jì)算量相對較小,但依然會涉及大量的矩陣運(yùn)算,因此,人工智能芯片將發(fā)揮大量作用。

人形機(jī)器人的落地需要下游場景的數(shù)據(jù)融合,具備 AI算法落地的廠商具有比較優(yōu)勢。特斯拉在智能駕領(lǐng)域已經(jīng)實(shí)現(xiàn)了純視覺的解決方案,相關(guān)FSD系統(tǒng)可以直接用于人形機(jī)器人的機(jī)器視覺領(lǐng)域。

然而距離人形機(jī)器人的商業(yè)落地,其數(shù)據(jù)需要和下游細(xì)分場景緊密結(jié)合,通過優(yōu)質(zhì)細(xì)分場景下的數(shù)據(jù)和算法進(jìn)行不斷地迭代訓(xùn)練,最后提供具有價值的商業(yè)服務(wù)。人形機(jī)器人在細(xì)分場景海量數(shù)據(jù)并不可以直接獲得,而具備AI算法商業(yè)化落地的公司本身具備卡位優(yōu)勢,即與下游細(xì)分場景連接密切,雙方可以通過合作共同賦能客戶,進(jìn)而加速人形機(jī)器人的商業(yè)化落地。

智東西認(rèn)為,特斯拉人形機(jī)器人的目標(biāo)是在重復(fù)、枯燥、危險的環(huán)境和工況下應(yīng)用,最終將走向我們的家庭,以徹底解決人工不斷短缺的趨勢。雖然特斯拉在AI、機(jī)器人技術(shù)方面有著雄厚的技術(shù)基礎(chǔ),但是馬斯克的海口是否能成真,這可能得到9月才能見分曉。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。