文|車東西 Juice
編輯|曉寒
特斯拉的人形機(jī)器人來了,成本不到2萬美元(約合人民幣14萬元),最快3年內(nèi)或許就能買到。
就在今天,特斯拉又一次舉辦了AI DAY活動,仍然發(fā)揮了延遲開始的傳統(tǒng)藝能。與往常馬斯克主講的模式不同,在本次AI DAY上,馬斯克穿著“撞衫”老黃的皮夾克簡短介紹了此次重點展示的機(jī)器人Optimus(與變形金剛里的擎天柱重名),之后都是各個業(yè)務(wù)負(fù)責(zé)人進(jìn)行的講解。
特斯拉機(jī)器人團(tuán)隊在過去一年內(nèi)幾乎每周都工作了7天,并且每天工作十幾個小時,終于在今年展示出了原型機(jī)。
在活動一開始,一個周身沒有任何偽裝的機(jī)器人緩緩走上舞臺,完成了行走、轉(zhuǎn)向、揮手等動作,從特斯拉展示的視頻來看,特斯拉Optimus還可以完成運輸物品,澆花等行為。
去年AI Day上,擎天柱還只是一個概念圖。現(xiàn)在僅僅過了一年,特斯拉就拿出來了一個能夠行走和進(jìn)行多種行為的原型產(chǎn)品,不得不說特斯拉的技術(shù)團(tuán)隊是真的很強(qiáng)。
特斯拉Optimus出場
對于這一產(chǎn)品,馬斯克非??粗?,認(rèn)為其價值將會比汽車、自動駕駛更加重要。他認(rèn)為特斯拉將會在未來生產(chǎn)數(shù)百萬臺機(jī)器人,成本低于2萬美元(約合人民幣14萬元),未來3~5年就能購買到。
而在自動駕駛方面,特斯拉一直在完善自己的技術(shù)和產(chǎn)品,目前FSD Beta版本已經(jīng)有16萬名用戶在使用,而今年底就將會具備全球推廣的能力。
此外,特斯拉自研了Dojo超算平臺,目前這一產(chǎn)品也正在幫助特斯拉在自動駕駛、機(jī)器人等方面取得更多成績。
整場發(fā)布會下來,特斯拉的多位工程師對特斯拉在Optimus、FSD、Dojo等方面進(jìn)行了詳細(xì)的軟硬件介紹,但幾乎在每個產(chǎn)品介紹的時候,特斯拉都聊到了希望更多的AI、硬件等人才可以加入特斯拉來做出更多有意義的產(chǎn)品。
也就是說,為了招聘合適的人才,特斯拉特意舉辦了一場發(fā)布會。
不過從這場發(fā)布來看,特斯拉已經(jīng)不僅僅是一家電動汽車公司了,在人形機(jī)器人、自動駕駛和超算等方面已經(jīng)進(jìn)行了很深的布局,正在成為全家非常硬核的科技公司。
01 Optimus原型機(jī)亮相,成本不超2萬美元
在發(fā)布會開始,馬斯克就展示了特斯拉制作的機(jī)器人Optimus原型,從直播上來看,率先亮相機(jī)器人造型確實很原型,周身直接裸露著電線,沒有做任何裝飾。
機(jī)器人可以獨立完成行走,向用戶揮手致意,甚至跳舞等內(nèi)容。
特斯拉Optimus可以跳舞
馬斯克表示,Optimus其實可以做更多事情,受限于舞臺只能展示這些。從現(xiàn)場展示的視頻來看,Optimus除了可以四處走動之外,還能完成運輸物品,澆花等行為。
特斯拉Optimus可以運輸東西
在工廠里,機(jī)器人能將一個長條狀的物體從工作臺拿下來,再整齊排放至裝有相同物體的盒子中。在機(jī)器人視角的渲染圖中,它能夠用顏色區(qū)分開現(xiàn)實世界中的不同物體。如它手持的長條形物體是紫色、工作臺是黃色等。
特斯拉Optimus搬運工廠貨物
隨后,特斯拉推了一個更接近真人的版本的Optimus,看上去和去年AI DAY上展示的模型有點類似,具備類似人類的外觀,自由度也更高一點。
在使用過程中也可以提供更多服務(wù),如手指可以自由移動,可以操作很多工具,右手可以拿一些工具,甚至在工廠做一些重復(fù)的工作等。
特斯拉Optimus
不過,馬斯克表示,在過去的一年中,機(jī)器人團(tuán)隊一周工作7天,每天工作十幾小時,雖然特斯拉已經(jīng)做了很多工作,但這個機(jī)器人目前還處在早期階段未來還可以將其做的更好。
按照介紹,完全體的特斯拉人形機(jī)器人“擎天柱”體重73kg,用電功率在靜坐時為100W,快走時500W,全身有200多個自由度,手部27個自由度。
馬斯克對這一產(chǎn)品的成本等信息進(jìn)行了劇透,他認(rèn)為目前可以在市面上看到一些其他的機(jī)器人,但成本非常高,特斯拉的Optimus可以低成本生產(chǎn),預(yù)計未來產(chǎn)量可以達(dá)到數(shù)百萬臺,而成本或許會低于2萬美元(約合人民幣14萬元)。
對于這一產(chǎn)品,馬斯克顯然非??春茫硎?,機(jī)器人可以降低勞動成本,更好的發(fā)展經(jīng)濟(jì),未來將沒有貧窮,人類可以自由選擇工作類型,體力活將不再是人類必須選擇的,人類可以更多的參與腦力工作。
雖然自動駕駛汽車非常重要,可以將運輸能力可以提升一個數(shù)量級,帶來革命性的變化。但機(jī)器人可以降低經(jīng)濟(jì)成本,讓社會發(fā)展更有動力。馬斯克希望機(jī)器人可以更加安全的為人類帶來更多幫助。
特斯拉Optimus
而在現(xiàn)場,馬斯克也不忘了給自己打廣告:“我們舉辦這個活動的目的就是為了吸引更多的AI人才加入我們,做出更好的產(chǎn)品?!?/p>
在馬斯克做完簡單的介紹之后,特斯拉的設(shè)計團(tuán)隊對Optimus的設(shè)計進(jìn)行了一些介紹。
特斯拉一位機(jī)器人負(fù)責(zé)人介紹了一些機(jī)器人的具體進(jìn)展,在去年的AI DAY上,特斯拉簡單介紹了特斯拉的機(jī)器人,到目前已經(jīng)進(jìn)行了三次演進(jìn),最終呈現(xiàn)出現(xiàn)在的結(jié)果。
Optimus采用的核心傳感器為攝像頭,和特斯拉FSD系統(tǒng)中采用的攝像機(jī)類似。目前特斯拉收集了很多數(shù)據(jù)來訓(xùn)練機(jī)器人。
特斯拉Optimus的電力系統(tǒng)集成到了上半部分,之所以這么設(shè)計則是考慮了特斯拉汽車的設(shè)計方案,希望減少更多的線束,將配電和計算集中在軀干中心。其中包含一塊電池組,容量為2.3kWh,充一次電后可以運行一整天。
特斯拉Optimus核心零部件展示
特斯拉機(jī)器人使用了單顆特斯拉自研SoC芯片,支持LTE 4G連接,但和汽車所采用的不一樣,機(jī)器人需要處理視覺數(shù)據(jù)做出迅速反應(yīng)、基于多種感官輸入和通訊,因此裝有無線電連接、音頻支持以及需要保護(hù)機(jī)器人本體和人類的安全特性。
在行動方面,特斯拉的擎天柱依然吸取了特斯拉電動車的動力系統(tǒng)。設(shè)計的時候,特斯拉先分析了機(jī)器人需要進(jìn)行哪些行動,包括行走、上下樓等。首先通過對機(jī)器人行走的動態(tài)數(shù)據(jù)進(jìn)行分析,然后就能夠分析出這些移動需要的時間、能耗和軌跡,根據(jù)這些數(shù)據(jù)就能設(shè)計出關(guān)節(jié)和執(zhí)行器。
安全性方面,特斯拉也做了一些設(shè)計。為了保護(hù)機(jī)器人,研發(fā)人員對其結(jié)構(gòu)基礎(chǔ)進(jìn)行了優(yōu)化,在人形機(jī)器人摔倒時不會把變速器和胳膊弄壞,就可以將這一技術(shù)應(yīng)用到機(jī)器人之上。畢竟一臺機(jī)器人的維修成本很高。
特斯拉Optimus可自我保護(hù)
研發(fā)人員采用了與汽車相同的底層技術(shù),讓機(jī)器人在所有組件中產(chǎn)生壓力,使得其行走控制變得更加容易,也不會那么僵硬。
特斯拉Optimus行走姿態(tài)模擬
以膝蓋為例,人形機(jī)器人在設(shè)計時需要仿照人類真實的膝蓋結(jié)構(gòu)。
特斯拉Optimus模擬了人類骨骼結(jié)構(gòu)
研發(fā)人員將人類的膝蓋和其運動過程中所受的力線性化,從而學(xué)習(xí)如何讓機(jī)器人膝蓋使用更少的力來構(gòu)建,讓其能實現(xiàn)更好的力度控制,并讓相關(guān)結(jié)構(gòu)緊密的包裹在膝蓋周圍。
執(zhí)行器共有6種,包括電機(jī)、類似重量秤一樣的牽引執(zhí)行器等。特斯拉在現(xiàn)場也展示了一段視頻,可以通過牽引執(zhí)行器吊起一臺鋼琴。
特斯拉Optimus牽引執(zhí)行器可以吊起一臺鋼琴
人形機(jī)器人的另外一個重點就是手部。特斯拉希望擎天柱的手部也能跟人類一樣靈活,能夠抓住物體,進(jìn)行操作,并且擁有傳感器進(jìn)行感知。
設(shè)計擎天柱的手部時同樣從生物學(xué)生吸取靈感。通過6個執(zhí)行器,讓擎天柱的手可以實現(xiàn)11個自由度的移動,并且可以拿動20磅的重量,并且可以操作一些器械,或者抓取小型物體。
特斯拉的技術(shù)專家在現(xiàn)場講到,汽車就是輪式機(jī)器人,擎天柱某種程度上只是把汽車立起來了。
在機(jī)器人的行動方面,擎天柱使用特斯拉電動車同樣的神經(jīng)網(wǎng)絡(luò)——“占用網(wǎng)絡(luò)”來識別可行駛區(qū)域。
特斯拉Optimus采用占用網(wǎng)絡(luò)識別
在行走方面,軟件在感知和分析外部環(huán)境后,會畫出行駛軌跡,然后根據(jù)軌跡規(guī)劃出每個腳的落腳點,然后再讓執(zhí)行器執(zhí)行。
人形機(jī)器人的一個重點就是保持直立狀態(tài),不能輕易就倒地。如何做到?通過傳感器和對外界的情況進(jìn)行感知,當(dāng)受到外部影響的時候能夠自行調(diào)節(jié)控制器的扭矩并最終讓它保持平衡。
抓取方面,特斯拉先通過對人的抓取行為的動作進(jìn)行軌跡數(shù)據(jù)采集,然后再映射到機(jī)器人身上,從而讓它能夠進(jìn)行一些抓取動作。
特斯拉Optimus通過真人動作抓取來模擬動作
未來,特斯拉希望讓擎天柱變得更加靈活,希望從原型機(jī)能夠走的更遠(yuǎn),讓它在各方面都進(jìn)行改善,擁有更好的導(dǎo)航、行動能力等。
02 發(fā)力自動駕駛,年底具備全球推出FSD能力
自動駕駛方面,特斯拉首先介紹了FSD的情況。2021年,F(xiàn)SD測試有2000客戶參加。2022年擴(kuò)展到了16萬客戶。特斯拉目前積累了480萬段數(shù)據(jù),訓(xùn)練了7.5萬個神經(jīng)網(wǎng)絡(luò),并在此基礎(chǔ)上推出了35個FSD的版本更新。
自動駕駛技術(shù)架構(gòu)方面,特斯拉的做法是先用自動化的數(shù)據(jù)標(biāo)注系統(tǒng)對收集的數(shù)據(jù)進(jìn)行自動標(biāo)注,然后對數(shù)據(jù)進(jìn)行處理后,來訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后將AI模型部署到FSD計算機(jī)中,通過計算來算出對外部環(huán)境的感知結(jié)果并算出本車的行駛規(guī)矩。
技術(shù)展示方面,特斯拉首先展示了一下無保護(hù)左轉(zhuǎn)能力。比如在左轉(zhuǎn)的時候有行人和其他車輛,特斯拉在考慮到不同交通參與者的行駛軌跡后,算出了最合適的行駛軌跡。
特斯拉FSD系統(tǒng)應(yīng)對無保護(hù)左轉(zhuǎn)
具體呢,特斯拉使用了一個名為交互搜索的技術(shù)。
首先從視覺感知開始,去感知交通參與者,然后去推測他們的行駛軌跡,然后生成幾種策略,最后再選擇出最佳的行駛軌跡。
特斯拉交互搜索技術(shù)架構(gòu)
這里需要注意,外部目標(biāo)如果越來越多,需要的計算量也會越來越大。
特斯拉通過環(huán)視攝像頭來對外界進(jìn)行感知,生成3D環(huán)境,并通過占用網(wǎng)絡(luò)來找到可行駛區(qū)域,并知道哪些是障礙物。
工作時候,第一步是先對攝像頭的圖像進(jìn)行校準(zhǔn),把圖像整合在一起就形成了3D空間,將數(shù)據(jù)進(jìn)行提取,輸入到神經(jīng)網(wǎng)絡(luò)里,通過相應(yīng)的算法就構(gòu)建空間特征。
基于視覺數(shù)據(jù)構(gòu)建3D空間
這里有個問題,僅僅生成了3D空間后,沒有各種物體的精確位置,依然無法進(jìn)行路徑規(guī)劃。所以特斯拉的做法是通過對關(guān)鍵特征進(jìn)行分析來算出位置數(shù)據(jù)。
特斯拉的車隊在日常行駛中積累了很多視頻片段。每個視頻有何多幀圖像,需要14億幀才能訓(xùn)練一個神經(jīng)網(wǎng)絡(luò),需要使用10萬個GPU工時(1個GPU工作1小時),訓(xùn)練量很大。
這里就需要使用超級計算機(jī)和AI加速器。這也是特斯拉為啥自己搞了Dojo超算的原因,能夠提升30%的網(wǎng)絡(luò)訓(xùn)練速度。
其他交通參與者的行為預(yù)測方面,特斯拉也介紹了一下自己的做法。
攝像頭的畫面會先進(jìn)入到RegNet網(wǎng)絡(luò),處理之后的數(shù)據(jù)再進(jìn)入Transformer模型之中??赡苡?0億個參數(shù),對他們進(jìn)行共同的優(yōu)化。想要實現(xiàn)的是最大程度實現(xiàn)算力,盡量減少延遲。
汽車在運行過程中將會產(chǎn)生大量的數(shù)據(jù),而這些數(shù)據(jù)也需要進(jìn)行標(biāo)注。
在進(jìn)行標(biāo)注的時候,特斯拉最先嘗試了手工標(biāo)注,但費時費力,之后有考慮過供應(yīng)商合作的方式,但從最終的結(jié)果來看,無論是時效性還是質(zhì)量都不是很好,而特斯拉需要非常高效且具備可擴(kuò)展性的標(biāo)注。
目前特斯拉采用的人機(jī)合作的標(biāo)準(zhǔn)方式,既有人類標(biāo)注,也有機(jī)器標(biāo)注,但整體而言,機(jī)器標(biāo)注的效率更好,機(jī)器30分鐘的工作量,人類可能需要更長時間,因此特斯拉正在構(gòu)建自動標(biāo)注系統(tǒng)。
特斯拉基于自動標(biāo)注的數(shù)據(jù)訓(xùn)練模型
通過高效率的標(biāo)注,讓現(xiàn)實世界中的時空片段轉(zhuǎn)化為可以使用的數(shù)據(jù),從而讓FSD更加智能和高效。
及時自動標(biāo)注也需要進(jìn)行梳理,之前特斯拉方面并沒有投入太多精力在這方面,而現(xiàn)在已經(jīng)有很多工程師在做這方面的工作。
此外,在自動駕駛中,非常重要的一部分就是仿真系統(tǒng),這可以提升車輛對于長尾場景的應(yīng)對能力。
特斯拉建立一個場景生成器,最快在五分鐘內(nèi)就可以生成一個場景,速度提升了1000倍,還可以掃描現(xiàn)實物體投射到屏幕上,可以模擬信號燈、停車標(biāo)志等,盡可能接近真實世界。
特斯拉的場景生成器
這對于訓(xùn)練來說,意義非常重大。
而通過數(shù)據(jù)引擎,可以讓神經(jīng)網(wǎng)絡(luò)更加真實,能夠帶來更多的確定性,去解決現(xiàn)實世界的不確定性。如在路口轉(zhuǎn)彎時,要判斷橫停的車輛究竟是停車狀態(tài)還是緩慢行駛,只用創(chuàng)建更多的網(wǎng)絡(luò)進(jìn)行評估,就能解決這樣的場景。
目前特斯拉的數(shù)據(jù)集,一部分來自車隊傳回的信息,另一部分來自模擬數(shù)據(jù),都可以更方便的對場景做出判斷。
而對于特斯拉FSD Beat的推廣情況,特斯拉今年年底將具備在全球推出FSD的能力。但北美之外,需要跟監(jiān)管方進(jìn)行溝通,而在有些國家和地區(qū),監(jiān)管還很滯后。
03 Dojo不斷迭代,正促進(jìn)特斯拉發(fā)展
在之前關(guān)于機(jī)器人和自動駕駛的介紹中,特斯拉工程師已經(jīng)多次提到了Dojo超算平臺。
在去年的首屆特斯拉AI Day上,特斯拉展示了其首款A(yù)I訓(xùn)練芯片Dojo D1,以及基于該芯片構(gòu)建的完整Dojo集群ExaPOD,用于執(zhí)行AI訓(xùn)練任務(wù),為其上路車輛龐大的視頻處理需求提供支撐。
當(dāng)前特斯拉已經(jīng)擁有基于英偉達(dá)GPU的大型超算,以及一個存儲30PB視頻素材的數(shù)據(jù)中心。
特斯拉還展示了一組過去兩年間從交付定制冷液分配單元(CDU)到安裝第一臺集成Dojo機(jī)柜、再到2.2MW機(jī)組負(fù)載測試的照片。
特斯拉研發(fā)Dojo超算的關(guān)鍵節(jié)點
特斯拉一直試圖優(yōu)化Dojo設(shè)計的可擴(kuò)展性,并以“快速試錯”的心態(tài)來克服挑戰(zhàn)。Dojo加速器具有單個可擴(kuò)展計算平面、全局尋址快速存儲器和統(tǒng)一的高帶寬+低延遲。
特斯拉技術(shù)工程師特別談到電壓調(diào)節(jié)模塊,它具有高性能、高密度(0.86A/mm2)、復(fù)雜集成性。
電壓調(diào)節(jié)模塊
其電壓調(diào)節(jié)模塊在24個月內(nèi)更新了14個版本。
熱膨脹系數(shù)(CTE)很重要,因此特斯拉與供應(yīng)商合作提供電力解決方案。其CTE降低了50%以上,Dojo的性能是初始擴(kuò)展的3倍。
會上,Dojo團(tuán)隊展示了通過Dojo實現(xiàn)Stable Diffusion在火星上運行Cybertruck的圖像。
據(jù)介紹,只用4個Dojo機(jī)柜就能取代由4000個GPU組成的72個GPU機(jī)架。Dojo能將通常需要幾個月的工作減少到了1周。
此外,特斯拉自研的D1芯片也發(fā)揮了作用。D1采用臺積電7nm制程工藝,在645mm2的面積上塞了500億顆晶體管,BF16、CFP8算力可達(dá)362TFLOPS,F(xiàn)P32算力可達(dá)22.6TFLOPS,TDP(熱設(shè)計功耗)為400W。
基于D1芯片,特斯拉推出晶圓上系統(tǒng)級方案,通過應(yīng)用臺積電InFO_SoW封裝技術(shù),將所有25顆D1裸片都集成到一個訓(xùn)練Tile上,每個Dojo訓(xùn)練Tile消耗15kW。特斯拉Dojo訓(xùn)練Tile中有計算、I/O、功率和液冷模塊。
Dojo超算的Tarining Tile模塊
Dojo System Tray有高速連接、密集集成等特性,75mm高度能支持135kg。其BF16/CFP8峰值算力可達(dá)到54TFLOPS,功耗100+kW。
Dojo接口處理器是一個具有高帶寬內(nèi)存的PCIe卡,利用特斯拉自家TTP接口。
特斯拉傳輸協(xié)議TTP還可以橋接到標(biāo)準(zhǔn)以太網(wǎng),TTPOE可將標(biāo)準(zhǔn)以太網(wǎng)轉(zhuǎn)換至Z平面拓?fù)?,擁有高Z平面拓?fù)溥B接性。
自去年特斯拉AI Day至今,Dojo開發(fā)迎來了一系列里程碑,包括安裝第一個Dojo機(jī)柜、進(jìn)行2.2mW負(fù)載測試等,現(xiàn)在特斯拉正以每天打造一個Tile的速度推進(jìn)工作。
Dojo超算機(jī)柜
特斯拉還宣布其第一個ExaPOD預(yù)計將在2023年第一季度完工,計劃在帕洛阿爾托總建造7臺ExaPOD。
據(jù)介紹,在10機(jī)柜系統(tǒng)中,Dojo ExaPOD集群將突破E級算力。
其BF16/CFP8峰值算力達(dá)到1.1EFLOPS(百億億次浮點運算),并擁有1.3TB高速SRAM和13TB高帶寬DRAM。
04 結(jié)語:特斯拉不僅是一家汽車公司
在很多普通公眾印象中,特斯拉是全球電動汽車的領(lǐng)頭羊,是世界上首個將電動汽車大規(guī)模推廣起來的公司,也是一家偉大的汽車公司。
但在特斯拉自己看來,汽車公司并不是其給自己的最終定位,特斯拉將自己能定位為一家非常硬核的科技公司。所以特斯拉在自動駕駛、AI、機(jī)器人,甚至超算方面發(fā)力,并且還都做出了一定的成果。
而為了實現(xiàn)這些成績,特斯拉內(nèi)部也進(jìn)行了非常多的努力,充分尊重有才華的員工,共同打造有價值的產(chǎn)品。