影音先锋中文字幕35页,成全影院电视剧在线观看,果冻国产传媒61国产免费

文丨產(chǎn)業(yè)象限錢(qián)江

編輯｜山茶

人形機(jī)器人行業(yè)又迎來(lái)一對(duì)新的強(qiáng)強(qiáng)聯(lián)合。

近期，波士頓動(dòng)力宣稱(chēng)，會(huì)使用豐田研究所的“大型行為模型”來(lái)訓(xùn)練機(jī)器人，它類(lèi)似于驅(qū)動(dòng)ChatGPT的“大型語(yǔ)言模型”，可以讓機(jī)器人通過(guò)少量演示數(shù)據(jù)和多模態(tài)感知來(lái)掌握復(fù)雜任務(wù)，走向通用機(jī)器人。

在過(guò)去，這條技術(shù)路徑一直是馬斯克為Optimus（下稱(chēng)“擎天柱”）畫(huà)的“餅”，想借此實(shí)現(xiàn)通用人形機(jī)器人。

今年10月初，馬斯克以《We, Robot》為主題在加州開(kāi)了一場(chǎng)“科幻”味兒十足的發(fā)布會(huì)。在現(xiàn)場(chǎng)，擎天柱以服務(wù)員的身份一邊為賓客調(diào)酒，一邊抬手打招呼說(shuō)著“Hi,everybody”，甚至在現(xiàn)場(chǎng)和賓客熱舞。

但發(fā)布會(huì)結(jié)束后，有現(xiàn)場(chǎng)賓客卻表示，擎天柱“親口”向他承認(rèn)，自己是被遠(yuǎn)程遙控的。而整個(gè)發(fā)布會(huì)，馬斯克也沒(méi)有透露關(guān)于擎天柱的任何技術(shù)細(xì)節(jié)。

看似自主的機(jī)器人，依舊離不開(kāi)人類(lèi)的遠(yuǎn)程遙控。

馬斯克似乎做了一個(gè)雙面鏡，一面是真實(shí)的擎天柱仍然做著人類(lèi)的提線木偶；而另一面，他又用一種近乎虛假的方式為人們構(gòu)畫(huà)出一個(gè)可能實(shí)現(xiàn)的未來(lái)。

但顯而易見(jiàn)，馬斯克并沒(méi)有興趣解答擎天柱當(dāng)前的研發(fā)進(jìn)度，那么作為馬斯克在機(jī)器人領(lǐng)域的強(qiáng)敵，波士頓動(dòng)力這次與豐田研究所的聯(lián)合，能將馬斯克畫(huà)的餅實(shí)現(xiàn)嗎？

波士頓動(dòng)力，率先走到終點(diǎn)？

想要完成馬斯克這張拼圖，擎天柱需要擁有與人類(lèi)和環(huán)境交互的能力。

比如將機(jī)器人放在廚房，它首先要能識(shí)別出自己所處場(chǎng)景是“廚房”。然后，當(dāng)人類(lèi)告訴他要做一道菜時(shí)，它可以主動(dòng)從冰箱拿出食材、清洗、切菜、并按步驟烹飪。

要實(shí)現(xiàn)這個(gè)過(guò)程，意味著機(jī)器人能夠自主辨別什么是冰箱，并移動(dòng)到冰箱前，打開(kāi)冰箱門(mén)，在眾多食材中找到需要的食材，取出來(lái)，然后結(jié)合各種工具進(jìn)行清洗.....

這個(gè)過(guò)程對(duì)人類(lèi)來(lái)說(shuō)十分簡(jiǎn)單，但對(duì)機(jī)器人而言卻十分困難。

當(dāng)前無(wú)論是老牌人形機(jī)器人波士頓動(dòng)力的Atlas，還是“新貴”擎天柱、Figure，都只能在受限制的環(huán)境里執(zhí)行單一任務(wù)，比如在案板前將已經(jīng)分揀好的各種蔬果拿起或者放下。

▲Figure01拾取水果，圖源YouTube@Figure

▲Optimus Gen2拾取雞蛋，圖源YouTube@Tesla

要知道這其中的區(qū)別，可以想一想咱們自己家里的冰箱，當(dāng)各種食材被混雜在一起、用透明塑料袋裝著的時(shí)候，識(shí)別難度就會(huì)高于單個(gè)的西紅柿、紅薯。

所以如果將機(jī)器人自主做出一頓飯的難度，比作是登上珠穆朗瑪峰，那么現(xiàn)在的人形機(jī)器人才剛剛坐進(jìn)學(xué)步車(chē)。對(duì)，它還沒(méi)有學(xué)會(huì)“走路”。

而更重要的是，當(dāng)前機(jī)器人學(xué)習(xí)新技能的效率十分低下，比如學(xué)會(huì)了疊衣服之后，轉(zhuǎn)而疊被子就要重新學(xué)習(xí)大量數(shù)據(jù)。

為了克服這個(gè)難題，波士頓動(dòng)力和豐田研究院團(tuán)隊(duì)采用一種新的AI系統(tǒng)“大型行為模型”訓(xùn)練機(jī)器人，通過(guò)物理演示任務(wù)（例如觀看視頻）進(jìn)行教學(xué)，來(lái)幫助將Atlas打造成一款自主性能力強(qiáng)的通用人形機(jī)器人。

經(jīng)過(guò)這套“大型行為模型”的訓(xùn)練，機(jī)器人可以通過(guò)少量數(shù)據(jù)學(xué)習(xí)新技能，這種方法叫做“擴(kuò)散策略”，這套策略可以探索多種不同的路徑，并根據(jù)實(shí)時(shí)情況選擇最佳方案，它可以幫助機(jī)器人更好地應(yīng)對(duì)不確定性的環(huán)境，比如突然的障礙或任務(wù)變化。

豐田研究院公布了關(guān)于這一成果的報(bào)告，其中有一個(gè)通俗案例可以解釋這個(gè)策略：

經(jīng)過(guò)擴(kuò)散策略訓(xùn)練的機(jī)器人，可以做醬汁燒注和涂抹任務(wù)，需要將醬汁涂抹在披薩面團(tuán)中心，分拆步驟來(lái)看：①握住勺子接近披薩面團(tuán)中心；②將醬汁以螺旋狀鋪在披薩上；③提起勺子。

▲論文《擴(kuò)散政策：通過(guò)動(dòng)作擴(kuò)散進(jìn)行視覺(jué)運(yùn)動(dòng)策略學(xué)習(xí)》

在這個(gè)過(guò)程里，披薩面團(tuán)會(huì)隨機(jī)移動(dòng)，而機(jī)器人可以“隨機(jī)應(yīng)變”，它能跟隨披薩面團(tuán)中心位置的遷移而即時(shí)挪動(dòng)勺子。

根據(jù)豐田工作人員透露，學(xué)會(huì)這個(gè)能力并不費(fèi)勁，“這個(gè)過(guò)程從老師遠(yuǎn)程操作演示一小部分技能開(kāi)始”，機(jī)器人晚上學(xué)習(xí)，第二天就可以獲得新技能。也就是說(shuō)，它用少量數(shù)據(jù)向機(jī)器人演示，便能夠讓機(jī)器人獲得“泛化”能力。

和傳統(tǒng)的機(jī)器人學(xué)習(xí)相比，這種行為模型就像運(yùn)動(dòng)界的ChatGPT一樣，給它一點(diǎn)行為上的Prompt，就能泛化出一套完成任務(wù)的操作軌跡和應(yīng)變能力。

但并不是任何人形機(jī)器人都能適配這套策略，擴(kuò)散策略更依賴(lài)視覺(jué)數(shù)據(jù)，這就需要硬件上擁有高精度視覺(jué)傳感器，還要擁有抓取復(fù)雜和精細(xì)物體操作能力。

這也是目前波士頓動(dòng)力面臨的挑戰(zhàn)。

其最新款人形機(jī)器人Atlas目前并不具備實(shí)現(xiàn)“自主”的硬性條件，它既沒(méi)有靈巧手，又缺乏生活場(chǎng)景的數(shù)據(jù)。

Atlas機(jī)器人雖然具備一定的抓握能力，但其手部設(shè)計(jì)相對(duì)簡(jiǎn)單，只有三指，并且常用場(chǎng)景是應(yīng)急救援和工廠搬運(yùn)，對(duì)于生活場(chǎng)景的數(shù)據(jù)也相對(duì)缺乏。

與此相比，特斯拉的擎天柱卻顯得更有優(yōu)勢(shì)。

比如在視覺(jué)數(shù)據(jù)上，特斯拉的自動(dòng)駕駛一直堅(jiān)持純視覺(jué)的解決方案，目前市場(chǎng)上運(yùn)行著將近600萬(wàn)輛特斯拉汽車(chē)，可以積累大量的視覺(jué)數(shù)據(jù)。

其次擎天柱在靈巧手、關(guān)節(jié)有更接近人類(lèi)的設(shè)計(jì)。在特斯拉最新展示的視頻里，擎天柱可以走到桌邊，用雙手的“指尖”舉起重11kg的4680電池盒。

這雙機(jī)械手已經(jīng)擁有22個(gè)自由度，分布在手指、手腕和小指下方，而年初手部擁有11個(gè)自由度的第二代擎天柱，所有手指都具有觸覺(jué)感應(yīng)，能夠靈巧地處理雞蛋等易碎物品。

▲擎天柱舉起電池，圖源：Tesla@YouTube

所以，雖然波士頓動(dòng)力和豐田研究院的找到了一種更有效率的機(jī)器人訓(xùn)練方式，但想要比擎天柱更快實(shí)現(xiàn)真正的自主性，Marc Raibert或許需要聯(lián)合他的老搭檔---曾一起在MIT腿部實(shí)驗(yàn)室共事、豐田研究所的CEO兼豐田汽車(chē)公司首席科學(xué)家Gill Pratt，對(duì)目前Atlas的機(jī)械手作一番改造，并且補(bǔ)足視覺(jué)識(shí)別所需要的硬件能力。

馬斯克鐘愛(ài)“奇跡廚房”

與波士頓動(dòng)力聯(lián)合豐田研究院發(fā)布的新技術(shù)相比，馬斯克更鐘愛(ài)打造“奇跡廚房”。

所謂“奇跡廚房”，是指夸大產(chǎn)品能力的科技營(yíng)銷(xiāo)行為。

1959年7月，《展望》雜志刊登了一篇描述未來(lái)“奇跡廚房”的文章，讓美國(guó)人認(rèn)為，未來(lái)自己家庭會(huì)有功能齊全、十分智能的廚房，在美國(guó)的宣傳片中，有一部分電器的運(yùn)作會(huì)被含糊其辭地描述為“自主”的：

“推車(chē)會(huì)將吃完飯后的臟盤(pán)子，推到墻面，進(jìn)行自動(dòng)清洗和干燥”

“清潔器可以從墻上自動(dòng)出來(lái)，在清理完地面后，會(huì)自動(dòng)回歸原來(lái)的位置”

“揮一揮手”就能召喚出隱藏在墻面的飲料機(jī)，告訴它“我想喝一罐冰凍橙汁”，飲料機(jī)就會(huì)自動(dòng)出水

▲吸塵機(jī)器人，照片由Robert S. Lerner Photography LLC拍攝

但這些在50年代令人感到驚奇的黑科技，卻是一個(gè)實(shí)實(shí)在在的謊言。

2013年，一位“奇跡廚房”設(shè)計(jì)師成員揭露，自動(dòng)洗碗機(jī)和清潔器這些“自走式電器”根本無(wú)法正常工作，而是工作人員在后臺(tái)通過(guò)遙控操作，讓一些隱藏在地板下的電子軌道輔助完成的。

“奇跡廚房”本質(zhì)上是冷戰(zhàn)時(shí)期的一種營(yíng)銷(xiāo)工具，設(shè)計(jì)初衷是為了嚇唬蘇聯(lián)游客，讓他們產(chǎn)生“一無(wú)所有”的感覺(jué)。

但從馬斯克的角度，他上演“奇跡廚房”的目的，顯然并不是為了讓人覺(jué)得自己一無(wú)所有，反而是為了讓人們知道自己未來(lái)可能會(huì)擁有什么。

2021年9月，馬斯克在特斯拉AI Day上突然宣布進(jìn)軍人形機(jī)器人領(lǐng)域，配合他宣傳的是一段“機(jī)器人”的熱舞，當(dāng)時(shí)這些機(jī)器人還只是身穿緊身衣的人類(lèi)舞者，而僅僅一年之后，擎天柱的原型機(jī)就被人攙扶著走上了發(fā)布會(huì)。

一直以來(lái)，馬斯克都以這種近乎夸張的方式，超前兜售自己的夢(mèng)想。今年的《We,Robot》發(fā)布會(huì)也是如此。

在10月初的《We,Robot》發(fā)布會(huì)上馬斯克用了一種科幻手法，在香檳美酒和燈光舞影之下，一群擎天柱與人類(lèi)其樂(lè)融融地相處，甚至在一個(gè)玻璃房里集體大跳“夜店舞”。

▲擎天柱熱舞，圖源Tesla@YouTube

可能是因?yàn)榍嫣熘谋憩F(xiàn)過(guò)于自然，以致于現(xiàn)場(chǎng)賓客幾乎沒(méi)有格格不入感。

但賓客很快就發(fā)現(xiàn)了不對(duì)勁。在現(xiàn)場(chǎng)，不同擎天柱的音色不盡相同，并且它們與人類(lèi)互動(dòng)的反應(yīng)是即時(shí)的，還伴隨著順滑的手勢(shì)，相比于自主，更像遠(yuǎn)程遙控。

連擎天柱自己都承認(rèn)了這一點(diǎn)，前微軟戰(zhàn)略家Robert Scoble在X上分享了一段視頻，他在現(xiàn)場(chǎng)向擎天柱發(fā)問(wèn)：“How much of you is AI？Some or none.”（你的表現(xiàn)里有多少成分是AI驅(qū)動(dòng)？一點(diǎn)點(diǎn)，還是完全沒(méi)有？），擎天柱回復(fù)“It might be some.”

擎天柱就像提線木偶，和背后操縱它的人類(lèi)共同演了一場(chǎng)戲。

馬斯克并不是第一次這么做，2024年1月份，他在X上發(fā)了一個(gè)擎天柱疊衣服的視頻，并配文“擎天柱在折襯衫?！?/p>

▲擎天柱折襯衫，圖源X@Elon Musk

眼尖的網(wǎng)友從視頻上看到一只快速閃現(xiàn)的手，擎天柱很快被質(zhì)疑背后由人類(lèi)遠(yuǎn)程操控，馬斯克也親自承認(rèn)了這一點(diǎn)，他發(fā)了一條“重要提示”：擎天柱還不能自主地做到這一點(diǎn)。

馬斯克的做法，與當(dāng)年“奇跡廚房”的構(gòu)建如出一轍。通過(guò)模棱兩可地描述，來(lái)構(gòu)建一個(gè)似有似無(wú)的科技場(chǎng)景。

雖然很多人對(duì)于這樣的營(yíng)銷(xiāo)方式不滿(mǎn)，但一些機(jī)器人從業(yè)者表示理解，谷歌DeepMind一位工作人員Ted Xiao在X上直言“實(shí)現(xiàn)低延遲全身遠(yuǎn)程操作是邁向自主化的一大步”。

特斯拉機(jī)器人工程師Milan Kovac在X上也承認(rèn)擎天柱“一定程度上有人類(lèi)的幫助”，但它們可以自主行走，并且在保持平衡的情況下，跳了4個(gè)小時(shí)的舞蹈，期間只摔倒過(guò)一次。

▲特斯拉機(jī)器人工程師Milan Kovac，X@Milan Kovac

總結(jié)起來(lái)看，雖然擎天柱每一次的出場(chǎng)，都有著遙操的成分，但它在遙操模式下的表現(xiàn)越來(lái)越好。

而馬斯克就好像在完成一張龐大的拼圖，一點(diǎn)一點(diǎn)地累積擎天柱的能力，讓它從一個(gè)需要被攙扶著上臺(tái)的“機(jī)器”，逐步變身為一個(gè)“有血有肉”的“類(lèi)人”物種。

擎天柱研發(fā)每走到一個(gè)新的階段，馬斯克就開(kāi)始啟動(dòng)一次“奇跡廚房”，用營(yíng)銷(xiāo)上的含糊口徑，向外界秀一遍自己腦中關(guān)于擎天柱的拼圖全貌。

哪怕這張拼圖可能才完成百分之一。

結(jié)語(yǔ)

1939年，在紐約的世界博覽會(huì)，西屋電氣公司推出一款身高7英尺（2.1米）的機(jī)器人Elektro，它的外形酷似人類(lèi)，會(huì)抽煙、會(huì)用手指數(shù)數(shù)，可以通過(guò)語(yǔ)音命令行走、會(huì)說(shuō)700個(gè)單詞。

一經(jīng)出現(xiàn)，Elektro就成為大眾心中的文化偶像，他激發(fā)了當(dāng)時(shí)的人們對(duì)未來(lái)機(jī)器人的想象。

▲A Blast from the Past，圖源justoborn-Elektro Robot

但實(shí)際上就像特斯拉擎天柱第一次登上發(fā)布會(huì)一樣，Elektro的一切都是假的，它其實(shí)是用內(nèi)置78rpm的唱片機(jī)來(lái)朗讀預(yù)先錄制的詞匯。

但85年后的今天，Elektro展示的一切已經(jīng)成為現(xiàn)實(shí)。越來(lái)越多企業(yè)開(kāi)始聯(lián)合，共同推動(dòng)人形機(jī)器人的發(fā)展。

比如為了給給機(jī)器人安裝大腦，波士頓動(dòng)力、Figure都選擇了尋找軟件實(shí)力強(qiáng)的合作伙伴，前者找到了豐田，后者綁定了OpenAI.

與他們相比，馬斯克就像一個(gè)孤膽英雄，他選擇了軟硬件自研的路徑。

不論是哪一種方法，在探索新物種的道路上，都充滿(mǎn)荊棘。

人類(lèi)一直試圖厘清自己“從哪里來(lái)”，并據(jù)此衍生出女?huà)z造人、亞當(dāng)夏娃這些神話故事。

在這些神話里，中國(guó)的女?huà)z、歐美的耶和華神，都充當(dāng)著人類(lèi)“造物主”的角色。而人形機(jī)器人，則是人類(lèi)自己企圖成為“造物主”的具象體現(xiàn)。

這個(gè)物種需要和人類(lèi)一樣，擁有自己的思想和行動(dòng)。

但現(xiàn)在，人們還只能在“奇跡廚房”里，等待著它們的到來(lái)。

文丨產(chǎn)業(yè)象限錢(qián)江

編輯｜山茶

人形機(jī)器人行業(yè)又迎來(lái)一對(duì)新的強(qiáng)強(qiáng)聯(lián)合。

在過(guò)去，這條技術(shù)路徑一直是馬斯克為Optimus（下稱(chēng)“擎天柱”）畫(huà)的“餅”，想借此實(shí)現(xiàn)通用人形機(jī)器人。

看似自主的機(jī)器人，依舊離不開(kāi)人類(lèi)的遠(yuǎn)程遙控。