正在閱讀:

人形機(jī)器人,應(yīng)該要“臉”嗎?

掃一掃下載界面新聞APP

人形機(jī)器人,應(yīng)該要“臉”嗎?

機(jī)器人不要“臉”,人才要“臉”。

文|產(chǎn)業(yè)象限 錢(qián)江

編輯丨山茶

臉有什么用嗎?在我們的社會(huì)中,“臉”幾乎是人與人之間互相識(shí)別的第一標(biāo)簽。

但除此之外,“臉”在我們生活中還承擔(dān)著一些其他意義:比如刷臉支付,臉會(huì)是我們確認(rèn)支付的許可;比如門(mén)禁識(shí)別,臉是我們?cè)谠S多地方暢通無(wú)阻的保證。甚至許多時(shí)候我們會(huì)氣憤地質(zhì)問(wèn)別人,你要臉嗎?這個(gè)這個(gè)時(shí)候,臉還會(huì)包含尊嚴(yán)、道德、責(zé)任等許多無(wú)形的價(jià)值觀念。

顯而易見(jiàn),臉幾乎是作為的人最重要的特征。以至于當(dāng)元宇宙熱潮來(lái)臨,人們需要從一個(gè)世界進(jìn)入一個(gè)世界時(shí),要做的第一件事,也是給自己捏一張“臉”。

但一個(gè)有意思的現(xiàn)象是,在人形機(jī)器人蓬勃發(fā)展的當(dāng)下,這個(gè)致力于模仿人類形象的事物,卻幾乎從來(lái)沒(méi)有被認(rèn)真討論過(guò)它的臉應(yīng)該長(zhǎng)成什么樣。人形機(jī)器人不需要臉嗎?還是說(shuō)當(dāng)前的技術(shù)條件,這個(gè)話題還不應(yīng)該被討論?如果一定要給機(jī)器人一張臉的話,這張臉又應(yīng)該怎么做?

機(jī)器人不要“臉”人才要“臉”

人形機(jī)器人要不要臉,答案是顯而易見(jiàn)的?;仡櫽洃浿心切┝钊擞∠笊羁痰臋C(jī)器人,無(wú)論是《變形金剛》里的大黃蜂、擎天柱,還是鳥(niǎo)山明筆下的阿拉蕾,亦或是獨(dú)自在地球上撿垃圾的瓦力,幾乎都有一張生動(dòng)而鮮明的臉。但最早的時(shí)候,人形機(jī)器人要“臉”這件事情是被忽略的。

波士頓動(dòng)力前CEO Marc Raibert早期就認(rèn)為,人形機(jī)器人“功能就是一切”,“能力、靈巧、感知和智力才是機(jī)器人的關(guān)鍵功能,其它的都不重要”。所以在2024年電動(dòng)版Atlas發(fā)布之前,波士頓動(dòng)力的機(jī)器人幾乎都沒(méi)有明顯的臉部特征。

Marc Raibert轉(zhuǎn)變理念是在2021年,波士頓動(dòng)力液壓版Atlas的一則互動(dòng)視頻“Do You Love Me”在網(wǎng)上出圈。這讓Marc Raibert意識(shí)到,形態(tài)的美感可以對(duì)機(jī)器人的仿生動(dòng)作帶來(lái)加成效果,而臉部是形態(tài)美最重要的一個(gè)特征。

同樣是在2021年,這一理念被另一家機(jī)器人公司所印證。這一年,英國(guó)機(jī)器人制造商Engineered Arts發(fā)布了一款名叫Ameca的人形機(jī)器人并且迅速出圈,原因就是因?yàn)锳meca擁有逼真的面部表情。與Marc Raibert不同,Ameca的創(chuàng)造者Will Jackson認(rèn)為:“人臉是我們擁有的具有最高帶寬的通信工具”,一個(gè)表情所能傳達(dá)的信息要遠(yuǎn)多于聲音和肢體。

Ameca的出圈,也側(cè)面證明了大眾其實(shí)更喜愛(ài)一個(gè)表情豐富、有溫度、會(huì)表達(dá)情感的伙伴,而不是一個(gè)空有力氣的鐵疙瘩。2009年的一部科幻電影《Moon》也在講述一個(gè)同樣的故事。電影中,男主Sam Bell常常向他的機(jī)器人工作伙伴Gerty傾訴心聲,Gerty總能一邊回答一邊給出動(dòng)畫(huà)表情來(lái)對(duì)Sam的遭遇表示同情。

Gerty的本質(zhì)是一串計(jì)算機(jī)符號(hào),而這張臉將冰冷的數(shù)學(xué)運(yùn)算幻化抽象為平易近人的表情,不僅在言語(yǔ)上安慰了Sam,更是通過(guò)視覺(jué)交流拉近了人機(jī)關(guān)系。

▲圖源:《Moon》電影

顯而易見(jiàn),與機(jī)器人相比,人類其實(shí)更需要機(jī)器人擁有一張臉。只是如何去實(shí)現(xiàn)這張臉,目前行業(yè)里還沒(méi)有一個(gè)統(tǒng)一的答案。

目前,主流機(jī)器人公司在設(shè)計(jì)面部時(shí)主要采用兩種策略:一種是基于集體文化共識(shí),選擇中立和抽象的圖像,通過(guò)符號(hào)化的情感傳達(dá)來(lái)滿足人類對(duì)情感表達(dá)的基本需求,以捕捉和傳遞情感的本質(zhì)。

另一種則是追求極致的逼真度,努力再現(xiàn)人類面部的細(xì)節(jié),試圖通過(guò)接近現(xiàn)實(shí)的人類面貌來(lái)實(shí)現(xiàn)更深層次的情感共鳴和互動(dòng)。但這兩種方案的落地,卻都面臨許多挑戰(zhàn)。

人形機(jī)器人,讓臉譜符號(hào)化

現(xiàn)實(shí)中,一款合格的人形機(jī)器人,頭部需要具備耐用性、抗沖擊能力,以適應(yīng)多樣化的操作環(huán)境和任務(wù)。

因此,包括特斯拉的擎天柱、Figure01、波士頓動(dòng)力的Atlas等人形機(jī)器人在內(nèi),其頭部使用的基本是金屬合金和高強(qiáng)度塑料。而在這樣一個(gè)“硬邦邦”的頭部,安裝一張靈動(dòng)、表情自然的臉并不容易。所以當(dāng)前主流的人形機(jī)器人并沒(méi)有對(duì)面部表情做精致的研究設(shè)計(jì),而是采用類似Gerty這種抽象的“動(dòng)畫(huà)臉”或“卡通臉”。畢竟這樣的臉龐幾乎能被所有種族的人接受,并且更容易構(gòu)建。

▲圖:主流人形機(jī)器人面部設(shè)計(jì) 產(chǎn)業(yè)象限制圖

「產(chǎn)業(yè)象限」梳理了目前幾家主流的人形機(jī)器人的臉部形象,可以看到它們面部清一色地使用“頭盔式”的“玻璃面罩”,面罩里內(nèi)置攝像頭或使用LED燈帶鑲邊。比如,仔細(xì)觀察智元機(jī)器人,會(huì)發(fā)現(xiàn)它在操作礦泉水瓶的時(shí)候,表情是微笑的:

宇樹(shù)新近發(fā)布的最新一代人形機(jī)器人直接使用凹陷的屏幕面部設(shè)計(jì),其頂部配置有攝像頭等組件,圍繞臉部的藍(lán)色弧光像是一種微笑。

Figure 01機(jī)器人借助搭建OpenAI的能力構(gòu)建大腦,所以它的面部也帶有明顯的OpenAI特色,即它每一次和人類交流,面部都會(huì)出現(xiàn)ChatGPT特有的“思考”符號(hào)。

波士頓動(dòng)力的電動(dòng)版Atlas采用光圈設(shè)計(jì),這種設(shè)計(jì)參考了皮克斯電影開(kāi)頭的臺(tái)燈,其內(nèi)部配置了三個(gè)攝像頭。波士頓創(chuàng)始人Marc Raibert在設(shè)計(jì)Atlas的頭部時(shí),并不希望它有類似人類的面孔,因?yàn)檫@會(huì)觸發(fā)“恐怖谷”效應(yīng),可能有點(diǎn)反烏托邦。Marc Raibert覺(jué)得對(duì)于一個(gè)人形機(jī)器人來(lái)說(shuō),只要能保持與人類基本的交流即可。但這種圓環(huán)的設(shè)計(jì),雖然沒(méi)有五官,卻總覺(jué)得這張“臉”自帶情愫。

特斯拉的擎天柱如今已進(jìn)化到第二代,但面部依舊一片漆黑,馬斯克鮮少提及擎天柱面部的設(shè)計(jì)邏輯。

清一色的“黑面騎士”背后也有共同的光學(xué)和美學(xué)邏輯。黑色被視為現(xiàn)代、簡(jiǎn)潔和高科技的象征,公眾易于接受的同時(shí),也不乏科技感和未來(lái)感。

目前包括蘋(píng)果、特斯拉在內(nèi)的科技公司,都偏愛(ài)在發(fā)布會(huì)上使用“高級(jí)黑”作為底色。較暗的面罩則有利于突出機(jī)器人的眼睛和其它面部特征,讓信息在不同條件和不同角度中都能被清晰辨識(shí)。

此外,黑色面罩還可以有效遮蓋和保護(hù)面部的各種傳感器和顯示屏,防止外界光線的干擾。但這般高科技感的“鋼鐵美學(xué)”,顯然無(wú)法在與人類互動(dòng)時(shí),充分滿足情感交流的需求,冰冷的機(jī)器感,令人形機(jī)器人喪失了“人形”應(yīng)該具有的一點(diǎn)柔性和“人性”。所以一直以來(lái),企業(yè)和科學(xué)家也仍然在為做一張無(wú)限逼近人類的的機(jī)器人臉而努力。

機(jī)器人,也可以“畫(huà)皮”?

抽象派為了文化共性,曾嘗試在機(jī)器人上采用經(jīng)過(guò)修飾的動(dòng)物臉或卡通臉,但它們無(wú)法傳遞復(fù)雜的情感細(xì)節(jié),限制了機(jī)器人在諸如醫(yī)療、教育領(lǐng)域等情感交流高需求的場(chǎng)景下的應(yīng)用。所以追求和真人一比一還原的“逼真臉”就成為一個(gè)不得不發(fā)展的技術(shù)路線。

“逼真臉”有兩個(gè)陣營(yíng),一種是依賴機(jī)器學(xué)習(xí)做表情控制的“自主機(jī)器人”,另一種是依賴操作員遠(yuǎn)程操作的“遠(yuǎn)程控制機(jī)器人”。它們的核心差異,是交互的“自主性”來(lái)源于機(jī)器還是人類。

2005年11月,世界上第一個(gè)具有表情的人臉行走雙足機(jī)器人Albert HUBO亮相。一年之后,第一個(gè)被授予沙特阿拉伯公民身份的機(jī)器人Sophia誕生,它能夠模仿62種面部表情。

其原型融合了古埃及女王娜芙蒂蒂、奧黛麗赫本和這家機(jī)器人創(chuàng)始人David Hanson的妻子阿曼達(dá)·漢森。這兩款表情機(jī)器人都隸屬于同一家名叫Hanson Robotics的公司。

其頭部使用的都是“Fubber”材料,它是具有高彈性和柔韌性的橡膠材料,可以產(chǎn)生皺紋與折痕,貼近皮膚,他們也幾乎是最早一批有逼真臉的“自主機(jī)器人”。

▲圖:Sophia機(jī)器人Hanson Robotics(左);Albert HUBO機(jī)器人Hanson Robotics(右)

Albert HUBO使用復(fù)雜的控制算法來(lái)實(shí)現(xiàn)面部表情和肢體運(yùn)動(dòng)的協(xié)調(diào)。其控制系統(tǒng)能夠自主管理基本動(dòng)作和表情,但需要人類預(yù)先編程和設(shè)定參數(shù)。Sophia具備一定的學(xué)習(xí)能力,使用自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)算法來(lái)理解和回應(yīng)人類對(duì)話,可以通過(guò)與人類的互動(dòng)不斷改進(jìn)其反應(yīng)和行為,她的“大腦”運(yùn)行在Hanson Robotics基于云的人工智能 (AI) ——MindCloud上。

前面曾提到的Engineered Arts也醉心于做逼真的人形機(jī)器人臉。旗下最知名的機(jī)器人是Ameca使用復(fù)雜的傳感器和伺服電機(jī),通過(guò)結(jié)合計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理,能夠理解和回應(yīng)用戶的指令和情感。據(jù)稱,Ameca的面部使用的是Engineered Arts開(kāi)發(fā)的一種專有材料,具有高度的彈性和柔韌性,以支持復(fù)雜的面部表情和自然的運(yùn)動(dòng)。

▲圖:機(jī)器人Ameca,Engineered Arts

在中國(guó),EX集團(tuán)擅長(zhǎng)做機(jī)器人面部表情,其曾推出還原魯迅形象的人形機(jī)器人人。EX集團(tuán)創(chuàng)始人李博陽(yáng)曾在接受采訪時(shí)提到,大多數(shù)人形機(jī)器人公司都更關(guān)注機(jī)器人的雙足這類“腰部以下”的位置,腰部以下主要在于處理好平衡控制的問(wèn)題,而腰部以上更多與AI所結(jié)合的智能決策等相關(guān)。EX集團(tuán)“主要布局腰部以上的方向,核心產(chǎn)品是仿生人形機(jī)器人”,“

不論是Albert HUBO、Sophia還是Ameca,他們探索的自主學(xué)習(xí)機(jī)器人的臉都非常具體,按照如愛(ài)因斯坦這樣的名人或融合真人臉龐創(chuàng)造一張新臉,但這些機(jī)器人的硬件都是專有的,Hanson Robotics和Engineered Arts之外的組織的研究人員無(wú)法使用這些類人機(jī)器人進(jìn)行自己的研究,他們不得不重新構(gòu)建新的逼真的類人機(jī)器人作為研究對(duì)象。

為了解決這類問(wèn)題,研究人員嘗試做了一款開(kāi)源機(jī)器人Eva,通過(guò)Eva的相關(guān)研究,類人機(jī)器人面部表情的生成過(guò)程也浮現(xiàn)在大眾眼前。

▲圖:Eva,Expressive humanoid robot face

Eva由四個(gè)部分組成:面罩驅(qū)動(dòng)機(jī)構(gòu)、下頜、眼睛和頸部,其中,面罩驅(qū)動(dòng)機(jī)構(gòu)主導(dǎo)著Eva的面部表情生成。Eva的表情生成主要由兩部分主導(dǎo)——先是由伺服電機(jī)驅(qū)動(dòng)面罩上的表情單元,再由面罩上的鋼絲將驅(qū)動(dòng)力傳導(dǎo)給硅膠面罩,從而形成Eva的表情。

▲圖:Eva,Expressive humanoid robot face

如圖中所示,面罩驅(qū)動(dòng)機(jī)構(gòu)的組成部分有12個(gè)MG90S伺服電機(jī)、一個(gè)定制硅膠面罩、一個(gè)支撐面罩的3D打印頭骨和鋼絲。每根鋼絲的一端連接相應(yīng)伺服電機(jī)的伺服喇叭,另一端連接面罩上的某個(gè)點(diǎn),鋼絲連接的點(diǎn)基本在面罩左右兩側(cè)呈現(xiàn)對(duì)稱,確保Eva做出面部表情時(shí),面罩兩側(cè)都會(huì)被驅(qū)動(dòng)。

▲圖:Eva的硅膠面罩,Expressive humanoid robot face

鋼絲主要通過(guò)布條和粘合劑附在硅膠面罩內(nèi)表面,硅膠面罩由Smooth-On EcoFlex 00-30制成,這種材料與人體皮膚的材料特性非常相似。

根據(jù)著名心理學(xué)家、面部表情研究的先驅(qū)保羅·艾克曼的說(shuō)法,所有面部表情都可以與憤怒、厭惡、恐懼、喜悅、悲傷和驚訝這6種基本情緒聯(lián)系起來(lái),Eva的表情設(shè)計(jì)也以這6種為主。每一種表情都對(duì)應(yīng)著面部肌肉的特定運(yùn)動(dòng),比如驚訝對(duì)應(yīng)著眉毛向上的運(yùn)動(dòng),喜悅對(duì)應(yīng)著嘴角向上。

▲圖:保羅·艾克曼假設(shè)的六種基本情緒,Boyuan Chen

Eva的開(kāi)發(fā)者對(duì)人類所有面部表情進(jìn)行分類,建立46個(gè)不同的表情動(dòng)作單元,比如,驚喜可以從AU 1、2、5和26中重現(xiàn)。

▲圖:情緒-AU 對(duì)應(yīng)關(guān)系,Expressive humanoid robot face

不論是自主機(jī)器人,還是遠(yuǎn)程操控機(jī)器人,他們的面部表情驅(qū)動(dòng)方式基本都與Eva的運(yùn)作邏輯類似。即使用伺服電機(jī)完成表情驅(qū)動(dòng)。但自主機(jī)器學(xué)習(xí)的機(jī)器人,可能會(huì)帶來(lái)不可預(yù)測(cè)的行為,并且其仿生相似度很大程度上取決于機(jī)器學(xué)習(xí)模擬人類的智慧和情感技術(shù)的成熟度。為了解決這個(gè)問(wèn)題,于是有了基于人類操作做精確控制的遠(yuǎn)程操控機(jī)器人,嘗試彌補(bǔ)自主學(xué)習(xí)機(jī)器人的不足之處。

大阪大學(xué)教授石黑浩和日本動(dòng)畫(huà)公司Kokoro共同研發(fā)出Geminoid——石浩黑的“復(fù)制品”,這臺(tái)高度仿生機(jī)器人可以被電腦遠(yuǎn)程操控,實(shí)現(xiàn)模仿石黑浩的行為和面部及頭部動(dòng)作,Geminoid身上有多個(gè)執(zhí)行器,面部有13個(gè)、軀干15個(gè)、手臂和腿部22個(gè)。

根據(jù)石黑浩的體驗(yàn),他認(rèn)為擁有和自己長(zhǎng)得一樣的克隆體,最主要的用途在于可以讓它做自己的分身,他曾在報(bào)道中提到,機(jī)器人是自己身體的延伸。

但從Geminoid相關(guān)表現(xiàn)來(lái)看,它的表情并不自然,比如它在與工作人員交流時(shí),眼神空洞、雙手僵硬,與真人有較為明顯的區(qū)分。不論是自主學(xué)習(xí)機(jī)器人還是遠(yuǎn)程操控機(jī)器人,即便臉無(wú)限逼近人類,但如何在一顰一笑之間依舊保持逼真,至今也沒(méi)有一個(gè)完美的方案。即便面部表情無(wú)限類人,手部、身體不夠與人類相似,依舊跨不過(guò)“恐怖谷”效應(yīng)。

結(jié)語(yǔ)

人類的壽命有限,可能正因如此,他們對(duì)追求另一種讓生命可能得以延續(xù)的方式十分執(zhí)著。

制作無(wú)限類人的人形機(jī)器人,或許能夠彌補(bǔ)一部分的缺憾,但“滿足感”和“遺憾感”似乎是一對(duì)遵循能量守恒定律的雙生火焰,它們會(huì)一直并存,滿足一種需求的同時(shí),又會(huì)誕生另一種遺憾。

人形機(jī)器人需要有一張臉,但人類的面部的結(jié)構(gòu)極其復(fù)雜,涉及骨骼、肌肉、皮膚、神經(jīng)和血管等多個(gè)層次,其中面部有40多塊肌肉,覆蓋在肌肉之上的皮膚具有彈性和伸縮性,能跟隨表情做實(shí)時(shí)的變化。隨著技術(shù)進(jìn)步,對(duì)人臉構(gòu)造所涉及的物理設(shè)備會(huì)越來(lái)越逼真,牽動(dòng)肌肉的若干個(gè)伺服電機(jī)也會(huì)配合得越來(lái)越熟練。

但是,人類面部有一雙通往心靈的眼睛,它映射著人生閱歷,通過(guò)雙眼,可以捕捉人所經(jīng)歷的滄桑與喜哀,而這是機(jī)器人難以擁有的,即便算法再高級(jí),也很難復(fù)制和代替人類的心境。

- END -

參考資料:https://www.sciencedirect.com/science/article/pii/S2468067220300262

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

人形機(jī)器人,應(yīng)該要“臉”嗎?

機(jī)器人不要“臉”,人才要“臉”。

文|產(chǎn)業(yè)象限 錢(qián)江

編輯丨山茶

臉有什么用嗎?在我們的社會(huì)中,“臉”幾乎是人與人之間互相識(shí)別的第一標(biāo)簽。

但除此之外,“臉”在我們生活中還承擔(dān)著一些其他意義:比如刷臉支付,臉會(huì)是我們確認(rèn)支付的許可;比如門(mén)禁識(shí)別,臉是我們?cè)谠S多地方暢通無(wú)阻的保證。甚至許多時(shí)候我們會(huì)氣憤地質(zhì)問(wèn)別人,你要臉嗎?這個(gè)這個(gè)時(shí)候,臉還會(huì)包含尊嚴(yán)、道德、責(zé)任等許多無(wú)形的價(jià)值觀念。

顯而易見(jiàn),臉幾乎是作為的人最重要的特征。以至于當(dāng)元宇宙熱潮來(lái)臨,人們需要從一個(gè)世界進(jìn)入一個(gè)世界時(shí),要做的第一件事,也是給自己捏一張“臉”。

但一個(gè)有意思的現(xiàn)象是,在人形機(jī)器人蓬勃發(fā)展的當(dāng)下,這個(gè)致力于模仿人類形象的事物,卻幾乎從來(lái)沒(méi)有被認(rèn)真討論過(guò)它的臉應(yīng)該長(zhǎng)成什么樣。人形機(jī)器人不需要臉嗎?還是說(shuō)當(dāng)前的技術(shù)條件,這個(gè)話題還不應(yīng)該被討論?如果一定要給機(jī)器人一張臉的話,這張臉又應(yīng)該怎么做?

機(jī)器人不要“臉”人才要“臉”

人形機(jī)器人要不要臉,答案是顯而易見(jiàn)的?;仡櫽洃浿心切┝钊擞∠笊羁痰臋C(jī)器人,無(wú)論是《變形金剛》里的大黃蜂、擎天柱,還是鳥(niǎo)山明筆下的阿拉蕾,亦或是獨(dú)自在地球上撿垃圾的瓦力,幾乎都有一張生動(dòng)而鮮明的臉。但最早的時(shí)候,人形機(jī)器人要“臉”這件事情是被忽略的。

波士頓動(dòng)力前CEO Marc Raibert早期就認(rèn)為,人形機(jī)器人“功能就是一切”,“能力、靈巧、感知和智力才是機(jī)器人的關(guān)鍵功能,其它的都不重要”。所以在2024年電動(dòng)版Atlas發(fā)布之前,波士頓動(dòng)力的機(jī)器人幾乎都沒(méi)有明顯的臉部特征。

Marc Raibert轉(zhuǎn)變理念是在2021年,波士頓動(dòng)力液壓版Atlas的一則互動(dòng)視頻“Do You Love Me”在網(wǎng)上出圈。這讓Marc Raibert意識(shí)到,形態(tài)的美感可以對(duì)機(jī)器人的仿生動(dòng)作帶來(lái)加成效果,而臉部是形態(tài)美最重要的一個(gè)特征。

同樣是在2021年,這一理念被另一家機(jī)器人公司所印證。這一年,英國(guó)機(jī)器人制造商Engineered Arts發(fā)布了一款名叫Ameca的人形機(jī)器人并且迅速出圈,原因就是因?yàn)锳meca擁有逼真的面部表情。與Marc Raibert不同,Ameca的創(chuàng)造者Will Jackson認(rèn)為:“人臉是我們擁有的具有最高帶寬的通信工具”,一個(gè)表情所能傳達(dá)的信息要遠(yuǎn)多于聲音和肢體。

Ameca的出圈,也側(cè)面證明了大眾其實(shí)更喜愛(ài)一個(gè)表情豐富、有溫度、會(huì)表達(dá)情感的伙伴,而不是一個(gè)空有力氣的鐵疙瘩。2009年的一部科幻電影《Moon》也在講述一個(gè)同樣的故事。電影中,男主Sam Bell常常向他的機(jī)器人工作伙伴Gerty傾訴心聲,Gerty總能一邊回答一邊給出動(dòng)畫(huà)表情來(lái)對(duì)Sam的遭遇表示同情。

Gerty的本質(zhì)是一串計(jì)算機(jī)符號(hào),而這張臉將冰冷的數(shù)學(xué)運(yùn)算幻化抽象為平易近人的表情,不僅在言語(yǔ)上安慰了Sam,更是通過(guò)視覺(jué)交流拉近了人機(jī)關(guān)系。

▲圖源:《Moon》電影

顯而易見(jiàn),與機(jī)器人相比,人類其實(shí)更需要機(jī)器人擁有一張臉。只是如何去實(shí)現(xiàn)這張臉,目前行業(yè)里還沒(méi)有一個(gè)統(tǒng)一的答案。

目前,主流機(jī)器人公司在設(shè)計(jì)面部時(shí)主要采用兩種策略:一種是基于集體文化共識(shí),選擇中立和抽象的圖像,通過(guò)符號(hào)化的情感傳達(dá)來(lái)滿足人類對(duì)情感表達(dá)的基本需求,以捕捉和傳遞情感的本質(zhì)。

另一種則是追求極致的逼真度,努力再現(xiàn)人類面部的細(xì)節(jié),試圖通過(guò)接近現(xiàn)實(shí)的人類面貌來(lái)實(shí)現(xiàn)更深層次的情感共鳴和互動(dòng)。但這兩種方案的落地,卻都面臨許多挑戰(zhàn)。

人形機(jī)器人,讓臉譜符號(hào)化

現(xiàn)實(shí)中,一款合格的人形機(jī)器人,頭部需要具備耐用性、抗沖擊能力,以適應(yīng)多樣化的操作環(huán)境和任務(wù)。

因此,包括特斯拉的擎天柱、Figure01、波士頓動(dòng)力的Atlas等人形機(jī)器人在內(nèi),其頭部使用的基本是金屬合金和高強(qiáng)度塑料。而在這樣一個(gè)“硬邦邦”的頭部,安裝一張靈動(dòng)、表情自然的臉并不容易。所以當(dāng)前主流的人形機(jī)器人并沒(méi)有對(duì)面部表情做精致的研究設(shè)計(jì),而是采用類似Gerty這種抽象的“動(dòng)畫(huà)臉”或“卡通臉”。畢竟這樣的臉龐幾乎能被所有種族的人接受,并且更容易構(gòu)建。

▲圖:主流人形機(jī)器人面部設(shè)計(jì) 產(chǎn)業(yè)象限制圖

「產(chǎn)業(yè)象限」梳理了目前幾家主流的人形機(jī)器人的臉部形象,可以看到它們面部清一色地使用“頭盔式”的“玻璃面罩”,面罩里內(nèi)置攝像頭或使用LED燈帶鑲邊。比如,仔細(xì)觀察智元機(jī)器人,會(huì)發(fā)現(xiàn)它在操作礦泉水瓶的時(shí)候,表情是微笑的:

宇樹(shù)新近發(fā)布的最新一代人形機(jī)器人直接使用凹陷的屏幕面部設(shè)計(jì),其頂部配置有攝像頭等組件,圍繞臉部的藍(lán)色弧光像是一種微笑。

Figure 01機(jī)器人借助搭建OpenAI的能力構(gòu)建大腦,所以它的面部也帶有明顯的OpenAI特色,即它每一次和人類交流,面部都會(huì)出現(xiàn)ChatGPT特有的“思考”符號(hào)。

波士頓動(dòng)力的電動(dòng)版Atlas采用光圈設(shè)計(jì),這種設(shè)計(jì)參考了皮克斯電影開(kāi)頭的臺(tái)燈,其內(nèi)部配置了三個(gè)攝像頭。波士頓創(chuàng)始人Marc Raibert在設(shè)計(jì)Atlas的頭部時(shí),并不希望它有類似人類的面孔,因?yàn)檫@會(huì)觸發(fā)“恐怖谷”效應(yīng),可能有點(diǎn)反烏托邦。Marc Raibert覺(jué)得對(duì)于一個(gè)人形機(jī)器人來(lái)說(shuō),只要能保持與人類基本的交流即可。但這種圓環(huán)的設(shè)計(jì),雖然沒(méi)有五官,卻總覺(jué)得這張“臉”自帶情愫。

特斯拉的擎天柱如今已進(jìn)化到第二代,但面部依舊一片漆黑,馬斯克鮮少提及擎天柱面部的設(shè)計(jì)邏輯。

清一色的“黑面騎士”背后也有共同的光學(xué)和美學(xué)邏輯。黑色被視為現(xiàn)代、簡(jiǎn)潔和高科技的象征,公眾易于接受的同時(shí),也不乏科技感和未來(lái)感。

目前包括蘋(píng)果、特斯拉在內(nèi)的科技公司,都偏愛(ài)在發(fā)布會(huì)上使用“高級(jí)黑”作為底色。較暗的面罩則有利于突出機(jī)器人的眼睛和其它面部特征,讓信息在不同條件和不同角度中都能被清晰辨識(shí)。

此外,黑色面罩還可以有效遮蓋和保護(hù)面部的各種傳感器和顯示屏,防止外界光線的干擾。但這般高科技感的“鋼鐵美學(xué)”,顯然無(wú)法在與人類互動(dòng)時(shí),充分滿足情感交流的需求,冰冷的機(jī)器感,令人形機(jī)器人喪失了“人形”應(yīng)該具有的一點(diǎn)柔性和“人性”。所以一直以來(lái),企業(yè)和科學(xué)家也仍然在為做一張無(wú)限逼近人類的的機(jī)器人臉而努力。

機(jī)器人,也可以“畫(huà)皮”?

抽象派為了文化共性,曾嘗試在機(jī)器人上采用經(jīng)過(guò)修飾的動(dòng)物臉或卡通臉,但它們無(wú)法傳遞復(fù)雜的情感細(xì)節(jié),限制了機(jī)器人在諸如醫(yī)療、教育領(lǐng)域等情感交流高需求的場(chǎng)景下的應(yīng)用。所以追求和真人一比一還原的“逼真臉”就成為一個(gè)不得不發(fā)展的技術(shù)路線。

“逼真臉”有兩個(gè)陣營(yíng),一種是依賴機(jī)器學(xué)習(xí)做表情控制的“自主機(jī)器人”,另一種是依賴操作員遠(yuǎn)程操作的“遠(yuǎn)程控制機(jī)器人”。它們的核心差異,是交互的“自主性”來(lái)源于機(jī)器還是人類。

2005年11月,世界上第一個(gè)具有表情的人臉行走雙足機(jī)器人Albert HUBO亮相。一年之后,第一個(gè)被授予沙特阿拉伯公民身份的機(jī)器人Sophia誕生,它能夠模仿62種面部表情。

其原型融合了古埃及女王娜芙蒂蒂、奧黛麗赫本和這家機(jī)器人創(chuàng)始人David Hanson的妻子阿曼達(dá)·漢森。這兩款表情機(jī)器人都隸屬于同一家名叫Hanson Robotics的公司。

其頭部使用的都是“Fubber”材料,它是具有高彈性和柔韌性的橡膠材料,可以產(chǎn)生皺紋與折痕,貼近皮膚,他們也幾乎是最早一批有逼真臉的“自主機(jī)器人”。

▲圖:Sophia機(jī)器人Hanson Robotics(左);Albert HUBO機(jī)器人Hanson Robotics(右)

Albert HUBO使用復(fù)雜的控制算法來(lái)實(shí)現(xiàn)面部表情和肢體運(yùn)動(dòng)的協(xié)調(diào)。其控制系統(tǒng)能夠自主管理基本動(dòng)作和表情,但需要人類預(yù)先編程和設(shè)定參數(shù)。Sophia具備一定的學(xué)習(xí)能力,使用自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)算法來(lái)理解和回應(yīng)人類對(duì)話,可以通過(guò)與人類的互動(dòng)不斷改進(jìn)其反應(yīng)和行為,她的“大腦”運(yùn)行在Hanson Robotics基于云的人工智能 (AI) ——MindCloud上。

前面曾提到的Engineered Arts也醉心于做逼真的人形機(jī)器人臉。旗下最知名的機(jī)器人是Ameca使用復(fù)雜的傳感器和伺服電機(jī),通過(guò)結(jié)合計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理,能夠理解和回應(yīng)用戶的指令和情感。據(jù)稱,Ameca的面部使用的是Engineered Arts開(kāi)發(fā)的一種專有材料,具有高度的彈性和柔韌性,以支持復(fù)雜的面部表情和自然的運(yùn)動(dòng)。

▲圖:機(jī)器人Ameca,Engineered Arts

在中國(guó),EX集團(tuán)擅長(zhǎng)做機(jī)器人面部表情,其曾推出還原魯迅形象的人形機(jī)器人人。EX集團(tuán)創(chuàng)始人李博陽(yáng)曾在接受采訪時(shí)提到,大多數(shù)人形機(jī)器人公司都更關(guān)注機(jī)器人的雙足這類“腰部以下”的位置,腰部以下主要在于處理好平衡控制的問(wèn)題,而腰部以上更多與AI所結(jié)合的智能決策等相關(guān)。EX集團(tuán)“主要布局腰部以上的方向,核心產(chǎn)品是仿生人形機(jī)器人”,“

不論是Albert HUBO、Sophia還是Ameca,他們探索的自主學(xué)習(xí)機(jī)器人的臉都非常具體,按照如愛(ài)因斯坦這樣的名人或融合真人臉龐創(chuàng)造一張新臉,但這些機(jī)器人的硬件都是專有的,Hanson Robotics和Engineered Arts之外的組織的研究人員無(wú)法使用這些類人機(jī)器人進(jìn)行自己的研究,他們不得不重新構(gòu)建新的逼真的類人機(jī)器人作為研究對(duì)象。

為了解決這類問(wèn)題,研究人員嘗試做了一款開(kāi)源機(jī)器人Eva,通過(guò)Eva的相關(guān)研究,類人機(jī)器人面部表情的生成過(guò)程也浮現(xiàn)在大眾眼前。

▲圖:Eva,Expressive humanoid robot face

Eva由四個(gè)部分組成:面罩驅(qū)動(dòng)機(jī)構(gòu)、下頜、眼睛和頸部,其中,面罩驅(qū)動(dòng)機(jī)構(gòu)主導(dǎo)著Eva的面部表情生成。Eva的表情生成主要由兩部分主導(dǎo)——先是由伺服電機(jī)驅(qū)動(dòng)面罩上的表情單元,再由面罩上的鋼絲將驅(qū)動(dòng)力傳導(dǎo)給硅膠面罩,從而形成Eva的表情。

▲圖:Eva,Expressive humanoid robot face

如圖中所示,面罩驅(qū)動(dòng)機(jī)構(gòu)的組成部分有12個(gè)MG90S伺服電機(jī)、一個(gè)定制硅膠面罩、一個(gè)支撐面罩的3D打印頭骨和鋼絲。每根鋼絲的一端連接相應(yīng)伺服電機(jī)的伺服喇叭,另一端連接面罩上的某個(gè)點(diǎn),鋼絲連接的點(diǎn)基本在面罩左右兩側(cè)呈現(xiàn)對(duì)稱,確保Eva做出面部表情時(shí),面罩兩側(cè)都會(huì)被驅(qū)動(dòng)。

▲圖:Eva的硅膠面罩,Expressive humanoid robot face

鋼絲主要通過(guò)布條和粘合劑附在硅膠面罩內(nèi)表面,硅膠面罩由Smooth-On EcoFlex 00-30制成,這種材料與人體皮膚的材料特性非常相似。

根據(jù)著名心理學(xué)家、面部表情研究的先驅(qū)保羅·艾克曼的說(shuō)法,所有面部表情都可以與憤怒、厭惡、恐懼、喜悅、悲傷和驚訝這6種基本情緒聯(lián)系起來(lái),Eva的表情設(shè)計(jì)也以這6種為主。每一種表情都對(duì)應(yīng)著面部肌肉的特定運(yùn)動(dòng),比如驚訝對(duì)應(yīng)著眉毛向上的運(yùn)動(dòng),喜悅對(duì)應(yīng)著嘴角向上。

▲圖:保羅·艾克曼假設(shè)的六種基本情緒,Boyuan Chen

Eva的開(kāi)發(fā)者對(duì)人類所有面部表情進(jìn)行分類,建立46個(gè)不同的表情動(dòng)作單元,比如,驚喜可以從AU 1、2、5和26中重現(xiàn)。

▲圖:情緒-AU 對(duì)應(yīng)關(guān)系,Expressive humanoid robot face

不論是自主機(jī)器人,還是遠(yuǎn)程操控機(jī)器人,他們的面部表情驅(qū)動(dòng)方式基本都與Eva的運(yùn)作邏輯類似。即使用伺服電機(jī)完成表情驅(qū)動(dòng)。但自主機(jī)器學(xué)習(xí)的機(jī)器人,可能會(huì)帶來(lái)不可預(yù)測(cè)的行為,并且其仿生相似度很大程度上取決于機(jī)器學(xué)習(xí)模擬人類的智慧和情感技術(shù)的成熟度。為了解決這個(gè)問(wèn)題,于是有了基于人類操作做精確控制的遠(yuǎn)程操控機(jī)器人,嘗試彌補(bǔ)自主學(xué)習(xí)機(jī)器人的不足之處。

大阪大學(xué)教授石黑浩和日本動(dòng)畫(huà)公司Kokoro共同研發(fā)出Geminoid——石浩黑的“復(fù)制品”,這臺(tái)高度仿生機(jī)器人可以被電腦遠(yuǎn)程操控,實(shí)現(xiàn)模仿石黑浩的行為和面部及頭部動(dòng)作,Geminoid身上有多個(gè)執(zhí)行器,面部有13個(gè)、軀干15個(gè)、手臂和腿部22個(gè)。

根據(jù)石黑浩的體驗(yàn),他認(rèn)為擁有和自己長(zhǎng)得一樣的克隆體,最主要的用途在于可以讓它做自己的分身,他曾在報(bào)道中提到,機(jī)器人是自己身體的延伸。

但從Geminoid相關(guān)表現(xiàn)來(lái)看,它的表情并不自然,比如它在與工作人員交流時(shí),眼神空洞、雙手僵硬,與真人有較為明顯的區(qū)分。不論是自主學(xué)習(xí)機(jī)器人還是遠(yuǎn)程操控機(jī)器人,即便臉無(wú)限逼近人類,但如何在一顰一笑之間依舊保持逼真,至今也沒(méi)有一個(gè)完美的方案。即便面部表情無(wú)限類人,手部、身體不夠與人類相似,依舊跨不過(guò)“恐怖谷”效應(yīng)。

結(jié)語(yǔ)

人類的壽命有限,可能正因如此,他們對(duì)追求另一種讓生命可能得以延續(xù)的方式十分執(zhí)著。

制作無(wú)限類人的人形機(jī)器人,或許能夠彌補(bǔ)一部分的缺憾,但“滿足感”和“遺憾感”似乎是一對(duì)遵循能量守恒定律的雙生火焰,它們會(huì)一直并存,滿足一種需求的同時(shí),又會(huì)誕生另一種遺憾。

人形機(jī)器人需要有一張臉,但人類的面部的結(jié)構(gòu)極其復(fù)雜,涉及骨骼、肌肉、皮膚、神經(jīng)和血管等多個(gè)層次,其中面部有40多塊肌肉,覆蓋在肌肉之上的皮膚具有彈性和伸縮性,能跟隨表情做實(shí)時(shí)的變化。隨著技術(shù)進(jìn)步,對(duì)人臉構(gòu)造所涉及的物理設(shè)備會(huì)越來(lái)越逼真,牽動(dòng)肌肉的若干個(gè)伺服電機(jī)也會(huì)配合得越來(lái)越熟練。

但是,人類面部有一雙通往心靈的眼睛,它映射著人生閱歷,通過(guò)雙眼,可以捕捉人所經(jīng)歷的滄桑與喜哀,而這是機(jī)器人難以擁有的,即便算法再高級(jí),也很難復(fù)制和代替人類的心境。

- END -

參考資料:https://www.sciencedirect.com/science/article/pii/S2468067220300262

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。