界面新聞記者 | 張熹瓏
作為人工智能發(fā)展的前沿分支,具身智能近年來成為受重點關(guān)注和大力投入的硬科技賽道。
在11月4日-5日舉辦的首屆珠海國際靈巧操作挑戰(zhàn)賽暨具身智能產(chǎn)業(yè)大會上,潤星泰電器、逸科興制造、智新自動化等珠海創(chuàng)新企業(yè)發(fā)布了在具身智能產(chǎn)業(yè)鏈的重大科研攻關(guān)項目,包括“合金材料壓鑄領(lǐng)域的智能制造方案”“電子元器件生產(chǎn)領(lǐng)域的機械靈巧手裝配方案”等11項技術(shù)攻關(guān)項目,金額超億元。
現(xiàn)場,珠海香洲區(qū)與清瑞博源智能、有怡科技、跨維智能等6家具身智能領(lǐng)域的創(chuàng)新企業(yè)簽訂了投資協(xié)議,將落地一系列人工智能項目。
珠海的城市發(fā)展曾長期依賴房地產(chǎn),產(chǎn)業(yè)結(jié)構(gòu)相對單一。近年來,這座濱海旅游城市大力推進新型工業(yè)化,在新能源、集成電路、生物醫(yī)藥、智能機器人等領(lǐng)域布局。上半年,珠海工業(yè)經(jīng)濟對全市GDP增長貢獻率達到80%。
香洲區(qū)副區(qū)長黃文勝接受界面新聞等媒體采訪時表示,之所以選擇具身智能這個賽道,因為這符合珠海在原有工業(yè)經(jīng)濟基礎(chǔ)上的轉(zhuǎn)型要求,特別是對發(fā)展智能裝備有很大幫助。
下一個典型智能終端
所謂具身智能(Embodied AI),指智能體有一個身體,并通過身體與環(huán)境的互動來獲得智能,其有望成為繼PC、智能手機、新能源汽車之后的下一個典型智能終端。
作為具身智能領(lǐng)域的關(guān)鍵組成部分,靈巧手以其高度仿生的結(jié)構(gòu)設(shè)計和精準的操作能力,成為機器人技術(shù)研究的熱點。
本次大賽設(shè)置了“機器人零件裝配任務(wù)”“在雜亂物體中拾取物品任務(wù)”“機器人雜亂線纜整理插拔任務(wù)”3個場景賽道,參賽的機械手、機械臂展示了繞線圈、擰螺絲、收拾雜物、拿放物品到指定位置等技能。
在具身智能產(chǎn)業(yè)大會現(xiàn)場,則展示了能制作拉花咖啡的“機器人咖啡機”,以及用電子琴和葫蘆絲合奏民樂的人型機器人。
“高精度的算法下,機器人能接近真人的技巧度,模仿真人咖啡拉花的軌跡,并重現(xiàn)這個流程。”深圳市越疆科技股份有限公司展位的人員表示。
從產(chǎn)業(yè)角度而言,目前服務(wù)類機器人實現(xiàn)較快落地,包括醫(yī)療健康、智能制造、家庭服務(wù)等領(lǐng)域。
珠海特索彼澳機器人科技有限公司展出了智能仿生靈巧機械手原型機。展位工作人員王杰(化名)介紹指,該機械手加持了伺服驅(qū)動、運動算法、EMG生物傳感等技術(shù),主要面向醫(yī)療和教育市場,例如對于殘疾人士,可以用腦電波控制義肢;也可以用于二次開發(fā),進行人工智能教育。
真健康(廣東橫琴)醫(yī)療科技有限公司則展出了穿刺手術(shù)導航定位系統(tǒng),該系統(tǒng)由機械臂、光學追蹤儀、人工智能系統(tǒng)三部分組成?!胺謩e是手、眼睛和大腦?!惫竟彩聞?wù)總監(jiān)李冀釗告訴界面新聞,該系統(tǒng)主要用于穿刺手術(shù),目前已經(jīng)落地約50家醫(yī)院、完成約3000例手術(shù)。
在屏幕上,機器會實時顯示病灶的位置,系統(tǒng)會規(guī)劃好穿刺路徑和深度,機械臂自動定位到相應(yīng)位置,并調(diào)整好針的長度,“醫(yī)生只要執(zhí)行扎針動作,就像操作傻瓜相機一樣?!崩罴结摫硎?,儀器的定位精確度可以達到0.03毫米。該設(shè)備被國家藥監(jiān)局認定為國內(nèi)首創(chuàng)。
真健康(廣東橫琴)醫(yī)療科技有限公司成立于2018年3月,是一家落地橫琴的“澳人澳企”。李冀釗指出,下一步的迭代方向是有望實現(xiàn)核磁引導,目前為CT引導,如果是核磁引導,醫(yī)生在進針時可以實時觀察到針的位置。
分級部署成為可能
盡管機器人市場具有巨大的想象空間,但其產(chǎn)業(yè)發(fā)展遠未及公眾預(yù)期的爆發(fā)狀態(tài)。浙江大學機器人研究院院長朱世強指出,主要原因在于仍有部分核心技術(shù)沒有得到根本性的解決。
“例如工業(yè)機器人,現(xiàn)在非常成熟,這是因為工業(yè)機器人主要在結(jié)構(gòu)化任務(wù)中作業(yè),事先可以編程。而對于非結(jié)構(gòu)化、柔性的作業(yè),很多機器人還不一定能適應(yīng)。所以服務(wù)機器人面臨一個共性難題,也就是非結(jié)構(gòu)化環(huán)境下的決策和作業(yè),這又牽涉到智力、智能、靈巧作業(yè)的問題?!敝焓缽娬f。
在非結(jié)構(gòu)化的環(huán)境中,機器人不乏出現(xiàn)“智力低下”的情況。如在大會現(xiàn)場,一家珠??萍脊菊故境龅臋C械手仍不具有位姿估計能力,其姿勢是固定的,當物品的擺放方向和形態(tài)發(fā)生變化時,機械手并不能進行調(diào)整。
“這一步目前在我們的程序里是沒有的,也是需要繼續(xù)完善的地方?!痹撜刮谎邪l(fā)人員提到,這需要算法訓練這個模型,“比如物品豎著、倒著時,我提供幾種手勢,對應(yīng)握點給物體進行標注,再把握點放到模型里訓練?!?/span>
王杰告訴記者,“現(xiàn)場的展品其實大部分都是程序控制,而不是AI。即使它是視覺的,能識別、抓取一些東西,也是按照固定程序?!彼J為,讓機器人學會自我學習的一個渠道是加入大模型,但現(xiàn)在國內(nèi)大模型還沒有達到相應(yīng)水平;另一個難點是數(shù)據(jù),由于獲取成本高,企業(yè)會數(shù)據(jù)不足的問題。
人型機器人則有更高的門檻。珠海一微半導體股份有限公司展位一名研發(fā)人員向界面新聞表示,“例如關(guān)節(jié)控制,融合起來就要求更高程度的算法,也對芯片性能有更高的要求?!?/span>
一微半導體是橫琴深合區(qū)培育的首家股份制企業(yè),已實現(xiàn)了慣導、激光、視覺三大機器人主控芯片的自主量產(chǎn)。
該研發(fā)人員續(xù)指,一個趨勢為“云端大腦加具身智能”:“把大模型、超級模型放到云端,本地再部署小模型進行交互更新。云端跟本體相結(jié)合是一個方向。實地的算力一般比較小,在云端部署算力,推算后再發(fā)給機器人本體,這樣一來也能降低本地對芯片的要求?!?/span>
朱世強認為,人工智能技術(shù)改變了機器人的智能體系結(jié)構(gòu),分級部署成為可能,可以將更高層的智能放到云端,為一群終端服務(wù),這樣一來終端的智能代價就大大降低,具身智能可以更加廉價。
打造“云上智城”
眼下,珠海也在加快云端部署。珠海市2024年政府工作報告首次提出“云上智城”的理念。根據(jù)報告,珠海將加快建設(shè)“云上智城”,引導社會資本參與算力基礎(chǔ)設(shè)施建設(shè),為未來產(chǎn)業(yè)在珠海布局提供支撐。
目前,全市已有10個數(shù)據(jù)中心,智能算力約1310P(1P約等于每秒1000萬億次的計算速度),并計劃引入更多高性能算力設(shè)備,如華為的昇騰910B訓練推理服務(wù)器,以及百度與格力合資公司的昆侖芯算力設(shè)備。
在更為詳細的“路線圖”中,珠海提出打造國內(nèi)發(fā)達地區(qū)最高性價比的“算力洼地”——推進1500P以上多路徑、多生態(tài)的本地智能算力建設(shè),構(gòu)建“本地算力+云計算”算力體系和多方戰(zhàn)略協(xié)同模式。
“1310P的算力在國內(nèi)屬于前列,達到了1000臺以上服務(wù)器的配置,可以滿足企業(yè)基本算力的需求。”深圳市極致激光科技有限公司董事長徐仕安告訴界面新聞,公司借由此次大會計劃將華南的研發(fā)制造總部落戶到珠海。
極致激光主要經(jīng)營三個板塊,包括鋰電板塊、光伏板塊和控制系統(tǒng)。徐仕安表示,計劃落地三個項目,首先是新能源鋰電的規(guī)?;a(chǎn)業(yè)化,第二是全固態(tài)電池以及高速激光切卷折一體機項目,并會籌建運動控制、伺服控制的研發(fā)中心。
針對總部的落戶,徐仕安提到,每個區(qū)域有各自的優(yōu)勢,軟件部分適合放在深圳,而珠海在控制系統(tǒng)、控制器、裝備制造業(yè)有一定優(yōu)勢,“我們上中下游在珠海都能找到(合作伙伴),例如跟格力電器在精密激光焊接有合作,珠海冠宇、珠海華冠、華發(fā)集團旗下的光庫科技,也跟我們有協(xié)同?!?/span>
徐仕安同時指出,國內(nèi)人工智能輸入端的數(shù)據(jù)是充足的,也就是應(yīng)用場景,但是輸出端受后端人才缺乏的制約,而對珠海人工智能產(chǎn)業(yè)而言,“要形成質(zhì)的飛躍至少要1萬臺服務(wù)器的配置。”
目前,珠海機器人產(chǎn)業(yè)仍處在萌芽階段,全市機器人相關(guān)企業(yè)僅29家,1至9月規(guī)上工業(yè)總產(chǎn)值41.71億元。
珠海有意打造為中國“模都”。一方面,計劃全年落地20家以上垂直和場景大模型企業(yè);另一方面,也將通過“算力券”向企業(yè)提供低成本、高效率、按需供給的普惠算力,推動垂直大模型和場景大模型的快速聚集發(fā)展。