正在閱讀:

從具身智能到車路云,一場關(guān)于數(shù)字未來的浩瀚遠(yuǎn)征

掃一掃下載界面新聞APP

從具身智能到車路云,一場關(guān)于數(shù)字未來的浩瀚遠(yuǎn)征

歡迎來到科技綻放年代。

文|極智GeeTech  

詩人艾略特所言:“我們不停止探索,最終所有的探索都將回到起點,并且對這個起點有了新的認(rèn)識。”

發(fā)生在距今5.2億年前的寒武紀(jì)生命大爆發(fā)是地球生命史上里程碑式的演化事件,其規(guī)模和強度前所未有,與之前生命世界形成截然不同的反差,更是深刻影響了后來地球生命史的發(fā)展,開啟了通向現(xiàn)代生物多樣性的浩瀚遠(yuǎn)征。

2024年,可以算是科技界的“寒武紀(jì)”大爆發(fā)之年,具身智能、自動駕駛、大模型、車路云一體化等眾多新技術(shù)在這一年相互交匯、彼此融合,并釋放出巨大的技術(shù)應(yīng)用潛力和極具想象力的商業(yè)化前景,不僅打開了通往未來世界的大門,也為產(chǎn)業(yè)升級找到了進(jìn)階之路,讓人們看到了數(shù)字未來的無限可能。

具身智能通往AGI的野望

從圖靈測試到深度學(xué)習(xí),從專家系統(tǒng)到大語言模型,人工智能的每一次進(jìn)化都在拓展著人類對智能的理解邊界。人工智能與具身智能的結(jié)合,一直是行業(yè)領(lǐng)域研究探索的重要方向。

繼大模型后,具身智能成為今年科技界的新熱點。通過賦予人工智能以具體的物理實體(如機(jī)器人和自動化設(shè)備等),具身智能可以與現(xiàn)實世界進(jìn)行交互,被認(rèn)為是推動通用人工智能(AGI)發(fā)展的關(guān)鍵技術(shù)。比亞迪、華為、廣汽集團(tuán)以及美團(tuán)、阿里巴巴、騰訊等企業(yè)都已親自下場,欲在這片混沌初開的市場中搶占一席之地。

作為該領(lǐng)域最具代表性的實體,人形機(jī)器人正在大模型催化下加速產(chǎn)業(yè)化落地。目前業(yè)內(nèi)普遍認(rèn)為,人形機(jī)器人是具身智能落地的最佳硬件載體。

高盛數(shù)據(jù)顯示,在理想情況下,預(yù)計到2035年,人形機(jī)器人市場空間有望達(dá)到1540億美元,約合11037.3億元人民幣,這一規(guī)模相當(dāng)于2021年智能手機(jī)市場的三分之一?;ㄆ煦y行發(fā)布的最新報告預(yù)測,到2050年,全球人形機(jī)器人市場規(guī)模將達(dá)7萬億美元,全球人形機(jī)器人數(shù)量將達(dá)到6.48億臺。

如果將大模型視為“有趣的靈魂”,“具身智能”賦能的人形機(jī)器人則有了“好看的皮囊”,大模型與機(jī)器人快速融合正在成為具身智能持續(xù)進(jìn)化的必然趨勢。

2022年8月,谷歌PaLM-SayCan首次將語言模型與物理機(jī)器人結(jié)合,通過預(yù)訓(xùn)練在大型語言模型中提取知識,讓機(jī)器人依據(jù)高級文本指令完成物理任務(wù)。

隨后,機(jī)器人與大模型的融合逐步加深。2023年7月,谷歌DeepMind推出了Robotics Transformer 2(RT-2),是全球第一個控制機(jī)器人的視覺-語言-動作(VLA)模型。RT-2可使機(jī)器人直接通過拍攝或感知環(huán)境的方式獲取視覺信息,并理解人類語言指令,然后通過動作執(zhí)行模塊進(jìn)行相應(yīng)的動作操作。

2024年3月,F(xiàn)igure發(fā)布OpenAI大模型加持的機(jī)器人Figure 01,F(xiàn)igure 01采用端到端神經(jīng)網(wǎng)絡(luò),由OpenAI大模型提供高級視覺和語言智能功能,神經(jīng)網(wǎng)絡(luò)進(jìn)行底層的控制,能夠與人類進(jìn)行對話交互,理解并執(zhí)行人類指令。

雖然人形機(jī)器人在2024年取得了“技驚四座”的進(jìn)展:優(yōu)必選人形機(jī)器人Walker聚焦汽車、3C等制造業(yè)重點領(lǐng)域,已進(jìn)入多家車廠實訓(xùn);宇樹科技機(jī)器人實現(xiàn)了完全仿人的自然行走;波士頓動力的新版Atlas機(jī)器人可在工廠里不同儲物柜之間絲滑搬動零件;特斯拉人形機(jī)器人擎天柱(Optimus)計劃在2025年量產(chǎn)……

但正如波士頓動力創(chuàng)始人Marc Raibert所說,目前人形機(jī)器人“在某種程度上是一種炫耀,而不是一種生產(chǎn)力”。具身智能固然是通往AGI大門的一把鑰匙,但目前行業(yè)還是沒有找到使用這把鑰匙的正確方式,并且低估了AGI的實現(xiàn)難度。

不同于快速收斂的大模型,具身智能涉及的模態(tài)空前復(fù)雜,需要同時具備多模態(tài)感知、具身決策與規(guī)劃和操作執(zhí)行能力,在發(fā)展過程中仍面臨多項挑戰(zhàn)。

首先,是要適應(yīng)非結(jié)構(gòu)化真實環(huán)境。與預(yù)設(shè)規(guī)則和模式驅(qū)動的傳統(tǒng)人工智能系統(tǒng)不同,具身智能必須在一個充滿復(fù)雜性和不可預(yù)測性的非結(jié)構(gòu)化環(huán)境中找到立足點。在這種環(huán)境中,信息的稀缺和場景的多變性,要求人工智能系統(tǒng)具備更加先進(jìn)和靈活的計算能力,以便能夠適應(yīng)環(huán)境的不斷變化和不確定性。

其次,是要發(fā)展更高級的認(rèn)知策略。在自然界中,生物體通過視覺、聽覺和觸覺等多種感覺途徑獲得復(fù)雜的感知信息,并在大腦中進(jìn)行有效的多模態(tài)信息融合。具身智能同樣需要模仿這種高效的多模態(tài)融合過程,以更全面地理解和適應(yīng)其所處的環(huán)境。

第三,涌現(xiàn)式創(chuàng)新與突破的缺乏影響著具身智能的進(jìn)化程度。生物群體能夠展現(xiàn)出令人驚嘆的集體智慧,主要歸功于其中個體之間的協(xié)同作用。對具身智能來說,一個重要的挑戰(zhàn)是模仿這種群體智能系統(tǒng)。這意味著需要將智能分散到多個實體中,并通過它們之間的協(xié)作,實現(xiàn)更高級別的認(rèn)知和決策能力,以實現(xiàn)分工協(xié)作和動態(tài)任務(wù)分配,從而能夠更靈活地應(yīng)對多種情境。

第四,具身智能在與真實環(huán)境進(jìn)行交互并充分學(xué)習(xí)時,勢必會收集和處理大量數(shù)據(jù)。這就引出了一個關(guān)鍵問題:如何在實時交互中確保這些數(shù)據(jù)的安全性和隱私性,同時具身智能在決策時還需要考慮倫理和道德問題,以確保其行為符合道德原則和社會價值觀。

具身智能的發(fā)展不僅是技術(shù)革新的過程,更是對人類理解、倫理道德和社會影響的深思,相關(guān)研究在推動科技邊界的同時,還將深刻影響人類社會的方方面面。

智能駕駛的夢想照進(jìn)現(xiàn)實

當(dāng)自動駕駛汽車的夢想在20年前被點燃時,誰能想到這條道路會如此坎坷?美國國防部高級研究計劃局(DARPA)發(fā)起的挑戰(zhàn)賽仿佛打開了一個新世界,激發(fā)了無數(shù)科技公司的熱情。然而,現(xiàn)實卻遠(yuǎn)比想象中復(fù)雜。

縱觀自動駕駛技術(shù)的發(fā)展歷程,人工智能的不斷突破顯著提升了自動駕駛的感知性能。從卷積神經(jīng)網(wǎng)(CNN)的引入,到循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的應(yīng)用,再到結(jié)合鳥瞰圖(BEV)與Transformer(自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu))的創(chuàng)新,新技術(shù)的迭代涌現(xiàn)在不斷增強自動駕駛的精確度與安全性。

尤其是在“BEV+Transformer”與OCC(占用網(wǎng)絡(luò))之后,端到端(End-to-End)自動駕駛技術(shù)開始受到廣泛關(guān)注??梢钥吹?,2024年高階智駕產(chǎn)品渴望商業(yè)成熟,但仍處于技術(shù)劇烈變革階段。

隨著神經(jīng)網(wǎng)絡(luò)智駕算法的崛起,自動駕駛進(jìn)入數(shù)據(jù)驅(qū)動時代,通過大量數(shù)據(jù)訓(xùn)練出能夠高度模擬人類駕駛習(xí)慣的人工智能,在達(dá)到一定的仿真閾值后,得出一套根據(jù)可靠性和符合人類乘車習(xí)慣的系統(tǒng)。

隨著智能駕駛技術(shù)的不斷成熟,車企逐步加大了在智能駕駛領(lǐng)域的投入。特斯拉、蔚來、小鵬、理想等廠商在智能駕駛技術(shù)的研發(fā)上已形成了自己的技術(shù)路線。

特斯拉作為智能駕駛領(lǐng)域的領(lǐng)軍者,通過影子模式進(jìn)行數(shù)據(jù)收集,將系統(tǒng)決策與駕駛員行為不斷進(jìn)行比對,當(dāng)兩者不一致時,系統(tǒng)將場景判定為“極端工況”,進(jìn)而觸發(fā)數(shù)據(jù)回傳。因此特斯拉收集的數(shù)據(jù)越多,對于人類駕駛習(xí)慣的模擬就越精準(zhǔn),進(jìn)而加速特斯拉FSD的車端部署,形成數(shù)據(jù)閉環(huán)。

蔚來通過引入高精地圖和Lidar技術(shù),打造其獨特的NAD系統(tǒng);小鵬則在其XNGP系統(tǒng)中引入了輕量化的傳感器方案,并計劃在未來通過端到端大模型進(jìn)一步提升系統(tǒng)性能。華為則通過與多個整車廠商的合作,推動其ADS系統(tǒng)的廣泛應(yīng)用。各大整車廠商在智駕領(lǐng)域的戰(zhàn)略布局,將在未來幾年內(nèi)決定市場的競爭格局。

盡管智能駕駛技術(shù)已經(jīng)取得了顯著進(jìn)展,但在實現(xiàn)全面普及之前仍面臨諸多挑戰(zhàn)。首先,算法的可靠性和安全性仍需進(jìn)一步提升,特別是在應(yīng)對復(fù)雜的城市交通環(huán)境時,智能駕駛系統(tǒng)需要能夠處理各種突發(fā)狀況和極端條件。

其次,智能駕駛系統(tǒng)的性能高度依賴于算力與算法的優(yōu)化。在端到端大模型的架構(gòu)下,算力需求呈指數(shù)級增長,特別是在進(jìn)行大規(guī)模數(shù)據(jù)訓(xùn)練和實時決策時。為了應(yīng)對這一挑戰(zhàn),業(yè)界正在探索基于云計算和邊緣計算的混合架構(gòu),通過將計算任務(wù)分布在云端和本地設(shè)備之間,以提高系統(tǒng)的響應(yīng)速度和計算效率。

算法的優(yōu)化也面臨著諸多挑戰(zhàn)。傳統(tǒng)的機(jī)器學(xué)習(xí)算法在處理長尾問題時表現(xiàn)不佳,而智能駕駛系統(tǒng)必須具備應(yīng)對這些情況的能力。強化學(xué)習(xí)和生成對抗網(wǎng)絡(luò)(GAN)等新型算法在解決這些問題上展示出了潛力,但如何將這些算法應(yīng)用到實際駕駛場景中,仍需要進(jìn)一步研究和探索。

隨著智能駕駛系統(tǒng)的普及,數(shù)據(jù)隱私和網(wǎng)絡(luò)安全問題日益突出。智能駕駛系統(tǒng)依賴于大量的傳感器數(shù)據(jù)和用戶行為數(shù)據(jù),這些數(shù)據(jù)的收集、傳輸和存儲都可能面臨安全風(fēng)險。如何保護(hù)用戶數(shù)據(jù)的隱私,防止數(shù)據(jù)被非法獲取和濫用,是當(dāng)前智能駕駛技術(shù)面臨的一個重要挑戰(zhàn)。

智能駕駛不僅是技術(shù)發(fā)展的新方向,更是汽車產(chǎn)業(yè)未來的重要增長點,2024年是智能駕駛技術(shù)從高端市場走向主流市場的關(guān)鍵節(jié)點。車企在智能駕駛領(lǐng)域的布局,將在很大程度上決定未來的市場格局。

為了將自動駕駛系統(tǒng)部署到更多車型上,模型壓縮和優(yōu)化技術(shù)將成為關(guān)鍵,我們將看到更加輕量級、高效的自動駕駛模型問世,這些模型將在保持性能的同時,大幅降低對硬件資源的需求。

車路云新基建“加速器”

如果說,具身智能和自動駕駛還只是停留在場景應(yīng)用層面,那么車路云一體化則是圍繞底層交通基礎(chǔ)設(shè)施智能化升級下的一盤“大棋”。

車路云網(wǎng)絡(luò)的本質(zhì)是通感算網(wǎng)絡(luò),其將通信、感知與計算深度融合,通過集成通信基站、衛(wèi)星通信和定位、各類傳感器、云控平臺等關(guān)鍵基礎(chǔ)設(shè)施,形成一個信息共享、高效協(xié)同的網(wǎng)絡(luò)空間,成為未來智能城市的底層系統(tǒng)。

作為龐大的實時數(shù)據(jù)網(wǎng)絡(luò),車路云網(wǎng)絡(luò)可以大規(guī)模獲取實體世界的全局?jǐn)?shù)字化信息,為普通汽車、智能汽車、機(jī)器人、無人機(jī)、低空飛行器等智能設(shè)備提供系統(tǒng)級的實時數(shù)據(jù)服務(wù),這些智能設(shè)備可以基于全局?jǐn)?shù)據(jù)信息進(jìn)行實時決策和精準(zhǔn)規(guī)劃,實現(xiàn)更高效的協(xié)作。

同時,這些數(shù)據(jù)還可以用來反哺自動駕駛模型、機(jī)器人模型的訓(xùn)練。比如可以根據(jù)不同城市特點,訓(xùn)練最適合當(dāng)?shù)伛{駛行為的自動駕駛模型;根據(jù)不同工作和工種特點,訓(xùn)練最適合不同工作場景的機(jī)器人。

當(dāng)智能設(shè)備規(guī)模越來越大,最具合理性的方式一定是盡可能降低對單體設(shè)備在計算能力和實時感知能力方面的依賴,通過整個網(wǎng)絡(luò)來承載巨量的數(shù)據(jù)處理和計算分析。這將有助于推動數(shù)字智能社會進(jìn)入到一個整合系統(tǒng),也就是從單體智能設(shè)備變成群體智能系統(tǒng),并將整合地面網(wǎng)絡(luò)、低空網(wǎng)絡(luò)、衛(wèi)星網(wǎng)絡(luò),形成空天地一體化的通感算網(wǎng)絡(luò),為智能體的大規(guī)模運行與自主交互協(xié)作提供重要支撐。

2024年,是我國全面布局車路云一體化的“元年”。年初,工信部發(fā)布的《關(guān)于開展智能網(wǎng)聯(lián)汽車“車路云一體化”應(yīng)用試點工作的通知》提出,要建設(shè)智能化路側(cè)基礎(chǔ)設(shè)施,實現(xiàn)試點區(qū)域5G通信網(wǎng)絡(luò)全覆蓋,部署LTE-V2X直連通信路側(cè)單元等在內(nèi)的C-V2X基礎(chǔ)設(shè)施。通過新一代移動通信技術(shù)將人、車、路、云一體化,建立系統(tǒng)性數(shù)據(jù)平臺,產(chǎn)業(yè)化規(guī)模落地應(yīng)用,就是智能駕駛的“中國方案”。

7月初,工信部公布了20個城市(聯(lián)合體)為“車路云一體化”應(yīng)用試點城市。車路云一體化作為優(yōu)化交通運效率、提升城市治理水平的技術(shù)手段,其重要性日益凸顯,已成為加速智能駕駛?cè)媛涞氐年P(guān)鍵所在。

10月,工信部相關(guān)負(fù)責(zé)人在國新辦新聞發(fā)布會上表示,下一步將深入開展智能網(wǎng)聯(lián)汽車準(zhǔn)入和上路通行試點、“車路云一體化”試點,穩(wěn)妥推進(jìn)自動駕駛技術(shù)產(chǎn)業(yè)化。

目前,中國已經(jīng)形成相對成熟的車路云一體化建設(shè)方案,主要由設(shè)備端、通信服務(wù)、云平臺、車路云應(yīng)用、車路云安全等部分組成。其中,在政府機(jī)構(gòu)主導(dǎo)的項目推動下,路側(cè)基礎(chǔ)設(shè)施及平臺建設(shè)率先開展。

數(shù)據(jù)顯示,2025年、2030年“車路云一體化”智能網(wǎng)聯(lián)汽車產(chǎn)值預(yù)計為7295億元、25825億元,年均復(fù)合增長率為28.8%。面向未來,車路云一體化要以應(yīng)用為出發(fā)點,不僅賦能具有自動駕駛功能的車輛,還要著眼于存量的智能網(wǎng)聯(lián)汽車和普通汽車。

對此,要挖掘更多應(yīng)用場景并形成可復(fù)制的方案。當(dāng)前,車路云一體化平臺已經(jīng)能夠?qū)β范说脑O(shè)備信息、預(yù)警結(jié)果等數(shù)據(jù)進(jìn)行較為穩(wěn)定的接入與處理,路云已經(jīng)基本實現(xiàn)協(xié)同連接,利用云端多車數(shù)據(jù)進(jìn)行交通智能調(diào)度管理、提高協(xié)作效率的場景將成為主流,車云協(xié)同也將迎來新發(fā)展。

同時,要進(jìn)一步探索車路云一體化更多商業(yè)價值。車路云一體化市場規(guī)模的增長依賴于各城市車路云項目的擴(kuò)張和落地,對于技術(shù)服務(wù)商而言需要更多的“增長曲線”維持業(yè)務(wù)運轉(zhuǎn)。

一方面,通過基礎(chǔ)設(shè)施類項目向車端協(xié)議棧的滲透是可行方案;另一方面,將平臺沉淀的高質(zhì)量數(shù)據(jù)賦能車企等對數(shù)據(jù)有海量需求的終端用戶,也不失為一種新的探索方向。

蘑菇車聯(lián)創(chuàng)始人兼CEO朱磊認(rèn)為,車路云網(wǎng)絡(luò)最需要的是操作系統(tǒng)和算法,數(shù)據(jù)質(zhì)量是推動整個產(chǎn)業(yè)向前發(fā)展的關(guān)鍵所在。車路云網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)能否給車輛使用以及如何使用是核心標(biāo)準(zhǔn)。目前這部分工作剛剛起步,還遠(yuǎn)沒有到成熟階段。

從數(shù)據(jù)應(yīng)用角度,車路云“數(shù)據(jù)上車”可以分為五個階段:

第一,路側(cè)基礎(chǔ)設(shè)施建設(shè)階段。主要將“通感算”的硬件設(shè)備部署在路側(cè);

第二,數(shù)據(jù)質(zhì)量達(dá)標(biāo)階段。針對單節(jié)點數(shù)據(jù)質(zhì)量進(jìn)行測試,可參考行業(yè)權(quán)威標(biāo)準(zhǔn),比如信通院的“雙SL3”;

第三,數(shù)據(jù)上車初級應(yīng)用階段。通過車路云系統(tǒng),將信號燈數(shù)據(jù)、路側(cè)識別到的事件類數(shù)據(jù)賦能智能網(wǎng)聯(lián)車輛;

第四,數(shù)據(jù)上車高級應(yīng)用階段。通過車路云系統(tǒng),將實時孿生數(shù)據(jù)賦能給智能網(wǎng)聯(lián)車輛和自動駕駛車輛,真正實現(xiàn)協(xié)同感知、協(xié)同決策;

第五,量產(chǎn)車型大規(guī)模應(yīng)用階段。與車企進(jìn)行量產(chǎn)車合作,保證車輛大規(guī)模接入車路云網(wǎng)絡(luò),并享受各類實時數(shù)據(jù)服務(wù)。

第五階段的實現(xiàn),需要政府、行業(yè)組織、車企、車路云技術(shù)公司等多方面開展協(xié)作,在政策、法規(guī)、標(biāo)準(zhǔn)等層面形成合力,共同推動數(shù)據(jù)上車大規(guī)模應(yīng)用,最終讓人們真實享受到車路云建設(shè)帶來的安全、效率、智能和便利。

此外,構(gòu)建互聯(lián)互通的車路云網(wǎng)絡(luò)形態(tài)有助于促進(jìn)產(chǎn)業(yè)規(guī)模發(fā)展。隨著國家層面政策推動與地方試點項目的成功經(jīng)驗積累,車路云網(wǎng)絡(luò)必將逐步擴(kuò)展至全國范圍,形成覆蓋高速公路、城市道路、鄉(xiāng)村公路的全域智能交通網(wǎng)絡(luò)。

未來,車路云一體化的定位將不再限于汽車產(chǎn)業(yè)本身,而是與交通、城市管理、通信等多領(lǐng)域深度融合的新型基礎(chǔ)設(shè)施體系,數(shù)據(jù)作為“橋梁”,構(gòu)建起高效協(xié)同的多業(yè)務(wù)系統(tǒng),從而全面提升城市的智能化、精細(xì)化管理水平。

每一次技術(shù)浪潮的來臨都伴隨著泡沫,但這并不意味著我們應(yīng)該回避。因為在這泡沫之下,隱藏著無數(shù)的機(jī)遇。創(chuàng)新往往發(fā)生在邊界之外,但又在跨界之中,來源于那些看似無用卻能激發(fā)無限可能的探索。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

從具身智能到車路云,一場關(guān)于數(shù)字未來的浩瀚遠(yuǎn)征

歡迎來到科技綻放年代。

文|極智GeeTech  

詩人艾略特所言:“我們不停止探索,最終所有的探索都將回到起點,并且對這個起點有了新的認(rèn)識?!?/p>

發(fā)生在距今5.2億年前的寒武紀(jì)生命大爆發(fā)是地球生命史上里程碑式的演化事件,其規(guī)模和強度前所未有,與之前生命世界形成截然不同的反差,更是深刻影響了后來地球生命史的發(fā)展,開啟了通向現(xiàn)代生物多樣性的浩瀚遠(yuǎn)征。

2024年,可以算是科技界的“寒武紀(jì)”大爆發(fā)之年,具身智能、自動駕駛、大模型、車路云一體化等眾多新技術(shù)在這一年相互交匯、彼此融合,并釋放出巨大的技術(shù)應(yīng)用潛力和極具想象力的商業(yè)化前景,不僅打開了通往未來世界的大門,也為產(chǎn)業(yè)升級找到了進(jìn)階之路,讓人們看到了數(shù)字未來的無限可能。

具身智能通往AGI的野望

從圖靈測試到深度學(xué)習(xí),從專家系統(tǒng)到大語言模型,人工智能的每一次進(jìn)化都在拓展著人類對智能的理解邊界。人工智能與具身智能的結(jié)合,一直是行業(yè)領(lǐng)域研究探索的重要方向。

繼大模型后,具身智能成為今年科技界的新熱點。通過賦予人工智能以具體的物理實體(如機(jī)器人和自動化設(shè)備等),具身智能可以與現(xiàn)實世界進(jìn)行交互,被認(rèn)為是推動通用人工智能(AGI)發(fā)展的關(guān)鍵技術(shù)。比亞迪、華為、廣汽集團(tuán)以及美團(tuán)、阿里巴巴、騰訊等企業(yè)都已親自下場,欲在這片混沌初開的市場中搶占一席之地。

作為該領(lǐng)域最具代表性的實體,人形機(jī)器人正在大模型催化下加速產(chǎn)業(yè)化落地。目前業(yè)內(nèi)普遍認(rèn)為,人形機(jī)器人是具身智能落地的最佳硬件載體。

高盛數(shù)據(jù)顯示,在理想情況下,預(yù)計到2035年,人形機(jī)器人市場空間有望達(dá)到1540億美元,約合11037.3億元人民幣,這一規(guī)模相當(dāng)于2021年智能手機(jī)市場的三分之一。花旗銀行發(fā)布的最新報告預(yù)測,到2050年,全球人形機(jī)器人市場規(guī)模將達(dá)7萬億美元,全球人形機(jī)器人數(shù)量將達(dá)到6.48億臺。

如果將大模型視為“有趣的靈魂”,“具身智能”賦能的人形機(jī)器人則有了“好看的皮囊”,大模型與機(jī)器人快速融合正在成為具身智能持續(xù)進(jìn)化的必然趨勢。

2022年8月,谷歌PaLM-SayCan首次將語言模型與物理機(jī)器人結(jié)合,通過預(yù)訓(xùn)練在大型語言模型中提取知識,讓機(jī)器人依據(jù)高級文本指令完成物理任務(wù)。

隨后,機(jī)器人與大模型的融合逐步加深。2023年7月,谷歌DeepMind推出了Robotics Transformer 2(RT-2),是全球第一個控制機(jī)器人的視覺-語言-動作(VLA)模型。RT-2可使機(jī)器人直接通過拍攝或感知環(huán)境的方式獲取視覺信息,并理解人類語言指令,然后通過動作執(zhí)行模塊進(jìn)行相應(yīng)的動作操作。

2024年3月,F(xiàn)igure發(fā)布OpenAI大模型加持的機(jī)器人Figure 01,F(xiàn)igure 01采用端到端神經(jīng)網(wǎng)絡(luò),由OpenAI大模型提供高級視覺和語言智能功能,神經(jīng)網(wǎng)絡(luò)進(jìn)行底層的控制,能夠與人類進(jìn)行對話交互,理解并執(zhí)行人類指令。

雖然人形機(jī)器人在2024年取得了“技驚四座”的進(jìn)展:優(yōu)必選人形機(jī)器人Walker聚焦汽車、3C等制造業(yè)重點領(lǐng)域,已進(jìn)入多家車廠實訓(xùn);宇樹科技機(jī)器人實現(xiàn)了完全仿人的自然行走;波士頓動力的新版Atlas機(jī)器人可在工廠里不同儲物柜之間絲滑搬動零件;特斯拉人形機(jī)器人擎天柱(Optimus)計劃在2025年量產(chǎn)……

但正如波士頓動力創(chuàng)始人Marc Raibert所說,目前人形機(jī)器人“在某種程度上是一種炫耀,而不是一種生產(chǎn)力”。具身智能固然是通往AGI大門的一把鑰匙,但目前行業(yè)還是沒有找到使用這把鑰匙的正確方式,并且低估了AGI的實現(xiàn)難度。

不同于快速收斂的大模型,具身智能涉及的模態(tài)空前復(fù)雜,需要同時具備多模態(tài)感知、具身決策與規(guī)劃和操作執(zhí)行能力,在發(fā)展過程中仍面臨多項挑戰(zhàn)。

首先,是要適應(yīng)非結(jié)構(gòu)化真實環(huán)境。與預(yù)設(shè)規(guī)則和模式驅(qū)動的傳統(tǒng)人工智能系統(tǒng)不同,具身智能必須在一個充滿復(fù)雜性和不可預(yù)測性的非結(jié)構(gòu)化環(huán)境中找到立足點。在這種環(huán)境中,信息的稀缺和場景的多變性,要求人工智能系統(tǒng)具備更加先進(jìn)和靈活的計算能力,以便能夠適應(yīng)環(huán)境的不斷變化和不確定性。

其次,是要發(fā)展更高級的認(rèn)知策略。在自然界中,生物體通過視覺、聽覺和觸覺等多種感覺途徑獲得復(fù)雜的感知信息,并在大腦中進(jìn)行有效的多模態(tài)信息融合。具身智能同樣需要模仿這種高效的多模態(tài)融合過程,以更全面地理解和適應(yīng)其所處的環(huán)境。

第三,涌現(xiàn)式創(chuàng)新與突破的缺乏影響著具身智能的進(jìn)化程度。生物群體能夠展現(xiàn)出令人驚嘆的集體智慧,主要歸功于其中個體之間的協(xié)同作用。對具身智能來說,一個重要的挑戰(zhàn)是模仿這種群體智能系統(tǒng)。這意味著需要將智能分散到多個實體中,并通過它們之間的協(xié)作,實現(xiàn)更高級別的認(rèn)知和決策能力,以實現(xiàn)分工協(xié)作和動態(tài)任務(wù)分配,從而能夠更靈活地應(yīng)對多種情境。

第四,具身智能在與真實環(huán)境進(jìn)行交互并充分學(xué)習(xí)時,勢必會收集和處理大量數(shù)據(jù)。這就引出了一個關(guān)鍵問題:如何在實時交互中確保這些數(shù)據(jù)的安全性和隱私性,同時具身智能在決策時還需要考慮倫理和道德問題,以確保其行為符合道德原則和社會價值觀。

具身智能的發(fā)展不僅是技術(shù)革新的過程,更是對人類理解、倫理道德和社會影響的深思,相關(guān)研究在推動科技邊界的同時,還將深刻影響人類社會的方方面面。

智能駕駛的夢想照進(jìn)現(xiàn)實

當(dāng)自動駕駛汽車的夢想在20年前被點燃時,誰能想到這條道路會如此坎坷?美國國防部高級研究計劃局(DARPA)發(fā)起的挑戰(zhàn)賽仿佛打開了一個新世界,激發(fā)了無數(shù)科技公司的熱情。然而,現(xiàn)實卻遠(yuǎn)比想象中復(fù)雜。

縱觀自動駕駛技術(shù)的發(fā)展歷程,人工智能的不斷突破顯著提升了自動駕駛的感知性能。從卷積神經(jīng)網(wǎng)(CNN)的引入,到循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的應(yīng)用,再到結(jié)合鳥瞰圖(BEV)與Transformer(自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu))的創(chuàng)新,新技術(shù)的迭代涌現(xiàn)在不斷增強自動駕駛的精確度與安全性。

尤其是在“BEV+Transformer”與OCC(占用網(wǎng)絡(luò))之后,端到端(End-to-End)自動駕駛技術(shù)開始受到廣泛關(guān)注??梢钥吹?,2024年高階智駕產(chǎn)品渴望商業(yè)成熟,但仍處于技術(shù)劇烈變革階段。

隨著神經(jīng)網(wǎng)絡(luò)智駕算法的崛起,自動駕駛進(jìn)入數(shù)據(jù)驅(qū)動時代,通過大量數(shù)據(jù)訓(xùn)練出能夠高度模擬人類駕駛習(xí)慣的人工智能,在達(dá)到一定的仿真閾值后,得出一套根據(jù)可靠性和符合人類乘車習(xí)慣的系統(tǒng)。

隨著智能駕駛技術(shù)的不斷成熟,車企逐步加大了在智能駕駛領(lǐng)域的投入。特斯拉、蔚來、小鵬、理想等廠商在智能駕駛技術(shù)的研發(fā)上已形成了自己的技術(shù)路線。

特斯拉作為智能駕駛領(lǐng)域的領(lǐng)軍者,通過影子模式進(jìn)行數(shù)據(jù)收集,將系統(tǒng)決策與駕駛員行為不斷進(jìn)行比對,當(dāng)兩者不一致時,系統(tǒng)將場景判定為“極端工況”,進(jìn)而觸發(fā)數(shù)據(jù)回傳。因此特斯拉收集的數(shù)據(jù)越多,對于人類駕駛習(xí)慣的模擬就越精準(zhǔn),進(jìn)而加速特斯拉FSD的車端部署,形成數(shù)據(jù)閉環(huán)。

蔚來通過引入高精地圖和Lidar技術(shù),打造其獨特的NAD系統(tǒng);小鵬則在其XNGP系統(tǒng)中引入了輕量化的傳感器方案,并計劃在未來通過端到端大模型進(jìn)一步提升系統(tǒng)性能。華為則通過與多個整車廠商的合作,推動其ADS系統(tǒng)的廣泛應(yīng)用。各大整車廠商在智駕領(lǐng)域的戰(zhàn)略布局,將在未來幾年內(nèi)決定市場的競爭格局。

盡管智能駕駛技術(shù)已經(jīng)取得了顯著進(jìn)展,但在實現(xiàn)全面普及之前仍面臨諸多挑戰(zhàn)。首先,算法的可靠性和安全性仍需進(jìn)一步提升,特別是在應(yīng)對復(fù)雜的城市交通環(huán)境時,智能駕駛系統(tǒng)需要能夠處理各種突發(fā)狀況和極端條件。

其次,智能駕駛系統(tǒng)的性能高度依賴于算力與算法的優(yōu)化。在端到端大模型的架構(gòu)下,算力需求呈指數(shù)級增長,特別是在進(jìn)行大規(guī)模數(shù)據(jù)訓(xùn)練和實時決策時。為了應(yīng)對這一挑戰(zhàn),業(yè)界正在探索基于云計算和邊緣計算的混合架構(gòu),通過將計算任務(wù)分布在云端和本地設(shè)備之間,以提高系統(tǒng)的響應(yīng)速度和計算效率。

算法的優(yōu)化也面臨著諸多挑戰(zhàn)。傳統(tǒng)的機(jī)器學(xué)習(xí)算法在處理長尾問題時表現(xiàn)不佳,而智能駕駛系統(tǒng)必須具備應(yīng)對這些情況的能力。強化學(xué)習(xí)和生成對抗網(wǎng)絡(luò)(GAN)等新型算法在解決這些問題上展示出了潛力,但如何將這些算法應(yīng)用到實際駕駛場景中,仍需要進(jìn)一步研究和探索。

隨著智能駕駛系統(tǒng)的普及,數(shù)據(jù)隱私和網(wǎng)絡(luò)安全問題日益突出。智能駕駛系統(tǒng)依賴于大量的傳感器數(shù)據(jù)和用戶行為數(shù)據(jù),這些數(shù)據(jù)的收集、傳輸和存儲都可能面臨安全風(fēng)險。如何保護(hù)用戶數(shù)據(jù)的隱私,防止數(shù)據(jù)被非法獲取和濫用,是當(dāng)前智能駕駛技術(shù)面臨的一個重要挑戰(zhàn)。

智能駕駛不僅是技術(shù)發(fā)展的新方向,更是汽車產(chǎn)業(yè)未來的重要增長點,2024年是智能駕駛技術(shù)從高端市場走向主流市場的關(guān)鍵節(jié)點。車企在智能駕駛領(lǐng)域的布局,將在很大程度上決定未來的市場格局。

為了將自動駕駛系統(tǒng)部署到更多車型上,模型壓縮和優(yōu)化技術(shù)將成為關(guān)鍵,我們將看到更加輕量級、高效的自動駕駛模型問世,這些模型將在保持性能的同時,大幅降低對硬件資源的需求。

車路云新基建“加速器”

如果說,具身智能和自動駕駛還只是停留在場景應(yīng)用層面,那么車路云一體化則是圍繞底層交通基礎(chǔ)設(shè)施智能化升級下的一盤“大棋”。

車路云網(wǎng)絡(luò)的本質(zhì)是通感算網(wǎng)絡(luò),其將通信、感知與計算深度融合,通過集成通信基站、衛(wèi)星通信和定位、各類傳感器、云控平臺等關(guān)鍵基礎(chǔ)設(shè)施,形成一個信息共享、高效協(xié)同的網(wǎng)絡(luò)空間,成為未來智能城市的底層系統(tǒng)。

作為龐大的實時數(shù)據(jù)網(wǎng)絡(luò),車路云網(wǎng)絡(luò)可以大規(guī)模獲取實體世界的全局?jǐn)?shù)字化信息,為普通汽車、智能汽車、機(jī)器人、無人機(jī)、低空飛行器等智能設(shè)備提供系統(tǒng)級的實時數(shù)據(jù)服務(wù),這些智能設(shè)備可以基于全局?jǐn)?shù)據(jù)信息進(jìn)行實時決策和精準(zhǔn)規(guī)劃,實現(xiàn)更高效的協(xié)作。

同時,這些數(shù)據(jù)還可以用來反哺自動駕駛模型、機(jī)器人模型的訓(xùn)練。比如可以根據(jù)不同城市特點,訓(xùn)練最適合當(dāng)?shù)伛{駛行為的自動駕駛模型;根據(jù)不同工作和工種特點,訓(xùn)練最適合不同工作場景的機(jī)器人。

當(dāng)智能設(shè)備規(guī)模越來越大,最具合理性的方式一定是盡可能降低對單體設(shè)備在計算能力和實時感知能力方面的依賴,通過整個網(wǎng)絡(luò)來承載巨量的數(shù)據(jù)處理和計算分析。這將有助于推動數(shù)字智能社會進(jìn)入到一個整合系統(tǒng),也就是從單體智能設(shè)備變成群體智能系統(tǒng),并將整合地面網(wǎng)絡(luò)、低空網(wǎng)絡(luò)、衛(wèi)星網(wǎng)絡(luò),形成空天地一體化的通感算網(wǎng)絡(luò),為智能體的大規(guī)模運行與自主交互協(xié)作提供重要支撐。

2024年,是我國全面布局車路云一體化的“元年”。年初,工信部發(fā)布的《關(guān)于開展智能網(wǎng)聯(lián)汽車“車路云一體化”應(yīng)用試點工作的通知》提出,要建設(shè)智能化路側(cè)基礎(chǔ)設(shè)施,實現(xiàn)試點區(qū)域5G通信網(wǎng)絡(luò)全覆蓋,部署LTE-V2X直連通信路側(cè)單元等在內(nèi)的C-V2X基礎(chǔ)設(shè)施。通過新一代移動通信技術(shù)將人、車、路、云一體化,建立系統(tǒng)性數(shù)據(jù)平臺,產(chǎn)業(yè)化規(guī)模落地應(yīng)用,就是智能駕駛的“中國方案”。

7月初,工信部公布了20個城市(聯(lián)合體)為“車路云一體化”應(yīng)用試點城市。車路云一體化作為優(yōu)化交通運效率、提升城市治理水平的技術(shù)手段,其重要性日益凸顯,已成為加速智能駕駛?cè)媛涞氐年P(guān)鍵所在。

10月,工信部相關(guān)負(fù)責(zé)人在國新辦新聞發(fā)布會上表示,下一步將深入開展智能網(wǎng)聯(lián)汽車準(zhǔn)入和上路通行試點、“車路云一體化”試點,穩(wěn)妥推進(jìn)自動駕駛技術(shù)產(chǎn)業(yè)化。

目前,中國已經(jīng)形成相對成熟的車路云一體化建設(shè)方案,主要由設(shè)備端、通信服務(wù)、云平臺、車路云應(yīng)用、車路云安全等部分組成。其中,在政府機(jī)構(gòu)主導(dǎo)的項目推動下,路側(cè)基礎(chǔ)設(shè)施及平臺建設(shè)率先開展。

數(shù)據(jù)顯示,2025年、2030年“車路云一體化”智能網(wǎng)聯(lián)汽車產(chǎn)值預(yù)計為7295億元、25825億元,年均復(fù)合增長率為28.8%。面向未來,車路云一體化要以應(yīng)用為出發(fā)點,不僅賦能具有自動駕駛功能的車輛,還要著眼于存量的智能網(wǎng)聯(lián)汽車和普通汽車。

對此,要挖掘更多應(yīng)用場景并形成可復(fù)制的方案。當(dāng)前,車路云一體化平臺已經(jīng)能夠?qū)β范说脑O(shè)備信息、預(yù)警結(jié)果等數(shù)據(jù)進(jìn)行較為穩(wěn)定的接入與處理,路云已經(jīng)基本實現(xiàn)協(xié)同連接,利用云端多車數(shù)據(jù)進(jìn)行交通智能調(diào)度管理、提高協(xié)作效率的場景將成為主流,車云協(xié)同也將迎來新發(fā)展。

同時,要進(jìn)一步探索車路云一體化更多商業(yè)價值。車路云一體化市場規(guī)模的增長依賴于各城市車路云項目的擴(kuò)張和落地,對于技術(shù)服務(wù)商而言需要更多的“增長曲線”維持業(yè)務(wù)運轉(zhuǎn)。

一方面,通過基礎(chǔ)設(shè)施類項目向車端協(xié)議棧的滲透是可行方案;另一方面,將平臺沉淀的高質(zhì)量數(shù)據(jù)賦能車企等對數(shù)據(jù)有海量需求的終端用戶,也不失為一種新的探索方向。

蘑菇車聯(lián)創(chuàng)始人兼CEO朱磊認(rèn)為,車路云網(wǎng)絡(luò)最需要的是操作系統(tǒng)和算法,數(shù)據(jù)質(zhì)量是推動整個產(chǎn)業(yè)向前發(fā)展的關(guān)鍵所在。車路云網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)能否給車輛使用以及如何使用是核心標(biāo)準(zhǔn)。目前這部分工作剛剛起步,還遠(yuǎn)沒有到成熟階段。

從數(shù)據(jù)應(yīng)用角度,車路云“數(shù)據(jù)上車”可以分為五個階段:

第一,路側(cè)基礎(chǔ)設(shè)施建設(shè)階段。主要將“通感算”的硬件設(shè)備部署在路側(cè);

第二,數(shù)據(jù)質(zhì)量達(dá)標(biāo)階段。針對單節(jié)點數(shù)據(jù)質(zhì)量進(jìn)行測試,可參考行業(yè)權(quán)威標(biāo)準(zhǔn),比如信通院的“雙SL3”;

第三,數(shù)據(jù)上車初級應(yīng)用階段。通過車路云系統(tǒng),將信號燈數(shù)據(jù)、路側(cè)識別到的事件類數(shù)據(jù)賦能智能網(wǎng)聯(lián)車輛;

第四,數(shù)據(jù)上車高級應(yīng)用階段。通過車路云系統(tǒng),將實時孿生數(shù)據(jù)賦能給智能網(wǎng)聯(lián)車輛和自動駕駛車輛,真正實現(xiàn)協(xié)同感知、協(xié)同決策;

第五,量產(chǎn)車型大規(guī)模應(yīng)用階段。與車企進(jìn)行量產(chǎn)車合作,保證車輛大規(guī)模接入車路云網(wǎng)絡(luò),并享受各類實時數(shù)據(jù)服務(wù)。

第五階段的實現(xiàn),需要政府、行業(yè)組織、車企、車路云技術(shù)公司等多方面開展協(xié)作,在政策、法規(guī)、標(biāo)準(zhǔn)等層面形成合力,共同推動數(shù)據(jù)上車大規(guī)模應(yīng)用,最終讓人們真實享受到車路云建設(shè)帶來的安全、效率、智能和便利。

此外,構(gòu)建互聯(lián)互通的車路云網(wǎng)絡(luò)形態(tài)有助于促進(jìn)產(chǎn)業(yè)規(guī)模發(fā)展。隨著國家層面政策推動與地方試點項目的成功經(jīng)驗積累,車路云網(wǎng)絡(luò)必將逐步擴(kuò)展至全國范圍,形成覆蓋高速公路、城市道路、鄉(xiāng)村公路的全域智能交通網(wǎng)絡(luò)。

未來,車路云一體化的定位將不再限于汽車產(chǎn)業(yè)本身,而是與交通、城市管理、通信等多領(lǐng)域深度融合的新型基礎(chǔ)設(shè)施體系,數(shù)據(jù)作為“橋梁”,構(gòu)建起高效協(xié)同的多業(yè)務(wù)系統(tǒng),從而全面提升城市的智能化、精細(xì)化管理水平。

每一次技術(shù)浪潮的來臨都伴隨著泡沫,但這并不意味著我們應(yīng)該回避。因為在這泡沫之下,隱藏著無數(shù)的機(jī)遇。創(chuàng)新往往發(fā)生在邊界之外,但又在跨界之中,來源于那些看似無用卻能激發(fā)無限可能的探索。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。