正在閱讀:

ChatGPT為自動駕駛指了條明路

掃一掃下載界面新聞APP

ChatGPT為自動駕駛指了條明路

搭上ChatGPT快車,自動駕駛迎來“突現(xiàn)”時刻。

文|科技新知 樟稻

編輯|伊頁

ChatGPT繼續(xù)如同黑洞一般,吸引著各大勢力布局。

外界看來,這是人工智能領(lǐng)域中的里程碑事件,代表著AI技術(shù)發(fā)展到臨界點,也同樣預(yù)示著原有的商業(yè)模式都有機(jī)會重塑一遍。

正如英偉達(dá)創(chuàng)始人黃仁勛所述,由于ChatGPT可以借助API方式被外界調(diào)用,意味著它可以接入各類軟件,它的出現(xiàn)也將像瀏覽器改變互聯(lián)網(wǎng)、蘋果應(yīng)用商店改變軟件行業(yè)一樣,對行業(yè)產(chǎn)生巨大的沖擊。

典型的如搜索引擎、云計算行業(yè),由于ChatGPT的橫空出世,原有的市場競爭態(tài)勢被打破。譬如百度可以借著文心一言,售賣其智能云服務(wù)。這對于場上原有的玩家而言,機(jī)遇與挑戰(zhàn)同在。

那么汽車行業(yè)呢?可以看到,近段時間內(nèi),車企們也頻頻在ChatGPT領(lǐng)域發(fā)聲:

先是,集度、長城、東風(fēng)日產(chǎn)、愛馳、零跑、吉利汽車、海馬汽車等近10家車企加入文心一言的朋友圈;緊接著,毫末智行宣布,自動駕駛認(rèn)知大模型正式升級為DriveGPT,在自動駕駛模型算法方面,全面應(yīng)用ChatGPT的模型和技術(shù)邏輯。

ChatGPT之于汽車行業(yè),乃至于更聚焦的自動駕駛領(lǐng)域,到底是放衛(wèi)星還是起飛點?

止于語音交互“雞肋”?

集度是最早公開打出“ChatGPT上車”概念的車企。

2月14日,集度ROBOVERSE三里屯體驗中心啟動會上,CEO夏一平率先宣布,將融合百度“文心一言”的能力,打造針對智能汽車場景的人工智能交互體驗,支持汽車實現(xiàn)自然交流的再進(jìn)階。

據(jù)了解,此次“文心一言”上車集度,是全球類ChatGPT技術(shù)首次應(yīng)用于智能汽車產(chǎn)品。

對于合作的具體細(xì)節(jié),現(xiàn)場并未公布。對此夏一平表示,“關(guān)于具體會有哪些功能,我只能說現(xiàn)在還在努力地去跟百度團(tuán)隊在對接,因為大家也知道文心一言將在三月份發(fā)布,之后才會去做我們的應(yīng)用?!?/p>

不過,結(jié)合其他資料,可以大膽猜測出,ChatGPT大概率率先應(yīng)用在語音交互方面。

畢竟,除了ChatGPT本身就是憑借其出色的交互能力出圈外,同一時期,長安汽車官方公號發(fā)布了題為《假如把ChatGPT裝進(jìn)長安深藍(lán)SL03》的文章,讓消費者自然而然聯(lián)想到車載智能語音交互功能上。

現(xiàn)階段,作為市場主流的交互方式,智能語音是智能座艙的標(biāo)配功能。根據(jù)消費者調(diào)研數(shù)據(jù),語音交互功能是座艙內(nèi)體驗比例和滿意程度最高的交互方式。

一般而言,主機(jī)廠將語音交互功能作為其產(chǎn)品智能化與差異化的核心體現(xiàn)。比如,梅賽德斯-奔馳的用戶體驗團(tuán)隊為其車載語音體驗的開發(fā)設(shè)定了三個目標(biāo):

1. 允許司機(jī)像對待另一個人一樣自然地交談。

2. 支持比典型語音服務(wù)更多的查詢類型。

3. 將語音更自然地集成到整體車內(nèi)體驗中,以便用戶可以在語音和觸摸控制之間無縫切換。

然而,現(xiàn)實往往很殘酷。由于車企對語音交互技術(shù)的掌握有所欠缺,導(dǎo)致車載語音系統(tǒng)的交互程度普遍較弱,體驗一般,大多時候淪為“雞肋”。

個中緣由,其實在于智能語音交互技術(shù)上,仍然存在難點。

智能語音交互的技術(shù)邏輯主要包括三大部分:識別、理解和執(zhí)行。目前提供解決方案的廠商中,識別部分已經(jīng)趨于成熟,識別率可以達(dá)到90%。行業(yè)的痛點主要集中在“理解”部分,大部分的車載語音交互系統(tǒng)在“理解”上并不智能。

舉個例子,此前傳統(tǒng)主機(jī)廠提供的前端語音交互功能,大部分采用命令控制。用戶需按照指定命令進(jìn)行交互,機(jī)器不具備語義理解能力。交互機(jī)械化,導(dǎo)致整個系統(tǒng)功能單一、命令詞單一。

那么,基于AI語言大模型,對任何領(lǐng)域的任何問題幾乎都能進(jìn)行整合回答的ChatGPT,能否給車載語音交互系統(tǒng)帶來新的可能?

答案是肯定的?!癈hatGPT在推理和學(xué)習(xí)能力上優(yōu)勢明顯,不僅可以用于理解和對話,更可以通過上下文交流和自我學(xué)習(xí),來實現(xiàn)輔助創(chuàng)作和知識進(jìn)化。這些能力同樣適用車載語音交互領(lǐng)域,融合對話智能技術(shù)、深度學(xué)習(xí)大模型技術(shù)、工程化能力、大數(shù)據(jù)的潛力,帶來更流暢、更有效的響應(yīng)……”思必馳汽車事業(yè)部產(chǎn)品總監(jiān)葛付江如此認(rèn)為。

從這點來看,如果汽車智能語音能夠植入類ChatGPT技術(shù),在高用戶黏性之下,未來的商業(yè)化前景將更加廣闊。

當(dāng)然,考慮到成本層面,又往往會將相關(guān)廠商拉回冰冷的現(xiàn)實。

根據(jù)Lambda官網(wǎng)數(shù)據(jù),微軟為OpenAI設(shè)計了一個包含10000塊Nvidia V100 GPU的分布式集群進(jìn)行GPT-3的模型訓(xùn)練,由于模型參數(shù)量較大(共1750億參數(shù)),訓(xùn)練完成共耗費30天,消耗總算力為 3640PF-days。以Nvidia Tesla V100的 Lambda GPU實例定價為1.50 美元/小時測算,GPT-3的完整訓(xùn)練成本將達(dá)到466萬美元/次。

自動駕駛的“突現(xiàn)”時刻

可以看出,ChatGPT短期內(nèi)更多是在智能化方面,賦能汽車行業(yè)發(fā)展,離完全意義上的自動駕駛還是有些距離。對此,ChatGPT自身也給出了如下回答:

作為一個語言模型,ChatGPT主要用于生成自然語言文本,如對話或文章等。自動駕駛技術(shù)需要處理的是感知、決策和控制等方面的問題,這些問題與ChatGPT所處理的文本生成任務(wù)并不相關(guān)。因此,在技術(shù)上,將自動駕駛技術(shù)與ChatGPT蹭熱點并不可行。但是,自動駕駛公司可以利用ChatGPT等自然語言處理技術(shù)來提高其產(chǎn)品的人機(jī)交互能力,以更好地滿足用戶需求。

實際上,這也是業(yè)內(nèi)主流的觀點。此前,中國電動汽車百人會論壇(2023)專家媒體溝通會上,副理事長歐陽明高院士表示,ChatGPT出來之后會引發(fā)人工智能新一輪的革命,對智能駕駛也會產(chǎn)生深遠(yuǎn)的影響。

“馬斯克做的就是基于這條技術(shù)路線,就是所謂的大模型、大數(shù)據(jù)、大算力……為了獲得大數(shù)據(jù),必須要大量賣智能輔助駕駛電動汽車,尤其是城市輔助駕駛今年可能大家會爭先恐后地上市,這也是很重要的技術(shù)趨勢?!?/p>

如何理解這段話?需要知曉的是,如果細(xì)究的話,ChatGPT成型背后有一個十分重要的基本原理能力—“突現(xiàn)能力(Emergent Ability)”,一般定義為“當(dāng)系統(tǒng)中的量變導(dǎo)致其行為發(fā)生質(zhì)變時出現(xiàn)的現(xiàn)象”。

簡單來說,在某個規(guī)模閾值以下,大模型性能接近隨機(jī),而超過該閾值,其性能遠(yuǎn)高于隨機(jī)。

各種測試表明,只有模型達(dá)到GPT3的規(guī)模,即參數(shù)大于1000億,模型才有可能形成“突現(xiàn)能力”。而正是在“突現(xiàn)能力”的基礎(chǔ)上,AI模型展示了類似人類的復(fù)雜推理和知識推理能力,這就是所謂“思維鏈(Chain-of-Thought)”。

基于“思維鏈”的推理能力,不需要再進(jìn)行復(fù)雜的訓(xùn)練,而只是在提問時附加給出提示,模型就能自動學(xué)習(xí),并做出相應(yīng)推理得到正確結(jié)果。徹底體現(xiàn)了AI模型對人類高級思維能力的模仿。

這個能力很可能是ChatGPT實現(xiàn)高度智能化的一個重要基礎(chǔ)。而這對于自動駕駛的路徑選擇來說,無疑會起到?jīng)Q定性的作用。

一直以來,圍繞自動駕駛技術(shù)的演進(jìn),業(yè)內(nèi)也一直存在兩大“流派”:其中,Waymo、小馬智行等是“躍進(jìn)式”的代表,策略是直接實現(xiàn)L4/L5級自動駕駛;特斯拉則是“漸進(jìn)式”路線的代表,策略是先在量產(chǎn)車上優(yōu)先搭載L2/L3級輔助駕駛,收集數(shù)據(jù)后再向L4/L5進(jìn)發(fā)。

此前,雙方陣營涇渭分明,近兩年情況則有所改變。不少L4公司開始“降維”進(jìn)入L2領(lǐng)域。例如,Robobus領(lǐng)域的輕舟智航,推出了高階自動駕駛解決方案;文遠(yuǎn)知行則是獲得博世投資,將開展應(yīng)用于乘用車的L2-L3級自動駕駛軟件的開發(fā)。

作為對比的是,“漸進(jìn)式”玩家中,特斯拉已經(jīng)生產(chǎn)了數(shù)百萬輛汽車,其搭載的輔助駕駛系統(tǒng)Autopilot,將收集到數(shù)十億英里的路況和駕駛數(shù)據(jù)。上述這些行業(yè)動向,似乎都在宣告,漸進(jìn)式路線階段性的勝利。

當(dāng)然,業(yè)內(nèi)也有不同的看法,認(rèn)為當(dāng)下只是L2領(lǐng)域的勝利,能否漸進(jìn)到L4尚且未知。而眼下,ChatGPT的橫空出世則讓行業(yè)認(rèn)識到,不斷去累積公里數(shù),一直這么跑下去是可以獲得更高級別的自動駕駛技術(shù)的跨越,量變能夠引起質(zhì)變,自動駕駛也有機(jī)會迎來“突現(xiàn)”時刻。

這才是ChatGPT對于自動駕駛的重要意義,某種程度上,算是為自動駕駛指了條明路。

參考資料:

TechWeb《ChatGPT上“車”?沒那么簡單》

蓋世汽車社區(qū)《ChatGPT,打了人車交互的“臉”?》

鈦媒體《爆火的ChatGPT,能讓自動駕駛更快實現(xiàn)嗎?》

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

ChatGPT為自動駕駛指了條明路

搭上ChatGPT快車,自動駕駛迎來“突現(xiàn)”時刻。

文|科技新知 樟稻

編輯|伊頁

ChatGPT繼續(xù)如同黑洞一般,吸引著各大勢力布局。

外界看來,這是人工智能領(lǐng)域中的里程碑事件,代表著AI技術(shù)發(fā)展到臨界點,也同樣預(yù)示著原有的商業(yè)模式都有機(jī)會重塑一遍。

正如英偉達(dá)創(chuàng)始人黃仁勛所述,由于ChatGPT可以借助API方式被外界調(diào)用,意味著它可以接入各類軟件,它的出現(xiàn)也將像瀏覽器改變互聯(lián)網(wǎng)、蘋果應(yīng)用商店改變軟件行業(yè)一樣,對行業(yè)產(chǎn)生巨大的沖擊。

典型的如搜索引擎、云計算行業(yè),由于ChatGPT的橫空出世,原有的市場競爭態(tài)勢被打破。譬如百度可以借著文心一言,售賣其智能云服務(wù)。這對于場上原有的玩家而言,機(jī)遇與挑戰(zhàn)同在。

那么汽車行業(yè)呢?可以看到,近段時間內(nèi),車企們也頻頻在ChatGPT領(lǐng)域發(fā)聲:

先是,集度、長城、東風(fēng)日產(chǎn)、愛馳、零跑、吉利汽車、海馬汽車等近10家車企加入文心一言的朋友圈;緊接著,毫末智行宣布,自動駕駛認(rèn)知大模型正式升級為DriveGPT,在自動駕駛模型算法方面,全面應(yīng)用ChatGPT的模型和技術(shù)邏輯。

ChatGPT之于汽車行業(yè),乃至于更聚焦的自動駕駛領(lǐng)域,到底是放衛(wèi)星還是起飛點?

止于語音交互“雞肋”?

集度是最早公開打出“ChatGPT上車”概念的車企。

2月14日,集度ROBOVERSE三里屯體驗中心啟動會上,CEO夏一平率先宣布,將融合百度“文心一言”的能力,打造針對智能汽車場景的人工智能交互體驗,支持汽車實現(xiàn)自然交流的再進(jìn)階。

據(jù)了解,此次“文心一言”上車集度,是全球類ChatGPT技術(shù)首次應(yīng)用于智能汽車產(chǎn)品。

對于合作的具體細(xì)節(jié),現(xiàn)場并未公布。對此夏一平表示,“關(guān)于具體會有哪些功能,我只能說現(xiàn)在還在努力地去跟百度團(tuán)隊在對接,因為大家也知道文心一言將在三月份發(fā)布,之后才會去做我們的應(yīng)用?!?/p>

不過,結(jié)合其他資料,可以大膽猜測出,ChatGPT大概率率先應(yīng)用在語音交互方面。

畢竟,除了ChatGPT本身就是憑借其出色的交互能力出圈外,同一時期,長安汽車官方公號發(fā)布了題為《假如把ChatGPT裝進(jìn)長安深藍(lán)SL03》的文章,讓消費者自然而然聯(lián)想到車載智能語音交互功能上。

現(xiàn)階段,作為市場主流的交互方式,智能語音是智能座艙的標(biāo)配功能。根據(jù)消費者調(diào)研數(shù)據(jù),語音交互功能是座艙內(nèi)體驗比例和滿意程度最高的交互方式。

一般而言,主機(jī)廠將語音交互功能作為其產(chǎn)品智能化與差異化的核心體現(xiàn)。比如,梅賽德斯-奔馳的用戶體驗團(tuán)隊為其車載語音體驗的開發(fā)設(shè)定了三個目標(biāo):

1. 允許司機(jī)像對待另一個人一樣自然地交談。

2. 支持比典型語音服務(wù)更多的查詢類型。

3. 將語音更自然地集成到整體車內(nèi)體驗中,以便用戶可以在語音和觸摸控制之間無縫切換。

然而,現(xiàn)實往往很殘酷。由于車企對語音交互技術(shù)的掌握有所欠缺,導(dǎo)致車載語音系統(tǒng)的交互程度普遍較弱,體驗一般,大多時候淪為“雞肋”。

個中緣由,其實在于智能語音交互技術(shù)上,仍然存在難點。

智能語音交互的技術(shù)邏輯主要包括三大部分:識別、理解和執(zhí)行。目前提供解決方案的廠商中,識別部分已經(jīng)趨于成熟,識別率可以達(dá)到90%。行業(yè)的痛點主要集中在“理解”部分,大部分的車載語音交互系統(tǒng)在“理解”上并不智能。

舉個例子,此前傳統(tǒng)主機(jī)廠提供的前端語音交互功能,大部分采用命令控制。用戶需按照指定命令進(jìn)行交互,機(jī)器不具備語義理解能力。交互機(jī)械化,導(dǎo)致整個系統(tǒng)功能單一、命令詞單一。

那么,基于AI語言大模型,對任何領(lǐng)域的任何問題幾乎都能進(jìn)行整合回答的ChatGPT,能否給車載語音交互系統(tǒng)帶來新的可能?

答案是肯定的?!癈hatGPT在推理和學(xué)習(xí)能力上優(yōu)勢明顯,不僅可以用于理解和對話,更可以通過上下文交流和自我學(xué)習(xí),來實現(xiàn)輔助創(chuàng)作和知識進(jìn)化。這些能力同樣適用車載語音交互領(lǐng)域,融合對話智能技術(shù)、深度學(xué)習(xí)大模型技術(shù)、工程化能力、大數(shù)據(jù)的潛力,帶來更流暢、更有效的響應(yīng)……”思必馳汽車事業(yè)部產(chǎn)品總監(jiān)葛付江如此認(rèn)為。

從這點來看,如果汽車智能語音能夠植入類ChatGPT技術(shù),在高用戶黏性之下,未來的商業(yè)化前景將更加廣闊。

當(dāng)然,考慮到成本層面,又往往會將相關(guān)廠商拉回冰冷的現(xiàn)實。

根據(jù)Lambda官網(wǎng)數(shù)據(jù),微軟為OpenAI設(shè)計了一個包含10000塊Nvidia V100 GPU的分布式集群進(jìn)行GPT-3的模型訓(xùn)練,由于模型參數(shù)量較大(共1750億參數(shù)),訓(xùn)練完成共耗費30天,消耗總算力為 3640PF-days。以Nvidia Tesla V100的 Lambda GPU實例定價為1.50 美元/小時測算,GPT-3的完整訓(xùn)練成本將達(dá)到466萬美元/次。

自動駕駛的“突現(xiàn)”時刻

可以看出,ChatGPT短期內(nèi)更多是在智能化方面,賦能汽車行業(yè)發(fā)展,離完全意義上的自動駕駛還是有些距離。對此,ChatGPT自身也給出了如下回答:

作為一個語言模型,ChatGPT主要用于生成自然語言文本,如對話或文章等。自動駕駛技術(shù)需要處理的是感知、決策和控制等方面的問題,這些問題與ChatGPT所處理的文本生成任務(wù)并不相關(guān)。因此,在技術(shù)上,將自動駕駛技術(shù)與ChatGPT蹭熱點并不可行。但是,自動駕駛公司可以利用ChatGPT等自然語言處理技術(shù)來提高其產(chǎn)品的人機(jī)交互能力,以更好地滿足用戶需求。

實際上,這也是業(yè)內(nèi)主流的觀點。此前,中國電動汽車百人會論壇(2023)專家媒體溝通會上,副理事長歐陽明高院士表示,ChatGPT出來之后會引發(fā)人工智能新一輪的革命,對智能駕駛也會產(chǎn)生深遠(yuǎn)的影響。

“馬斯克做的就是基于這條技術(shù)路線,就是所謂的大模型、大數(shù)據(jù)、大算力……為了獲得大數(shù)據(jù),必須要大量賣智能輔助駕駛電動汽車,尤其是城市輔助駕駛今年可能大家會爭先恐后地上市,這也是很重要的技術(shù)趨勢?!?/p>

如何理解這段話?需要知曉的是,如果細(xì)究的話,ChatGPT成型背后有一個十分重要的基本原理能力—“突現(xiàn)能力(Emergent Ability)”,一般定義為“當(dāng)系統(tǒng)中的量變導(dǎo)致其行為發(fā)生質(zhì)變時出現(xiàn)的現(xiàn)象”。

簡單來說,在某個規(guī)模閾值以下,大模型性能接近隨機(jī),而超過該閾值,其性能遠(yuǎn)高于隨機(jī)。

各種測試表明,只有模型達(dá)到GPT3的規(guī)模,即參數(shù)大于1000億,模型才有可能形成“突現(xiàn)能力”。而正是在“突現(xiàn)能力”的基礎(chǔ)上,AI模型展示了類似人類的復(fù)雜推理和知識推理能力,這就是所謂“思維鏈(Chain-of-Thought)”。

基于“思維鏈”的推理能力,不需要再進(jìn)行復(fù)雜的訓(xùn)練,而只是在提問時附加給出提示,模型就能自動學(xué)習(xí),并做出相應(yīng)推理得到正確結(jié)果。徹底體現(xiàn)了AI模型對人類高級思維能力的模仿。

這個能力很可能是ChatGPT實現(xiàn)高度智能化的一個重要基礎(chǔ)。而這對于自動駕駛的路徑選擇來說,無疑會起到?jīng)Q定性的作用。

一直以來,圍繞自動駕駛技術(shù)的演進(jìn),業(yè)內(nèi)也一直存在兩大“流派”:其中,Waymo、小馬智行等是“躍進(jìn)式”的代表,策略是直接實現(xiàn)L4/L5級自動駕駛;特斯拉則是“漸進(jìn)式”路線的代表,策略是先在量產(chǎn)車上優(yōu)先搭載L2/L3級輔助駕駛,收集數(shù)據(jù)后再向L4/L5進(jìn)發(fā)。

此前,雙方陣營涇渭分明,近兩年情況則有所改變。不少L4公司開始“降維”進(jìn)入L2領(lǐng)域。例如,Robobus領(lǐng)域的輕舟智航,推出了高階自動駕駛解決方案;文遠(yuǎn)知行則是獲得博世投資,將開展應(yīng)用于乘用車的L2-L3級自動駕駛軟件的開發(fā)。

作為對比的是,“漸進(jìn)式”玩家中,特斯拉已經(jīng)生產(chǎn)了數(shù)百萬輛汽車,其搭載的輔助駕駛系統(tǒng)Autopilot,將收集到數(shù)十億英里的路況和駕駛數(shù)據(jù)。上述這些行業(yè)動向,似乎都在宣告,漸進(jìn)式路線階段性的勝利。

當(dāng)然,業(yè)內(nèi)也有不同的看法,認(rèn)為當(dāng)下只是L2領(lǐng)域的勝利,能否漸進(jìn)到L4尚且未知。而眼下,ChatGPT的橫空出世則讓行業(yè)認(rèn)識到,不斷去累積公里數(shù),一直這么跑下去是可以獲得更高級別的自動駕駛技術(shù)的跨越,量變能夠引起質(zhì)變,自動駕駛也有機(jī)會迎來“突現(xiàn)”時刻。

這才是ChatGPT對于自動駕駛的重要意義,某種程度上,算是為自動駕駛指了條明路。

參考資料:

TechWeb《ChatGPT上“車”?沒那么簡單》

蓋世汽車社區(qū)《ChatGPT,打了人車交互的“臉”?》

鈦媒體《爆火的ChatGPT,能讓自動駕駛更快實現(xiàn)嗎?》

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。