正在閱讀:

汽車(chē)卷入百模大戰(zhàn)

掃一掃下載界面新聞APP

汽車(chē)卷入百模大戰(zhàn)

軟件定義汽車(chē)已經(jīng)過(guò)時(shí),AI定義汽車(chē)才是熱點(diǎn)。

圖片來(lái)源:界面新聞 匡達(dá)

文|智駕網(wǎng) 黃華丹

“物以稀為貴,現(xiàn)在一臺(tái)8卡的A800服務(wù)器,已經(jīng)賣(mài)到了140萬(wàn)?!蹦吃品?wù)商的業(yè)務(wù)人員表示?!艾F(xiàn)在大模型的問(wèn)題主要是兩個(gè),一是算力,一是落地的場(chǎng)景。”

A800已經(jīng)是英偉達(dá)A100的閹割版,但隨著國(guó)內(nèi)百模大戰(zhàn),英偉達(dá)GPU的需求水漲船高,專(zhuān)供中國(guó)市場(chǎng)的A800,H800價(jià)格也已經(jīng)超過(guò)了A100,H100原版售價(jià),且依然一卡難求。限于臺(tái)積電產(chǎn)能,據(jù)稱A800,H800的交期已經(jīng)排到了年底或明年。

此前有報(bào)道稱字節(jié)跳動(dòng)已經(jīng)像向英偉達(dá)訂購(gòu)了價(jià)值10億美元的GPU產(chǎn)品,而日前,英國(guó)《金融時(shí)報(bào)》又援引接近英偉達(dá)的相關(guān)人士發(fā)言稱,百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴向英偉達(dá)下單訂購(gòu)了50億美元的芯片。

50億美元什么概念?英偉達(dá)2022年總營(yíng)收為269.14億美元,僅這一筆交易,就占了其全年?duì)I收的18.6%。折算成人民幣約為362億,以車(chē)企為對(duì)比,2022全年小鵬營(yíng)收268.55億,這筆費(fèi)用超過(guò)小鵬全年收入。

而作為本輪AI浪潮最大的獲益者,賣(mài)鏟人英偉達(dá)在大賣(mài)之外,也在進(jìn)一步推出更先進(jìn)的產(chǎn)品。

剛剛過(guò)去的世界頂級(jí)計(jì)算機(jī)圖形學(xué)會(huì)議SIGGRAPH上,黃仁勛用大量篇幅介紹了新一代GH200超級(jí)芯片平臺(tái)。

除了為NVIDIA GH200 Grace Hopper配備更加先進(jìn)的HBM3e內(nèi)存外,下一代GH200超級(jí)芯片平臺(tái)還將具備連接多個(gè)GPU的能力,從而實(shí)現(xiàn)更強(qiáng)大的計(jì)算能力,可處理世界上最復(fù)雜的生成式工作負(fù)載。

從數(shù)據(jù)來(lái)看,HBM3e內(nèi)存要比當(dāng)前的HBM3快50%,10T/s的組合帶寬,使其可運(yùn)行比上一版本大3.5倍的模型,同時(shí)通過(guò)3倍更快的內(nèi)存帶寬提高性能。預(yù)計(jì)將于2024年第二季度推出。

黃仁勛的自信是,英偉達(dá)高性能GPU,屬于“買(mǎi)得越多,省得越多”。但在當(dāng)前的地緣政治背景下,后續(xù)在中國(guó)市場(chǎng)會(huì)有怎樣的發(fā)展,暫時(shí)還是個(gè)未知數(shù)。

與之形成鮮明對(duì)比的,是一大批初創(chuàng)企業(yè)的退潮。Wind數(shù)據(jù)顯示,今年A股中24家AIGC概念股合計(jì)已發(fā)生67筆減持。

在大洋彼岸的硅谷,同樣是熱潮過(guò)后的冷靜。根據(jù)極客公園對(duì)硅谷多名相關(guān)人員的采訪,在ChatGPT爆火半年后,硅谷巨頭們經(jīng)歷了最初的恐慌,已經(jīng)完成對(duì)OpenAI的祛媚,開(kāi)始根據(jù)自身已有優(yōu)勢(shì)擴(kuò)展布局,尋找大模型能為之助力,甚至可能發(fā)生顛覆式創(chuàng)新的方向。也就是說(shuō),開(kāi)始根據(jù)原有優(yōu)勢(shì)業(yè)務(wù),尋找真正能讓大模型落地的場(chǎng)景。

例如Meta是將大模型視為下一代計(jì)算平臺(tái),開(kāi)放其Llama2商業(yè)許可,并與微軟Azure合作對(duì)外提供服務(wù),與高通合作推進(jìn)在終端運(yùn)行Llama2,即同時(shí)提供to B和to C的能力。亞馬遜則圍繞其B端業(yè)務(wù)推出了大模型服務(wù)Amazon Bedrock,既包括自研的大模型,同時(shí)也與Stability AI、A121 Labs等基礎(chǔ)模型提供商廣泛合作,幫助企業(yè)靈活構(gòu)建生成式AI應(yīng)用,降低開(kāi)發(fā)者使用門(mén)檻。

巨頭們的業(yè)務(wù)開(kāi)始向大模型服務(wù)轉(zhuǎn)型,而對(duì)更多初創(chuàng)企業(yè)來(lái)說(shuō),利用大模型實(shí)現(xiàn)垂直領(lǐng)域的應(yīng)用是更現(xiàn)實(shí)的落地路徑。

總之,很少有人再將做一個(gè)通用大模型視為目標(biāo)。

01 上車(chē)是大模型落地的一大場(chǎng)景

打造垂直領(lǐng)域的專(zhuān)業(yè)模型,從目前來(lái)看,直接上云借助巨頭的算力和能力進(jìn)行更便捷的研發(fā)或是一大趨勢(shì)。

模型的訓(xùn)練需要消耗大量算力,無(wú)論是否有實(shí)力采購(gòu)芯片,或者是否能買(mǎi)到芯片,對(duì)一般企業(yè)都是一大考驗(yàn)。同時(shí),也是對(duì)算力的巨大浪費(fèi)。上云,是更好的選擇。包括前文提及的亞馬遜云,以及阿里云、華為云和騰訊云等均提供了基于云服務(wù)開(kāi)發(fā)大模型的能力。

對(duì)于大部分并沒(méi)有足夠的實(shí)力和精力去自己構(gòu)建數(shù)據(jù)中心的企業(yè)來(lái)說(shuō),在云上開(kāi)發(fā)成為更好的選擇。這也導(dǎo)致各家云巨頭對(duì)算力的需求猛增。一定意義上,這些互聯(lián)網(wǎng)巨頭成為了各企業(yè)的算力提供商。

亞馬遜云能為大模型上車(chē)提供的服務(wù)包括幫助主機(jī)廠進(jìn)行軟件開(kāi)發(fā),以及設(shè)計(jì)、訓(xùn)練和測(cè)試自動(dòng)駕駛系統(tǒng)。而此前華為云發(fā)布烏蘭察布汽車(chē)專(zhuān)區(qū)時(shí)推出的自動(dòng)駕駛開(kāi)發(fā)平臺(tái),則可實(shí)現(xiàn)全流程覆蓋智駕開(kāi)發(fā)、仿真測(cè)試、實(shí)車(chē)測(cè)試、量產(chǎn)上車(chē)等環(huán)節(jié)。

包括英偉達(dá),也同樣為需要開(kāi)發(fā)大模型業(yè)務(wù)的企業(yè)提供了大模型開(kāi)發(fā)平臺(tái)工具NVIDIA AI Workbench,來(lái)幫助開(kāi)發(fā)和部署生成式AI模型。概括來(lái)說(shuō),AI Workbench為開(kāi)發(fā)者提供了一個(gè)統(tǒng)一且易于使用的工具包,能夠快速在PC或工作站上創(chuàng)建、測(cè)試和微調(diào)模型,并無(wú)縫擴(kuò)展到幾乎任何數(shù)據(jù)中心、公有云或NVIDIA DGX Cloud上。

天津大學(xué)無(wú)人駕駛汽車(chē)交叉研究中心主任謝輝教授認(rèn)為,通用大模型和專(zhuān)業(yè)模型的區(qū)別就像是本科生與工程師的區(qū)別,ChatGPT像是將計(jì)算機(jī)培養(yǎng)到了大學(xué)畢業(yè)的智能水平,專(zhuān)業(yè)模型就像是各個(gè)領(lǐng)域?qū)I(yè)的工程師。

而上車(chē),就是一個(gè)將大模型運(yùn)用于垂直領(lǐng)域的落地場(chǎng)景。

我們已經(jīng)看到無(wú)數(shù)關(guān)于大模型上車(chē)的宣傳。從百度、阿里、華為等巨頭宣布在車(chē)端接入其自研大模型,到吉利、廣汽等車(chē)企表示將自研大模型上車(chē),也有如毫末這樣的智駕公司推出針對(duì)自動(dòng)駕駛的模型。

綜觀各家大模型上車(chē),其應(yīng)用主要可分為兩大領(lǐng)域,即智能座艙和自動(dòng)駕駛。

斑馬智行CEO張春暉在上海車(chē)展期間的發(fā)布會(huì)上表示,汽車(chē)是大模型最好的落地場(chǎng)景。

從目前的市場(chǎng)表現(xiàn)來(lái)看,大模型上車(chē)熱鬧非凡,但實(shí)際的發(fā)展如何,還有待驗(yàn)證。

02 智能座艙還需要實(shí)際落地的樣本

大模型上車(chē)的風(fēng),首先是從百度文心一言吹起的。此后,包括阿里通義千問(wèn),華為盤(pán)古大模型,商湯日日新、科大訊飛星火大模型等也先后發(fā)布并宣布上車(chē)。發(fā)展到今天,廣汽、吉利、理想等車(chē)企也開(kāi)始宣布將自研AI模型上車(chē)。

相較于自動(dòng)駕駛,大模型在智能座艙的落地普遍被認(rèn)為更加容易,也是大部分宣傳大模型上車(chē)的企業(yè)宣傳的方向。但從目前發(fā)展來(lái)看,尚沒(méi)有車(chē)企真正實(shí)現(xiàn)大模型上車(chē)的量產(chǎn)交付。

一般認(rèn)為,大模型接入智能座艙將加速軟件能力的升級(jí),推動(dòng)座艙實(shí)現(xiàn)人機(jī)主動(dòng)式交互。例如,通過(guò)增強(qiáng)對(duì)乘客語(yǔ)音語(yǔ)義的理解能力,讓車(chē)載語(yǔ)音實(shí)現(xiàn)更深層次的個(gè)性化和自然擬人的交互,而且,還可以實(shí)現(xiàn)對(duì)駕駛員在視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多模態(tài)應(yīng)用上的識(shí)別和響應(yīng),形成深度的人機(jī)主動(dòng)式互動(dòng)體驗(yàn),并根據(jù)駕駛員的表現(xiàn)為其提供更智能化的服務(wù)。

最接近落地的是6月奔馳宣布在美國(guó)市場(chǎng)為配置MBUX的車(chē)型接入ChatGPT,開(kāi)啟為期三月的測(cè)試。百度則在五月測(cè)試了文心大模型上車(chē)效果。我們可以從這兩場(chǎng)最接近真實(shí)上車(chē)的測(cè)試一窺大模型接入座艙將帶來(lái)的改變。

從海外記者的體驗(yàn)來(lái)看,接入ChatGPT的奔馳語(yǔ)音助手實(shí)現(xiàn)了更為流暢對(duì)話的能力,還可根據(jù)需要提供建議。不過(guò),整體反應(yīng)速度相對(duì)來(lái)說(shuō)還是比較滯后。奔馳表示國(guó)內(nèi)車(chē)型上并沒(méi)有接入ChatGPT的計(jì)劃。

而搭載文心大模型的百度Apollo表現(xiàn)相對(duì)更加流暢,而且,也做到了對(duì)傳統(tǒng)AIGC能力的覆蓋,例如,生成文案、圖像等,還可以切換人設(shè),分辨不同聲音來(lái)源,同時(shí)處理多個(gè)指令。

但目前,這套系統(tǒng)也尚未實(shí)現(xiàn)真正的上車(chē)落地。此前百度曾表示包括長(zhǎng)安、紅旗等品牌均將接入文心大模型,但目前并沒(méi)有相關(guān)信息。

最新消息是8月份百度Apollo宣布長(zhǎng)城汽車(chē)、億咖通科技成為首批文心大模型智艙應(yīng)用探索伙伴。百度Apollo已分別與長(zhǎng)城汽車(chē)、億咖通科技基于大模型能力圍繞車(chē)載交互場(chǎng)景開(kāi)展探索和實(shí)踐,完成多項(xiàng)創(chuàng)新功能在量產(chǎn)車(chē)型平臺(tái)上的驗(yàn)證,部分功能未來(lái)有望在長(zhǎng)城、領(lǐng)克、smart等量產(chǎn)車(chē)型上率先落地。從措辭來(lái)看,何時(shí)落地尚未確定。

智駕網(wǎng)也詢問(wèn)了多家曾發(fā)布大模型上車(chē)計(jì)劃的企業(yè)。在上海車(chē)展期間宣布將接入阿里大模型通義千問(wèn)的斑馬智行,同樣表示關(guān)于大模型的具體進(jìn)度并不清楚,但九月初應(yīng)該會(huì)有一波新的進(jìn)展公布。

商湯與科大訊飛也尚無(wú)明確的相關(guān)披露。而華為的盤(pán)古大模型則已接入鴻蒙4系統(tǒng),不過(guò)在車(chē)端,預(yù)告首搭鴻蒙4座艙系統(tǒng)的是將于今年三季度正式發(fā)布的與奇瑞合作的Luxeed。

吉利和廣汽目前則處于宣布將上車(chē)AI大模型的階段。理想汽車(chē)也表示自研了Mind GPT,并將AI技術(shù)引入到車(chē)機(jī)理想同學(xué)中。

大模型上車(chē)進(jìn)行得如火如荼,但可以猜測(cè)的是,真正要實(shí)現(xiàn)上車(chē)后達(dá)到自然的多模態(tài)交互,似乎并沒(méi)有普遍宣傳的那樣簡(jiǎn)單。

03 大模型將助力自動(dòng)駕駛落地,但為時(shí)尚早

而在自動(dòng)駕駛領(lǐng)域,目前明確提出相關(guān)模型的是毫末智行的DriveGPT。其原理是按照ChatGPT的格式將輸入圖像轉(zhuǎn)換為場(chǎng)景的Token化表達(dá),再用強(qiáng)化學(xué)習(xí)的思想去輸出自動(dòng)駕駛的控制量。

毫末智行技術(shù)副總裁艾銳表示,目前,DriveGPT的應(yīng)用,對(duì)于汽車(chē)算力的需求還是太大,還需要一定的時(shí)間才能解決。同時(shí)在算力提升后,對(duì)汽車(chē)的能耗也會(huì)帶來(lái)不小的挑戰(zhàn),未來(lái)需要找到一種低成本的兌現(xiàn)方式。從目前來(lái)看,這種能力只能部署在云端,讓大家通過(guò)聯(lián)網(wǎng)去使用。

同濟(jì)大學(xué)汽車(chē)學(xué)院黃巖軍教授則認(rèn)為,DriveGPT在駕駛場(chǎng)景識(shí)別等類(lèi)似ChatGPT的對(duì)話生成場(chǎng)景中效果是很好的,能很好地識(shí)別輸入圖像的駕駛場(chǎng)景。但自動(dòng)駕駛并不是自然語(yǔ)言處理,無(wú)法將復(fù)雜的環(huán)境動(dòng)力學(xué)信息理解簡(jiǎn)化為對(duì)話的形式,以Token的方式對(duì)自動(dòng)駕駛汽車(chē)進(jìn)行控制。因?yàn)榄h(huán)境中存在的語(yǔ)義信息非常多,現(xiàn)在自動(dòng)駕駛的做法是通過(guò)感知模塊將類(lèi)似的信息提取出來(lái),再交給規(guī)劃控制模塊。目前在云端運(yùn)行的是自動(dòng)化標(biāo)注、駕駛場(chǎng)景識(shí)別、駕駛場(chǎng)景重構(gòu)等功能,這對(duì)于之后打破自動(dòng)駕駛壁壘很有必要,不過(guò)這些功能在云端運(yùn)行已經(jīng)足夠了。

這也是目前已經(jīng)推出了自動(dòng)駕駛相關(guān)服務(wù)的云廠商所能實(shí)現(xiàn)的能力。亞馬遜云表示主機(jī)廠可以借助生成式AI來(lái)進(jìn)行模擬,以測(cè)試車(chē)輛對(duì)各種駕駛場(chǎng)景的響應(yīng)。這些場(chǎng)景可能是極小概率會(huì)發(fā)生的情況,或者在現(xiàn)實(shí)世界比較極端的情況,測(cè)試并不安全(比如,在夜間、雨天和黑暗中差點(diǎn)撞上橫穿馬路的人)。模擬測(cè)試不僅可以提高測(cè)試效率,還將使汽車(chē)企業(yè)得以創(chuàng)建更豐富的測(cè)試場(chǎng)景,并提高整個(gè)駕駛系統(tǒng)的能力。

而關(guān)于大模型對(duì)標(biāo)注的促進(jìn)作用,理想汽車(chē)?yán)钕朐e例解釋過(guò):僅以自動(dòng)駕駛的圖片標(biāo)定為例,過(guò)去一年需要做大概1000萬(wàn)幀圖像的人工標(biāo)定,成本6-8元每張,一年成本接近一億。而使用大模型軟件后,通過(guò)自動(dòng)化標(biāo)定,過(guò)去需要一年做的事情,基本上3個(gè)小時(shí)就能完成,效率是人的1000倍。

此前,地平線聯(lián)合創(chuàng)始人黃暢也曾在接受采訪時(shí)表示,GPT在自動(dòng)駕駛場(chǎng)景中最先應(yīng)用的很可能是環(huán)境模型的預(yù)測(cè)和交互式規(guī)劃。這個(gè)場(chǎng)景不需要特別大規(guī)模的參數(shù)模型,因?yàn)樗皇且粋€(gè)完整的端到端,尤其因?yàn)樗P(guān)注于預(yù)測(cè)和規(guī)劃,不用花太多精力在感知這個(gè)層面上,因此很可能在百TOPS級(jí)別的算力平臺(tái)上就能應(yīng)用,三到五年內(nèi)就可以初步上線。

而在完整的端到端緩解,從感知到定位地圖到規(guī)控,整個(gè)端到端的閉環(huán)做出來(lái),黃暢認(rèn)為需要一個(gè)更大規(guī)模的參數(shù)模型,大概需要五到十年的時(shí)間。

黃巖軍則認(rèn)為,在將生成式大模型運(yùn)用于自動(dòng)駕駛中時(shí),需要首先提出新概念新算法,模擬神經(jīng)系統(tǒng)建立類(lèi)腦模型,以創(chuàng)新帶動(dòng)發(fā)展;其次需要使用面向通用人工智能的生成式方法對(duì)感知對(duì)預(yù)測(cè)一整套流程進(jìn)行建模,全面表征環(huán)境動(dòng)力學(xué)信息;最后,在大模型建模完成之后,需要利用數(shù)據(jù)閉環(huán)的方式,不斷在長(zhǎng)尾場(chǎng)景進(jìn)行學(xué)習(xí),使模型得到自我進(jìn)化,才能讓大模型更好的應(yīng)用于自動(dòng)駕駛當(dāng)中。

也就是說(shuō),目前用于自動(dòng)駕駛的模型主要還是在標(biāo)注、場(chǎng)景識(shí)別和模擬這些數(shù)據(jù)層面回傳功能的實(shí)現(xiàn),真正要用到最后規(guī)控決策的還無(wú)法實(shí)現(xiàn)。

但關(guān)于大模型在自動(dòng)駕駛中的應(yīng)用前景,黃巖軍顯然持樂(lè)觀態(tài)度。

“我認(rèn)為,隨著通用人工智能技術(shù)的發(fā)展,未來(lái)十五年到未來(lái)二十年,生成式大模型能夠以獨(dú)特的姿態(tài)站上自動(dòng)駕駛領(lǐng)域之巔,解決目前自動(dòng)駕駛的各種邊緣場(chǎng)景,實(shí)現(xiàn)自動(dòng)駕駛的閉環(huán)自進(jìn)化?!?/p>

大模型的混戰(zhàn)仍在繼續(xù),對(duì)芯片和算力的需求似乎也尚未達(dá)到一個(gè)穩(wěn)定的狀態(tài)。而要真正看到大模型在相關(guān)場(chǎng)景實(shí)現(xiàn)質(zhì)的飛躍,顯然也還需要時(shí)間。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

汽車(chē)卷入百模大戰(zhàn)

軟件定義汽車(chē)已經(jīng)過(guò)時(shí),AI定義汽車(chē)才是熱點(diǎn)。

圖片來(lái)源:界面新聞 匡達(dá)

文|智駕網(wǎng) 黃華丹

“物以稀為貴,現(xiàn)在一臺(tái)8卡的A800服務(wù)器,已經(jīng)賣(mài)到了140萬(wàn)?!蹦吃品?wù)商的業(yè)務(wù)人員表示?!艾F(xiàn)在大模型的問(wèn)題主要是兩個(gè),一是算力,一是落地的場(chǎng)景?!?/p>

A800已經(jīng)是英偉達(dá)A100的閹割版,但隨著國(guó)內(nèi)百模大戰(zhàn),英偉達(dá)GPU的需求水漲船高,專(zhuān)供中國(guó)市場(chǎng)的A800,H800價(jià)格也已經(jīng)超過(guò)了A100,H100原版售價(jià),且依然一卡難求。限于臺(tái)積電產(chǎn)能,據(jù)稱A800,H800的交期已經(jīng)排到了年底或明年。

此前有報(bào)道稱字節(jié)跳動(dòng)已經(jīng)像向英偉達(dá)訂購(gòu)了價(jià)值10億美元的GPU產(chǎn)品,而日前,英國(guó)《金融時(shí)報(bào)》又援引接近英偉達(dá)的相關(guān)人士發(fā)言稱,百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴向英偉達(dá)下單訂購(gòu)了50億美元的芯片。

50億美元什么概念?英偉達(dá)2022年總營(yíng)收為269.14億美元,僅這一筆交易,就占了其全年?duì)I收的18.6%。折算成人民幣約為362億,以車(chē)企為對(duì)比,2022全年小鵬營(yíng)收268.55億,這筆費(fèi)用超過(guò)小鵬全年收入。

而作為本輪AI浪潮最大的獲益者,賣(mài)鏟人英偉達(dá)在大賣(mài)之外,也在進(jìn)一步推出更先進(jìn)的產(chǎn)品。

剛剛過(guò)去的世界頂級(jí)計(jì)算機(jī)圖形學(xué)會(huì)議SIGGRAPH上,黃仁勛用大量篇幅介紹了新一代GH200超級(jí)芯片平臺(tái)。

除了為NVIDIA GH200 Grace Hopper配備更加先進(jìn)的HBM3e內(nèi)存外,下一代GH200超級(jí)芯片平臺(tái)還將具備連接多個(gè)GPU的能力,從而實(shí)現(xiàn)更強(qiáng)大的計(jì)算能力,可處理世界上最復(fù)雜的生成式工作負(fù)載。

從數(shù)據(jù)來(lái)看,HBM3e內(nèi)存要比當(dāng)前的HBM3快50%,10T/s的組合帶寬,使其可運(yùn)行比上一版本大3.5倍的模型,同時(shí)通過(guò)3倍更快的內(nèi)存帶寬提高性能。預(yù)計(jì)將于2024年第二季度推出。

黃仁勛的自信是,英偉達(dá)高性能GPU,屬于“買(mǎi)得越多,省得越多”。但在當(dāng)前的地緣政治背景下,后續(xù)在中國(guó)市場(chǎng)會(huì)有怎樣的發(fā)展,暫時(shí)還是個(gè)未知數(shù)。

與之形成鮮明對(duì)比的,是一大批初創(chuàng)企業(yè)的退潮。Wind數(shù)據(jù)顯示,今年A股中24家AIGC概念股合計(jì)已發(fā)生67筆減持。

在大洋彼岸的硅谷,同樣是熱潮過(guò)后的冷靜。根據(jù)極客公園對(duì)硅谷多名相關(guān)人員的采訪,在ChatGPT爆火半年后,硅谷巨頭們經(jīng)歷了最初的恐慌,已經(jīng)完成對(duì)OpenAI的祛媚,開(kāi)始根據(jù)自身已有優(yōu)勢(shì)擴(kuò)展布局,尋找大模型能為之助力,甚至可能發(fā)生顛覆式創(chuàng)新的方向。也就是說(shuō),開(kāi)始根據(jù)原有優(yōu)勢(shì)業(yè)務(wù),尋找真正能讓大模型落地的場(chǎng)景。

例如Meta是將大模型視為下一代計(jì)算平臺(tái),開(kāi)放其Llama2商業(yè)許可,并與微軟Azure合作對(duì)外提供服務(wù),與高通合作推進(jìn)在終端運(yùn)行Llama2,即同時(shí)提供to B和to C的能力。亞馬遜則圍繞其B端業(yè)務(wù)推出了大模型服務(wù)Amazon Bedrock,既包括自研的大模型,同時(shí)也與Stability AI、A121 Labs等基礎(chǔ)模型提供商廣泛合作,幫助企業(yè)靈活構(gòu)建生成式AI應(yīng)用,降低開(kāi)發(fā)者使用門(mén)檻。

巨頭們的業(yè)務(wù)開(kāi)始向大模型服務(wù)轉(zhuǎn)型,而對(duì)更多初創(chuàng)企業(yè)來(lái)說(shuō),利用大模型實(shí)現(xiàn)垂直領(lǐng)域的應(yīng)用是更現(xiàn)實(shí)的落地路徑。

總之,很少有人再將做一個(gè)通用大模型視為目標(biāo)。

01 上車(chē)是大模型落地的一大場(chǎng)景

打造垂直領(lǐng)域的專(zhuān)業(yè)模型,從目前來(lái)看,直接上云借助巨頭的算力和能力進(jìn)行更便捷的研發(fā)或是一大趨勢(shì)。

模型的訓(xùn)練需要消耗大量算力,無(wú)論是否有實(shí)力采購(gòu)芯片,或者是否能買(mǎi)到芯片,對(duì)一般企業(yè)都是一大考驗(yàn)。同時(shí),也是對(duì)算力的巨大浪費(fèi)。上云,是更好的選擇。包括前文提及的亞馬遜云,以及阿里云、華為云和騰訊云等均提供了基于云服務(wù)開(kāi)發(fā)大模型的能力。

對(duì)于大部分并沒(méi)有足夠的實(shí)力和精力去自己構(gòu)建數(shù)據(jù)中心的企業(yè)來(lái)說(shuō),在云上開(kāi)發(fā)成為更好的選擇。這也導(dǎo)致各家云巨頭對(duì)算力的需求猛增。一定意義上,這些互聯(lián)網(wǎng)巨頭成為了各企業(yè)的算力提供商。

亞馬遜云能為大模型上車(chē)提供的服務(wù)包括幫助主機(jī)廠進(jìn)行軟件開(kāi)發(fā),以及設(shè)計(jì)、訓(xùn)練和測(cè)試自動(dòng)駕駛系統(tǒng)。而此前華為云發(fā)布烏蘭察布汽車(chē)專(zhuān)區(qū)時(shí)推出的自動(dòng)駕駛開(kāi)發(fā)平臺(tái),則可實(shí)現(xiàn)全流程覆蓋智駕開(kāi)發(fā)、仿真測(cè)試、實(shí)車(chē)測(cè)試、量產(chǎn)上車(chē)等環(huán)節(jié)。

包括英偉達(dá),也同樣為需要開(kāi)發(fā)大模型業(yè)務(wù)的企業(yè)提供了大模型開(kāi)發(fā)平臺(tái)工具NVIDIA AI Workbench,來(lái)幫助開(kāi)發(fā)和部署生成式AI模型。概括來(lái)說(shuō),AI Workbench為開(kāi)發(fā)者提供了一個(gè)統(tǒng)一且易于使用的工具包,能夠快速在PC或工作站上創(chuàng)建、測(cè)試和微調(diào)模型,并無(wú)縫擴(kuò)展到幾乎任何數(shù)據(jù)中心、公有云或NVIDIA DGX Cloud上。

天津大學(xué)無(wú)人駕駛汽車(chē)交叉研究中心主任謝輝教授認(rèn)為,通用大模型和專(zhuān)業(yè)模型的區(qū)別就像是本科生與工程師的區(qū)別,ChatGPT像是將計(jì)算機(jī)培養(yǎng)到了大學(xué)畢業(yè)的智能水平,專(zhuān)業(yè)模型就像是各個(gè)領(lǐng)域?qū)I(yè)的工程師。

而上車(chē),就是一個(gè)將大模型運(yùn)用于垂直領(lǐng)域的落地場(chǎng)景。

我們已經(jīng)看到無(wú)數(shù)關(guān)于大模型上車(chē)的宣傳。從百度、阿里、華為等巨頭宣布在車(chē)端接入其自研大模型,到吉利、廣汽等車(chē)企表示將自研大模型上車(chē),也有如毫末這樣的智駕公司推出針對(duì)自動(dòng)駕駛的模型。

綜觀各家大模型上車(chē),其應(yīng)用主要可分為兩大領(lǐng)域,即智能座艙和自動(dòng)駕駛。

斑馬智行CEO張春暉在上海車(chē)展期間的發(fā)布會(huì)上表示,汽車(chē)是大模型最好的落地場(chǎng)景。

從目前的市場(chǎng)表現(xiàn)來(lái)看,大模型上車(chē)熱鬧非凡,但實(shí)際的發(fā)展如何,還有待驗(yàn)證。

02 智能座艙還需要實(shí)際落地的樣本

大模型上車(chē)的風(fēng),首先是從百度文心一言吹起的。此后,包括阿里通義千問(wèn),華為盤(pán)古大模型,商湯日日新、科大訊飛星火大模型等也先后發(fā)布并宣布上車(chē)。發(fā)展到今天,廣汽、吉利、理想等車(chē)企也開(kāi)始宣布將自研AI模型上車(chē)。

相較于自動(dòng)駕駛,大模型在智能座艙的落地普遍被認(rèn)為更加容易,也是大部分宣傳大模型上車(chē)的企業(yè)宣傳的方向。但從目前發(fā)展來(lái)看,尚沒(méi)有車(chē)企真正實(shí)現(xiàn)大模型上車(chē)的量產(chǎn)交付。

一般認(rèn)為,大模型接入智能座艙將加速軟件能力的升級(jí),推動(dòng)座艙實(shí)現(xiàn)人機(jī)主動(dòng)式交互。例如,通過(guò)增強(qiáng)對(duì)乘客語(yǔ)音語(yǔ)義的理解能力,讓車(chē)載語(yǔ)音實(shí)現(xiàn)更深層次的個(gè)性化和自然擬人的交互,而且,還可以實(shí)現(xiàn)對(duì)駕駛員在視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多模態(tài)應(yīng)用上的識(shí)別和響應(yīng),形成深度的人機(jī)主動(dòng)式互動(dòng)體驗(yàn),并根據(jù)駕駛員的表現(xiàn)為其提供更智能化的服務(wù)。

最接近落地的是6月奔馳宣布在美國(guó)市場(chǎng)為配置MBUX的車(chē)型接入ChatGPT,開(kāi)啟為期三月的測(cè)試。百度則在五月測(cè)試了文心大模型上車(chē)效果。我們可以從這兩場(chǎng)最接近真實(shí)上車(chē)的測(cè)試一窺大模型接入座艙將帶來(lái)的改變。

從海外記者的體驗(yàn)來(lái)看,接入ChatGPT的奔馳語(yǔ)音助手實(shí)現(xiàn)了更為流暢對(duì)話的能力,還可根據(jù)需要提供建議。不過(guò),整體反應(yīng)速度相對(duì)來(lái)說(shuō)還是比較滯后。奔馳表示國(guó)內(nèi)車(chē)型上并沒(méi)有接入ChatGPT的計(jì)劃。

而搭載文心大模型的百度Apollo表現(xiàn)相對(duì)更加流暢,而且,也做到了對(duì)傳統(tǒng)AIGC能力的覆蓋,例如,生成文案、圖像等,還可以切換人設(shè),分辨不同聲音來(lái)源,同時(shí)處理多個(gè)指令。

但目前,這套系統(tǒng)也尚未實(shí)現(xiàn)真正的上車(chē)落地。此前百度曾表示包括長(zhǎng)安、紅旗等品牌均將接入文心大模型,但目前并沒(méi)有相關(guān)信息。

最新消息是8月份百度Apollo宣布長(zhǎng)城汽車(chē)、億咖通科技成為首批文心大模型智艙應(yīng)用探索伙伴。百度Apollo已分別與長(zhǎng)城汽車(chē)、億咖通科技基于大模型能力圍繞車(chē)載交互場(chǎng)景開(kāi)展探索和實(shí)踐,完成多項(xiàng)創(chuàng)新功能在量產(chǎn)車(chē)型平臺(tái)上的驗(yàn)證,部分功能未來(lái)有望在長(zhǎng)城、領(lǐng)克、smart等量產(chǎn)車(chē)型上率先落地。從措辭來(lái)看,何時(shí)落地尚未確定。

智駕網(wǎng)也詢問(wèn)了多家曾發(fā)布大模型上車(chē)計(jì)劃的企業(yè)。在上海車(chē)展期間宣布將接入阿里大模型通義千問(wèn)的斑馬智行,同樣表示關(guān)于大模型的具體進(jìn)度并不清楚,但九月初應(yīng)該會(huì)有一波新的進(jìn)展公布。

商湯與科大訊飛也尚無(wú)明確的相關(guān)披露。而華為的盤(pán)古大模型則已接入鴻蒙4系統(tǒng),不過(guò)在車(chē)端,預(yù)告首搭鴻蒙4座艙系統(tǒng)的是將于今年三季度正式發(fā)布的與奇瑞合作的Luxeed。

吉利和廣汽目前則處于宣布將上車(chē)AI大模型的階段。理想汽車(chē)也表示自研了Mind GPT,并將AI技術(shù)引入到車(chē)機(jī)理想同學(xué)中。

大模型上車(chē)進(jìn)行得如火如荼,但可以猜測(cè)的是,真正要實(shí)現(xiàn)上車(chē)后達(dá)到自然的多模態(tài)交互,似乎并沒(méi)有普遍宣傳的那樣簡(jiǎn)單。

03 大模型將助力自動(dòng)駕駛落地,但為時(shí)尚早

而在自動(dòng)駕駛領(lǐng)域,目前明確提出相關(guān)模型的是毫末智行的DriveGPT。其原理是按照ChatGPT的格式將輸入圖像轉(zhuǎn)換為場(chǎng)景的Token化表達(dá),再用強(qiáng)化學(xué)習(xí)的思想去輸出自動(dòng)駕駛的控制量。

毫末智行技術(shù)副總裁艾銳表示,目前,DriveGPT的應(yīng)用,對(duì)于汽車(chē)算力的需求還是太大,還需要一定的時(shí)間才能解決。同時(shí)在算力提升后,對(duì)汽車(chē)的能耗也會(huì)帶來(lái)不小的挑戰(zhàn),未來(lái)需要找到一種低成本的兌現(xiàn)方式。從目前來(lái)看,這種能力只能部署在云端,讓大家通過(guò)聯(lián)網(wǎng)去使用。

同濟(jì)大學(xué)汽車(chē)學(xué)院黃巖軍教授則認(rèn)為,DriveGPT在駕駛場(chǎng)景識(shí)別等類(lèi)似ChatGPT的對(duì)話生成場(chǎng)景中效果是很好的,能很好地識(shí)別輸入圖像的駕駛場(chǎng)景。但自動(dòng)駕駛并不是自然語(yǔ)言處理,無(wú)法將復(fù)雜的環(huán)境動(dòng)力學(xué)信息理解簡(jiǎn)化為對(duì)話的形式,以Token的方式對(duì)自動(dòng)駕駛汽車(chē)進(jìn)行控制。因?yàn)榄h(huán)境中存在的語(yǔ)義信息非常多,現(xiàn)在自動(dòng)駕駛的做法是通過(guò)感知模塊將類(lèi)似的信息提取出來(lái),再交給規(guī)劃控制模塊。目前在云端運(yùn)行的是自動(dòng)化標(biāo)注、駕駛場(chǎng)景識(shí)別、駕駛場(chǎng)景重構(gòu)等功能,這對(duì)于之后打破自動(dòng)駕駛壁壘很有必要,不過(guò)這些功能在云端運(yùn)行已經(jīng)足夠了。

這也是目前已經(jīng)推出了自動(dòng)駕駛相關(guān)服務(wù)的云廠商所能實(shí)現(xiàn)的能力。亞馬遜云表示主機(jī)廠可以借助生成式AI來(lái)進(jìn)行模擬,以測(cè)試車(chē)輛對(duì)各種駕駛場(chǎng)景的響應(yīng)。這些場(chǎng)景可能是極小概率會(huì)發(fā)生的情況,或者在現(xiàn)實(shí)世界比較極端的情況,測(cè)試并不安全(比如,在夜間、雨天和黑暗中差點(diǎn)撞上橫穿馬路的人)。模擬測(cè)試不僅可以提高測(cè)試效率,還將使汽車(chē)企業(yè)得以創(chuàng)建更豐富的測(cè)試場(chǎng)景,并提高整個(gè)駕駛系統(tǒng)的能力。

而關(guān)于大模型對(duì)標(biāo)注的促進(jìn)作用,理想汽車(chē)?yán)钕朐e例解釋過(guò):僅以自動(dòng)駕駛的圖片標(biāo)定為例,過(guò)去一年需要做大概1000萬(wàn)幀圖像的人工標(biāo)定,成本6-8元每張,一年成本接近一億。而使用大模型軟件后,通過(guò)自動(dòng)化標(biāo)定,過(guò)去需要一年做的事情,基本上3個(gè)小時(shí)就能完成,效率是人的1000倍。

此前,地平線聯(lián)合創(chuàng)始人黃暢也曾在接受采訪時(shí)表示,GPT在自動(dòng)駕駛場(chǎng)景中最先應(yīng)用的很可能是環(huán)境模型的預(yù)測(cè)和交互式規(guī)劃。這個(gè)場(chǎng)景不需要特別大規(guī)模的參數(shù)模型,因?yàn)樗皇且粋€(gè)完整的端到端,尤其因?yàn)樗P(guān)注于預(yù)測(cè)和規(guī)劃,不用花太多精力在感知這個(gè)層面上,因此很可能在百TOPS級(jí)別的算力平臺(tái)上就能應(yīng)用,三到五年內(nèi)就可以初步上線。

而在完整的端到端緩解,從感知到定位地圖到規(guī)控,整個(gè)端到端的閉環(huán)做出來(lái),黃暢認(rèn)為需要一個(gè)更大規(guī)模的參數(shù)模型,大概需要五到十年的時(shí)間。

黃巖軍則認(rèn)為,在將生成式大模型運(yùn)用于自動(dòng)駕駛中時(shí),需要首先提出新概念新算法,模擬神經(jīng)系統(tǒng)建立類(lèi)腦模型,以創(chuàng)新帶動(dòng)發(fā)展;其次需要使用面向通用人工智能的生成式方法對(duì)感知對(duì)預(yù)測(cè)一整套流程進(jìn)行建模,全面表征環(huán)境動(dòng)力學(xué)信息;最后,在大模型建模完成之后,需要利用數(shù)據(jù)閉環(huán)的方式,不斷在長(zhǎng)尾場(chǎng)景進(jìn)行學(xué)習(xí),使模型得到自我進(jìn)化,才能讓大模型更好的應(yīng)用于自動(dòng)駕駛當(dāng)中。

也就是說(shuō),目前用于自動(dòng)駕駛的模型主要還是在標(biāo)注、場(chǎng)景識(shí)別和模擬這些數(shù)據(jù)層面回傳功能的實(shí)現(xiàn),真正要用到最后規(guī)控決策的還無(wú)法實(shí)現(xiàn)。

但關(guān)于大模型在自動(dòng)駕駛中的應(yīng)用前景,黃巖軍顯然持樂(lè)觀態(tài)度。

“我認(rèn)為,隨著通用人工智能技術(shù)的發(fā)展,未來(lái)十五年到未來(lái)二十年,生成式大模型能夠以獨(dú)特的姿態(tài)站上自動(dòng)駕駛領(lǐng)域之巔,解決目前自動(dòng)駕駛的各種邊緣場(chǎng)景,實(shí)現(xiàn)自動(dòng)駕駛的閉環(huán)自進(jìn)化?!?/p>

大模型的混戰(zhàn)仍在繼續(xù),對(duì)芯片和算力的需求似乎也尚未達(dá)到一個(gè)穩(wěn)定的狀態(tài)。而要真正看到大模型在相關(guān)場(chǎng)景實(shí)現(xiàn)質(zhì)的飛躍,顯然也還需要時(shí)間。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。