文|劉曠
ChatGPT走紅后,大模型的熱度持續(xù)不減,并日漸形成了“千模大戰(zhàn)”的局面。前兩個(gè)月,百度、阿里、騰訊加入;進(jìn)入5月份,先有網(wǎng)易有道,發(fā)布了基于“子曰”大模型開(kāi)發(fā)的AI口語(yǔ)老師劇透視頻,介紹其基于教育場(chǎng)景的類(lèi)ChatGPT產(chǎn)品;后有科大訊飛,發(fā)布認(rèn)知大模型“訊飛星火”……總之,各種大大小小的發(fā)布會(huì),都在向外界證明自己到底有多大的想象空間。
在大模型進(jìn)展如火如荼之下,其產(chǎn)業(yè)化也被越來(lái)越多地提及,從前炒作的“AI+”也再次站上風(fēng)口。在此背景下,關(guān)于AI大模型在汽車(chē)領(lǐng)域的應(yīng)用,也開(kāi)始熱度飆升。
智能汽車(chē)的“ChatGPT時(shí)刻”來(lái)了
目前來(lái)看,大模型重構(gòu)各行各業(yè)雖然已經(jīng)成為業(yè)界共識(shí),但ChatGPT“上車(chē)”遠(yuǎn)比預(yù)想中的來(lái)得更快。作為繼家庭和辦公場(chǎng)所之外的“第三空間”,汽車(chē)正在變成一個(gè)新型智能終端。ChatGPT到來(lái)了之后,車(chē)機(jī)關(guān)系也受到了更多的影響。
一是ChatGPT對(duì)汽車(chē)自動(dòng)駕駛的影響。業(yè)內(nèi)人士分析表示,大模型具備對(duì)海量數(shù)據(jù)的處理能力以及多維度分析能力,可以提供更精準(zhǔn)、更全面的數(shù)據(jù)分析和預(yù)測(cè)能力,持續(xù)優(yōu)化模型,提高智能駕駛的準(zhǔn)確性和可靠性。尤其是隨著ChatGPT的出現(xiàn),人們發(fā)現(xiàn)當(dāng)模型的參數(shù)量,達(dá)到了一定程度之后,呈現(xiàn)出的效果不是“性能變好”,而是“出奇的好”。
具體到應(yīng)用層面,大模型對(duì)自動(dòng)駕駛的影響是:在云端,車(chē)企可以發(fā)揮模型參數(shù)量的大容量?jī)?yōu)勢(shì),通過(guò)大模型完成絕大多數(shù)的數(shù)據(jù)標(biāo)注和數(shù)據(jù)挖掘工作,節(jié)省數(shù)據(jù)標(biāo)注成本,還能夠借助仿真場(chǎng)景構(gòu)建賦能。在車(chē)端,它可以將分管不同子任務(wù)的小模型合并為一個(gè)大模型,節(jié)省車(chē)端推理計(jì)算時(shí)間,增加汽車(chē)安全性。最重要的是,被認(rèn)為是自動(dòng)駕駛算法終局的端到端感知決策一體化算法瓶頸,或許在汽車(chē)接入大模型之后可以得到有效解決,自動(dòng)駕駛算法升級(jí)指日可待。
二是對(duì)汽車(chē)智能座艙的影響。車(chē)載ChatGPT語(yǔ)音助手,可以處理完整的對(duì)話(huà),比如追問(wèn),并能保持對(duì)前后文的理解,形成較為良好的語(yǔ)音交互體驗(yàn)。比如,微軟與梅賽德斯—奔馳探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務(wù)集成開(kāi)辟可能性。駕駛員未來(lái)有望通過(guò)車(chē)載系統(tǒng)完成預(yù)訂餐廳、預(yù)訂電影票等任務(wù),進(jìn)一步提升便利性和生產(chǎn)力,極大地豐富智能汽車(chē)與人之間的交互體驗(yàn)。
另外,在改變智能駕駛和智能座艙交互能力的情況下,其也對(duì)汽車(chē)的研發(fā)方式和商業(yè)模式產(chǎn)生全新的影響。研發(fā)方式方面,由于機(jī)器的高效標(biāo)注能力,使得需要一年時(shí)間的數(shù)據(jù)標(biāo)注任務(wù),現(xiàn)在只需要短短數(shù)小時(shí),研發(fā)周期大幅縮短,而且多模態(tài)(視覺(jué)、語(yǔ)音、手勢(shì)等)的豐富數(shù)據(jù),更可以進(jìn)一步提升總體的研發(fā)效能,降低研發(fā)成本。就商業(yè)模式而言,車(chē)載AI語(yǔ)音交互在它具備情感智能之后,它就會(huì)從“雇傭關(guān)系”演變成“陪伴關(guān)系”,對(duì)人的喜好和習(xí)慣會(huì)更加了解,這將會(huì)衍生出全新的商業(yè)價(jià)值。
產(chǎn)業(yè)探索流派紛呈
或許正是意識(shí)到了這一點(diǎn),現(xiàn)在正有越來(lái)越多的車(chē)企選擇接入AI大模型。除了國(guó)外的奔馳宣布ChatGPT之外,國(guó)內(nèi)理想汽車(chē)也發(fā)布了自研大模型MindGPT,百度的文心一言也被接入到了長(zhǎng)安、吉利、嵐圖、紅旗、零跑等眾多車(chē)企之中,就連“讓夢(mèng)想窒息”的法拉利未來(lái),也在新車(chē)中納入了大模型,不難預(yù)見(jiàn)未來(lái)大模型在智能汽車(chē)中普及,將會(huì)是大概率事件。從整個(gè)參與的車(chē)企來(lái)看,其發(fā)展大模型的方向和側(cè)重點(diǎn)并不相同。
從功能上來(lái)看其主要可以分為以下兩類(lèi):一類(lèi)是用于人工智能交流對(duì)話(huà)領(lǐng)域,多數(shù)應(yīng)用在智能座艙上。比如,百度的文心一言,目前已經(jīng)有東風(fēng)日產(chǎn)、紅旗、長(zhǎng)城等近十家車(chē)企宣布接入;上海車(chē)展期間,商湯科技亮相了日日新Sensenova大模型,展示了其中文語(yǔ)言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結(jié)合;此前阿里巴巴也宣布AliOS智能汽車(chē)操作系統(tǒng),已接入通義千問(wèn)大模型進(jìn)行測(cè)試等。
另一類(lèi)是聚焦智能駕駛的大模型應(yīng)用。比如毫末智行發(fā)布了自動(dòng)駕駛生成式大模型DriveGPT,幫助解決認(rèn)知決策問(wèn)題,最終實(shí)現(xiàn)端到端的自動(dòng)駕駛。理想汽車(chē)自研大模型MindGPT,擺脫對(duì)高清地圖的依賴(lài),讓汽車(chē)做到更接近人類(lèi)司機(jī)的駕駛表現(xiàn)。蔚來(lái)、小鵬、長(zhǎng)城、奇瑞四家車(chē)企,也已經(jīng)注冊(cè)申請(qǐng)了多個(gè)與GPT相關(guān)的商標(biāo)。
從參與主體來(lái)看,也主要可以分為兩類(lèi):一是車(chē)企親自下場(chǎng)做的,如理想汽車(chē)、百度將自家大模型應(yīng)用于自家汽車(chē)產(chǎn)品等;另一類(lèi)是外部廠(chǎng)商提供大模型給車(chē)企,比如華為盤(pán)古大模型、百度文心一言等用于給其他車(chē)企使用。
相較通用大模型來(lái)說(shuō),垂直領(lǐng)域的大模型訓(xùn)練和使用成本更低,或許會(huì)成為更容易實(shí)現(xiàn)商業(yè)化落地的領(lǐng)域。業(yè)內(nèi)人士分析稱(chēng),汽車(chē)有著明確的交互需求,且相較于通用大模型,垂直領(lǐng)域的應(yīng)用場(chǎng)景相對(duì)較小,對(duì)參數(shù)的量級(jí)要求也沒(méi)有通用型AI那么大。因此,無(wú)論是傳統(tǒng)車(chē)廠(chǎng)還是新勢(shì)力,抑或是大模型科技廠(chǎng)商,普遍認(rèn)為智能汽車(chē)最有可能成為率先實(shí)現(xiàn)大模型落地的B端場(chǎng)景。
大模型規(guī)模上車(chē)時(shí)機(jī)尚未成熟
目前來(lái)看,盡管ChatGPT的首發(fā)“上車(chē)”,已經(jīng)拉開(kāi)了智能汽車(chē)領(lǐng)域大模型較量的序幕。但現(xiàn)階段距離大模型的真正規(guī)模上車(chē),也還有一段距離。
首先,車(chē)企做大模型,多模態(tài)數(shù)據(jù)的收集、處理、訓(xùn)練本身是一個(gè)難題。自動(dòng)駕駛所需傳感器數(shù)據(jù)包括激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá),以及高清攝像頭、GPS等。這些數(shù)據(jù)來(lái)自不同的坐標(biāo)系,帶有不同的觸發(fā)時(shí)間戳,且要考慮到硬件損壞等問(wèn)題;同時(shí),需要大量的場(chǎng)景數(shù)據(jù),比如交通標(biāo)志線(xiàn)、交通流、行為模型等。這讓汽車(chē)大模型的研發(fā)、訓(xùn)練門(mén)檻變得很高。
業(yè)內(nèi)人士認(rèn)為,模型數(shù)據(jù)調(diào)動(dòng)管理需要利用智能網(wǎng)聯(lián)汽車(chē)以及計(jì)算技術(shù)平臺(tái)、云控技術(shù)平臺(tái)等諸多平臺(tái),只有做到海量數(shù)據(jù)匯聚才可以做交叉,尤其是垂直領(lǐng)域,這和車(chē)內(nèi)的其他系統(tǒng)并不相同,假如基礎(chǔ)的平臺(tái)能力不能打通,其很難向更深層次發(fā)展。另外,盡管生成式AI在信息獲取上獲得了突破,但在決策、執(zhí)行控制層面,其離真正在汽車(chē)上落地還有較大的距離。
另外,端到端的AI大模型訓(xùn)練,需要在智能汽車(chē)中構(gòu)建全新的基于AI大模型的全新算法,這也需要一個(gè)過(guò)程,業(yè)內(nèi)人士認(rèn)為至少需要3—5年甚至更長(zhǎng)的時(shí)間,來(lái)完成這一過(guò)程。
其次,受限于車(chē)載設(shè)備的硬件條件,汽車(chē)內(nèi)大模型所需要的硬件配置可能會(huì)受到限制,難以有效發(fā)揮好作用。具體來(lái)說(shuō),大模型需要高規(guī)格的硬件配置,包括高性能計(jì)算能力、大容量?jī)?nèi)存和低時(shí)延等特點(diǎn),但車(chē)載設(shè)備的硬件條件相對(duì)有限,無(wú)法提供足夠的算力資源支撐大模型運(yùn)行。比如,在自然語(yǔ)言處理領(lǐng)域的GPT-3模型,就需要數(shù)萬(wàn)億TOPS的計(jì)算能力。這要求芯片的算力至少要在萬(wàn)級(jí)TOPS以上,才能夠勝任大模型的計(jì)算任務(wù)。但是在車(chē)載部署場(chǎng)景下,芯片的算力往往只有數(shù)百TOPS,遠(yuǎn)遠(yuǎn)達(dá)不到大型模型的要求。
在此背景下,升級(jí)汽車(chē)內(nèi)的算力基礎(chǔ)設(shè)施已成必然趨勢(shì),目前來(lái)看智算中心或許會(huì)成為未來(lái)智能汽車(chē)的“標(biāo)配”。比如,特斯拉發(fā)布了獨(dú)立的云端智算中心——Dojo,總計(jì)使用了1.4萬(wàn)個(gè)英偉達(dá)的GPU來(lái)訓(xùn)練AI模型。在國(guó)內(nèi),小鵬汽車(chē)與阿里云合建了智算中心“扶搖”,專(zhuān)門(mén)用于自動(dòng)駕駛模型訓(xùn)練,算力可達(dá)到600PFLOPS;毫末智行與火山引擎聯(lián)合打造了國(guó)內(nèi)自動(dòng)駕駛行業(yè)最大的智算中心“雪湖.綠洲”,每秒浮點(diǎn)運(yùn)算可達(dá)到67億億次。不過(guò),目前這些建設(shè)還處于探索應(yīng)用階段,大模型應(yīng)用大規(guī)模上車(chē)的時(shí)機(jī),還沒(méi)有完全成熟。
底層技術(shù)才是未來(lái)角逐焦點(diǎn)
目前來(lái)看,AI大模型對(duì)汽車(chē)最本質(zhì)的改變,可能在于它將進(jìn)一步驅(qū)動(dòng)汽車(chē),從制造屬性向科技+消費(fèi)電子屬性轉(zhuǎn)變。在這種背景下,車(chē)廠(chǎng)本身的底層科技能力,將會(huì)成為未來(lái)的決勝關(guān)鍵。
一方面,AI大模型會(huì)重新定義“人機(jī)交互”和“服務(wù)生態(tài)”,加速汽車(chē)應(yīng)用服務(wù)生態(tài)消費(fèi)電子化,這將改變底層的產(chǎn)品定義。當(dāng)前車(chē)載語(yǔ)音系統(tǒng)底層是未完全成熟的任務(wù)型對(duì)話(huà)系統(tǒng),尚無(wú)法真正實(shí)現(xiàn)個(gè)性化、情感化、自由化的交互能力,而大模型可以通過(guò)深度學(xué)習(xí)+語(yǔ)音生成,迎來(lái)開(kāi)放場(chǎng)景+自然交互的全新人機(jī)交互體驗(yàn)。同時(shí),在研發(fā)設(shè)計(jì)上,隨著大模型的OS化,傳統(tǒng)的APP上車(chē)、點(diǎn)觸功能、HMI交付的必要性和重要性值得思考,這意味著汽車(chē)“產(chǎn)品”的重新定義。
正如前華為自動(dòng)駕駛產(chǎn)品部部長(zhǎng)蘇箐所言:“傳統(tǒng)車(chē)廠(chǎng)看法首先我的基座是車(chē),現(xiàn)在有些計(jì)算機(jī)的單點(diǎn),那么我是把車(chē)作為一個(gè)基礎(chǔ),試圖把計(jì)算機(jī)嵌進(jìn)去,這是傳統(tǒng)車(chē)廠(chǎng)的看法。我們的看法不一樣,基礎(chǔ)是計(jì)算機(jī),車(chē)是計(jì)算機(jī)控制的外設(shè),一個(gè)大計(jì)算機(jī)了事,把車(chē)掛上去。這是本質(zhì)看法不一樣。”事實(shí)上,在大模型上車(chē)之后,汽車(chē)的計(jì)算中心、智能化、消費(fèi)電子屬性將變得更加明顯,其產(chǎn)品定義將遵循消費(fèi)電子的底層邏輯迭代演變(如APP化、生態(tài)服務(wù)等)。
另一方面,AI大模型將會(huì)改變汽車(chē)的現(xiàn)有算法,考慮到大模型應(yīng)用所需要的硬件成本以及外部環(huán)境來(lái)看,未來(lái)國(guó)內(nèi)企業(yè)大模型的技術(shù)實(shí)力,將更加取決于包括AI操作系統(tǒng)等在內(nèi)的底層技術(shù)。具體來(lái)說(shuō),原來(lái)汽車(chē)的自動(dòng)駕駛算法較為依賴(lài)人工,而接入大模型之后,就需要依靠大模型驅(qū)動(dòng)形成新的智能算法,而要構(gòu)筑這樣的算法,除了要做好產(chǎn)品,還要做好平臺(tái)。
比如,圍繞芯片、云端等在內(nèi)的計(jì)算平臺(tái),需要做到低成本、可標(biāo)配;有了好的產(chǎn)品,才能夠有足夠多的銷(xiāo)量,有足夠多的銷(xiāo)量,才能增加“端到端”(云端到車(chē)端)的閉環(huán)數(shù)據(jù);作為基礎(chǔ)支撐的AI大算力芯片,也需要重新考慮車(chē)企自身的情況來(lái)做,回到底層來(lái)說(shuō)就是誰(shuí)的訓(xùn)練成本低,誰(shuí)的轉(zhuǎn)化速度快,誰(shuí)就將跑到最前面。
拿英偉達(dá)的訓(xùn)練芯片來(lái)說(shuō),一枚芯片被炒到了10萬(wàn)塊錢(qián),關(guān)鍵是這種高成本芯片訓(xùn)練方案,對(duì)于車(chē)企并非最優(yōu)解決辦法。而且受外部制裁影響,這種“外供依賴(lài)”隨時(shí)有可能被掐掉,脆弱性很大。因而從長(zhǎng)遠(yuǎn)來(lái)看,車(chē)企想要在這一領(lǐng)域走到行業(yè)前列去,要么加大對(duì)底層芯片的自研力度以減少采購(gòu)成本,如百度自研AI芯片,要么在AI算法、操作系統(tǒng)上去尋求破局,以找到最佳的應(yīng)用路徑。