正在閱讀:

對(duì)話前圖森未來(lái)CEO侯曉迪:大模型催快的自動(dòng)駕駛與攪局的馬斯克

掃一掃下載界面新聞APP

對(duì)話前圖森未來(lái)CEO侯曉迪:大模型催快的自動(dòng)駕駛與攪局的馬斯克

“實(shí)名反對(duì)”馬斯克的弄潮者。

文|硅谷101 泓君 陳茜

自動(dòng)駕駛行業(yè)備受關(guān)注的前圖森聯(lián)合創(chuàng)始人侯曉迪,在《硅谷101》的訪談中,透露了他的最新動(dòng)向,他已經(jīng)開(kāi)始了新一次的創(chuàng)業(yè),依舊是自動(dòng)駕駛卡車,新公司的名字叫做 Bot.Auto。

在《硅谷101》的訪談中,侯曉迪承認(rèn)自動(dòng)駕駛行業(yè)進(jìn)入了低潮期,但這種低潮是由加息帶來(lái)的純資本問(wèn)題,并預(yù)估在2026-2027年他的公司可以在特定場(chǎng)景下賺錢。

侯曉迪之前所在的圖森也是命途多舛:

作為全球自動(dòng)駕駛第一股,圖森未來(lái)2021年4月在納斯達(dá)克上市,發(fā)行價(jià)是40美元,很快股價(jià)翻番,沖上70美元。但是圖森未來(lái)的高光沒(méi)有持續(xù)多久,就遇到了很多中資背景的企業(yè)在美國(guó)遇到的一系列你能想象的困難:

第一波的困難是在做空機(jī)構(gòu)與2022年美國(guó)加息的雙重背景下股價(jià)腰斬;

接下來(lái)又被美國(guó)的監(jiān)管機(jī)構(gòu)盯上,美國(guó)海外投資委員會(huì)CIFUS對(duì)圖森進(jìn)行了持續(xù)的調(diào)查與監(jiān)管;

最后圖森經(jīng)歷了四輪管理權(quán)的更迭。

2022年3月,呂程離開(kāi)公司, 2022 年6月,陳默離開(kāi)董事會(huì)。侯曉迪作為僅剩的創(chuàng)始團(tuán)隊(duì)與早期管理團(tuán)隊(duì)的代表留在了公司和董事會(huì)上,接下來(lái)就是圖森美國(guó)的董事會(huì)強(qiáng)行通過(guò)投票把侯曉迪也給罷免了,使用的條款叫做 Terminate without cause(無(wú)理由終止合約)。至此,圖森未來(lái)可以說(shuō)他們的創(chuàng)始團(tuán)隊(duì)以及早期管理團(tuán)隊(duì)全部出局。這是第二次權(quán)利的反轉(zhuǎn)。

第三次是10天之后,圖森的創(chuàng)始團(tuán)隊(duì)與管理團(tuán)隊(duì)侯曉迪、陳默、呂程三人用超級(jí)投票權(quán)重新奪回了公司,又換掉了之前的董事。但是代價(jià)就是,圖森重新回到陳默與呂程手中,侯曉迪被邊緣化,于次年辭去董事職位,徹底離開(kāi)圖森。

所有的這些事情都發(fā)生在圖森上市以后的兩年內(nèi)。經(jīng)過(guò)美國(guó)監(jiān)管機(jī)構(gòu)的調(diào)查與管理權(quán)的輪番更替后,圖森未來(lái)的股價(jià)當(dāng)時(shí)已經(jīng)跌破了上市發(fā)行價(jià)的 90%。在2024年1月份,圖森發(fā)布公告說(shuō),公司正決定從納斯達(dá)克摘牌退市,并且會(huì)注銷普通股。這個(gè)時(shí)候圖森的股價(jià)只剩下 0.25 美元,距離上市時(shí)候的40美元可以說(shuō)是只剩下了一個(gè)零頭。

在大國(guó)科技交鋒的風(fēng)口浪尖上,圖森未來(lái)的故事比tiktok更加跌宕起伏,也更加艱難。無(wú)論是自動(dòng)駕駛還是大模型的更新熱點(diǎn)不斷。侯曉迪在訪談中也詳細(xì)解釋了為什么他實(shí)名反對(duì)馬斯克,以及他對(duì)大模型、世界模型、具身智能等諸多熱點(diǎn)話題的看法。以下是《硅谷101》與侯曉迪的對(duì)話。

01 我為什么實(shí)名反對(duì)馬斯克

《硅谷101》:為什么再次創(chuàng)業(yè)還是選了自動(dòng)駕駛這個(gè)方向?

侯曉迪:因?yàn)榭匆?jiàn)所以相信。我在過(guò)去的七年中也看到了一些不變性,這是我最寶貴的財(cái)富,也是支持我做下一次事業(yè)的出發(fā)點(diǎn)。首先是技術(shù)管理的能力,更多的是行業(yè)里面的一些必然趨勢(shì),這些必然趨勢(shì)讓我覺(jué)得無(wú)人駕駛一定可以做出來(lái)。

無(wú)人駕駛這件事,之前的問(wèn)題就在于大家都在做一個(gè)騙錢的生意,但是我們現(xiàn)在要做一個(gè)賺錢的生意。大概在未來(lái)的三四年,也就是2026或者2027年,我覺(jué)得自動(dòng)駕駛就可以實(shí)現(xiàn)商業(yè)化或者說(shuō)就能開(kāi)始在一些特定場(chǎng)景下賺錢了,真正的規(guī)?;矣X(jué)得應(yīng)該在2030年前后可以實(shí)現(xiàn)。

當(dāng)然了,這個(gè)時(shí)間節(jié)點(diǎn)是我和我們公司在一個(gè)理性樂(lè)觀的情況下給出的預(yù)估,但是對(duì)于整個(gè)行業(yè)而言,我沒(méi)有這么樂(lè)觀的估計(jì),因?yàn)檫@還是取決于具體的人和團(tuán)隊(duì),而人和人的差距比人和狗的差距還大。

《硅谷101》:相比于自動(dòng)駕駛剛剛成立的時(shí)候,這幾年其實(shí)已經(jīng)非常少看到這個(gè)行業(yè)拿到融資的情況了。你會(huì)覺(jué)得行業(yè)在一個(gè)寒冬期嗎?

侯曉迪:我覺(jué)得是這樣,窮有窮的活法,富有富的活法。大家可能都認(rèn)為自動(dòng)駕駛是一個(gè)高資金門檻的行業(yè),燒錢燒得太貴了,但是在我看來(lái)不是這樣?;四敲炊噱X,但是實(shí)際上這些錢有多少是用在探索上的?有多少錢是用在盲目擴(kuò)張和其他并不有助于實(shí)際開(kāi)發(fā)的事情的?我覺(jué)得行業(yè)內(nèi)耗實(shí)際上非常大的。那現(xiàn)在可能說(shuō)得極端一點(diǎn),就是在一個(gè)寸草不生的環(huán)境下,我們只需要做自己就可以了。

無(wú)人駕駛這個(gè)行業(yè),過(guò)去七年不變的東西就是它的商業(yè)邏輯。這個(gè)商業(yè)邏輯讓我非常堅(jiān)信這件事一定能做出來(lái),而且它做出來(lái)一定能讓我們站著把錢掙了。

《硅谷101》:馬斯克說(shuō)他在今年8月份要去推robotaxi,你怎么看?

侯曉迪:我覺(jué)得首先是這樣,我是實(shí)名反對(duì)Elon Musk的,我認(rèn)為他做的事情不是一個(gè)利他主義的事情,他自己是做輔助駕駛的,但是總喜歡把自己打扮成無(wú)人駕駛。我們今天談的是L4無(wú)人駕駛,去掉人并且由軟件開(kāi)發(fā)公司承擔(dān)責(zé)任的方案才叫無(wú)人駕駛,而FSD叫輔助駕駛,它不是無(wú)人駕駛。所以我們做的其實(shí)根本不是一個(gè)東西。

如果特斯拉撞死人了怎么辦?對(duì)于馬斯克來(lái)講,這不是他的責(zé)任。因?yàn)樘厮估瓕懙煤芮宄?,誰(shuí)駕駛誰(shuí)負(fù)責(zé),所以撞死人了,是司機(jī)的責(zé)任。第二點(diǎn),繞一大圈回來(lái),他的商業(yè)邏輯還是賣車,怎么把車賣得更好是這個(gè)公司的核心戰(zhàn)略,所以無(wú)人駕駛是為了輔助他賣車的,并不是這個(gè)公司的底色。它讓你覺(jué)得它是無(wú)人駕駛,但它實(shí)際上是輔助駕駛。

再回到馬斯克發(fā)表8月 8 日要做 robotaxi 的陳述。如果他8月8日沒(méi)做出來(lái),投資人們一定會(huì)來(lái)問(wèn)我,是不是這事做不出來(lái)啦?那第二種可能是 8月8日真的運(yùn)營(yíng)了,然后第二天撞車了。投資人肯定也會(huì)擔(dān)心:馬斯克都撞車了,你們行不行???這事果然不安全啊。好,第三種情況是開(kāi)始運(yùn)營(yíng)了,沒(méi)撞車。那投資人們會(huì)說(shuō),你看馬斯克都做出來(lái)了,人家降維打擊你們,你們?cè)趺崔k呀?

所以馬斯克發(fā)出這個(gè)陳述的時(shí)候他就已經(jīng)贏了,我們已經(jīng)輸了,或者說(shuō)他沒(méi)有贏,但我們已經(jīng)輸了。我覺(jué)得一個(gè)問(wèn)題就在于,大家真的過(guò)多地去相信馬斯克說(shuō)的每句話,但是如果我們?nèi)タ纯瘩R斯克之前說(shuō)的事情,他有做成的地方,但是他做不成的東西更多。這個(gè)人做的很多事情還是以表演為主。他的很多言論肥了自己,但是實(shí)際上傷害到了無(wú)人駕駛整個(gè)行業(yè)。

比如說(shuō)無(wú)人駕駛要不要上激光雷達(dá)這個(gè)問(wèn)題,他說(shuō)你有激光雷達(dá)你就弱,但是我認(rèn)為黑貓白貓抓著耗子就是好貓,激光雷達(dá)弱不弱最后我們需要核算的是成本,如果加了激光雷達(dá)我們能賺錢,我們就加。我想告訴大家這件事的本源是怎樣的,這有可能并不是一個(gè)最有效率的、最有利于對(duì)自己發(fā)展方向的手段,但是我們至少不應(yīng)該去做一些有損整個(gè)行業(yè)前進(jìn)的事情。

《硅谷101》:如果他們做成了,這個(gè)行業(yè)會(huì)不會(huì)就重新回暖了?

侯曉迪:首先我覺(jué)得做不成,因?yàn)橹澳莻€(gè)車的租期到了,最近我太太特意換了輛特斯拉,我自己去開(kāi)特斯拉, 10 分鐘一次接管,以我做無(wú)人駕駛這么多年的標(biāo)準(zhǔn),它目前根本不可能做成robotaxi 的運(yùn)營(yíng),至少不可能在8月8日做成Waymo程度的運(yùn)營(yíng),不過(guò)當(dāng)然了,它可以在里面偷換很多概念。到時(shí)候開(kāi)一個(gè)有輔助駕駛功能的出租車公司,這是有可能做到的,但是一定不是 Waymo 這種程度的。

《硅谷101》:不過(guò)特斯拉其實(shí)有在輔助駕駛上積累很多的數(shù)據(jù),這些數(shù)據(jù)能不能幫它更快地解決一些在無(wú)人駕駛上的 corner case(極端情況)?

侯曉迪:我們認(rèn)為無(wú)人駕駛是一個(gè)世界級(jí)的、競(jìng)賽水平很高的行業(yè)。在非常低的水平,當(dāng)你做任務(wù)a的時(shí)候,它也許能夠幫助到任務(wù)b,但當(dāng)你的水平越來(lái)越高的時(shí)候,你是做不到的。

在非常低水平,你確實(shí)可以說(shuō)L2是有幫助的,誰(shuí)也不能否認(rèn)它是有幫助的。但是 L4 無(wú)人駕駛要解決的核心問(wèn)題是什么呢?是安全性,是冗余,是當(dāng)一個(gè)系統(tǒng)的每一個(gè)模塊都有可能會(huì)失效的時(shí)候,這個(gè)系統(tǒng)還仍然能夠保障最底線的安全,這才是 L4 最難和最關(guān)鍵的部分。所以在掙錢之前它要先解決安全性的問(wèn)題,但是這件事情根本不是特斯拉的設(shè)計(jì)宗旨。

02 自動(dòng)駕駛的核心難題:不是少數(shù)的大問(wèn)題,而是大量的小問(wèn)題

《硅谷101》:你覺(jué)得自動(dòng)駕駛的錯(cuò)誤觀念跟正確觀念是什么?

侯曉迪:我覺(jué)得首先無(wú)人駕駛現(xiàn)在需要解決的不是一個(gè)少數(shù)的大問(wèn)題,而是大量的小問(wèn)題。無(wú)人駕駛最大的問(wèn)題之一是運(yùn)營(yíng)不穩(wěn)定,而這個(gè)運(yùn)營(yíng)不穩(wěn)定有可能是因?yàn)榫W(wǎng)線質(zhì)量不行導(dǎo)致的,比如每天上傳下載數(shù)據(jù)效率很低之類的,這個(gè)事情就太復(fù)雜了,但是它絕對(duì)不是一個(gè)一句話能講清楚的大問(wèn)題,而是由大量的小問(wèn)題組成。我們?cè)谧龅钠鋵?shí)就是一個(gè)組織結(jié)構(gòu),這考驗(yàn)的就是你的組織是否進(jìn)化到具備以變態(tài)高的效率去解決大量小問(wèn)題的能力。

我們不斷地去改變組織結(jié)構(gòu),去適應(yīng)新的時(shí)代,最終的目的就是讓組織用最少的人,能干最多的活,并且可以最快地去解決這個(gè)事。它必然是跟一些大公司的文化是對(duì)立的,什么時(shí)候如果一個(gè)公司認(rèn)為你做不出來(lái)一個(gè)奇跡是不應(yīng)該被批評(píng)的,因?yàn)槲覀円?,我們要保證團(tuán)隊(duì)的氣氛比較好,這個(gè)時(shí)候這個(gè)公司就已經(jīng)死了,他就已經(jīng)不是一個(gè)創(chuàng)業(yè)公司了。

《硅谷101》:我之前跟 Cruise 的人聊,他說(shuō)其實(shí) Cruise 內(nèi)部在面臨非常大的一個(gè)問(wèn)題,也是運(yùn)營(yíng)問(wèn)題。舊金山的無(wú)人駕駛事故讓Cruise元?dú)獯髠?,這件事有一點(diǎn)點(diǎn)巧合的因素在里面,我們就不展開(kāi)說(shuō)了。但是其實(shí)這個(gè)是大家能看到的,大家不能看到的就是不管是你剮蹭,或者是別人故意蹭你,他們都會(huì)有一個(gè)非常大的團(tuán)隊(duì)每天專門去處理這些個(gè)案性的無(wú)人駕駛車帶來(lái)的問(wèn)題。

侯曉迪:對(duì),你看這不就是運(yùn)營(yíng)嘛?這就是無(wú)人駕駛的運(yùn)營(yíng)問(wèn)題。如果你落地的時(shí)候有問(wèn)題,你要么是自己去扛這個(gè)運(yùn)營(yíng)的問(wèn)題,要么就是找一冤大頭讓他來(lái)扛這個(gè)問(wèn)題。首先冤大頭的數(shù)量是有限的,哪天冤大頭自己發(fā)現(xiàn)虧錢了,他也不會(huì)繼續(xù)冤下去了,所以我們不能坑我們的客戶,我認(rèn)為運(yùn)營(yíng)一定是要無(wú)人駕駛公司自己來(lái)?yè)?dān)的,這是第一。

第二就是你說(shuō)這種小的剮蹭問(wèn)題,其實(shí)它更根本反映的是什么呢?在城市交通里面,我們的交通規(guī)則是不完善的,再具體說(shuō)就是交通規(guī)則的權(quán)責(zé)劃分是不完善的。如果你在開(kāi)車,右邊有一個(gè)自行車道,然后你想右拐,是不是就應(yīng)該往自行車道走?這時(shí)候誰(shuí)有責(zé),誰(shuí)有路權(quán),撞了以后是誰(shuí)的責(zé)任?這件事是不清晰的,而且也不會(huì)清晰。因?yàn)槟忝鎸?duì)的是一個(gè)人,人們?cè)谧鰧徟械臅r(shí)候總是傾向于認(rèn)為機(jī)器應(yīng)該是完美服從于人的。人可以犯各種錯(cuò),人可以跟人共情,但人不會(huì)跟電腦共情。所以在這個(gè)問(wèn)題上,無(wú)人駕駛在一個(gè)權(quán)責(zé)不清的交通環(huán)境下,它一定是非常難做的。

那么城區(qū)是權(quán)責(zé)不清最嚴(yán)重的地方,這就是為什么一開(kāi)始我就做卡車,做了 7 年,我現(xiàn)在還做卡車??ㄜ嚻鋵?shí)就不會(huì)像在城市交通,尤其是擁堵的城市交通里面會(huì)遇到這么多權(quán)責(zé)不清的情況。我們的經(jīng)驗(yàn)認(rèn)為,即使是在最后一公里的狀況下,卡車所面臨的權(quán)責(zé)不清的交通場(chǎng)景也是非常非常少的。

《硅谷101》:所以你覺(jué)得高速是一個(gè)比城市更容易實(shí)現(xiàn)無(wú)人駕駛的地方?

侯曉迪:對(duì),而且卡車的無(wú)人駕駛,我不用去解決這些不可解的問(wèn)題——既要守交通規(guī)則,又要確保乘客的安全和乘客乘坐體驗(yàn)的舒適,同時(shí)我還要需要確保周邊其他道路交通的參與者的安全,這三個(gè)東西放在一起就是不可解問(wèn)題。

比如機(jī)器能否壓雙黃線這個(gè)問(wèn)題。很多時(shí)候如果壓雙黃線,我就能夠比較快速繞過(guò)去解決一個(gè)問(wèn)題,但是壓雙黃線就是違反交通規(guī)則了。那如果我遵守交通規(guī)則慢慢等著,乘客可能會(huì)覺(jué)得我太慢了,然后給差評(píng)。此外,我還要跟其他不守交通規(guī)則的人去競(jìng)爭(zhēng),并且出了責(zé)任以后,我會(huì)被放到一個(gè)非常不利的被審判的位置上,因?yàn)槲沂请娔X,我就應(yīng)該把事情做完美。這三個(gè)東西加起來(lái),無(wú)人駕駛就很難了。

但是如果第一我沒(méi)有乘客,第二我可以犧牲運(yùn)營(yíng)的時(shí)間和效率去確保我的安全和合規(guī),只要這個(gè)矛盾發(fā)生的概率足夠小,它就能是一個(gè)合理的商業(yè)模式。

03 大模型里有成千上百的小創(chuàng)新,無(wú)人駕駛都能用上

《硅谷101》:因?yàn)榇竽P吞貏e火,你覺(jué)得大模型對(duì)自動(dòng)駕駛的技術(shù)會(huì)有什么幫助嗎?

侯曉迪:大模型非?;?,但是我覺(jué)得絕大部分談大模型的人根本不懂什么是大模型。我認(rèn)為大模型不是一種參數(shù)越多就越厲害的東西,它是一種具備了遷移能力的模型。在 computer vision 領(lǐng)域,其實(shí)很久以前人們就已經(jīng)發(fā)現(xiàn),當(dāng)一個(gè)模型訓(xùn)練到一定程度以后,它的內(nèi)蘊(yùn)表達(dá)是具有很高價(jià)值的,這個(gè)內(nèi)蘊(yùn)表達(dá)能夠以比較低甚至是零成本遷移到另外一個(gè)任務(wù)上,這就是模型的遷移能力,是它推動(dòng)了這一波大模型。

在以前沒(méi)有遷移能力的時(shí)候,適應(yīng)成本是非常高的。當(dāng)你的系統(tǒng)學(xué)會(huì)了做一件事兒,想用它做第二件事時(shí),需要把原來(lái)做好的系統(tǒng)再放到一個(gè)看起來(lái)相似但不完全相同的場(chǎng)景下,成本非常高。那么現(xiàn)在這種遷移成本變得越來(lái)越低。

遷移成本,也就是落地成本的降低,使得很多事情變得可做了,我覺(jué)得這就是人工智能這一次給大家?guī)?lái)的比較大的啟示。但是我想說(shuō)這不是一朝一夕的事情,其實(shí)在 deep learning 2012年被提出以后, 我們每幾年就能發(fā)現(xiàn)遷移能力、泛化能力在不斷提升。我作為一個(gè)從業(yè)者,看到的是一個(gè)漸變的過(guò)程,它不是一個(gè)突變的過(guò)程。

如果咱們做個(gè)科技考古,真正出圈的事情是ChatGPT,但是GPT 1、GPT 2的大模型從根本上跟 GPT 3 或者 ChatGPT 背后的GPT 3.5,能力差距到底有那么大嗎?我覺(jué)得其實(shí)沒(méi)有。從學(xué)術(shù)角度來(lái)看,它是一個(gè)很連續(xù)的過(guò)程,但是ChatGPT出圈恰恰是因?yàn)樗褑?wèn)答這件事做好了,能讓一個(gè)普通老百姓感受到語(yǔ)言模型的威力。

而諷刺的是問(wèn)答這件事做好,背后的技術(shù)能力中我覺(jué)得最重要的是 RLHF(Reinforcement Learning with Human Feedback ) 這個(gè)技術(shù),這個(gè)技術(shù)的賣點(diǎn)恰恰是說(shuō)我可以用 1% 的參數(shù)量就能達(dá)到一個(gè)跟之前更大的模型一樣的效果。所以這件事兒其實(shí)反倒不是大模型給你帶來(lái)的優(yōu)勢(shì),而是說(shuō)我可以提升學(xué)習(xí)的效率,使得我的模型能達(dá)到更好的效果。

所以在我看來(lái)的話,首先模型學(xué)習(xí)效率的提升是一個(gè)主旋律,在這個(gè)主旋律下,當(dāng)?shù)竭_(dá)了一個(gè)閾值以后,它進(jìn)入到公眾視野,大家就開(kāi)始說(shuō)這個(gè)事情變得很厲害,它可能突然能改變世界,但是從學(xué)術(shù)角度看的話,它是一系列的小創(chuàng)新疊加起來(lái)產(chǎn)生到今天這樣一個(gè)效果。

當(dāng)然我相信很多人會(huì)談Scaling Law,但是這不是今天才發(fā)現(xiàn)的,任何非參數(shù)模型都有Scaling Law。10 年前我們談 Kernel Method,談非參數(shù)學(xué)習(xí),任何非參數(shù)學(xué)習(xí)里面你都可以說(shuō)我們的參數(shù)量更大,我的學(xué)習(xí)效果就是更好,這是一個(gè)公認(rèn)的事情,所以我覺(jué)得它只是陳述了一個(gè)必然現(xiàn)象,但是這個(gè)必然現(xiàn)象不應(yīng)該是我們認(rèn)為的唯一福音。

《硅谷101》:那么現(xiàn)在更大的模型出來(lái)了,它有在一些方向上表現(xiàn)出更好的效果,在這個(gè)過(guò)程中,你覺(jué)得已經(jīng)訓(xùn)練出來(lái)的這些技術(shù)有沒(méi)有可以用到自動(dòng)駕駛的?因?yàn)槟愕难邪l(fā)分很多個(gè)環(huán)節(jié),有沒(méi)有哪個(gè)環(huán)節(jié)能夠用到大模型,讓它變得更好的?

侯曉迪:全部環(huán)節(jié)都能用上。首先我們把大模型打散,不要把大模型當(dāng)成是一塊大石頭,大模型可能是一把沙子,它里邊有成千上萬(wàn)的小創(chuàng)新。這里邊幾乎所有的小創(chuàng)新如果能夠擇其善者,它一定能全方位地提升一個(gè)公司的科技競(jìng)爭(zhēng)力。

舉一個(gè)具體一點(diǎn)的例子,比如預(yù)訓(xùn)練這件事,對(duì)于大模型來(lái)講,可能有100 篇 paper 在講它在預(yù)訓(xùn)練過(guò)程中的各種奇跡淫巧。那傳統(tǒng)的范式是,我先招一個(gè)標(biāo)定團(tuán)隊(duì),標(biāo)定 1000 萬(wàn)張照片,再把這 1000 萬(wàn)張照片放到 Deep Learning 里邊,訓(xùn)練出一個(gè)結(jié)果來(lái),然后完成一個(gè)神經(jīng)網(wǎng)絡(luò)的冷啟動(dòng)過(guò)程。而當(dāng)這些paper中的各種奇跡淫巧都疊加起來(lái)以后你會(huì)發(fā)現(xiàn),好像我并不需要用傳統(tǒng)的范式了,現(xiàn)在我可以有各種花式的方法降低我的標(biāo)定成本,提升我對(duì)于未標(biāo)定數(shù)據(jù)的消化能力。最終使得整體的開(kāi)發(fā)成本降低。

我們并不是應(yīng)用了大模型,而是應(yīng)用了比如100個(gè)奇跡淫巧中的36個(gè),用上了這些小竅門,我們的冷啟動(dòng)問(wèn)題就非常低成本高效率的解決了。

《硅谷101》:所以我理解其實(shí)在整個(gè)過(guò)程里面,你們不僅僅只是用模型的結(jié)果或者接口,而是你們會(huì)去學(xué)他的研究方法,然后看他的研究方法能夠從根本上去改變哪些問(wèn)題。

侯曉迪:誰(shuí)也不會(huì)直接用別人的模型,就你一定得自己搞自己的模型。2012年以后大家都在用神經(jīng)網(wǎng)絡(luò),那我們也在用神經(jīng)網(wǎng)絡(luò),但肯定用的是自家的神經(jīng)網(wǎng)絡(luò),你怎么去訓(xùn)練呢?訓(xùn)練的過(guò)程里邊有特別多的門道,你怎么把預(yù)訓(xùn)練的數(shù)據(jù)準(zhǔn)備好、你怎么訓(xùn)練、要買多少?gòu)圙PU、怎么做能夠讓 training 變得更有效率……這些所有的東西都是創(chuàng)新的一部分。在我看來(lái),新的時(shí)代就是在整個(gè)行業(yè)生命周期的各個(gè)部分都賦予了我們新的提升效率的手段和新的思路。

04 管理與招人:在火箭上不挑座位

《硅谷101》:你覺(jué)得在你的管理經(jīng)驗(yàn)上對(duì)你啟發(fā)最大的人或者事是什么?

侯曉迪:一個(gè)是我早期特別喜歡Andy Grove的兩本書,一本是《Only the Paranoid Survive》,但那本書我覺(jué)得它有太強(qiáng)的時(shí)代背景,但是另外一本書時(shí)代性沒(méi)有那么強(qiáng),換句話說(shuō),它過(guò)了這么多年仍然適用,叫做《High Output Management》。這個(gè)書其實(shí)就是著眼于作為一個(gè)管理者需要做的事情,這可能是在 2022 年以前,我覺(jué)得對(duì)我影響最大的一個(gè)理念或者一套系統(tǒng)。

之后我覺(jué)得對(duì)我影響更大的是曾鳴教授的一些言論和他的一些公開(kāi)課。其實(shí)我覺(jué)得作為一個(gè)創(chuàng)業(yè)者,不要只去想下一輪融資的時(shí)候,我要把自己打扮成什么樣子,曾教授的話叫做“看十年,想三年,做一年”。如果我們的戰(zhàn)略永遠(yuǎn)是為了下一輪融資怎么活下來(lái),那太沒(méi)理想了。我們需要想的是,如果要做一個(gè)能代表十年二十年的業(yè)務(wù),我們應(yīng)該怎么去設(shè)計(jì)一條路徑,使得我今天做的事情在五年以后仍然是有效果的?

我覺(jué)得很多時(shí)候創(chuàng)業(yè)者是覺(jué)得一個(gè)項(xiàng)目喜歡就去做,但是很多時(shí)候這是停留在直覺(jué)上,而直覺(jué)是會(huì)因?yàn)橄才?lè)改變的,比如說(shuō)現(xiàn)在這一輪融資壓力好大呀,那公司是不是應(yīng)該朝著這個(gè)方向走一走?這種時(shí)候你的直覺(jué)就被恐懼所支配,動(dòng)作就可能變形,雖然這次融資故事講出來(lái)了,但是當(dāng)包袱背在身上,你就很難卸掉了。

所以很多時(shí)候,對(duì)于一些在戰(zhàn)略上錯(cuò)誤的事情要堅(jiān)決地說(shuō)不,但是“堅(jiān)決說(shuō)不”的底氣從哪兒來(lái)?這是戰(zhàn)略帶給我們的一個(gè)全局思考架構(gòu),這個(gè)全局的思考架構(gòu)能幫助我們戰(zhàn)勝戰(zhàn)術(shù)上需要勇氣說(shuō)不的事情。

《硅谷101》:當(dāng)你更著眼于長(zhǎng)期的時(shí)候,其實(shí)短期跟長(zhǎng)期之間是有一個(gè)平衡的。比如說(shuō)你要去融資的時(shí)候,你有時(shí)候階段性的需要沖到一些里程碑,你會(huì)覺(jué)得有在這兩者之間發(fā)生沖突的時(shí)候嗎?

侯曉迪:我覺(jué)得戰(zhàn)略就是為了讓這兩者不發(fā)生沖突。如果從比較短期來(lái)看,那我現(xiàn)在最不該做的就是無(wú)人駕駛了。去做機(jī)器人,尤其是做兩條腿的機(jī)器人現(xiàn)在是很容易融資的。人家一看兩條腿的,具身智能。對(duì),記住我這句話,凡是拿兩條腿兒出來(lái)賣的都是騙子,我至今沒(méi)有看到兩條腿兒可以產(chǎn)生具體的商業(yè)價(jià)值的點(diǎn)。

人形機(jī)器人滿足的是一種大家對(duì)科幻的幻想,我覺(jué)得這就跟會(huì)飛的汽車一樣,是由幾十年以來(lái)的科幻帶給人類社會(huì)的價(jià)值,但是科幻從來(lái)不是從商業(yè)邏輯出發(fā)的,科幻是因?yàn)榭幔圆疟惶岢鰜?lái)的,這件事情引起的是你的情感共鳴,但是它從來(lái)不是引起的你的商業(yè)邏輯共鳴。

這個(gè)世界的悲慘之處就在于有很多投資人是投情感共鳴的,但是如果你真的作為創(chuàng)業(yè)者想把事情做出來(lái),你要做的是商業(yè)邏輯上的正確性,這兩者很多時(shí)候是矛盾的,我認(rèn)為最典型的兩個(gè),一個(gè)是兩條腿的機(jī)器人,一個(gè)是會(huì)飛的汽車。在科幻里,汽車能夠飛來(lái)飛去,但是我們從物理上看,我們的能量?jī)?chǔ)存、能量使用效率并沒(méi)有達(dá)到能讓車飛起來(lái)的一個(gè)狀態(tài)。

《硅谷101》:所以你覺(jué)得馬斯克的人形機(jī)器人 Optimus 還有波士頓動(dòng)力都是騙子?

侯曉迪:Boston Dynamics 是一個(gè)我非常敬佩的長(zhǎng)期主義的公司,除了兩條腿 ,它也有四條腿的機(jī)器人。它想先回答的問(wèn)題是四條腿甚至兩條腿的東西有沒(méi)有可能做出來(lái),它是在探索控制論的邊界。所以這么多年它在做的事情是堅(jiān)持不斷地給自己加難度,去做一個(gè)科學(xué)探索。

但是我覺(jué)得不應(yīng)該用具身智能突然畫一個(gè)很大的餅,我認(rèn)為我不喜歡的地方就是現(xiàn)在畫的這個(gè)餅過(guò)大,而這個(gè)餅里邊缺失的環(huán)節(jié)過(guò)多,但是大家在評(píng)估這個(gè)產(chǎn)業(yè)時(shí),又會(huì)集體性的選擇忽視其中缺失的環(huán)節(jié),它成為了一個(gè)暫時(shí)無(wú)法證偽的愿景。

如果你看到一個(gè)趨勢(shì)就不加節(jié)制的外推是很愚蠢的,但凡你了解事情更根本的運(yùn)行規(guī)律,并且能從第一性原則出發(fā),實(shí)際上就能夠推演出來(lái)很多決定性的限制因素。而這些限制因素會(huì)幫你更準(zhǔn)確地預(yù)測(cè)未來(lái),于是很多時(shí)候你就會(huì)看到你預(yù)測(cè)的未來(lái)比別人預(yù)測(cè)的未來(lái)結(jié)果要悲觀很多。

但是我的本意并不想過(guò)度批判機(jī)器人,我覺(jué)得現(xiàn)在有很多的任務(wù),我們確實(shí)發(fā)現(xiàn)了曙光,比如它的泛化能力變得比以前更強(qiáng)了,它能解決更多具體的問(wèn)題了。但是我想說(shuō)的是,如果今天就要做兩條腿、并且拿兩條腿作為賣點(diǎn)的機(jī)器人,這件事情我是堅(jiān)決反對(duì)的,但是你說(shuō)這個(gè)機(jī)器人可以在更大的規(guī)模上去替換掉在工廠里擰螺絲的人,這件事我是認(rèn)同的,而且我覺(jué)得這件事在比較近的未來(lái)就會(huì)發(fā)生。

《硅谷101》:你怎么去定義一個(gè)好的團(tuán)隊(duì)?在你看來(lái),什么樣的團(tuán)隊(duì)是能夠解決 L4 運(yùn)營(yíng)的最好的團(tuán)隊(duì),如何去組建這樣一個(gè)團(tuán)隊(duì)?

侯曉迪:我沒(méi)法定義一個(gè)好的團(tuán)隊(duì),但我能給出好團(tuán)隊(duì)的一些特性。我能想到的第一個(gè)特性就是這個(gè)團(tuán)隊(duì)必須非常靈活,我堅(jiān)信一件事情就是叫做 fluid organization,就是流動(dòng)性組織,比如說(shuō)我們的做 deep learning 的團(tuán)隊(duì)可以去搞Infra,能做到這種程度,在這個(gè)前進(jìn)方向上做得越極致,這個(gè)團(tuán)隊(duì)?wèi)?zhàn)斗力就越強(qiáng)。

我覺(jué)得公司的文化應(yīng)該是為大家共同的事業(yè)效忠,這件事情高于你個(gè)人的利益,某種意義上有一定集體主義的色彩在,因?yàn)槿绻覀儧](méi)有這樣程度的認(rèn)知,每一個(gè)人都問(wèn)公司,我憑什么加入你們?我這么厲害的人,我加入你,我的事業(yè)的增長(zhǎng)必須是一條最好的路徑,你要為我事業(yè)增長(zhǎng)的這條路負(fù)責(zé),如果每個(gè)員工都這么想的話,這活兒別干了。

我希望招到的員工他可以暫時(shí)不會(huì)這個(gè)新的技術(shù),但是他是有潛力的,他是可以被培養(yǎng)的 ,首先很重要的一點(diǎn)就是別太把自己當(dāng)回事兒。如果這個(gè)事業(yè)是我們值得效忠的,那我們就一起為他努力,不要太去計(jì)較個(gè)人的得失。就像Eric Schmid說(shuō)的,在火箭上不挑座位。

《硅谷101》:之前和你的一個(gè)投資人聊,他說(shuō)你從圖森的事情出來(lái)之后,基本上沒(méi)有緩沖時(shí)間,然后馬上就投入自己新的項(xiàng)目中,你當(dāng)時(shí)是怎么思考的?

侯曉迪:沒(méi)有沒(méi)有,這是亂講,其實(shí)在 3 月份之前我并不知道我要做什么,我花了很多時(shí)間,在想接下來(lái)要干什么,最有價(jià)值的東西是什么呢?

那時(shí)其實(shí)正好是ChatGPT出來(lái)的時(shí)候,大語(yǔ)言模型的進(jìn)展令我也很震驚,為什么我沒(méi)有做大模型呢 ?因?yàn)榇笳Z(yǔ)言模型當(dāng)下的進(jìn)展是技術(shù)進(jìn)展,技術(shù)進(jìn)展到產(chǎn)品之間的不確定性還很長(zhǎng),我已經(jīng)走過(guò)這樣的彎路了。當(dāng)時(shí)我看到deep learning 在圖像領(lǐng)域的進(jìn)展,就去搞了第一家公司知圖科技,做了一年以后發(fā)現(xiàn)其實(shí)這里邊技術(shù)并不能夠成為商業(yè)模式中最主要的部分,就是在商業(yè)上的不確定性,并不是一個(gè)技術(shù)問(wèn)題。

而這個(gè)不確定性現(xiàn)在出現(xiàn)在大模型領(lǐng)域,到底什么樣的商業(yè)模式對(duì)于大模型領(lǐng)域是合適的、真正能賺錢的?到底是大公司能先跑出來(lái),還是小公司?最有早期應(yīng)用價(jià)值的是哪部分?這些問(wèn)題我都無(wú)法回答,所以我不應(yīng)該因?yàn)橐粋€(gè)技術(shù)強(qiáng)開(kāi),就進(jìn)入到這個(gè)領(lǐng)域里面,我還是覺(jué)得應(yīng)該說(shuō)怎么賺錢,才是最基本的問(wèn)題,也是最難回答的問(wèn)題,回答清楚這個(gè)問(wèn)題才能夠進(jìn)入到這個(gè)領(lǐng)域里。

所以最后我經(jīng)過(guò)了仔細(xì)的權(quán)衡,還是認(rèn)為過(guò)去 7 年我在無(wú)人駕駛領(lǐng)域的觀察讓我看到了這個(gè)領(lǐng)域的不變性,這是我最有價(jià)值的經(jīng)驗(yàn)和知識(shí)。

我覺(jué)得每一個(gè)投資人都會(huì)說(shuō),哎呀曉迪你不該去做無(wú)人駕駛,你該做點(diǎn)別的,你要做大模型,我現(xiàn)在就給你投錢。我說(shuō)我不做大模型,我們都不清楚未來(lái)會(huì)是什么樣。無(wú)人駕駛是我明確一定能做出來(lái)的事情,我還是想去做這個(gè)確定性更高的事。作為一個(gè)長(zhǎng)期主義者,我看到的是長(zhǎng)期的確定性,而這件事情的價(jià)值被很多沒(méi)有長(zhǎng)期主義視野的人低估。

如果把時(shí)間的窗口拉到十年,我很難想象人類作為一個(gè)種群,十年之后還由人來(lái)開(kāi)車。物流系統(tǒng)必須有一次它的迭代和升級(jí),這個(gè)升級(jí)由誰(shuí)來(lái)完成?這個(gè)使命就放在這里,我想把這個(gè)使命實(shí)現(xiàn)。

05 世界模型:新瓶裝舊酒

《硅谷101》:現(xiàn)在全球的自動(dòng)駕駛到了什么樣的一個(gè)水平呢?它面臨的主要問(wèn)題跟瓶頸是什么?

侯曉迪:革命進(jìn)入低潮期,面臨著由加息帶來(lái)的純資本問(wèn)題,但是資本又是很重要的一個(gè)問(wèn)題。資本能澆灌一個(gè)行業(yè),行業(yè)里邊有了閑錢,人們的創(chuàng)造力就會(huì)得到解放,去發(fā)現(xiàn)一些可有可無(wú)的東西。早期技術(shù)的發(fā)展和產(chǎn)品的發(fā)展可能沒(méi)有那么直接相關(guān),很多時(shí)候你為了做一個(gè)技術(shù),會(huì)發(fā)現(xiàn)產(chǎn)品最后一團(tuán)糟,有的時(shí)候你為了做一個(gè)產(chǎn)品,你發(fā)現(xiàn)技術(shù)用在了你想象不到的地方。但是在這之后,技術(shù)就有可能就會(huì)被用在更正確的產(chǎn)品上。

不過(guò)這個(gè)低潮期跟技術(shù)沒(méi)什么關(guān)系,技術(shù)還是穩(wěn)步甚至加速在發(fā)展。和大模型領(lǐng)域不同,無(wú)人駕駛行業(yè)的產(chǎn)品形態(tài)已經(jīng)越來(lái)越清晰,這是我認(rèn)為我過(guò)去幾年最大的價(jià)值。

《硅谷101》:Sora 出來(lái)之后,這種世界模擬器的概念是不是能夠賦能無(wú)人駕駛界可以發(fā)展的更快?

侯曉迪:咱們來(lái)個(gè)長(zhǎng)議題,咱們談?wù)勈澜缒P?。什么是世界模型呢?世界模型就是新瓶裝舊酒,一九八幾年的時(shí)候,機(jī)器視覺(jué)這個(gè)行業(yè)誕生的那個(gè)時(shí)刻, David Marr 老師就提出來(lái)了一個(gè)叫做 mid-level representation,他的這個(gè)概念也引導(dǎo)我入行,引導(dǎo)我讀完整個(gè)本科初步的探索以及博士深入的探索。

在計(jì)算機(jī)視覺(jué)領(lǐng)域,我覺(jué)得 mid-level representation 是我最喜歡的一個(gè)議題。mid-level representation 后來(lái)也叫 internal representation(內(nèi)蘊(yùn)表達(dá))。過(guò)了幾年 deep learning 出來(lái)了,大家認(rèn)為 deep learning 解決的核心問(wèn)題是什么呢?其實(shí)是 representation 的問(wèn)題。于是有一個(gè)特別著名的會(huì)議在 deep learning 誕生以后提出來(lái),叫做 ICLRA, 這個(gè)會(huì)本身講的就是 the learning of the representation,就是說(shuō)這個(gè)內(nèi)蘊(yùn)表達(dá)或者內(nèi)蘊(yùn)表征是可以被學(xué)到的,而且應(yīng)該被學(xué)到,而怎么學(xué)就是我們探索的事情。

這件事情不斷地被人包裝,2024 年的版本叫做世界模型,但是這個(gè)世界模型首先可大可小,它的精度也是可糙可細(xì)。所以我覺(jué)得首先世界模型這件事它確實(shí)是一個(gè)本質(zhì)問(wèn)題,但是這個(gè)本質(zhì)問(wèn)題不新,其實(shí) 40 年前就已經(jīng)有了,而且確實(shí)是 40 年以來(lái)貫穿整個(gè)計(jì)算機(jī)視覺(jué)和模式識(shí)別發(fā)展的核心問(wèn)題。但是愚者的原罪在于外推,外推的地方就是說(shuō)大家談到世界模型就會(huì)把它認(rèn)為是一個(gè)可以無(wú)限高精度的、無(wú)限遠(yuǎn)未來(lái)的外推模型,這是不對(duì)的,這就是我說(shuō)的錯(cuò)誤的外推世界模型。對(duì)外在世界的內(nèi)蘊(yùn)表達(dá),這件事情是我們一直以來(lái)的追求,是我們整個(gè)行業(yè)幾輩幾代人一直以來(lái)的追求。但是不要把這個(gè)事情它的最終形態(tài)的結(jié)果就當(dāng)成現(xiàn)在已經(jīng)有的東西。

那我來(lái)再說(shuō)說(shuō) Sora 是什么?Sora 是一個(gè)學(xué)了一套東西,使得它讓你看起來(lái)這個(gè)東西像那么回事。很多年前有一個(gè)迪士尼電影叫做冰雪奇緣。

冰雪奇緣這個(gè)電影它干的事是什么呢?是當(dāng)時(shí)電影工業(yè) CG Computer Graphics,人們突然提出了一個(gè)新的算法,能夠模擬雪這種非牛頓流體的流體力學(xué),雪不是液體,也不是缸體,它是一種有一定粘連性,但是又能散開(kāi)的東西。如果你像用每一個(gè)粒子去模擬雪的動(dòng)態(tài)過(guò)程的話,那累死了,機(jī)器做不了。

但是如果我們找到了一種簡(jiǎn)化的近似算法,讓這坨雪看起來(lái)像是雪,那我們就覺(jué)得這件事情就是計(jì)算上足夠便宜,可以用渲染集群渲染出一個(gè)動(dòng)畫片。所以是基于一個(gè)算法的創(chuàng)新,做了這個(gè)動(dòng)畫片,就為了這盤醋包了一鍋餃子??赡芪艺f(shuō)的有點(diǎn)夸張,但是確實(shí)冰雪奇緣之所以能做出來(lái),背后最大的創(chuàng)新是 Computer Graphics 的創(chuàng)新,但是這種創(chuàng)新并不能夠讓你用到比如說(shuō)飛機(jī)的流體力學(xué)上,它跟真正的物理真實(shí)是兩碼事。他所做的只是看起來(lái)像是真的,那么 Sora 給我們帶來(lái)的一個(gè)狀態(tài),也是說(shuō)他做了一個(gè)模擬器,看起來(lái)像是真的,但是這件事情不是物理真實(shí)。

《硅谷101》:業(yè)界對(duì)于自動(dòng)駕駛的長(zhǎng)尾問(wèn)題,現(xiàn)在還有什么好的方法去解決嗎?

侯曉迪:我覺(jué)得長(zhǎng)尾問(wèn)題其實(shí)也是一個(gè)偽命題,很高興你們提出來(lái)這個(gè)事情。在我看來(lái)長(zhǎng)尾問(wèn)題,比如說(shuō)我見(jiàn)到鱷魚怎么處理?我見(jiàn)到大象怎么處理?我見(jiàn)著一個(gè)固定翼飛機(jī)停在高速公路上,我怎么處理這件事情?大家都覺(jué)得它是長(zhǎng)尾問(wèn)題。比如在我的前進(jìn)路徑上,見(jiàn)到了一個(gè)沒(méi)見(jiàn)過(guò)的物體,我怎么處理?但是如果你把它包裹成了一個(gè)更通用的一類問(wèn)題,它是很好處理的。

比如說(shuō)我們?cè)?jīng)就見(jiàn)到有固定翼飛機(jī)停在高速公路上,那我們的處理方法很簡(jiǎn)單,停車對(duì)吧?這是好處理的情況,但是其實(shí)人們感覺(jué)長(zhǎng)尾問(wèn)題很難處理,是很難當(dāng)場(chǎng)讓這個(gè)車做出一個(gè)人類經(jīng)過(guò)深思熟慮以后認(rèn)為最優(yōu)的操作,再去跟這個(gè)場(chǎng)景進(jìn)行交互,這件事情是難的。

首先機(jī)器的感知沒(méi)那么難,尤其再加上激光雷達(dá)或者雙目視覺(jué)以后,各種各樣的問(wèn)題你都能識(shí)別,但是你如何跟他進(jìn)行交互?如果一個(gè)鱷魚來(lái)了,一個(gè)駱駝來(lái)了,一個(gè)兔子來(lái)了你都要怎么操作?對(duì)于這種問(wèn)題確實(shí)是你需要回答的長(zhǎng)尾問(wèn)題,但是我覺(jué)得我們的無(wú)人駕駛卡車是不需要做這樣的回答的。

如果當(dāng)你有乘客在無(wú)人駕駛轎車?yán)锩娴臅r(shí)候,你要顧及一個(gè)不可能三角,就是交規(guī)要滿足乘客的體驗(yàn)、要滿足路上其他的道路參與者的安全和他們的感受,在這個(gè)不可能三角的情況下,確實(shí)存在有很多你需要特事特辦的討論。但是我覺(jué)得無(wú)人駕駛卡車如果在全局平均意義下來(lái)講,我們的運(yùn)營(yíng)成本是可接受的。運(yùn)營(yíng)產(chǎn)生的額外成本,比如我因?yàn)橐?jiàn)到飛機(jī)停在路邊兒這件事情產(chǎn)生的成本,是能夠被我的每英里成本所消化的,那我覺(jué)得這事兒我們就可以做。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

對(duì)話前圖森未來(lái)CEO侯曉迪:大模型催快的自動(dòng)駕駛與攪局的馬斯克

“實(shí)名反對(duì)”馬斯克的弄潮者。

文|硅谷101 泓君 陳茜

自動(dòng)駕駛行業(yè)備受關(guān)注的前圖森聯(lián)合創(chuàng)始人侯曉迪,在《硅谷101》的訪談中,透露了他的最新動(dòng)向,他已經(jīng)開(kāi)始了新一次的創(chuàng)業(yè),依舊是自動(dòng)駕駛卡車,新公司的名字叫做 Bot.Auto。

在《硅谷101》的訪談中,侯曉迪承認(rèn)自動(dòng)駕駛行業(yè)進(jìn)入了低潮期,但這種低潮是由加息帶來(lái)的純資本問(wèn)題,并預(yù)估在2026-2027年他的公司可以在特定場(chǎng)景下賺錢。

侯曉迪之前所在的圖森也是命途多舛:

作為全球自動(dòng)駕駛第一股,圖森未來(lái)2021年4月在納斯達(dá)克上市,發(fā)行價(jià)是40美元,很快股價(jià)翻番,沖上70美元。但是圖森未來(lái)的高光沒(méi)有持續(xù)多久,就遇到了很多中資背景的企業(yè)在美國(guó)遇到的一系列你能想象的困難:

第一波的困難是在做空機(jī)構(gòu)與2022年美國(guó)加息的雙重背景下股價(jià)腰斬;

接下來(lái)又被美國(guó)的監(jiān)管機(jī)構(gòu)盯上,美國(guó)海外投資委員會(huì)CIFUS對(duì)圖森進(jìn)行了持續(xù)的調(diào)查與監(jiān)管;

最后圖森經(jīng)歷了四輪管理權(quán)的更迭。

2022年3月,呂程離開(kāi)公司, 2022 年6月,陳默離開(kāi)董事會(huì)。侯曉迪作為僅剩的創(chuàng)始團(tuán)隊(duì)與早期管理團(tuán)隊(duì)的代表留在了公司和董事會(huì)上,接下來(lái)就是圖森美國(guó)的董事會(huì)強(qiáng)行通過(guò)投票把侯曉迪也給罷免了,使用的條款叫做 Terminate without cause(無(wú)理由終止合約)。至此,圖森未來(lái)可以說(shuō)他們的創(chuàng)始團(tuán)隊(duì)以及早期管理團(tuán)隊(duì)全部出局。這是第二次權(quán)利的反轉(zhuǎn)。

第三次是10天之后,圖森的創(chuàng)始團(tuán)隊(duì)與管理團(tuán)隊(duì)侯曉迪、陳默、呂程三人用超級(jí)投票權(quán)重新奪回了公司,又換掉了之前的董事。但是代價(jià)就是,圖森重新回到陳默與呂程手中,侯曉迪被邊緣化,于次年辭去董事職位,徹底離開(kāi)圖森。

所有的這些事情都發(fā)生在圖森上市以后的兩年內(nèi)。經(jīng)過(guò)美國(guó)監(jiān)管機(jī)構(gòu)的調(diào)查與管理權(quán)的輪番更替后,圖森未來(lái)的股價(jià)當(dāng)時(shí)已經(jīng)跌破了上市發(fā)行價(jià)的 90%。在2024年1月份,圖森發(fā)布公告說(shuō),公司正決定從納斯達(dá)克摘牌退市,并且會(huì)注銷普通股。這個(gè)時(shí)候圖森的股價(jià)只剩下 0.25 美元,距離上市時(shí)候的40美元可以說(shuō)是只剩下了一個(gè)零頭。

在大國(guó)科技交鋒的風(fēng)口浪尖上,圖森未來(lái)的故事比tiktok更加跌宕起伏,也更加艱難。無(wú)論是自動(dòng)駕駛還是大模型的更新熱點(diǎn)不斷。侯曉迪在訪談中也詳細(xì)解釋了為什么他實(shí)名反對(duì)馬斯克,以及他對(duì)大模型、世界模型、具身智能等諸多熱點(diǎn)話題的看法。以下是《硅谷101》與侯曉迪的對(duì)話。

01 我為什么實(shí)名反對(duì)馬斯克

《硅谷101》:為什么再次創(chuàng)業(yè)還是選了自動(dòng)駕駛這個(gè)方向?

侯曉迪:因?yàn)榭匆?jiàn)所以相信。我在過(guò)去的七年中也看到了一些不變性,這是我最寶貴的財(cái)富,也是支持我做下一次事業(yè)的出發(fā)點(diǎn)。首先是技術(shù)管理的能力,更多的是行業(yè)里面的一些必然趨勢(shì),這些必然趨勢(shì)讓我覺(jué)得無(wú)人駕駛一定可以做出來(lái)。

無(wú)人駕駛這件事,之前的問(wèn)題就在于大家都在做一個(gè)騙錢的生意,但是我們現(xiàn)在要做一個(gè)賺錢的生意。大概在未來(lái)的三四年,也就是2026或者2027年,我覺(jué)得自動(dòng)駕駛就可以實(shí)現(xiàn)商業(yè)化或者說(shuō)就能開(kāi)始在一些特定場(chǎng)景下賺錢了,真正的規(guī)?;矣X(jué)得應(yīng)該在2030年前后可以實(shí)現(xiàn)。

當(dāng)然了,這個(gè)時(shí)間節(jié)點(diǎn)是我和我們公司在一個(gè)理性樂(lè)觀的情況下給出的預(yù)估,但是對(duì)于整個(gè)行業(yè)而言,我沒(méi)有這么樂(lè)觀的估計(jì),因?yàn)檫@還是取決于具體的人和團(tuán)隊(duì),而人和人的差距比人和狗的差距還大。

《硅谷101》:相比于自動(dòng)駕駛剛剛成立的時(shí)候,這幾年其實(shí)已經(jīng)非常少看到這個(gè)行業(yè)拿到融資的情況了。你會(huì)覺(jué)得行業(yè)在一個(gè)寒冬期嗎?

侯曉迪:我覺(jué)得是這樣,窮有窮的活法,富有富的活法。大家可能都認(rèn)為自動(dòng)駕駛是一個(gè)高資金門檻的行業(yè),燒錢燒得太貴了,但是在我看來(lái)不是這樣?;四敲炊噱X,但是實(shí)際上這些錢有多少是用在探索上的?有多少錢是用在盲目擴(kuò)張和其他并不有助于實(shí)際開(kāi)發(fā)的事情的?我覺(jué)得行業(yè)內(nèi)耗實(shí)際上非常大的。那現(xiàn)在可能說(shuō)得極端一點(diǎn),就是在一個(gè)寸草不生的環(huán)境下,我們只需要做自己就可以了。

無(wú)人駕駛這個(gè)行業(yè),過(guò)去七年不變的東西就是它的商業(yè)邏輯。這個(gè)商業(yè)邏輯讓我非常堅(jiān)信這件事一定能做出來(lái),而且它做出來(lái)一定能讓我們站著把錢掙了。

《硅谷101》:馬斯克說(shuō)他在今年8月份要去推robotaxi,你怎么看?

侯曉迪:我覺(jué)得首先是這樣,我是實(shí)名反對(duì)Elon Musk的,我認(rèn)為他做的事情不是一個(gè)利他主義的事情,他自己是做輔助駕駛的,但是總喜歡把自己打扮成無(wú)人駕駛。我們今天談的是L4無(wú)人駕駛,去掉人并且由軟件開(kāi)發(fā)公司承擔(dān)責(zé)任的方案才叫無(wú)人駕駛,而FSD叫輔助駕駛,它不是無(wú)人駕駛。所以我們做的其實(shí)根本不是一個(gè)東西。

如果特斯拉撞死人了怎么辦?對(duì)于馬斯克來(lái)講,這不是他的責(zé)任。因?yàn)樘厮估瓕懙煤芮宄l(shuí)駕駛誰(shuí)負(fù)責(zé),所以撞死人了,是司機(jī)的責(zé)任。第二點(diǎn),繞一大圈回來(lái),他的商業(yè)邏輯還是賣車,怎么把車賣得更好是這個(gè)公司的核心戰(zhàn)略,所以無(wú)人駕駛是為了輔助他賣車的,并不是這個(gè)公司的底色。它讓你覺(jué)得它是無(wú)人駕駛,但它實(shí)際上是輔助駕駛。

再回到馬斯克發(fā)表8月 8 日要做 robotaxi 的陳述。如果他8月8日沒(méi)做出來(lái),投資人們一定會(huì)來(lái)問(wèn)我,是不是這事做不出來(lái)啦?那第二種可能是 8月8日真的運(yùn)營(yíng)了,然后第二天撞車了。投資人肯定也會(huì)擔(dān)心:馬斯克都撞車了,你們行不行???這事果然不安全啊。好,第三種情況是開(kāi)始運(yùn)營(yíng)了,沒(méi)撞車。那投資人們會(huì)說(shuō),你看馬斯克都做出來(lái)了,人家降維打擊你們,你們?cè)趺崔k呀?

所以馬斯克發(fā)出這個(gè)陳述的時(shí)候他就已經(jīng)贏了,我們已經(jīng)輸了,或者說(shuō)他沒(méi)有贏,但我們已經(jīng)輸了。我覺(jué)得一個(gè)問(wèn)題就在于,大家真的過(guò)多地去相信馬斯克說(shuō)的每句話,但是如果我們?nèi)タ纯瘩R斯克之前說(shuō)的事情,他有做成的地方,但是他做不成的東西更多。這個(gè)人做的很多事情還是以表演為主。他的很多言論肥了自己,但是實(shí)際上傷害到了無(wú)人駕駛整個(gè)行業(yè)。

比如說(shuō)無(wú)人駕駛要不要上激光雷達(dá)這個(gè)問(wèn)題,他說(shuō)你有激光雷達(dá)你就弱,但是我認(rèn)為黑貓白貓抓著耗子就是好貓,激光雷達(dá)弱不弱最后我們需要核算的是成本,如果加了激光雷達(dá)我們能賺錢,我們就加。我想告訴大家這件事的本源是怎樣的,這有可能并不是一個(gè)最有效率的、最有利于對(duì)自己發(fā)展方向的手段,但是我們至少不應(yīng)該去做一些有損整個(gè)行業(yè)前進(jìn)的事情。

《硅谷101》:如果他們做成了,這個(gè)行業(yè)會(huì)不會(huì)就重新回暖了?

侯曉迪:首先我覺(jué)得做不成,因?yàn)橹澳莻€(gè)車的租期到了,最近我太太特意換了輛特斯拉,我自己去開(kāi)特斯拉, 10 分鐘一次接管,以我做無(wú)人駕駛這么多年的標(biāo)準(zhǔn),它目前根本不可能做成robotaxi 的運(yùn)營(yíng),至少不可能在8月8日做成Waymo程度的運(yùn)營(yíng),不過(guò)當(dāng)然了,它可以在里面偷換很多概念。到時(shí)候開(kāi)一個(gè)有輔助駕駛功能的出租車公司,這是有可能做到的,但是一定不是 Waymo 這種程度的。

《硅谷101》:不過(guò)特斯拉其實(shí)有在輔助駕駛上積累很多的數(shù)據(jù),這些數(shù)據(jù)能不能幫它更快地解決一些在無(wú)人駕駛上的 corner case(極端情況)?

侯曉迪:我們認(rèn)為無(wú)人駕駛是一個(gè)世界級(jí)的、競(jìng)賽水平很高的行業(yè)。在非常低的水平,當(dāng)你做任務(wù)a的時(shí)候,它也許能夠幫助到任務(wù)b,但當(dāng)你的水平越來(lái)越高的時(shí)候,你是做不到的。

在非常低水平,你確實(shí)可以說(shuō)L2是有幫助的,誰(shuí)也不能否認(rèn)它是有幫助的。但是 L4 無(wú)人駕駛要解決的核心問(wèn)題是什么呢?是安全性,是冗余,是當(dāng)一個(gè)系統(tǒng)的每一個(gè)模塊都有可能會(huì)失效的時(shí)候,這個(gè)系統(tǒng)還仍然能夠保障最底線的安全,這才是 L4 最難和最關(guān)鍵的部分。所以在掙錢之前它要先解決安全性的問(wèn)題,但是這件事情根本不是特斯拉的設(shè)計(jì)宗旨。

02 自動(dòng)駕駛的核心難題:不是少數(shù)的大問(wèn)題,而是大量的小問(wèn)題

《硅谷101》:你覺(jué)得自動(dòng)駕駛的錯(cuò)誤觀念跟正確觀念是什么?

侯曉迪:我覺(jué)得首先無(wú)人駕駛現(xiàn)在需要解決的不是一個(gè)少數(shù)的大問(wèn)題,而是大量的小問(wèn)題。無(wú)人駕駛最大的問(wèn)題之一是運(yùn)營(yíng)不穩(wěn)定,而這個(gè)運(yùn)營(yíng)不穩(wěn)定有可能是因?yàn)榫W(wǎng)線質(zhì)量不行導(dǎo)致的,比如每天上傳下載數(shù)據(jù)效率很低之類的,這個(gè)事情就太復(fù)雜了,但是它絕對(duì)不是一個(gè)一句話能講清楚的大問(wèn)題,而是由大量的小問(wèn)題組成。我們?cè)谧龅钠鋵?shí)就是一個(gè)組織結(jié)構(gòu),這考驗(yàn)的就是你的組織是否進(jìn)化到具備以變態(tài)高的效率去解決大量小問(wèn)題的能力。

我們不斷地去改變組織結(jié)構(gòu),去適應(yīng)新的時(shí)代,最終的目的就是讓組織用最少的人,能干最多的活,并且可以最快地去解決這個(gè)事。它必然是跟一些大公司的文化是對(duì)立的,什么時(shí)候如果一個(gè)公司認(rèn)為你做不出來(lái)一個(gè)奇跡是不應(yīng)該被批評(píng)的,因?yàn)槲覀円?,我們要保證團(tuán)隊(duì)的氣氛比較好,這個(gè)時(shí)候這個(gè)公司就已經(jīng)死了,他就已經(jīng)不是一個(gè)創(chuàng)業(yè)公司了。

《硅谷101》:我之前跟 Cruise 的人聊,他說(shuō)其實(shí) Cruise 內(nèi)部在面臨非常大的一個(gè)問(wèn)題,也是運(yùn)營(yíng)問(wèn)題。舊金山的無(wú)人駕駛事故讓Cruise元?dú)獯髠?,這件事有一點(diǎn)點(diǎn)巧合的因素在里面,我們就不展開(kāi)說(shuō)了。但是其實(shí)這個(gè)是大家能看到的,大家不能看到的就是不管是你剮蹭,或者是別人故意蹭你,他們都會(huì)有一個(gè)非常大的團(tuán)隊(duì)每天專門去處理這些個(gè)案性的無(wú)人駕駛車帶來(lái)的問(wèn)題。

侯曉迪:對(duì),你看這不就是運(yùn)營(yíng)嘛?這就是無(wú)人駕駛的運(yùn)營(yíng)問(wèn)題。如果你落地的時(shí)候有問(wèn)題,你要么是自己去扛這個(gè)運(yùn)營(yíng)的問(wèn)題,要么就是找一冤大頭讓他來(lái)扛這個(gè)問(wèn)題。首先冤大頭的數(shù)量是有限的,哪天冤大頭自己發(fā)現(xiàn)虧錢了,他也不會(huì)繼續(xù)冤下去了,所以我們不能坑我們的客戶,我認(rèn)為運(yùn)營(yíng)一定是要無(wú)人駕駛公司自己來(lái)?yè)?dān)的,這是第一。

第二就是你說(shuō)這種小的剮蹭問(wèn)題,其實(shí)它更根本反映的是什么呢?在城市交通里面,我們的交通規(guī)則是不完善的,再具體說(shuō)就是交通規(guī)則的權(quán)責(zé)劃分是不完善的。如果你在開(kāi)車,右邊有一個(gè)自行車道,然后你想右拐,是不是就應(yīng)該往自行車道走?這時(shí)候誰(shuí)有責(zé),誰(shuí)有路權(quán),撞了以后是誰(shuí)的責(zé)任?這件事是不清晰的,而且也不會(huì)清晰。因?yàn)槟忝鎸?duì)的是一個(gè)人,人們?cè)谧鰧徟械臅r(shí)候總是傾向于認(rèn)為機(jī)器應(yīng)該是完美服從于人的。人可以犯各種錯(cuò),人可以跟人共情,但人不會(huì)跟電腦共情。所以在這個(gè)問(wèn)題上,無(wú)人駕駛在一個(gè)權(quán)責(zé)不清的交通環(huán)境下,它一定是非常難做的。

那么城區(qū)是權(quán)責(zé)不清最嚴(yán)重的地方,這就是為什么一開(kāi)始我就做卡車,做了 7 年,我現(xiàn)在還做卡車??ㄜ嚻鋵?shí)就不會(huì)像在城市交通,尤其是擁堵的城市交通里面會(huì)遇到這么多權(quán)責(zé)不清的情況。我們的經(jīng)驗(yàn)認(rèn)為,即使是在最后一公里的狀況下,卡車所面臨的權(quán)責(zé)不清的交通場(chǎng)景也是非常非常少的。

《硅谷101》:所以你覺(jué)得高速是一個(gè)比城市更容易實(shí)現(xiàn)無(wú)人駕駛的地方?

侯曉迪:對(duì),而且卡車的無(wú)人駕駛,我不用去解決這些不可解的問(wèn)題——既要守交通規(guī)則,又要確保乘客的安全和乘客乘坐體驗(yàn)的舒適,同時(shí)我還要需要確保周邊其他道路交通的參與者的安全,這三個(gè)東西放在一起就是不可解問(wèn)題。

比如機(jī)器能否壓雙黃線這個(gè)問(wèn)題。很多時(shí)候如果壓雙黃線,我就能夠比較快速繞過(guò)去解決一個(gè)問(wèn)題,但是壓雙黃線就是違反交通規(guī)則了。那如果我遵守交通規(guī)則慢慢等著,乘客可能會(huì)覺(jué)得我太慢了,然后給差評(píng)。此外,我還要跟其他不守交通規(guī)則的人去競(jìng)爭(zhēng),并且出了責(zé)任以后,我會(huì)被放到一個(gè)非常不利的被審判的位置上,因?yàn)槲沂请娔X,我就應(yīng)該把事情做完美。這三個(gè)東西加起來(lái),無(wú)人駕駛就很難了。

但是如果第一我沒(méi)有乘客,第二我可以犧牲運(yùn)營(yíng)的時(shí)間和效率去確保我的安全和合規(guī),只要這個(gè)矛盾發(fā)生的概率足夠小,它就能是一個(gè)合理的商業(yè)模式。

03 大模型里有成千上百的小創(chuàng)新,無(wú)人駕駛都能用上

《硅谷101》:因?yàn)榇竽P吞貏e火,你覺(jué)得大模型對(duì)自動(dòng)駕駛的技術(shù)會(huì)有什么幫助嗎?

侯曉迪:大模型非?;?,但是我覺(jué)得絕大部分談大模型的人根本不懂什么是大模型。我認(rèn)為大模型不是一種參數(shù)越多就越厲害的東西,它是一種具備了遷移能力的模型。在 computer vision 領(lǐng)域,其實(shí)很久以前人們就已經(jīng)發(fā)現(xiàn),當(dāng)一個(gè)模型訓(xùn)練到一定程度以后,它的內(nèi)蘊(yùn)表達(dá)是具有很高價(jià)值的,這個(gè)內(nèi)蘊(yùn)表達(dá)能夠以比較低甚至是零成本遷移到另外一個(gè)任務(wù)上,這就是模型的遷移能力,是它推動(dòng)了這一波大模型。

在以前沒(méi)有遷移能力的時(shí)候,適應(yīng)成本是非常高的。當(dāng)你的系統(tǒng)學(xué)會(huì)了做一件事兒,想用它做第二件事時(shí),需要把原來(lái)做好的系統(tǒng)再放到一個(gè)看起來(lái)相似但不完全相同的場(chǎng)景下,成本非常高。那么現(xiàn)在這種遷移成本變得越來(lái)越低。

遷移成本,也就是落地成本的降低,使得很多事情變得可做了,我覺(jué)得這就是人工智能這一次給大家?guī)?lái)的比較大的啟示。但是我想說(shuō)這不是一朝一夕的事情,其實(shí)在 deep learning 2012年被提出以后, 我們每幾年就能發(fā)現(xiàn)遷移能力、泛化能力在不斷提升。我作為一個(gè)從業(yè)者,看到的是一個(gè)漸變的過(guò)程,它不是一個(gè)突變的過(guò)程。

如果咱們做個(gè)科技考古,真正出圈的事情是ChatGPT,但是GPT 1、GPT 2的大模型從根本上跟 GPT 3 或者 ChatGPT 背后的GPT 3.5,能力差距到底有那么大嗎?我覺(jué)得其實(shí)沒(méi)有。從學(xué)術(shù)角度來(lái)看,它是一個(gè)很連續(xù)的過(guò)程,但是ChatGPT出圈恰恰是因?yàn)樗褑?wèn)答這件事做好了,能讓一個(gè)普通老百姓感受到語(yǔ)言模型的威力。

而諷刺的是問(wèn)答這件事做好,背后的技術(shù)能力中我覺(jué)得最重要的是 RLHF(Reinforcement Learning with Human Feedback ) 這個(gè)技術(shù),這個(gè)技術(shù)的賣點(diǎn)恰恰是說(shuō)我可以用 1% 的參數(shù)量就能達(dá)到一個(gè)跟之前更大的模型一樣的效果。所以這件事兒其實(shí)反倒不是大模型給你帶來(lái)的優(yōu)勢(shì),而是說(shuō)我可以提升學(xué)習(xí)的效率,使得我的模型能達(dá)到更好的效果。

所以在我看來(lái)的話,首先模型學(xué)習(xí)效率的提升是一個(gè)主旋律,在這個(gè)主旋律下,當(dāng)?shù)竭_(dá)了一個(gè)閾值以后,它進(jìn)入到公眾視野,大家就開(kāi)始說(shuō)這個(gè)事情變得很厲害,它可能突然能改變世界,但是從學(xué)術(shù)角度看的話,它是一系列的小創(chuàng)新疊加起來(lái)產(chǎn)生到今天這樣一個(gè)效果。

當(dāng)然我相信很多人會(huì)談Scaling Law,但是這不是今天才發(fā)現(xiàn)的,任何非參數(shù)模型都有Scaling Law。10 年前我們談 Kernel Method,談非參數(shù)學(xué)習(xí),任何非參數(shù)學(xué)習(xí)里面你都可以說(shuō)我們的參數(shù)量更大,我的學(xué)習(xí)效果就是更好,這是一個(gè)公認(rèn)的事情,所以我覺(jué)得它只是陳述了一個(gè)必然現(xiàn)象,但是這個(gè)必然現(xiàn)象不應(yīng)該是我們認(rèn)為的唯一福音。

《硅谷101》:那么現(xiàn)在更大的模型出來(lái)了,它有在一些方向上表現(xiàn)出更好的效果,在這個(gè)過(guò)程中,你覺(jué)得已經(jīng)訓(xùn)練出來(lái)的這些技術(shù)有沒(méi)有可以用到自動(dòng)駕駛的?因?yàn)槟愕难邪l(fā)分很多個(gè)環(huán)節(jié),有沒(méi)有哪個(gè)環(huán)節(jié)能夠用到大模型,讓它變得更好的?

侯曉迪:全部環(huán)節(jié)都能用上。首先我們把大模型打散,不要把大模型當(dāng)成是一塊大石頭,大模型可能是一把沙子,它里邊有成千上萬(wàn)的小創(chuàng)新。這里邊幾乎所有的小創(chuàng)新如果能夠擇其善者,它一定能全方位地提升一個(gè)公司的科技競(jìng)爭(zhēng)力。

舉一個(gè)具體一點(diǎn)的例子,比如預(yù)訓(xùn)練這件事,對(duì)于大模型來(lái)講,可能有100 篇 paper 在講它在預(yù)訓(xùn)練過(guò)程中的各種奇跡淫巧。那傳統(tǒng)的范式是,我先招一個(gè)標(biāo)定團(tuán)隊(duì),標(biāo)定 1000 萬(wàn)張照片,再把這 1000 萬(wàn)張照片放到 Deep Learning 里邊,訓(xùn)練出一個(gè)結(jié)果來(lái),然后完成一個(gè)神經(jīng)網(wǎng)絡(luò)的冷啟動(dòng)過(guò)程。而當(dāng)這些paper中的各種奇跡淫巧都疊加起來(lái)以后你會(huì)發(fā)現(xiàn),好像我并不需要用傳統(tǒng)的范式了,現(xiàn)在我可以有各種花式的方法降低我的標(biāo)定成本,提升我對(duì)于未標(biāo)定數(shù)據(jù)的消化能力。最終使得整體的開(kāi)發(fā)成本降低。

我們并不是應(yīng)用了大模型,而是應(yīng)用了比如100個(gè)奇跡淫巧中的36個(gè),用上了這些小竅門,我們的冷啟動(dòng)問(wèn)題就非常低成本高效率的解決了。

《硅谷101》:所以我理解其實(shí)在整個(gè)過(guò)程里面,你們不僅僅只是用模型的結(jié)果或者接口,而是你們會(huì)去學(xué)他的研究方法,然后看他的研究方法能夠從根本上去改變哪些問(wèn)題。

侯曉迪:誰(shuí)也不會(huì)直接用別人的模型,就你一定得自己搞自己的模型。2012年以后大家都在用神經(jīng)網(wǎng)絡(luò),那我們也在用神經(jīng)網(wǎng)絡(luò),但肯定用的是自家的神經(jīng)網(wǎng)絡(luò),你怎么去訓(xùn)練呢?訓(xùn)練的過(guò)程里邊有特別多的門道,你怎么把預(yù)訓(xùn)練的數(shù)據(jù)準(zhǔn)備好、你怎么訓(xùn)練、要買多少?gòu)圙PU、怎么做能夠讓 training 變得更有效率……這些所有的東西都是創(chuàng)新的一部分。在我看來(lái),新的時(shí)代就是在整個(gè)行業(yè)生命周期的各個(gè)部分都賦予了我們新的提升效率的手段和新的思路。

04 管理與招人:在火箭上不挑座位

《硅谷101》:你覺(jué)得在你的管理經(jīng)驗(yàn)上對(duì)你啟發(fā)最大的人或者事是什么?

侯曉迪:一個(gè)是我早期特別喜歡Andy Grove的兩本書,一本是《Only the Paranoid Survive》,但那本書我覺(jué)得它有太強(qiáng)的時(shí)代背景,但是另外一本書時(shí)代性沒(méi)有那么強(qiáng),換句話說(shuō),它過(guò)了這么多年仍然適用,叫做《High Output Management》。這個(gè)書其實(shí)就是著眼于作為一個(gè)管理者需要做的事情,這可能是在 2022 年以前,我覺(jué)得對(duì)我影響最大的一個(gè)理念或者一套系統(tǒng)。

之后我覺(jué)得對(duì)我影響更大的是曾鳴教授的一些言論和他的一些公開(kāi)課。其實(shí)我覺(jué)得作為一個(gè)創(chuàng)業(yè)者,不要只去想下一輪融資的時(shí)候,我要把自己打扮成什么樣子,曾教授的話叫做“看十年,想三年,做一年”。如果我們的戰(zhàn)略永遠(yuǎn)是為了下一輪融資怎么活下來(lái),那太沒(méi)理想了。我們需要想的是,如果要做一個(gè)能代表十年二十年的業(yè)務(wù),我們應(yīng)該怎么去設(shè)計(jì)一條路徑,使得我今天做的事情在五年以后仍然是有效果的?

我覺(jué)得很多時(shí)候創(chuàng)業(yè)者是覺(jué)得一個(gè)項(xiàng)目喜歡就去做,但是很多時(shí)候這是停留在直覺(jué)上,而直覺(jué)是會(huì)因?yàn)橄才?lè)改變的,比如說(shuō)現(xiàn)在這一輪融資壓力好大呀,那公司是不是應(yīng)該朝著這個(gè)方向走一走?這種時(shí)候你的直覺(jué)就被恐懼所支配,動(dòng)作就可能變形,雖然這次融資故事講出來(lái)了,但是當(dāng)包袱背在身上,你就很難卸掉了。

所以很多時(shí)候,對(duì)于一些在戰(zhàn)略上錯(cuò)誤的事情要堅(jiān)決地說(shuō)不,但是“堅(jiān)決說(shuō)不”的底氣從哪兒來(lái)?這是戰(zhàn)略帶給我們的一個(gè)全局思考架構(gòu),這個(gè)全局的思考架構(gòu)能幫助我們戰(zhàn)勝戰(zhàn)術(shù)上需要勇氣說(shuō)不的事情。

《硅谷101》:當(dāng)你更著眼于長(zhǎng)期的時(shí)候,其實(shí)短期跟長(zhǎng)期之間是有一個(gè)平衡的。比如說(shuō)你要去融資的時(shí)候,你有時(shí)候階段性的需要沖到一些里程碑,你會(huì)覺(jué)得有在這兩者之間發(fā)生沖突的時(shí)候嗎?

侯曉迪:我覺(jué)得戰(zhàn)略就是為了讓這兩者不發(fā)生沖突。如果從比較短期來(lái)看,那我現(xiàn)在最不該做的就是無(wú)人駕駛了。去做機(jī)器人,尤其是做兩條腿的機(jī)器人現(xiàn)在是很容易融資的。人家一看兩條腿的,具身智能。對(duì),記住我這句話,凡是拿兩條腿兒出來(lái)賣的都是騙子,我至今沒(méi)有看到兩條腿兒可以產(chǎn)生具體的商業(yè)價(jià)值的點(diǎn)。

人形機(jī)器人滿足的是一種大家對(duì)科幻的幻想,我覺(jué)得這就跟會(huì)飛的汽車一樣,是由幾十年以來(lái)的科幻帶給人類社會(huì)的價(jià)值,但是科幻從來(lái)不是從商業(yè)邏輯出發(fā)的,科幻是因?yàn)榭?,所以才被提出?lái)的,這件事情引起的是你的情感共鳴,但是它從來(lái)不是引起的你的商業(yè)邏輯共鳴。

這個(gè)世界的悲慘之處就在于有很多投資人是投情感共鳴的,但是如果你真的作為創(chuàng)業(yè)者想把事情做出來(lái),你要做的是商業(yè)邏輯上的正確性,這兩者很多時(shí)候是矛盾的,我認(rèn)為最典型的兩個(gè),一個(gè)是兩條腿的機(jī)器人,一個(gè)是會(huì)飛的汽車。在科幻里,汽車能夠飛來(lái)飛去,但是我們從物理上看,我們的能量?jī)?chǔ)存、能量使用效率并沒(méi)有達(dá)到能讓車飛起來(lái)的一個(gè)狀態(tài)。

《硅谷101》:所以你覺(jué)得馬斯克的人形機(jī)器人 Optimus 還有波士頓動(dòng)力都是騙子?

侯曉迪:Boston Dynamics 是一個(gè)我非常敬佩的長(zhǎng)期主義的公司,除了兩條腿 ,它也有四條腿的機(jī)器人。它想先回答的問(wèn)題是四條腿甚至兩條腿的東西有沒(méi)有可能做出來(lái),它是在探索控制論的邊界。所以這么多年它在做的事情是堅(jiān)持不斷地給自己加難度,去做一個(gè)科學(xué)探索。

但是我覺(jué)得不應(yīng)該用具身智能突然畫一個(gè)很大的餅,我認(rèn)為我不喜歡的地方就是現(xiàn)在畫的這個(gè)餅過(guò)大,而這個(gè)餅里邊缺失的環(huán)節(jié)過(guò)多,但是大家在評(píng)估這個(gè)產(chǎn)業(yè)時(shí),又會(huì)集體性的選擇忽視其中缺失的環(huán)節(jié),它成為了一個(gè)暫時(shí)無(wú)法證偽的愿景。

如果你看到一個(gè)趨勢(shì)就不加節(jié)制的外推是很愚蠢的,但凡你了解事情更根本的運(yùn)行規(guī)律,并且能從第一性原則出發(fā),實(shí)際上就能夠推演出來(lái)很多決定性的限制因素。而這些限制因素會(huì)幫你更準(zhǔn)確地預(yù)測(cè)未來(lái),于是很多時(shí)候你就會(huì)看到你預(yù)測(cè)的未來(lái)比別人預(yù)測(cè)的未來(lái)結(jié)果要悲觀很多。

但是我的本意并不想過(guò)度批判機(jī)器人,我覺(jué)得現(xiàn)在有很多的任務(wù),我們確實(shí)發(fā)現(xiàn)了曙光,比如它的泛化能力變得比以前更強(qiáng)了,它能解決更多具體的問(wèn)題了。但是我想說(shuō)的是,如果今天就要做兩條腿、并且拿兩條腿作為賣點(diǎn)的機(jī)器人,這件事情我是堅(jiān)決反對(duì)的,但是你說(shuō)這個(gè)機(jī)器人可以在更大的規(guī)模上去替換掉在工廠里擰螺絲的人,這件事我是認(rèn)同的,而且我覺(jué)得這件事在比較近的未來(lái)就會(huì)發(fā)生。

《硅谷101》:你怎么去定義一個(gè)好的團(tuán)隊(duì)?在你看來(lái),什么樣的團(tuán)隊(duì)是能夠解決 L4 運(yùn)營(yíng)的最好的團(tuán)隊(duì),如何去組建這樣一個(gè)團(tuán)隊(duì)?

侯曉迪:我沒(méi)法定義一個(gè)好的團(tuán)隊(duì),但我能給出好團(tuán)隊(duì)的一些特性。我能想到的第一個(gè)特性就是這個(gè)團(tuán)隊(duì)必須非常靈活,我堅(jiān)信一件事情就是叫做 fluid organization,就是流動(dòng)性組織,比如說(shuō)我們的做 deep learning 的團(tuán)隊(duì)可以去搞Infra,能做到這種程度,在這個(gè)前進(jìn)方向上做得越極致,這個(gè)團(tuán)隊(duì)?wèi)?zhàn)斗力就越強(qiáng)。

我覺(jué)得公司的文化應(yīng)該是為大家共同的事業(yè)效忠,這件事情高于你個(gè)人的利益,某種意義上有一定集體主義的色彩在,因?yàn)槿绻覀儧](méi)有這樣程度的認(rèn)知,每一個(gè)人都問(wèn)公司,我憑什么加入你們?我這么厲害的人,我加入你,我的事業(yè)的增長(zhǎng)必須是一條最好的路徑,你要為我事業(yè)增長(zhǎng)的這條路負(fù)責(zé),如果每個(gè)員工都這么想的話,這活兒別干了。

我希望招到的員工他可以暫時(shí)不會(huì)這個(gè)新的技術(shù),但是他是有潛力的,他是可以被培養(yǎng)的 ,首先很重要的一點(diǎn)就是別太把自己當(dāng)回事兒。如果這個(gè)事業(yè)是我們值得效忠的,那我們就一起為他努力,不要太去計(jì)較個(gè)人的得失。就像Eric Schmid說(shuō)的,在火箭上不挑座位。

《硅谷101》:之前和你的一個(gè)投資人聊,他說(shuō)你從圖森的事情出來(lái)之后,基本上沒(méi)有緩沖時(shí)間,然后馬上就投入自己新的項(xiàng)目中,你當(dāng)時(shí)是怎么思考的?

侯曉迪:沒(méi)有沒(méi)有,這是亂講,其實(shí)在 3 月份之前我并不知道我要做什么,我花了很多時(shí)間,在想接下來(lái)要干什么,最有價(jià)值的東西是什么呢?

那時(shí)其實(shí)正好是ChatGPT出來(lái)的時(shí)候,大語(yǔ)言模型的進(jìn)展令我也很震驚,為什么我沒(méi)有做大模型呢 ?因?yàn)榇笳Z(yǔ)言模型當(dāng)下的進(jìn)展是技術(shù)進(jìn)展,技術(shù)進(jìn)展到產(chǎn)品之間的不確定性還很長(zhǎng),我已經(jīng)走過(guò)這樣的彎路了。當(dāng)時(shí)我看到deep learning 在圖像領(lǐng)域的進(jìn)展,就去搞了第一家公司知圖科技,做了一年以后發(fā)現(xiàn)其實(shí)這里邊技術(shù)并不能夠成為商業(yè)模式中最主要的部分,就是在商業(yè)上的不確定性,并不是一個(gè)技術(shù)問(wèn)題。

而這個(gè)不確定性現(xiàn)在出現(xiàn)在大模型領(lǐng)域,到底什么樣的商業(yè)模式對(duì)于大模型領(lǐng)域是合適的、真正能賺錢的?到底是大公司能先跑出來(lái),還是小公司?最有早期應(yīng)用價(jià)值的是哪部分?這些問(wèn)題我都無(wú)法回答,所以我不應(yīng)該因?yàn)橐粋€(gè)技術(shù)強(qiáng)開(kāi),就進(jìn)入到這個(gè)領(lǐng)域里面,我還是覺(jué)得應(yīng)該說(shuō)怎么賺錢,才是最基本的問(wèn)題,也是最難回答的問(wèn)題,回答清楚這個(gè)問(wèn)題才能夠進(jìn)入到這個(gè)領(lǐng)域里。

所以最后我經(jīng)過(guò)了仔細(xì)的權(quán)衡,還是認(rèn)為過(guò)去 7 年我在無(wú)人駕駛領(lǐng)域的觀察讓我看到了這個(gè)領(lǐng)域的不變性,這是我最有價(jià)值的經(jīng)驗(yàn)和知識(shí)。

我覺(jué)得每一個(gè)投資人都會(huì)說(shuō),哎呀曉迪你不該去做無(wú)人駕駛,你該做點(diǎn)別的,你要做大模型,我現(xiàn)在就給你投錢。我說(shuō)我不做大模型,我們都不清楚未來(lái)會(huì)是什么樣。無(wú)人駕駛是我明確一定能做出來(lái)的事情,我還是想去做這個(gè)確定性更高的事。作為一個(gè)長(zhǎng)期主義者,我看到的是長(zhǎng)期的確定性,而這件事情的價(jià)值被很多沒(méi)有長(zhǎng)期主義視野的人低估。

如果把時(shí)間的窗口拉到十年,我很難想象人類作為一個(gè)種群,十年之后還由人來(lái)開(kāi)車。物流系統(tǒng)必須有一次它的迭代和升級(jí),這個(gè)升級(jí)由誰(shuí)來(lái)完成?這個(gè)使命就放在這里,我想把這個(gè)使命實(shí)現(xiàn)。

05 世界模型:新瓶裝舊酒

《硅谷101》:現(xiàn)在全球的自動(dòng)駕駛到了什么樣的一個(gè)水平呢?它面臨的主要問(wèn)題跟瓶頸是什么?

侯曉迪:革命進(jìn)入低潮期,面臨著由加息帶來(lái)的純資本問(wèn)題,但是資本又是很重要的一個(gè)問(wèn)題。資本能澆灌一個(gè)行業(yè),行業(yè)里邊有了閑錢,人們的創(chuàng)造力就會(huì)得到解放,去發(fā)現(xiàn)一些可有可無(wú)的東西。早期技術(shù)的發(fā)展和產(chǎn)品的發(fā)展可能沒(méi)有那么直接相關(guān),很多時(shí)候你為了做一個(gè)技術(shù),會(huì)發(fā)現(xiàn)產(chǎn)品最后一團(tuán)糟,有的時(shí)候你為了做一個(gè)產(chǎn)品,你發(fā)現(xiàn)技術(shù)用在了你想象不到的地方。但是在這之后,技術(shù)就有可能就會(huì)被用在更正確的產(chǎn)品上。

不過(guò)這個(gè)低潮期跟技術(shù)沒(méi)什么關(guān)系,技術(shù)還是穩(wěn)步甚至加速在發(fā)展。和大模型領(lǐng)域不同,無(wú)人駕駛行業(yè)的產(chǎn)品形態(tài)已經(jīng)越來(lái)越清晰,這是我認(rèn)為我過(guò)去幾年最大的價(jià)值。

《硅谷101》:Sora 出來(lái)之后,這種世界模擬器的概念是不是能夠賦能無(wú)人駕駛界可以發(fā)展的更快?

侯曉迪:咱們來(lái)個(gè)長(zhǎng)議題,咱們談?wù)勈澜缒P汀J裁词鞘澜缒P湍??世界模型就是新瓶裝舊酒,一九八幾年的時(shí)候,機(jī)器視覺(jué)這個(gè)行業(yè)誕生的那個(gè)時(shí)刻, David Marr 老師就提出來(lái)了一個(gè)叫做 mid-level representation,他的這個(gè)概念也引導(dǎo)我入行,引導(dǎo)我讀完整個(gè)本科初步的探索以及博士深入的探索。

在計(jì)算機(jī)視覺(jué)領(lǐng)域,我覺(jué)得 mid-level representation 是我最喜歡的一個(gè)議題。mid-level representation 后來(lái)也叫 internal representation(內(nèi)蘊(yùn)表達(dá))。過(guò)了幾年 deep learning 出來(lái)了,大家認(rèn)為 deep learning 解決的核心問(wèn)題是什么呢?其實(shí)是 representation 的問(wèn)題。于是有一個(gè)特別著名的會(huì)議在 deep learning 誕生以后提出來(lái),叫做 ICLRA, 這個(gè)會(huì)本身講的就是 the learning of the representation,就是說(shuō)這個(gè)內(nèi)蘊(yùn)表達(dá)或者內(nèi)蘊(yùn)表征是可以被學(xué)到的,而且應(yīng)該被學(xué)到,而怎么學(xué)就是我們探索的事情。

這件事情不斷地被人包裝,2024 年的版本叫做世界模型,但是這個(gè)世界模型首先可大可小,它的精度也是可糙可細(xì)。所以我覺(jué)得首先世界模型這件事它確實(shí)是一個(gè)本質(zhì)問(wèn)題,但是這個(gè)本質(zhì)問(wèn)題不新,其實(shí) 40 年前就已經(jīng)有了,而且確實(shí)是 40 年以來(lái)貫穿整個(gè)計(jì)算機(jī)視覺(jué)和模式識(shí)別發(fā)展的核心問(wèn)題。但是愚者的原罪在于外推,外推的地方就是說(shuō)大家談到世界模型就會(huì)把它認(rèn)為是一個(gè)可以無(wú)限高精度的、無(wú)限遠(yuǎn)未來(lái)的外推模型,這是不對(duì)的,這就是我說(shuō)的錯(cuò)誤的外推世界模型。對(duì)外在世界的內(nèi)蘊(yùn)表達(dá),這件事情是我們一直以來(lái)的追求,是我們整個(gè)行業(yè)幾輩幾代人一直以來(lái)的追求。但是不要把這個(gè)事情它的最終形態(tài)的結(jié)果就當(dāng)成現(xiàn)在已經(jīng)有的東西。

那我來(lái)再說(shuō)說(shuō) Sora 是什么?Sora 是一個(gè)學(xué)了一套東西,使得它讓你看起來(lái)這個(gè)東西像那么回事。很多年前有一個(gè)迪士尼電影叫做冰雪奇緣。

冰雪奇緣這個(gè)電影它干的事是什么呢?是當(dāng)時(shí)電影工業(yè) CG Computer Graphics,人們突然提出了一個(gè)新的算法,能夠模擬雪這種非牛頓流體的流體力學(xué),雪不是液體,也不是缸體,它是一種有一定粘連性,但是又能散開(kāi)的東西。如果你像用每一個(gè)粒子去模擬雪的動(dòng)態(tài)過(guò)程的話,那累死了,機(jī)器做不了。

但是如果我們找到了一種簡(jiǎn)化的近似算法,讓這坨雪看起來(lái)像是雪,那我們就覺(jué)得這件事情就是計(jì)算上足夠便宜,可以用渲染集群渲染出一個(gè)動(dòng)畫片。所以是基于一個(gè)算法的創(chuàng)新,做了這個(gè)動(dòng)畫片,就為了這盤醋包了一鍋餃子??赡芪艺f(shuō)的有點(diǎn)夸張,但是確實(shí)冰雪奇緣之所以能做出來(lái),背后最大的創(chuàng)新是 Computer Graphics 的創(chuàng)新,但是這種創(chuàng)新并不能夠讓你用到比如說(shuō)飛機(jī)的流體力學(xué)上,它跟真正的物理真實(shí)是兩碼事。他所做的只是看起來(lái)像是真的,那么 Sora 給我們帶來(lái)的一個(gè)狀態(tài),也是說(shuō)他做了一個(gè)模擬器,看起來(lái)像是真的,但是這件事情不是物理真實(shí)。

《硅谷101》:業(yè)界對(duì)于自動(dòng)駕駛的長(zhǎng)尾問(wèn)題,現(xiàn)在還有什么好的方法去解決嗎?

侯曉迪:我覺(jué)得長(zhǎng)尾問(wèn)題其實(shí)也是一個(gè)偽命題,很高興你們提出來(lái)這個(gè)事情。在我看來(lái)長(zhǎng)尾問(wèn)題,比如說(shuō)我見(jiàn)到鱷魚怎么處理?我見(jiàn)到大象怎么處理?我見(jiàn)著一個(gè)固定翼飛機(jī)停在高速公路上,我怎么處理這件事情?大家都覺(jué)得它是長(zhǎng)尾問(wèn)題。比如在我的前進(jìn)路徑上,見(jiàn)到了一個(gè)沒(méi)見(jiàn)過(guò)的物體,我怎么處理?但是如果你把它包裹成了一個(gè)更通用的一類問(wèn)題,它是很好處理的。

比如說(shuō)我們?cè)?jīng)就見(jiàn)到有固定翼飛機(jī)停在高速公路上,那我們的處理方法很簡(jiǎn)單,停車對(duì)吧?這是好處理的情況,但是其實(shí)人們感覺(jué)長(zhǎng)尾問(wèn)題很難處理,是很難當(dāng)場(chǎng)讓這個(gè)車做出一個(gè)人類經(jīng)過(guò)深思熟慮以后認(rèn)為最優(yōu)的操作,再去跟這個(gè)場(chǎng)景進(jìn)行交互,這件事情是難的。

首先機(jī)器的感知沒(méi)那么難,尤其再加上激光雷達(dá)或者雙目視覺(jué)以后,各種各樣的問(wèn)題你都能識(shí)別,但是你如何跟他進(jìn)行交互?如果一個(gè)鱷魚來(lái)了,一個(gè)駱駝來(lái)了,一個(gè)兔子來(lái)了你都要怎么操作?對(duì)于這種問(wèn)題確實(shí)是你需要回答的長(zhǎng)尾問(wèn)題,但是我覺(jué)得我們的無(wú)人駕駛卡車是不需要做這樣的回答的。

如果當(dāng)你有乘客在無(wú)人駕駛轎車?yán)锩娴臅r(shí)候,你要顧及一個(gè)不可能三角,就是交規(guī)要滿足乘客的體驗(yàn)、要滿足路上其他的道路參與者的安全和他們的感受,在這個(gè)不可能三角的情況下,確實(shí)存在有很多你需要特事特辦的討論。但是我覺(jué)得無(wú)人駕駛卡車如果在全局平均意義下來(lái)講,我們的運(yùn)營(yíng)成本是可接受的。運(yùn)營(yíng)產(chǎn)生的額外成本,比如我因?yàn)橐?jiàn)到飛機(jī)停在路邊兒這件事情產(chǎn)生的成本,是能夠被我的每英里成本所消化的,那我覺(jué)得這事兒我們就可以做。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。