正在閱讀:

對話獵豹移動傅盛:“大”模型不是通往AGI的唯一路徑

掃一掃下載界面新聞APP

對話獵豹移動傅盛:“大”模型不是通往AGI的唯一路徑

“我們可能真的不會遇到一種‘萬能’技術(shù),所有的技術(shù)最后都要跟不同的場景結(jié)合。即便有這樣的能力,還要考慮成本?!?/p>

圖片來源:獵豹移動

界面新聞記者 | 伍洋宇

界面新聞編輯 | 宋佳楠

8月21日,2024世界機器人大會期間,作為獵豹移動董事長兼CEO、獵戶星空董事長,傅盛就AGI(通用人工智能)、具身智能、大模型機器人等話題進行了演講。

傅盛表示,自己在AI 1.0時代便看到了機器人將從傳統(tǒng)的工業(yè)場景走到服務業(yè)場景,乃至千家萬戶的機會,因此于七年前投資創(chuàng)辦了獵戶星空。

而在進階程度更高的AI 2.0時代,他用“人類科技史上的奇跡年”來形容人工智能的這波崛起,認為可與牛頓的“萬有引力”或是愛因斯坦“相對論”的出現(xiàn)相提并論。在他看來,大語言模型帶來的端到端創(chuàng)新范式的影響,對全行業(yè)、全社會都會產(chǎn)生巨大改變。

受益于ChatGPT在語義理解方面實現(xiàn)的能力突破,機器人也迎來更多發(fā)展機會,因為“語言實際上是人類真正獨立于其它物種的核心智能”。 

“智能涌現(xiàn)”的整個過程可謂“神奇”。用AI教母李飛飛的話來說,“大模型是個灰盒”。伴隨著各種不確定性,OpenAI率先走出一條與眾不同的道路,且實現(xiàn)了創(chuàng)新。

但傅盛指出,大語言模型并不一定是通往AGI的唯一道路。他贊同Meta首席科學家楊立昆的觀點:大語言模型的天然結(jié)構(gòu)使得它很難實現(xiàn)AGI。

其中有兩方面考量因素,一是更小參數(shù)的大模型是否同樣可以實現(xiàn)智能;另一方面,不是所有工作都需要AGI這樣的“愛因斯坦”,整個社會是一個金字塔形的多元結(jié)構(gòu),基層需要更多平民化的大模型出現(xiàn)。

當前,OpenAI、蘋果、微軟等科技巨頭都在以實際行動驗證“小模型”趨勢,這可能讓大模型直接成為端的一部分,而不只是在云上。

今年1月,獵戶星空也曾發(fā)布小參數(shù)模型Orion-14B。除了考慮大參數(shù)模型的成本昂貴之外,這家公司認為,機器人一定要在端上跑自己的模型,才可能既解決數(shù)據(jù)隱私問題,又做到實時快速響應。 

傅盛表示,端模一體帶來的產(chǎn)品和科技變革的意義將更大,會直接引發(fā)交互革命和生產(chǎn)力革命,而大模型機器人是獵戶星空所押注的賽道。目前,該公司將其分為勞動協(xié)作機器人、接待營銷機器人和遞送配貨機器人三類。

就大模型私有化部署而言,傅盛稱自己不僅要負責產(chǎn)品,也對銷售投入了大量精力。他發(fā)現(xiàn),ToB(企業(yè)端)的銷售本身就是一個產(chǎn)品化過程。

在他看來,這項業(yè)務的收入表現(xiàn)不會是一條很陡峭的曲線,甚至過去幾年經(jīng)歷過近乎水平的進程。但由于大模型的介入,明年產(chǎn)業(yè)規(guī)模可能會有明顯變化。

演講結(jié)束后,傅盛接受了界面新聞等媒體采訪,對AGI實現(xiàn)路徑、小模型趨勢、端模一體、雙足機器人的未來等熱門話題,給出了自己的看法。

以下為采訪實錄,略作編輯:

問:你說大語言模型不是AGI的唯一路徑,所指的到底是Scaling law不行,還是Transformer架構(gòu)不行?

傅盛:對于Scaling law到底行不行,大家都有自己的看法。我看谷歌一位研究員說,現(xiàn)在大語言模型遇到了瓶頸,標志性事件就是GPT-5發(fā)不出來。OpenAI作為一家科技創(chuàng)業(yè)公司,18個月沒有發(fā)自己的旗艦產(chǎn)品,而是忙著做Search GPT,或者GPT-4o,說明要么是卡著上不去,要么是訓練出的效果不太好,沒有質(zhì)的提升。

硅谷都在盯著GPT-5到底何時出來,出來后是不是有大的提升。如果沒有提升,可能會有點類似出現(xiàn)互聯(lián)網(wǎng)泡沫的感覺。

我也不知道到底是Scaling law不行,還是Transformer架構(gòu)不行。做大語言模型就是一個嘗試的過程。OpenAI有技術(shù)信仰,他們堅信這事,靠一個ChatGPT活過來了。但今天到底為什么這樣,以后它的Scaling law能走到什么地方,沒有原理去證明。此外,新的數(shù)據(jù)從哪里來也是個問題。

問:從GPT-4o mini和Apple intelligence來看,小模型可能是趨勢。你認為端模一體最考驗企業(yè)的是什么?這個能力現(xiàn)在中美有明顯差距嗎?

傅盛:小模型已經(jīng)不斷被驗證了。技術(shù)發(fā)展到這一步,一個幾十億參數(shù)的模型能力已經(jīng)不錯了,蘋果做的所有工作都是在它的小模型上?,F(xiàn)在看起來端上的需求是很大的,無論是手機、電腦,未來一定是這樣的邏輯。

中美應該沒有太大差距。訓練小模型對算力要求低,需要結(jié)合真正的應用場景,這方面中國有自己的優(yōu)勢,迭代快。包括私有化大模型出海,如果不是美國的大公司在做,那些創(chuàng)業(yè)公司和中國的效率還是有差距的。

問:1月份時,你曾說過超越OpenAI的機會一定來自大模型的應用。大半年過去了,現(xiàn)在看到哪些應用的機會?  

傅盛:那個時候,對于是否做好一個特別牛的模型就能解決所有問題,大家有很多爭議。今天看起來答案非常明顯,即做好一個模型也不能解決大多數(shù)問題。學界也在討論,大語言模型到底能不能實現(xiàn)AGI?去年大家都信心滿滿,現(xiàn)在很多人覺得不太可能,它只是一個更好用的工具而已。 

我們可能真的不會遇到一種“萬能”技術(shù),所有的技術(shù)最后都要跟不同的場景結(jié)合。即便有這樣的能力,還要考慮成本。比如你要取暖,最簡單的就是燒柴火,而不是建一個熱力站,不同場景中大家的需求不一樣。

今天可見之處都是應用的機會,只是有些可能不屬于創(chuàng)業(yè)者。比如蘋果發(fā)布了iOS 18,股價最高上漲10%。你把手機改造一下可能有機會,但只要手機廠商自己干,你就沒機會。

機器人也是一個很大的應用。雖然我對雙足機器人商業(yè)化不看好,但對機器人這個行業(yè)的發(fā)展充滿了信心。

大語言模型出來之前,讓機器人拿杯子是個世界級難題,當時大家都是絕望的,認為不可能做成。但今天有了大語言模型,它自己具備了規(guī)劃、判斷和模糊的體驗,能讓機器人成為很重要的產(chǎn)品載體。 

問:為什么不看好雙足機器人商業(yè)化?

傅盛:技術(shù)過于復雜。雙足機器人必須依賴于機械結(jié)構(gòu),但結(jié)構(gòu)不是摩爾定律支撐的,每年能改一點點就不錯了。就像汽車剎車系統(tǒng)、底盤,一百年過去了,改了多少?

雙足機器人進展比較慢,今天是電機問題,明天也是,最多電機大一點。為了雙足犧牲了太多,包括產(chǎn)品的能耗和穩(wěn)定性。雙足機器人要解決摔倒的問題,而人的穩(wěn)定性相當高。

再者是成本,用幾個電機和輪子相比,它成本一定高,還要保證在99%以上的場景不能出錯。

作為一個研究方向是可以的,但說現(xiàn)在雙足機器人要大行其道,我不看好。每個人的夢想都值得鼓勵,但還得看能不能真正量產(chǎn),以及量產(chǎn)以后市場的接受程度。

問:雙足機器人做科研的這幾年,主要是解決哪些問題?

傅盛:結(jié)構(gòu)的靈活性問題以及算法問題。膝蓋是非常復雜的,有各種肌肉、小關(guān)節(jié),還有很好的力反饋,再借助大腦、小腦,才能讓我們站立。雙足機器人是鋼鐵的東西,沒有這些,只能靠算法。由于端到端,算法的確進步很大,像波士頓動力以前所有的積累可能都廢了,但難度還是挺大的。 

問:如果三五年之后,它們真的能落到產(chǎn)線上,會改變你的看法嗎?

傅盛:不會,因為你能落在產(chǎn)業(yè)上,我一個輪子的結(jié)構(gòu)也能落,而且永遠比你便宜100倍以上。今天你花20萬買輛汽車,一下能開出去100公里。有一天來了一匹機械馬,需要100多萬,你買車還是買馬?車就是這么打敗馬的。

機器人用輪子很有優(yōu)勢,等到有一天產(chǎn)品真正穩(wěn)定的時候,其實干活是用上半肢。

問:有一些雙足或者人形機器人的研報,會說現(xiàn)在處在人形機器人的“前夜”,你是否認同這樣的觀點?

傅盛:去年(特斯拉)“擎天柱”出來的時候,很多投資人都很受震動。當時特斯拉放話,再過一兩年,能達到幾萬臺或者10萬臺的規(guī)模。當時我說不可能,今天話就放在這。

之前特斯拉說明年會有1000臺“擎天柱”進入工廠,但我認為它們做不到很好地工作。以特斯拉的實力,放1000臺去測試是可以的。

一些企業(yè)講人形機器人產(chǎn)線搬運,這完全是作秀,搬運為什么不用叉車?用加機械臂的叉車不行嗎?一個輪子能拉100公斤,人形機器人搬運兩公斤就不禁摔,更別說造價多少。

現(xiàn)在離“前夜”很遠很遠。2017年,我的團隊就拿機器人點蠟燭,好多機械臂廠商也說要改變行業(yè),后來發(fā)現(xiàn)這個行業(yè)真的很難改變,因為機械結(jié)構(gòu)是一點點磨出來的。不能因為埃隆·馬斯克做了這個事就覺得一定行。人都有驕傲的時候,他也不例外,沒有神嘛。 

問:大模型機器人是怎樣一個概念?

傅盛:有點“具身智能”的概念。大模型通過語言的學習構(gòu)建了對這個世界的基本邏輯和認知。大語言模型可以做出規(guī)劃,反饋給人,這比以前(做機器人)的技術(shù)難度要低很多,要知道以前所有的移動都得寫控制代碼,寫起來很費勁。 

大模型是實現(xiàn)具身智能的推動力,是一個基礎條件。在沒有大模型之前,(機器)理解世界是不可想象的。 

問:這個概念為什么這兩年才火起來,它和之前的那些智能化的機器人傳感器等有什么不同?

傅盛:之前的很多智能化可以理解成一種程序化的過程,比如先幫你預設好,看了一個什么東西去點一下,這已經(jīng)算很高級了。最早的都不需要交互,自動化完全匹配,這是第一階段。

第二階段有一定判別的技能,我們叫做“規(guī)則”。規(guī)則很難容納太多的東西,比如突然出現(xiàn)一杯水,但(代碼)沒寫就傻了。有了大語言模型,它可以理解世界,知道這是水,只要有足夠多的數(shù)據(jù),就不用再寫規(guī)則代碼,而是通過各種方式去獲得更多的數(shù)據(jù)進行訓練。這也是為什么“具身智能”一下火起來了。 

問:獵戶星空服務機器人在海外市場主要的應用場景是哪些?中國的機器人產(chǎn)品出海要進一步克服哪些困難?

傅盛:目前獵戶星空機器人主要還是遞送類,在餐廳送餐、回盤,也有一些交互類的,去做講解、引導等工作。

海外需求相對旺盛,因為發(fā)達國家勞動力比較貴,而且稀缺。要進一步打開市場,就得用大模型把它智能化。

我們在海外遇到了一些問題,也在慢慢克服。早期部署成本很高,不僅機器人過去,也要讓商家會用。我們未來的目標是實現(xiàn)“開箱即用”,機器人做到這個并不容易,它得認識環(huán)境。以前需要人去給它建圖,現(xiàn)在有了大語言模型,這件事的難度會大幅度降低,甚至可以實現(xiàn)自動化。 

另一個問題是交互能力。我們在海外一直沒有做交互,因為每個國家語言不同,還得做定制,非常復雜。而大語言模型天然就是翻譯機,像獵戶星空大模型(Orion-14B)的日語能力在開源模型里是比較好的,因為我們認真訓練了一下日語。最神奇的是,你都不用管它,只要把日語輸出給它,它自然就會了,而且會翻譯。這放以前也是一種顛覆,是它的天然能力。機器人未來要把智能化再提高,拓展它的應用場景。

我雖然不看好人形機器人,但覺得機械臂去做一些動作是可以的。我們下半年會有機械臂方面的產(chǎn)品推出,因為它在某些場景下能夠?qū)崿F(xiàn)一定的任務。 

問:SaaS在中國差不多被驗證是失敗的,獵豹現(xiàn)在做私有化大模型,會不會也會面臨企業(yè)付費意愿低的問題?畢竟現(xiàn)在AI應用還沒有產(chǎn)生多少收入,包括國外也是。

傅盛:是的。我們現(xiàn)在在和頭部的企業(yè)合作,一期已經(jīng)在交付,二期正在做,我們認為是有可能標準化的。

中國的市場我可能改變不了,但只要做好,讓企業(yè)都能滿意,我們就把它標準化,下一步再出海去做。出海本就是我們的基因,很多海外客戶也愿意接受(私有化大模型)。海外市場足夠大,愿意付費。經(jīng)過中國市場驗證的產(chǎn)品模式,現(xiàn)在到全球都是有競爭力的。 

問:你覺得窗口期大概有多久?

傅盛:最多就到年底,一步一步來,我用更長的時間來看這件事情時,思路就會不太一樣,現(xiàn)在就是盯效果,真要說多拿幾單進來也不是不能。

問:在獵戶星空這邊,你的精力主要放在產(chǎn)品這塊嗎?

傅盛:現(xiàn)在是,銷售上我也得花精力。我后來意識到,ToB和ToC最大的不同,就是ToB銷售本身就是一個產(chǎn)品化的過程。

比如說私有化大模型跟做ToC不一樣,做ToC我自己覺得這個產(chǎn)品不錯,不需要ToB。但是ToB必須要了解客戶,這對我們以前做ToC的團隊來講是個挑戰(zhàn),這兩年慢慢積累了一些經(jīng)驗,學了不少。

問:這種業(yè)務收入規(guī)模的提升,大概是一條什么樣的曲線?有所謂爆發(fā)節(jié)點嗎?

傅盛:ToB的肯定不會那么快,前幾年其實還在水平線上,今年開始產(chǎn)品化,能再做好一些。大語言模型是讓整個機器人場景發(fā)生了很大的拓展。我今天展示的講解、直播機器人,以前是很難實現(xiàn)的,現(xiàn)在能做到接近于人的水平,明年它的增長可能會比較大。

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。

獵豹移動

  • 德國再向烏克蘭交付一批坦克等武器
  • 周鴻祎傅盛決裂16年后首度同臺,還預測了大模型的這些趨勢

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

對話獵豹移動傅盛:“大”模型不是通往AGI的唯一路徑

“我們可能真的不會遇到一種‘萬能’技術(shù),所有的技術(shù)最后都要跟不同的場景結(jié)合。即便有這樣的能力,還要考慮成本。”

圖片來源:獵豹移動

界面新聞記者 | 伍洋宇

界面新聞編輯 | 宋佳楠

8月21日,2024世界機器人大會期間,作為獵豹移動董事長兼CEO、獵戶星空董事長,傅盛就AGI(通用人工智能)、具身智能、大模型機器人等話題進行了演講。

傅盛表示,自己在AI 1.0時代便看到了機器人將從傳統(tǒng)的工業(yè)場景走到服務業(yè)場景,乃至千家萬戶的機會,因此于七年前投資創(chuàng)辦了獵戶星空。

而在進階程度更高的AI 2.0時代,他用“人類科技史上的奇跡年”來形容人工智能的這波崛起,認為可與牛頓的“萬有引力”或是愛因斯坦“相對論”的出現(xiàn)相提并論。在他看來,大語言模型帶來的端到端創(chuàng)新范式的影響,對全行業(yè)、全社會都會產(chǎn)生巨大改變。

受益于ChatGPT在語義理解方面實現(xiàn)的能力突破,機器人也迎來更多發(fā)展機會,因為“語言實際上是人類真正獨立于其它物種的核心智能”。 

“智能涌現(xiàn)”的整個過程可謂“神奇”。用AI教母李飛飛的話來說,“大模型是個灰盒”。伴隨著各種不確定性,OpenAI率先走出一條與眾不同的道路,且實現(xiàn)了創(chuàng)新。

但傅盛指出,大語言模型并不一定是通往AGI的唯一道路。他贊同Meta首席科學家楊立昆的觀點:大語言模型的天然結(jié)構(gòu)使得它很難實現(xiàn)AGI。

其中有兩方面考量因素,一是更小參數(shù)的大模型是否同樣可以實現(xiàn)智能;另一方面,不是所有工作都需要AGI這樣的“愛因斯坦”,整個社會是一個金字塔形的多元結(jié)構(gòu),基層需要更多平民化的大模型出現(xiàn)。

當前,OpenAI、蘋果、微軟等科技巨頭都在以實際行動驗證“小模型”趨勢,這可能讓大模型直接成為端的一部分,而不只是在云上。

今年1月,獵戶星空也曾發(fā)布小參數(shù)模型Orion-14B。除了考慮大參數(shù)模型的成本昂貴之外,這家公司認為,機器人一定要在端上跑自己的模型,才可能既解決數(shù)據(jù)隱私問題,又做到實時快速響應。 

傅盛表示,端模一體帶來的產(chǎn)品和科技變革的意義將更大,會直接引發(fā)交互革命和生產(chǎn)力革命,而大模型機器人是獵戶星空所押注的賽道。目前,該公司將其分為勞動協(xié)作機器人、接待營銷機器人和遞送配貨機器人三類。

就大模型私有化部署而言,傅盛稱自己不僅要負責產(chǎn)品,也對銷售投入了大量精力。他發(fā)現(xiàn),ToB(企業(yè)端)的銷售本身就是一個產(chǎn)品化過程。

在他看來,這項業(yè)務的收入表現(xiàn)不會是一條很陡峭的曲線,甚至過去幾年經(jīng)歷過近乎水平的進程。但由于大模型的介入,明年產(chǎn)業(yè)規(guī)??赡軙忻黠@變化。

演講結(jié)束后,傅盛接受了界面新聞等媒體采訪,對AGI實現(xiàn)路徑、小模型趨勢、端模一體、雙足機器人的未來等熱門話題,給出了自己的看法。

以下為采訪實錄,略作編輯:

問:你說大語言模型不是AGI的唯一路徑,所指的到底是Scaling law不行,還是Transformer架構(gòu)不行?

傅盛:對于Scaling law到底行不行,大家都有自己的看法。我看谷歌一位研究員說,現(xiàn)在大語言模型遇到了瓶頸,標志性事件就是GPT-5發(fā)不出來。OpenAI作為一家科技創(chuàng)業(yè)公司,18個月沒有發(fā)自己的旗艦產(chǎn)品,而是忙著做Search GPT,或者GPT-4o,說明要么是卡著上不去,要么是訓練出的效果不太好,沒有質(zhì)的提升。

硅谷都在盯著GPT-5到底何時出來,出來后是不是有大的提升。如果沒有提升,可能會有點類似出現(xiàn)互聯(lián)網(wǎng)泡沫的感覺。

我也不知道到底是Scaling law不行,還是Transformer架構(gòu)不行。做大語言模型就是一個嘗試的過程。OpenAI有技術(shù)信仰,他們堅信這事,靠一個ChatGPT活過來了。但今天到底為什么這樣,以后它的Scaling law能走到什么地方,沒有原理去證明。此外,新的數(shù)據(jù)從哪里來也是個問題。

問:從GPT-4o mini和Apple intelligence來看,小模型可能是趨勢。你認為端模一體最考驗企業(yè)的是什么?這個能力現(xiàn)在中美有明顯差距嗎?

傅盛:小模型已經(jīng)不斷被驗證了。技術(shù)發(fā)展到這一步,一個幾十億參數(shù)的模型能力已經(jīng)不錯了,蘋果做的所有工作都是在它的小模型上?,F(xiàn)在看起來端上的需求是很大的,無論是手機、電腦,未來一定是這樣的邏輯。

中美應該沒有太大差距。訓練小模型對算力要求低,需要結(jié)合真正的應用場景,這方面中國有自己的優(yōu)勢,迭代快。包括私有化大模型出海,如果不是美國的大公司在做,那些創(chuàng)業(yè)公司和中國的效率還是有差距的。

問:1月份時,你曾說過超越OpenAI的機會一定來自大模型的應用。大半年過去了,現(xiàn)在看到哪些應用的機會?  

傅盛:那個時候,對于是否做好一個特別牛的模型就能解決所有問題,大家有很多爭議。今天看起來答案非常明顯,即做好一個模型也不能解決大多數(shù)問題。學界也在討論,大語言模型到底能不能實現(xiàn)AGI?去年大家都信心滿滿,現(xiàn)在很多人覺得不太可能,它只是一個更好用的工具而已。 

我們可能真的不會遇到一種“萬能”技術(shù),所有的技術(shù)最后都要跟不同的場景結(jié)合。即便有這樣的能力,還要考慮成本。比如你要取暖,最簡單的就是燒柴火,而不是建一個熱力站,不同場景中大家的需求不一樣。

今天可見之處都是應用的機會,只是有些可能不屬于創(chuàng)業(yè)者。比如蘋果發(fā)布了iOS 18,股價最高上漲10%。你把手機改造一下可能有機會,但只要手機廠商自己干,你就沒機會。

機器人也是一個很大的應用。雖然我對雙足機器人商業(yè)化不看好,但對機器人這個行業(yè)的發(fā)展充滿了信心。

大語言模型出來之前,讓機器人拿杯子是個世界級難題,當時大家都是絕望的,認為不可能做成。但今天有了大語言模型,它自己具備了規(guī)劃、判斷和模糊的體驗,能讓機器人成為很重要的產(chǎn)品載體。 

問:為什么不看好雙足機器人商業(yè)化?

傅盛:技術(shù)過于復雜。雙足機器人必須依賴于機械結(jié)構(gòu),但結(jié)構(gòu)不是摩爾定律支撐的,每年能改一點點就不錯了。就像汽車剎車系統(tǒng)、底盤,一百年過去了,改了多少?

雙足機器人進展比較慢,今天是電機問題,明天也是,最多電機大一點。為了雙足犧牲了太多,包括產(chǎn)品的能耗和穩(wěn)定性。雙足機器人要解決摔倒的問題,而人的穩(wěn)定性相當高。

再者是成本,用幾個電機和輪子相比,它成本一定高,還要保證在99%以上的場景不能出錯。

作為一個研究方向是可以的,但說現(xiàn)在雙足機器人要大行其道,我不看好。每個人的夢想都值得鼓勵,但還得看能不能真正量產(chǎn),以及量產(chǎn)以后市場的接受程度。

問:雙足機器人做科研的這幾年,主要是解決哪些問題?

傅盛:結(jié)構(gòu)的靈活性問題以及算法問題。膝蓋是非常復雜的,有各種肌肉、小關(guān)節(jié),還有很好的力反饋,再借助大腦、小腦,才能讓我們站立。雙足機器人是鋼鐵的東西,沒有這些,只能靠算法。由于端到端,算法的確進步很大,像波士頓動力以前所有的積累可能都廢了,但難度還是挺大的。 

問:如果三五年之后,它們真的能落到產(chǎn)線上,會改變你的看法嗎?

傅盛:不會,因為你能落在產(chǎn)業(yè)上,我一個輪子的結(jié)構(gòu)也能落,而且永遠比你便宜100倍以上。今天你花20萬買輛汽車,一下能開出去100公里。有一天來了一匹機械馬,需要100多萬,你買車還是買馬?車就是這么打敗馬的。

機器人用輪子很有優(yōu)勢,等到有一天產(chǎn)品真正穩(wěn)定的時候,其實干活是用上半肢。

問:有一些雙足或者人形機器人的研報,會說現(xiàn)在處在人形機器人的“前夜”,你是否認同這樣的觀點?

傅盛:去年(特斯拉)“擎天柱”出來的時候,很多投資人都很受震動。當時特斯拉放話,再過一兩年,能達到幾萬臺或者10萬臺的規(guī)模。當時我說不可能,今天話就放在這。

之前特斯拉說明年會有1000臺“擎天柱”進入工廠,但我認為它們做不到很好地工作。以特斯拉的實力,放1000臺去測試是可以的。

一些企業(yè)講人形機器人產(chǎn)線搬運,這完全是作秀,搬運為什么不用叉車?用加機械臂的叉車不行嗎?一個輪子能拉100公斤,人形機器人搬運兩公斤就不禁摔,更別說造價多少。

現(xiàn)在離“前夜”很遠很遠。2017年,我的團隊就拿機器人點蠟燭,好多機械臂廠商也說要改變行業(yè),后來發(fā)現(xiàn)這個行業(yè)真的很難改變,因為機械結(jié)構(gòu)是一點點磨出來的。不能因為埃隆·馬斯克做了這個事就覺得一定行。人都有驕傲的時候,他也不例外,沒有神嘛。 

問:大模型機器人是怎樣一個概念?

傅盛:有點“具身智能”的概念。大模型通過語言的學習構(gòu)建了對這個世界的基本邏輯和認知。大語言模型可以做出規(guī)劃,反饋給人,這比以前(做機器人)的技術(shù)難度要低很多,要知道以前所有的移動都得寫控制代碼,寫起來很費勁。 

大模型是實現(xiàn)具身智能的推動力,是一個基礎條件。在沒有大模型之前,(機器)理解世界是不可想象的。 

問:這個概念為什么這兩年才火起來,它和之前的那些智能化的機器人傳感器等有什么不同?

傅盛:之前的很多智能化可以理解成一種程序化的過程,比如先幫你預設好,看了一個什么東西去點一下,這已經(jīng)算很高級了。最早的都不需要交互,自動化完全匹配,這是第一階段。

第二階段有一定判別的技能,我們叫做“規(guī)則”。規(guī)則很難容納太多的東西,比如突然出現(xiàn)一杯水,但(代碼)沒寫就傻了。有了大語言模型,它可以理解世界,知道這是水,只要有足夠多的數(shù)據(jù),就不用再寫規(guī)則代碼,而是通過各種方式去獲得更多的數(shù)據(jù)進行訓練。這也是為什么“具身智能”一下火起來了。 

問:獵戶星空服務機器人在海外市場主要的應用場景是哪些?中國的機器人產(chǎn)品出海要進一步克服哪些困難?

傅盛:目前獵戶星空機器人主要還是遞送類,在餐廳送餐、回盤,也有一些交互類的,去做講解、引導等工作。

海外需求相對旺盛,因為發(fā)達國家勞動力比較貴,而且稀缺。要進一步打開市場,就得用大模型把它智能化。

我們在海外遇到了一些問題,也在慢慢克服。早期部署成本很高,不僅機器人過去,也要讓商家會用。我們未來的目標是實現(xiàn)“開箱即用”,機器人做到這個并不容易,它得認識環(huán)境。以前需要人去給它建圖,現(xiàn)在有了大語言模型,這件事的難度會大幅度降低,甚至可以實現(xiàn)自動化。 

另一個問題是交互能力。我們在海外一直沒有做交互,因為每個國家語言不同,還得做定制,非常復雜。而大語言模型天然就是翻譯機,像獵戶星空大模型(Orion-14B)的日語能力在開源模型里是比較好的,因為我們認真訓練了一下日語。最神奇的是,你都不用管它,只要把日語輸出給它,它自然就會了,而且會翻譯。這放以前也是一種顛覆,是它的天然能力。機器人未來要把智能化再提高,拓展它的應用場景。

我雖然不看好人形機器人,但覺得機械臂去做一些動作是可以的。我們下半年會有機械臂方面的產(chǎn)品推出,因為它在某些場景下能夠?qū)崿F(xiàn)一定的任務。 

問:SaaS在中國差不多被驗證是失敗的,獵豹現(xiàn)在做私有化大模型,會不會也會面臨企業(yè)付費意愿低的問題?畢竟現(xiàn)在AI應用還沒有產(chǎn)生多少收入,包括國外也是。

傅盛:是的。我們現(xiàn)在在和頭部的企業(yè)合作,一期已經(jīng)在交付,二期正在做,我們認為是有可能標準化的。

中國的市場我可能改變不了,但只要做好,讓企業(yè)都能滿意,我們就把它標準化,下一步再出海去做。出海本就是我們的基因,很多海外客戶也愿意接受(私有化大模型)。海外市場足夠大,愿意付費。經(jīng)過中國市場驗證的產(chǎn)品模式,現(xiàn)在到全球都是有競爭力的。 

問:你覺得窗口期大概有多久?

傅盛:最多就到年底,一步一步來,我用更長的時間來看這件事情時,思路就會不太一樣,現(xiàn)在就是盯效果,真要說多拿幾單進來也不是不能。

問:在獵戶星空這邊,你的精力主要放在產(chǎn)品這塊嗎?

傅盛:現(xiàn)在是,銷售上我也得花精力。我后來意識到,ToB和ToC最大的不同,就是ToB銷售本身就是一個產(chǎn)品化的過程。

比如說私有化大模型跟做ToC不一樣,做ToC我自己覺得這個產(chǎn)品不錯,不需要ToB。但是ToB必須要了解客戶,這對我們以前做ToC的團隊來講是個挑戰(zhàn),這兩年慢慢積累了一些經(jīng)驗,學了不少。

問:這種業(yè)務收入規(guī)模的提升,大概是一條什么樣的曲線?有所謂爆發(fā)節(jié)點嗎?

傅盛:ToB的肯定不會那么快,前幾年其實還在水平線上,今年開始產(chǎn)品化,能再做好一些。大語言模型是讓整個機器人場景發(fā)生了很大的拓展。我今天展示的講解、直播機器人,以前是很難實現(xiàn)的,現(xiàn)在能做到接近于人的水平,明年它的增長可能會比較大。

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。