正在閱讀:

AI明星科學(xué)家李飛飛創(chuàng)業(yè),新公司方向是“空間智能”

掃一掃下載界面新聞APP

AI明星科學(xué)家李飛飛創(chuàng)業(yè),新公司方向是“空間智能”

空間智能所要做的就是教會(huì)計(jì)算機(jī)如何在真實(shí)的世界中行動(dòng)。

圖片來源:斯坦福大學(xué)

界面新聞?dòng)浾?| 李彪

界面新聞編輯 | 劉方遠(yuǎn)

著名華裔人工智能科學(xué)家、斯坦福大學(xué)教授李飛飛近期創(chuàng)辦了一家新的AI公司。這也是她2018年從谷歌離職重返斯坦福后,首次直接下場參與的創(chuàng)業(yè)項(xiàng)目。

李的個(gè)人領(lǐng)英主頁也有了相應(yīng)的更新變化,最上面的簡歷一欄顯示她從2024年1月已經(jīng)有了新職位,相關(guān)項(xiàng)目匿名顯示為“something new”,工作狀態(tài)為“全職”。

根據(jù)路透社報(bào)道,李飛飛所創(chuàng)辦的新公司主要從事“空間智能”的研發(fā),已完成種子輪融資,投資方包括a16z和RadicalVentures。 李飛飛本人也是RadicalVentures的合伙人之一,這是一家專注于人工智能和相關(guān)創(chuàng)新的獨(dú)立基金,在加拿大注冊成立,成立之初就拿到了AI領(lǐng)域的頂尖科學(xué)家Jeff Hinton、李飛飛等人的投資。

而新公司要做的“空間智能”也與李飛飛最近在許多場合頻繁提及的AI應(yīng)用方向一致。

按照其上個(gè)月在TED大會(huì)上發(fā)表的主題演講介紹,空間智能是通過理解物體之間的關(guān)系,從中得到新的發(fā)現(xiàn)或預(yù)測。這是比傳統(tǒng)視覺識(shí)別更高級的計(jì)算機(jī)視覺智能,是綜合自然語言大模型、機(jī)器人、計(jì)算機(jī)視覺多領(lǐng)域研究成果的一門研究,機(jī)器可以像人類一樣進(jìn)行更復(fù)雜的視覺推理,進(jìn)而采取更貼合實(shí)際的行動(dòng)。

她在演講中展示了一張“貓伸出爪子要把玻璃杯推向桌子邊緣”的照片來幫助觀眾理解何為空間智能:人類大腦通常這一瞬間可以評估玻璃杯的幾何形狀、玻璃杯在真實(shí)三維世界中的位置、杯子與桌子、貓和其他物體的關(guān)系,并且可以預(yù)測接下來會(huì)發(fā)生什么,采取行動(dòng)。

而空間智能所要做的就是教會(huì)計(jì)算機(jī)如何在真實(shí)的三維世界中行動(dòng)。

去年11月,李飛飛領(lǐng)導(dǎo)實(shí)驗(yàn)室已經(jīng)發(fā)布過一款“VoxPoser”智能機(jī)器人。這項(xiàng)研究把通用語言大模型與計(jì)算機(jī)視覺、機(jī)器人等多項(xiàng)技術(shù)結(jié)合在一起,允許機(jī)器人通過接入大模型來直接理解人類的自然語言指令,并將這些復(fù)雜指令轉(zhuǎn)化為具體的行動(dòng)規(guī)劃。這款機(jī)器人不但能順利完成類似于人類口頭直接指派的“清掃垃圾到簸箕里”“打開抽屜并注意避開附近的花瓶”等日常任務(wù),還能根據(jù)諸如“我是左撇子”“你偏離了1厘米”等特殊行為偏好來調(diào)整操作。

更為重要的是,團(tuán)隊(duì)宣稱這款機(jī)器人可以做到“零樣本”,即不需要提前接受過特定任務(wù)訓(xùn)練也能夠完成訓(xùn)練。雖然此項(xiàng)目目前還處于實(shí)驗(yàn)室測試階段,但也足以令常年受困于“數(shù)據(jù)不足”的機(jī)器人行業(yè)興奮異常。

“讓我們更接近一個(gè)人工智能不僅可以看到、創(chuàng)造,還與周圍的物理世界互動(dòng)的世界?!崩铒w飛在TED演進(jìn)中這樣總結(jié)空間智能的最終愿景。

讓計(jì)算機(jī)像人一樣“看到”,也是李飛飛多年人工智能研究的注腳。她近日出版的個(gè)人自傳也用“我看見的世界”作為書名。

1976年,李飛飛出生于中國北京,在四川成都長大。1992年跟隨父母前往美國移民定居,先后考入普林斯頓大學(xué)、加州理工學(xué)院攻讀本科、研究生。

2005年,不滿30歲、剛從加州理工學(xué)院拿到電子工程博士學(xué)位的李飛飛,便同自己的一名研究生共同發(fā)起了ImageNet項(xiàng)目。這個(gè)項(xiàng)目是她學(xué)術(shù)生涯的開端,也是其迄今為止為人工智能行業(yè)做出的最重要貢獻(xiàn)。

ImageNet是一個(gè)擁有超過1500萬張經(jīng)過標(biāo)注的高清圖片,覆蓋了22000個(gè)類別的大型圖像數(shù)據(jù)庫,龐大的數(shù)據(jù)集為人工智能深度學(xué)習(xí)模型的訓(xùn)練提供了豐富的資源。此后,她與學(xué)生發(fā)起了ImageNet Challenge挑戰(zhàn)賽,從2010年至今已有14年的歷史,每一年舉辦一次,已經(jīng)成為了目前計(jì)算機(jī)視覺領(lǐng)域最受矚目的頂尖賽事。

上述兩項(xiàng)工作也被認(rèn)為奠定了人工智能革命全面爆發(fā)的開端。2022年,李飛飛被選為美國工程院院士時(shí),官方在頒獎(jiǎng)詞中寫道,“李飛飛為建立大型機(jī)器學(xué)習(xí)和視覺理解知識(shí)庫做出了貢獻(xiàn)?!?/p>

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

AI明星科學(xué)家李飛飛創(chuàng)業(yè),新公司方向是“空間智能”

空間智能所要做的就是教會(huì)計(jì)算機(jī)如何在真實(shí)的世界中行動(dòng)。

圖片來源:斯坦福大學(xué)

界面新聞?dòng)浾?| 李彪

界面新聞編輯 | 劉方遠(yuǎn)

著名華裔人工智能科學(xué)家、斯坦福大學(xué)教授李飛飛近期創(chuàng)辦了一家新的AI公司。這也是她2018年從谷歌離職重返斯坦福后,首次直接下場參與的創(chuàng)業(yè)項(xiàng)目。

李的個(gè)人領(lǐng)英主頁也有了相應(yīng)的更新變化,最上面的簡歷一欄顯示她從2024年1月已經(jīng)有了新職位,相關(guān)項(xiàng)目匿名顯示為“something new”,工作狀態(tài)為“全職”。

根據(jù)路透社報(bào)道,李飛飛所創(chuàng)辦的新公司主要從事“空間智能”的研發(fā),已完成種子輪融資,投資方包括a16z和RadicalVentures。 李飛飛本人也是RadicalVentures的合伙人之一,這是一家專注于人工智能和相關(guān)創(chuàng)新的獨(dú)立基金,在加拿大注冊成立,成立之初就拿到了AI領(lǐng)域的頂尖科學(xué)家Jeff Hinton、李飛飛等人的投資。

而新公司要做的“空間智能”也與李飛飛最近在許多場合頻繁提及的AI應(yīng)用方向一致。

按照其上個(gè)月在TED大會(huì)上發(fā)表的主題演講介紹,空間智能是通過理解物體之間的關(guān)系,從中得到新的發(fā)現(xiàn)或預(yù)測。這是比傳統(tǒng)視覺識(shí)別更高級的計(jì)算機(jī)視覺智能,是綜合自然語言大模型、機(jī)器人、計(jì)算機(jī)視覺多領(lǐng)域研究成果的一門研究,機(jī)器可以像人類一樣進(jìn)行更復(fù)雜的視覺推理,進(jìn)而采取更貼合實(shí)際的行動(dòng)。

她在演講中展示了一張“貓伸出爪子要把玻璃杯推向桌子邊緣”的照片來幫助觀眾理解何為空間智能:人類大腦通常這一瞬間可以評估玻璃杯的幾何形狀、玻璃杯在真實(shí)三維世界中的位置、杯子與桌子、貓和其他物體的關(guān)系,并且可以預(yù)測接下來會(huì)發(fā)生什么,采取行動(dòng)。

而空間智能所要做的就是教會(huì)計(jì)算機(jī)如何在真實(shí)的三維世界中行動(dòng)。

去年11月,李飛飛領(lǐng)導(dǎo)實(shí)驗(yàn)室已經(jīng)發(fā)布過一款“VoxPoser”智能機(jī)器人。這項(xiàng)研究把通用語言大模型與計(jì)算機(jī)視覺、機(jī)器人等多項(xiàng)技術(shù)結(jié)合在一起,允許機(jī)器人通過接入大模型來直接理解人類的自然語言指令,并將這些復(fù)雜指令轉(zhuǎn)化為具體的行動(dòng)規(guī)劃。這款機(jī)器人不但能順利完成類似于人類口頭直接指派的“清掃垃圾到簸箕里”“打開抽屜并注意避開附近的花瓶”等日常任務(wù),還能根據(jù)諸如“我是左撇子”“你偏離了1厘米”等特殊行為偏好來調(diào)整操作。

更為重要的是,團(tuán)隊(duì)宣稱這款機(jī)器人可以做到“零樣本”,即不需要提前接受過特定任務(wù)訓(xùn)練也能夠完成訓(xùn)練。雖然此項(xiàng)目目前還處于實(shí)驗(yàn)室測試階段,但也足以令常年受困于“數(shù)據(jù)不足”的機(jī)器人行業(yè)興奮異常。

“讓我們更接近一個(gè)人工智能不僅可以看到、創(chuàng)造,還與周圍的物理世界互動(dòng)的世界?!崩铒w飛在TED演進(jìn)中這樣總結(jié)空間智能的最終愿景。

讓計(jì)算機(jī)像人一樣“看到”,也是李飛飛多年人工智能研究的注腳。她近日出版的個(gè)人自傳也用“我看見的世界”作為書名。

1976年,李飛飛出生于中國北京,在四川成都長大。1992年跟隨父母前往美國移民定居,先后考入普林斯頓大學(xué)、加州理工學(xué)院攻讀本科、研究生。

2005年,不滿30歲、剛從加州理工學(xué)院拿到電子工程博士學(xué)位的李飛飛,便同自己的一名研究生共同發(fā)起了ImageNet項(xiàng)目。這個(gè)項(xiàng)目是她學(xué)術(shù)生涯的開端,也是其迄今為止為人工智能行業(yè)做出的最重要貢獻(xiàn)。

ImageNet是一個(gè)擁有超過1500萬張經(jīng)過標(biāo)注的高清圖片,覆蓋了22000個(gè)類別的大型圖像數(shù)據(jù)庫,龐大的數(shù)據(jù)集為人工智能深度學(xué)習(xí)模型的訓(xùn)練提供了豐富的資源。此后,她與學(xué)生發(fā)起了ImageNet Challenge挑戰(zhàn)賽,從2010年至今已有14年的歷史,每一年舉辦一次,已經(jīng)成為了目前計(jì)算機(jī)視覺領(lǐng)域最受矚目的頂尖賽事。

上述兩項(xiàng)工作也被認(rèn)為奠定了人工智能革命全面爆發(fā)的開端。2022年,李飛飛被選為美國工程院院士時(shí),官方在頒獎(jiǎng)詞中寫道,“李飛飛為建立大型機(jī)器學(xué)習(xí)和視覺理解知識(shí)庫做出了貢獻(xiàn)?!?/p>

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。