正在閱讀:

大模型落地難,產(chǎn)業(yè)從物理世界尋找突破口

掃一掃下載界面新聞APP

大模型落地難,產(chǎn)業(yè)從物理世界尋找突破口

過去業(yè)界對AI的落地應(yīng)用主要集中在自然語言理解、語音識別、視覺識別等方面,并沒有從真實的物理世界中去思考AI如何解決需求痛點。

圖片來源:視覺中國

界面新聞記者 | 肖芳

界面新聞編輯 | 文姝琪

大模型走紅之后,從業(yè)者對其落地應(yīng)用有各種各樣的暢想,也拉高了業(yè)界對大模型落地應(yīng)用的預(yù)期。但一年多過去,大模型在實際應(yīng)用場景中的落地并沒有此前預(yù)期的那么順利。

一家大模型公司的銷售負責人告訴界面新聞,他們走訪了多家工廠之后發(fā)現(xiàn),工廠對AI最迫切的需求是質(zhì)檢,但目前大模型的能力還不足以支撐其在真實的質(zhì)檢場景中應(yīng)用,而通過大語言模型幫助企業(yè)解決培訓(xùn)、管理流程等問題對制造業(yè)來說并不算剛需。

而在C端(用戶端),此前AI助手類應(yīng)用被認為最能夠成為超級App。但從實際的數(shù)據(jù)來看,Kimi、文小言等AI助手產(chǎn)品在經(jīng)歷一波快速增長時候,留存率并不是很理想,也沒有呈現(xiàn)出移動互聯(lián)網(wǎng)時代超級應(yīng)用爆發(fā)前的增長潛力。

對于當下大模型行業(yè)普遍面臨的迷茫局面,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘在2024云棲大會上表示,AI最大的想象力不在手機屏幕,而是接管數(shù)字世界,改變物理世界。

過去三十年,互聯(lián)網(wǎng)浪潮的本質(zhì)是連接,互聯(lián)網(wǎng)連接了人、信息、商業(yè)和工廠,通過連接提高了世界的協(xié)作效率,創(chuàng)造了巨大的價值,改變了人們的生活方式。但生成式AI是通過生產(chǎn)力的供給創(chuàng)造了新的價值,從而為世界創(chuàng)造了更大的內(nèi)在價值,也就是總體提高了整個世界的生產(chǎn)力水平。這種價值創(chuàng)造,可能是移動互聯(lián)網(wǎng)連接價值的十倍、幾十倍。

但過去業(yè)界對AI的落地應(yīng)用主要集中在自然語言理解、語音識別、視覺識別等方面,并沒有從真實的物理世界中去思考AI如何解決需求痛點。而從今年云棲大會前沿應(yīng)用館展出的一些應(yīng)用來看,一些創(chuàng)業(yè)者和開發(fā)者也意識到此前的問題,在大模型應(yīng)用開發(fā)中改變了思路。

教育科技公司精準學是其中之一。這家成立于2018年的公司原來的主要產(chǎn)品是搭載“AI錯題集”服務(wù)的智能平板,學生在精準學上完成測評,AI通過分析錯題,找到學生掌握不牢的知識點,再自動推薦類似的題目。去年看到大模型走紅之后,精準學創(chuàng)始人楊仁斌開始思考通過大模型來解決學生在使用學習機產(chǎn)品時容易跑神、沒有效率的問題。

精準學基于大模型研發(fā)出的新產(chǎn)品是“超擬人AI一對一老師”。界面新聞從精準學展臺演示產(chǎn)品發(fā)現(xiàn),這款產(chǎn)品和花200-300元/小時購買的線上一對一私教課體驗類似,講解題目的語氣也和真人老師類似,學生還能夠針對題目的知識點、錯題點等進行對話。這款產(chǎn)品將搭載在精準學今年10月即將發(fā)布的AI輔學機中直接面向?qū)W生提供服務(wù)。

個人開發(fā)者、知名技術(shù)博主張子豪看中大模型人形機器人走入日常生活帶來機會。

人形機器人發(fā)展數(shù)年卻一直不溫不火一個重要原因是機器人無法聽懂人類語言。此前機器人不管能夠完成多么復(fù)雜任務(wù),都是根據(jù)固定的指令去完成固定的動作,沒法實現(xiàn)泛化性、多樣性、通用性操作和對指令的理解。張子豪通過大模型人類語言翻譯成機器人能夠執(zhí)行的動作列表及函數(shù)參數(shù),機器人可以聽懂人類任意指令,后續(xù)機器人真正走向普通人的日常生活較大啟發(fā)

還有一些已經(jīng)在C端有認知度的產(chǎn)品,把原有的業(yè)務(wù)積累和大模型相結(jié)合,提供一些更深層次的服務(wù)。其中,高德地圖基于時空大數(shù)據(jù)和大模型研發(fā)了商業(yè)智能平臺,并基于此推出了商業(yè)智能體ChatBI Agent,可針對咖啡茶飲、商超便利、餐飲等行業(yè)提供行業(yè)趨勢、品牌發(fā)展、選址評估、運營分析等報告生成服務(wù)。

高德地圖副總裁董振寧告訴界面新聞,在開店選址評估上,高德商業(yè)智能體能夠根據(jù)區(qū)域分析客戶目標用戶人群的占比,評估出合適的位置。如果客戶想要在商場選址,高德商業(yè)智能體還能分析流動用戶是否符合預(yù)期?!霸瓉碇饕ㄟ^大數(shù)據(jù)進行分析,有了大模型之后,分析的效率更高,也更準確。

這些真實生活中小切口應(yīng)用看起來不太起眼很難達到業(yè)界大模型落地應(yīng)用期待。這是因為作為一項新技術(shù)大模型目前的能力還處于早期階段,落地應(yīng)用也要這些細微場景開始,循序漸進解決更為復(fù)雜問題。

從歷史經(jīng)驗來看,人們對新技術(shù)革命,往往對短期高估,又對長期低估,很多大模型態(tài)度也是這樣。實際上,去年今年大模型能力一直進步。比如OpenAI最新發(fā)布o1推理模型已經(jīng)能夠解決復(fù)雜推理問題,在物理、生物和化學問題的基準測試中超越了人類博士水平的準確率。

不過,這個漫長模型升級過程一方面考驗基礎(chǔ)模型公司模型訓(xùn)練過程持續(xù)資金投入同時也需要大模型公司持續(xù)降低創(chuàng)業(yè)者開發(fā)者使用大模型成本根據(jù)特許金融分析師周淳哲預(yù)測,未來的GPT-5則是完成AI從“高中生躍升至博士”的成長模型非常消耗算力,使用價格也可能非常高昂

樂觀一面模型推理成本一直指數(shù)級下降,已經(jīng)遠遠超過摩爾定律,大模型未來某個時間更低成本滿足人類社會更多復(fù)雜場景需求。

吳泳銘在2024云棲大會上預(yù)測了這個階段的變化:大模型物理世界數(shù)據(jù)的Token化之后能夠理解真實世界的方方面面,還能完成使用工具、開公司創(chuàng)業(yè)各種各樣這個階段,AI能夠模仿人類去執(zhí)行物理世界的任務(wù)產(chǎn)業(yè)革命才會發(fā)生。

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型落地難,產(chǎn)業(yè)從物理世界尋找突破口

過去業(yè)界對AI的落地應(yīng)用主要集中在自然語言理解、語音識別、視覺識別等方面,并沒有從真實的物理世界中去思考AI如何解決需求痛點。

圖片來源:視覺中國

界面新聞記者 | 肖芳

界面新聞編輯 | 文姝琪

大模型走紅之后,從業(yè)者對其落地應(yīng)用有各種各樣的暢想,也拉高了業(yè)界對大模型落地應(yīng)用的預(yù)期。但一年多過去,大模型在實際應(yīng)用場景中的落地并沒有此前預(yù)期的那么順利。

一家大模型公司的銷售負責人告訴界面新聞,他們走訪了多家工廠之后發(fā)現(xiàn),工廠對AI最迫切的需求是質(zhì)檢,但目前大模型的能力還不足以支撐其在真實的質(zhì)檢場景中應(yīng)用,而通過大語言模型幫助企業(yè)解決培訓(xùn)、管理流程等問題對制造業(yè)來說并不算剛需。

而在C端(用戶端),此前AI助手類應(yīng)用被認為最能夠成為超級App。但從實際的數(shù)據(jù)來看,Kimi、文小言等AI助手產(chǎn)品在經(jīng)歷一波快速增長時候,留存率并不是很理想,也沒有呈現(xiàn)出移動互聯(lián)網(wǎng)時代超級應(yīng)用爆發(fā)前的增長潛力。

對于當下大模型行業(yè)普遍面臨的迷茫局面,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘在2024云棲大會上表示,AI最大的想象力不在手機屏幕,而是接管數(shù)字世界,改變物理世界。

過去三十年,互聯(lián)網(wǎng)浪潮的本質(zhì)是連接,互聯(lián)網(wǎng)連接了人、信息、商業(yè)和工廠,通過連接提高了世界的協(xié)作效率,創(chuàng)造了巨大的價值,改變了人們的生活方式。但生成式AI是通過生產(chǎn)力的供給創(chuàng)造了新的價值,從而為世界創(chuàng)造了更大的內(nèi)在價值,也就是總體提高了整個世界的生產(chǎn)力水平。這種價值創(chuàng)造,可能是移動互聯(lián)網(wǎng)連接價值的十倍、幾十倍。

但過去業(yè)界對AI的落地應(yīng)用主要集中在自然語言理解、語音識別、視覺識別等方面,并沒有從真實的物理世界中去思考AI如何解決需求痛點。而從今年云棲大會前沿應(yīng)用館展出的一些應(yīng)用來看,一些創(chuàng)業(yè)者和開發(fā)者也意識到此前的問題,在大模型應(yīng)用開發(fā)中改變了思路。

教育科技公司精準學是其中之一。這家成立于2018年的公司原來的主要產(chǎn)品是搭載“AI錯題集”服務(wù)的智能平板,學生在精準學上完成測評,AI通過分析錯題,找到學生掌握不牢的知識點,再自動推薦類似的題目。去年看到大模型走紅之后,精準學創(chuàng)始人楊仁斌開始思考通過大模型來解決學生在使用學習機產(chǎn)品時容易跑神、沒有效率的問題。

精準學基于大模型研發(fā)出的新產(chǎn)品是“超擬人AI一對一老師”。界面新聞從精準學展臺演示產(chǎn)品發(fā)現(xiàn),這款產(chǎn)品和花200-300元/小時購買的線上一對一私教課體驗類似,講解題目的語氣也和真人老師類似,學生還能夠針對題目的知識點、錯題點等進行對話。這款產(chǎn)品將搭載在精準學今年10月即將發(fā)布的AI輔學機中直接面向?qū)W生提供服務(wù)。

個人開發(fā)者、知名技術(shù)博主張子豪看中大模型人形機器人走入日常生活帶來機會

人形機器人發(fā)展數(shù)年卻一直不溫不火一個重要原因是機器人無法聽懂人類語言。此前機器人不管能夠完成多么復(fù)雜任務(wù),都是根據(jù)固定的指令去完成固定的動作,沒法實現(xiàn)泛化性、多樣性、通用性操作和對指令的理解。張子豪通過大模型人類語言翻譯成機器人能夠執(zhí)行的動作列表及函數(shù)參數(shù),機器人可以聽懂人類任意指令,后續(xù)機器人真正走向普通人的日常生活較大啟發(fā)。

還有一些已經(jīng)在C端有認知度的產(chǎn)品,把原有的業(yè)務(wù)積累和大模型相結(jié)合,提供一些更深層次的服務(wù)。其中,高德地圖基于時空大數(shù)據(jù)和大模型研發(fā)了商業(yè)智能平臺,并基于此推出了商業(yè)智能體ChatBI Agent,可針對咖啡茶飲、商超便利、餐飲等行業(yè)提供行業(yè)趨勢、品牌發(fā)展、選址評估、運營分析等報告生成服務(wù)。

高德地圖副總裁董振寧告訴界面新聞,在開店選址評估上,高德商業(yè)智能體能夠根據(jù)區(qū)域分析客戶目標用戶人群的占比,評估出合適的位置。如果客戶想要在商場選址,高德商業(yè)智能體還能分析流動用戶是否符合預(yù)期?!霸瓉碇饕ㄟ^大數(shù)據(jù)進行分析,有了大模型之后,分析的效率更高,也更準確。

這些真實生活中小切口應(yīng)用看起來不太起眼,很難達到業(yè)界大模型落地應(yīng)用期待。這是因為作為一項新技術(shù),大模型目前的能力還處于早期階段,落地應(yīng)用也要這些細微場景開始,循序漸進解決更為復(fù)雜問題。

從歷史經(jīng)驗來看,人們對新技術(shù)革命,往往對短期高估,又對長期低估,很多大模型態(tài)度也是這樣實際上,去年今年大模型能力一直進步。比如,OpenAI最新發(fā)布o1推理模型已經(jīng)能夠解決復(fù)雜推理問題,在物理、生物和化學問題的基準測試中超越了人類博士水平的準確率。

不過,這個漫長模型升級過程一方面考驗基礎(chǔ)模型公司模型訓(xùn)練過程持續(xù)資金投入,同時也需要大模型公司持續(xù)降低創(chuàng)業(yè)者開發(fā)者使用大模型成本。根據(jù)特許金融分析師周淳哲預(yù)測未來的GPT-5則是完成AI從“高中生躍升至博士”的成長,模型非常消耗算力使用價格也可能非常高昂。

樂觀一面模型推理成本一直指數(shù)級下降,已經(jīng)遠遠超過摩爾定律,大模型未來某個時間更低成本滿足人類社會更多復(fù)雜場景需求。

吳泳銘在2024云棲大會上預(yù)測了這個階段的變化:大模型物理世界數(shù)據(jù)的Token化之后,能夠理解真實世界的方方面面還能完成使用工具、開公司創(chuàng)業(yè)各種各樣。這個階段AI能夠模仿人類去執(zhí)行物理世界的任務(wù),產(chǎn)業(yè)革命才會發(fā)生

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。