正在閱讀:

你還不知道什么是AI大模型?

掃一掃下載界面新聞APP

你還不知道什么是AI大模型?

大模型作為人工智能技術(shù)的重要組成部分,可以在各個(gè)領(lǐng)域發(fā)揮巨大的作用。

文|上海汽車報(bào)

當(dāng)前,人工智能(AI)正在成為新一輪科技進(jìn)步和產(chǎn)業(yè)變革的關(guān)鍵要素。工業(yè)和信息化部副部長徐曉蘭在日前召開的“2023世界AI大會(huì)”上表示,我國AI產(chǎn)業(yè)體系逐步完善,核心產(chǎn)業(yè)規(guī)模已達(dá)5000億元,企業(yè)數(shù)量超過4300家,智能芯片、開發(fā)框架、通用大模型等創(chuàng)新成果不斷涌現(xiàn)。

隨著ChatGPT這一現(xiàn)象級產(chǎn)品橫空出世,“AI大模型”一詞進(jìn)入更多人的視野,同時(shí)拉開了大模型產(chǎn)業(yè)和生成式AI產(chǎn)業(yè)蓬勃發(fā)展的序幕。

除了海外的OpenAI、微軟、谷歌、Meta,國內(nèi)市場也出現(xiàn)了百花齊放的現(xiàn)象。3月,百度率先發(fā)布了新一代大語言模型“文心一言”,成為中國第一家正式推出對標(biāo)ChatGPT產(chǎn)品的企業(yè)。此后,阿里、華為、騰訊、字節(jié)跳動(dòng)等巨頭廠商開始陸續(xù)發(fā)布自己的大模型產(chǎn)品。

什么是大模型?

AI模型可以分為淺層模型和深度學(xué)習(xí)模型兩大類。大模型屬于深度學(xué)習(xí)模型,是一個(gè)龐大、復(fù)雜的神經(jīng)網(wǎng)絡(luò),需要通過存儲(chǔ)更多參數(shù)來增加模型的深度和寬度,從而提高模型的表現(xiàn)能力。參數(shù)量一般從百億起步,對大量數(shù)據(jù)進(jìn)行訓(xùn)練并產(chǎn)生高質(zhì)量的預(yù)測結(jié)果。最著名的AI大模型莫過于OpenAI的GPT-3模型,參數(shù)規(guī)模達(dá)1750億,谷歌的PaLM-E模型的參數(shù)規(guī)模更是達(dá)到了5620億。

一般來說,大模型具有更好的通用性、精度和效率,可以通過預(yù)訓(xùn)練或其他方式在大型數(shù)據(jù)集上進(jìn)行學(xué)習(xí),再通過微調(diào),最終高效地完成自然語言處理、圖像識別、語音識別等復(fù)雜任務(wù)。

用百度CEO李彥宏的話來說,就是過去的AI是人類想讓機(jī)器學(xué)會(huì)什么技能,就教它什么技能。教過的技能,它有可能會(huì),沒教過的就不會(huì)。大模型出現(xiàn)后,以前沒教過的技能,它可能也會(huì),這種現(xiàn)象被稱為“智能涌現(xiàn)”。同時(shí),大模型讓AI發(fā)展方向從辨別式走向了生成式。搜索引擎就是典型的辨別式,而用AI進(jìn)行文學(xué)創(chuàng)作、寫報(bào)告、繪制海報(bào)等就被稱為生成式。

大模型重新定義了哪些內(nèi)容?

現(xiàn)在,行業(yè)內(nèi)有一種說法,那就是大模型時(shí)代來臨了,每一個(gè)產(chǎn)品都值得重做一遍。

大模型帶來了哪些改變?首先,大模型再度改變了人機(jī)交互的方式。過去幾十年里,人機(jī)交互方式發(fā)生了幾次變化。從一開始用鍵盤輸入文字命令到后來的圖形用戶界面,也就是現(xiàn)在人們常用的在電腦中點(diǎn)開對應(yīng)的菜單和選項(xiàng)進(jìn)行指令的輸入,這種方式比第一種方式要友好得多,大部分人很快就能上手,但它不是最直接的輸入方式。后來,人們可以通過自然語音與機(jī)器進(jìn)行一些簡單的輸入和交互。如今,當(dāng)你用自然語言與機(jī)器進(jìn)行交互時(shí),它能夠處理更加復(fù)雜的工作。

比如,你想查詢“今年上半年,公司有哪些產(chǎn)品的毛利率超過了新冠疫情爆發(fā)前的水平?”這件事,過去需要人工花費(fèi)半天到一天時(shí)間才能獲得結(jié)果。如今,在大模型的加持下,計(jì)算機(jī)有可能在幾秒鐘以內(nèi)就能給你一個(gè)表格。

此外,大模型的出現(xiàn)讓IT技術(shù)棧發(fā)生了根本性變化。過去,無論是PC還是移動(dòng)時(shí)代,IT技術(shù)棧都是三層,即芯片層、操作系統(tǒng)層、應(yīng)用層。

大模型時(shí)代,IT技術(shù)棧變成了四層:底層仍然是芯片層。芯片層之上是框架層,就是深度學(xué)習(xí)框架,比如ChatGPT的框架層Transformer、Meta的PyTorch,以及谷歌的TensorFlow都是深度學(xué)習(xí)框架。框架層之上是模型層,ChatGPT、文心一言都屬于模型層。最上面的一層才是應(yīng)用層。

現(xiàn)在,大模型已經(jīng)讓開發(fā)者有能力推出并將催生出更多AI原生應(yīng)用。比如,DoNotPay是一個(gè)用AI幫助人們打官司、寫法律文書的應(yīng)用,AI能幫你把不該付的錢要回來。Jasper是一個(gè)通過AI幫助企業(yè)和個(gè)人寫營銷推廣文案的應(yīng)用。

從大模型到應(yīng)用層

“大模型本身是實(shí)現(xiàn)產(chǎn)業(yè)價(jià)值的工具,真正實(shí)現(xiàn)自己的價(jià)值一定是在產(chǎn)業(yè)的應(yīng)用中。”京東集團(tuán)CEO許冉曾表示,大模型的價(jià)值等于算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方,前三個(gè)指標(biāo)固然重要,但技術(shù)在產(chǎn)業(yè)場景落地應(yīng)用,創(chuàng)造實(shí)際價(jià)值才是關(guān)鍵。

目前,除了前文提到的幾個(gè)例子以外,還有幾個(gè)行業(yè)的大模型應(yīng)用受到了比較多的關(guān)注:一是在醫(yī)療領(lǐng)域可以開發(fā)針對疾病及其癥狀的大模型,幫助醫(yī)生更好地診斷和治療疾??;二是在金融領(lǐng)域可以開發(fā)針對股票和市場行情的大模型,幫助投資者更好地做出決策。

再者是汽車領(lǐng)域,自動(dòng)駕駛是AI應(yīng)用的熱門場景。根據(jù)艾媒咨詢提供的數(shù)據(jù),到2025年,我國自動(dòng)駕駛汽車行業(yè)規(guī)模預(yù)計(jì)將從2015年的30.5億元增長至267.6億元。開源證券指出,大模型在自動(dòng)駕駛中應(yīng)用趨勢明確。

大模型的自學(xué)習(xí)算法能力在汽車駕駛過程中發(fā)揮的關(guān)鍵作用,主要體現(xiàn)在感知和決策層面。就感知層面而言,以往自動(dòng)駕駛感知使用的都是各個(gè)小模型“堆疊”的方式,識別的原理就是自己先看,然后到知識庫里進(jìn)行比對,如果以前沒有學(xué)習(xí)過,那就無法準(zhǔn)確識別出來。這種方法對于感知能力的提升是有限的,因?yàn)槁窙r的變化是日新月異的。此前,特斯拉自動(dòng)駕駛汽車高速撞上側(cè)翻的白色貨車,就有可能是將側(cè)翻的車廂誤判為天空或者強(qiáng)反光地面。而有了AI大模型后,可以在有限的標(biāo)注數(shù)據(jù)前提下,找到相似障礙物之間的相關(guān)性。

AI大模型上車后,還有一個(gè)很重要的提升點(diǎn),那就是智能座艙的進(jìn)一步智能化。以往,車載語音助手只是單純地執(zhí)行用戶的指令,屬于命令式交互。而在大模型的加持下,未來車載語音助手有望轉(zhuǎn)變成能和用戶閑聊的伙伴。此前,東風(fēng)日產(chǎn)、紅旗、長城,以及吉利銀河等近10家車企或品牌宣布接入百度的文心一言;阿里巴巴也宣布,AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試。

大模型“井噴”,政策推動(dòng)發(fā)展

自3月以來,國內(nèi)大模型呈現(xiàn)“井噴”狀態(tài)。從互聯(lián)網(wǎng)巨頭到IT企業(yè),從科研機(jī)構(gòu)到科創(chuàng)企業(yè),大家對大模型趨之若鶩,在短時(shí)間內(nèi)紛紛推出自有的大模型產(chǎn)品。

據(jù)科技部新一代AI發(fā)展研究中心于5月底發(fā)布的《中國AI大模型地圖研究報(bào)告》顯示,我國已發(fā)布79個(gè)10億參數(shù)規(guī)模以上的大模型,即將迎來“百模大戰(zhàn)”。

北京、上海和深圳等地接連出臺(tái)政策舉措,積極布局AI產(chǎn)業(yè)。日前,《上海市推動(dòng)AI大模型創(chuàng)新發(fā)展的若干措施》公布,并發(fā)布了“?!倍汲h。據(jù)介紹,上海破解大模型發(fā)展瓶頸的三項(xiàng)計(jì)劃是:一是大模型創(chuàng)新扶持計(jì)劃,重點(diǎn)支持上海市創(chuàng)新主體研發(fā)具有國際競爭力的大模型;二是智能算力加速計(jì)劃,強(qiáng)化大模型智能算力建設(shè)力度,建立綠色通道;三是示范應(yīng)用推進(jìn)計(jì)劃,加強(qiáng)大模型在特定領(lǐng)域的深度應(yīng)用和標(biāo)桿場景打造。

在ChatGPT引發(fā)的大模型浪潮中,巨頭廠商、國內(nèi)科技企業(yè)的入局,加之政策的推動(dòng),使國內(nèi)大模型領(lǐng)域遍地開花。大模型作為人工智能技術(shù)的重要組成部分,可以在各個(gè)領(lǐng)域發(fā)揮巨大的作用。但AI大模型也存在一些問題和挑戰(zhàn)。由于AI大模型的復(fù)雜性,可解釋性(表示模型能夠使用人類可認(rèn)知的說法進(jìn)行解釋和呈現(xiàn))有可能相對較低,會(huì)給人類帶來一定的困惑和不確定性。此外,由于AI大模型的使用涉及隱私和安全等問題,需要加強(qiáng)相關(guān)的法律法規(guī)和管理措施。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

你還不知道什么是AI大模型?

大模型作為人工智能技術(shù)的重要組成部分,可以在各個(gè)領(lǐng)域發(fā)揮巨大的作用。

文|上海汽車報(bào)

當(dāng)前,人工智能(AI)正在成為新一輪科技進(jìn)步和產(chǎn)業(yè)變革的關(guān)鍵要素。工業(yè)和信息化部副部長徐曉蘭在日前召開的“2023世界AI大會(huì)”上表示,我國AI產(chǎn)業(yè)體系逐步完善,核心產(chǎn)業(yè)規(guī)模已達(dá)5000億元,企業(yè)數(shù)量超過4300家,智能芯片、開發(fā)框架、通用大模型等創(chuàng)新成果不斷涌現(xiàn)。

隨著ChatGPT這一現(xiàn)象級產(chǎn)品橫空出世,“AI大模型”一詞進(jìn)入更多人的視野,同時(shí)拉開了大模型產(chǎn)業(yè)和生成式AI產(chǎn)業(yè)蓬勃發(fā)展的序幕。

除了海外的OpenAI、微軟、谷歌、Meta,國內(nèi)市場也出現(xiàn)了百花齊放的現(xiàn)象。3月,百度率先發(fā)布了新一代大語言模型“文心一言”,成為中國第一家正式推出對標(biāo)ChatGPT產(chǎn)品的企業(yè)。此后,阿里、華為、騰訊、字節(jié)跳動(dòng)等巨頭廠商開始陸續(xù)發(fā)布自己的大模型產(chǎn)品。

什么是大模型?

AI模型可以分為淺層模型和深度學(xué)習(xí)模型兩大類。大模型屬于深度學(xué)習(xí)模型,是一個(gè)龐大、復(fù)雜的神經(jīng)網(wǎng)絡(luò),需要通過存儲(chǔ)更多參數(shù)來增加模型的深度和寬度,從而提高模型的表現(xiàn)能力。參數(shù)量一般從百億起步,對大量數(shù)據(jù)進(jìn)行訓(xùn)練并產(chǎn)生高質(zhì)量的預(yù)測結(jié)果。最著名的AI大模型莫過于OpenAI的GPT-3模型,參數(shù)規(guī)模達(dá)1750億,谷歌的PaLM-E模型的參數(shù)規(guī)模更是達(dá)到了5620億。

一般來說,大模型具有更好的通用性、精度和效率,可以通過預(yù)訓(xùn)練或其他方式在大型數(shù)據(jù)集上進(jìn)行學(xué)習(xí),再通過微調(diào),最終高效地完成自然語言處理、圖像識別、語音識別等復(fù)雜任務(wù)。

用百度CEO李彥宏的話來說,就是過去的AI是人類想讓機(jī)器學(xué)會(huì)什么技能,就教它什么技能。教過的技能,它有可能會(huì),沒教過的就不會(huì)。大模型出現(xiàn)后,以前沒教過的技能,它可能也會(huì),這種現(xiàn)象被稱為“智能涌現(xiàn)”。同時(shí),大模型讓AI發(fā)展方向從辨別式走向了生成式。搜索引擎就是典型的辨別式,而用AI進(jìn)行文學(xué)創(chuàng)作、寫報(bào)告、繪制海報(bào)等就被稱為生成式。

大模型重新定義了哪些內(nèi)容?

現(xiàn)在,行業(yè)內(nèi)有一種說法,那就是大模型時(shí)代來臨了,每一個(gè)產(chǎn)品都值得重做一遍。

大模型帶來了哪些改變?首先,大模型再度改變了人機(jī)交互的方式。過去幾十年里,人機(jī)交互方式發(fā)生了幾次變化。從一開始用鍵盤輸入文字命令到后來的圖形用戶界面,也就是現(xiàn)在人們常用的在電腦中點(diǎn)開對應(yīng)的菜單和選項(xiàng)進(jìn)行指令的輸入,這種方式比第一種方式要友好得多,大部分人很快就能上手,但它不是最直接的輸入方式。后來,人們可以通過自然語音與機(jī)器進(jìn)行一些簡單的輸入和交互。如今,當(dāng)你用自然語言與機(jī)器進(jìn)行交互時(shí),它能夠處理更加復(fù)雜的工作。

比如,你想查詢“今年上半年,公司有哪些產(chǎn)品的毛利率超過了新冠疫情爆發(fā)前的水平?”這件事,過去需要人工花費(fèi)半天到一天時(shí)間才能獲得結(jié)果。如今,在大模型的加持下,計(jì)算機(jī)有可能在幾秒鐘以內(nèi)就能給你一個(gè)表格。

此外,大模型的出現(xiàn)讓IT技術(shù)棧發(fā)生了根本性變化。過去,無論是PC還是移動(dòng)時(shí)代,IT技術(shù)棧都是三層,即芯片層、操作系統(tǒng)層、應(yīng)用層。

大模型時(shí)代,IT技術(shù)棧變成了四層:底層仍然是芯片層。芯片層之上是框架層,就是深度學(xué)習(xí)框架,比如ChatGPT的框架層Transformer、Meta的PyTorch,以及谷歌的TensorFlow都是深度學(xué)習(xí)框架。框架層之上是模型層,ChatGPT、文心一言都屬于模型層。最上面的一層才是應(yīng)用層。

現(xiàn)在,大模型已經(jīng)讓開發(fā)者有能力推出并將催生出更多AI原生應(yīng)用。比如,DoNotPay是一個(gè)用AI幫助人們打官司、寫法律文書的應(yīng)用,AI能幫你把不該付的錢要回來。Jasper是一個(gè)通過AI幫助企業(yè)和個(gè)人寫營銷推廣文案的應(yīng)用。

從大模型到應(yīng)用層

“大模型本身是實(shí)現(xiàn)產(chǎn)業(yè)價(jià)值的工具,真正實(shí)現(xiàn)自己的價(jià)值一定是在產(chǎn)業(yè)的應(yīng)用中。”京東集團(tuán)CEO許冉曾表示,大模型的價(jià)值等于算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方,前三個(gè)指標(biāo)固然重要,但技術(shù)在產(chǎn)業(yè)場景落地應(yīng)用,創(chuàng)造實(shí)際價(jià)值才是關(guān)鍵。

目前,除了前文提到的幾個(gè)例子以外,還有幾個(gè)行業(yè)的大模型應(yīng)用受到了比較多的關(guān)注:一是在醫(yī)療領(lǐng)域可以開發(fā)針對疾病及其癥狀的大模型,幫助醫(yī)生更好地診斷和治療疾??;二是在金融領(lǐng)域可以開發(fā)針對股票和市場行情的大模型,幫助投資者更好地做出決策。

再者是汽車領(lǐng)域,自動(dòng)駕駛是AI應(yīng)用的熱門場景。根據(jù)艾媒咨詢提供的數(shù)據(jù),到2025年,我國自動(dòng)駕駛汽車行業(yè)規(guī)模預(yù)計(jì)將從2015年的30.5億元增長至267.6億元。開源證券指出,大模型在自動(dòng)駕駛中應(yīng)用趨勢明確。

大模型的自學(xué)習(xí)算法能力在汽車駕駛過程中發(fā)揮的關(guān)鍵作用,主要體現(xiàn)在感知和決策層面。就感知層面而言,以往自動(dòng)駕駛感知使用的都是各個(gè)小模型“堆疊”的方式,識別的原理就是自己先看,然后到知識庫里進(jìn)行比對,如果以前沒有學(xué)習(xí)過,那就無法準(zhǔn)確識別出來。這種方法對于感知能力的提升是有限的,因?yàn)槁窙r的變化是日新月異的。此前,特斯拉自動(dòng)駕駛汽車高速撞上側(cè)翻的白色貨車,就有可能是將側(cè)翻的車廂誤判為天空或者強(qiáng)反光地面。而有了AI大模型后,可以在有限的標(biāo)注數(shù)據(jù)前提下,找到相似障礙物之間的相關(guān)性。

AI大模型上車后,還有一個(gè)很重要的提升點(diǎn),那就是智能座艙的進(jìn)一步智能化。以往,車載語音助手只是單純地執(zhí)行用戶的指令,屬于命令式交互。而在大模型的加持下,未來車載語音助手有望轉(zhuǎn)變成能和用戶閑聊的伙伴。此前,東風(fēng)日產(chǎn)、紅旗、長城,以及吉利銀河等近10家車企或品牌宣布接入百度的文心一言;阿里巴巴也宣布,AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試。

大模型“井噴”,政策推動(dòng)發(fā)展

自3月以來,國內(nèi)大模型呈現(xiàn)“井噴”狀態(tài)。從互聯(lián)網(wǎng)巨頭到IT企業(yè),從科研機(jī)構(gòu)到科創(chuàng)企業(yè),大家對大模型趨之若鶩,在短時(shí)間內(nèi)紛紛推出自有的大模型產(chǎn)品。

據(jù)科技部新一代AI發(fā)展研究中心于5月底發(fā)布的《中國AI大模型地圖研究報(bào)告》顯示,我國已發(fā)布79個(gè)10億參數(shù)規(guī)模以上的大模型,即將迎來“百模大戰(zhàn)”。

北京、上海和深圳等地接連出臺(tái)政策舉措,積極布局AI產(chǎn)業(yè)。日前,《上海市推動(dòng)AI大模型創(chuàng)新發(fā)展的若干措施》公布,并發(fā)布了“模”都倡議。據(jù)介紹,上海破解大模型發(fā)展瓶頸的三項(xiàng)計(jì)劃是:一是大模型創(chuàng)新扶持計(jì)劃,重點(diǎn)支持上海市創(chuàng)新主體研發(fā)具有國際競爭力的大模型;二是智能算力加速計(jì)劃,強(qiáng)化大模型智能算力建設(shè)力度,建立綠色通道;三是示范應(yīng)用推進(jìn)計(jì)劃,加強(qiáng)大模型在特定領(lǐng)域的深度應(yīng)用和標(biāo)桿場景打造。

在ChatGPT引發(fā)的大模型浪潮中,巨頭廠商、國內(nèi)科技企業(yè)的入局,加之政策的推動(dòng),使國內(nèi)大模型領(lǐng)域遍地開花。大模型作為人工智能技術(shù)的重要組成部分,可以在各個(gè)領(lǐng)域發(fā)揮巨大的作用。但AI大模型也存在一些問題和挑戰(zhàn)。由于AI大模型的復(fù)雜性,可解釋性(表示模型能夠使用人類可認(rèn)知的說法進(jìn)行解釋和呈現(xiàn))有可能相對較低,會(huì)給人類帶來一定的困惑和不確定性。此外,由于AI大模型的使用涉及隱私和安全等問題,需要加強(qiáng)相關(guān)的法律法規(guī)和管理措施。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。