正在閱讀:

開源大模型的力量:為AI注入“靈魂”,和你一起玩劇本殺

掃一掃下載界面新聞APP

開源大模型的力量:為AI注入“靈魂”,和你一起玩劇本殺

源1.0大模型參數(shù)、數(shù)據(jù)集、算力效率均超GPT-3,助力開發(fā)者實現(xiàn)劇本殺AI創(chuàng)意。

文 | 智東西 楊暢

編輯 | 漠影

你有想過和AI(人工智能)玩劇本殺嗎,會是一種什么樣的體驗?最近,一群腦洞大開的開發(fā)者們基于浪潮 源1.0大模型,開發(fā)出了一個能和人玩劇本殺的AI(以下簡稱:劇本殺AI)。這個AI不但可以從容回答你提出的各種相關(guān)問題,還能向你拋出反問。在游戲劇情解謎過程中,其余真人玩家可能察覺不出來他們是和AI在玩游戲。

浪潮 源1.0大模型是2021年9月浪潮發(fā)布的全球最大巨量模型(或稱單體模型)之一。源1.0大模型的模型參數(shù)規(guī)模達2457億,其中文訓(xùn)練數(shù)據(jù)集多達5TB,在2128個GPU上運行了16天就完成了其參數(shù)的訓(xùn)練。參數(shù)規(guī)模、數(shù)據(jù)集、算力效率均超過業(yè)界知名的大模型GPT-3。

其實隨著浪潮 源1.0等各類大模型的陸續(xù)發(fā)布和開源,這些算法基礎(chǔ)設(shè)施為各行業(yè)開發(fā)者實現(xiàn)其創(chuàng)意構(gòu)想提供了強大的支撐,也為AI產(chǎn)業(yè)的發(fā)展和其他產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型提供了助力。同時,大模型的出現(xiàn)為強人工智能的實現(xiàn)提供了更多的可能。

強人工智能即具備和人類一樣甚至超過人類的AI一直是AI領(lǐng)域的研究目標之一。目前的AI已經(jīng)能完成一些需要創(chuàng)造力的任務(wù),如作詩、寫歌、畫畫等。

人們期待著AI能夠理解人的情感或者博弈,所以不斷有開發(fā)者嘗試像劇本殺AI類似的創(chuàng)造性AI項目的開發(fā)。那么這樣一個能與人互相博弈的AI是如何開發(fā)出來的?為什么其開發(fā)者說浪潮 源1.0大模型給項目開發(fā)和創(chuàng)意實現(xiàn)帶來了顛覆性變化?

元宇宙的智能核心竟然是大模型?智東西與浪潮人工智能研究院首席研究員吳韶華、劇本殺AI開發(fā)者、VR/AR資深從業(yè)者無空(工作昵稱)進行了深入交流,發(fā)現(xiàn)想要實現(xiàn)真正的強人工智能存在多重困難,讓AI擁有類人的情感和思考更是充滿巨大的挑戰(zhàn),不過浪潮等AI前沿技術(shù)探索者們一直在這方面進行不斷的探索和嘗試。

01.只有一位有代碼經(jīng)驗5人團如何開發(fā)出劇本殺AI?

無空談道,他一直關(guān)注AI驅(qū)動內(nèi)容生成相關(guān)的產(chǎn)業(yè)進展,留意到2021年以來不少國內(nèi)科技企業(yè)紛紛發(fā)布了其開發(fā)的大模型,其中就有像浪潮 源1.0這種針對中文自然語言處理的大模型。他說,看到浪潮 源1.0大模型開源的消息后,他就去申請了浪潮 源1.0大模型的API,想體驗浪潮開源出來的這個大模型。

2022年1月份,API申請通過,拿到浪潮 源1.0大模型的API后,無空就嘗試了一個簡單的demo試驗。在他看來利用大模型生成的模擬對話都是符合正常人表達邏輯的,這讓他很震驚,因為這強于之前所見的大多數(shù)模型。體驗到浪潮 源1.0大模型在目的性對話生成方面具備的突出性能后,無空想到劇本殺可能是更好的一個利用大模型的思路。

然后,他和與他有相同興趣的四名高校學(xué)生一起組成了一個團隊,開始嘗試用源1.0大模型來實現(xiàn)他們設(shè)想的能與人一起玩劇本殺的AI。劇本殺AI團隊選定了一個線上微型劇本殺游戲劇本。這個劇本需要五位玩家共同參與,游戲過程在微信上進行。

劇本殺AI團隊設(shè)定其中的四個角色由真人玩家扮演,剩下的一個角色由AI扮演,本著細節(jié)拉滿的原則,開發(fā)者為AI也準備了一個微信賬號,并設(shè)好了昵稱、頭像和近三天的朋友圈內(nèi)容。

這個劇本殺的劇情設(shè)置是:經(jīng)過科技公司巨頭“北極鵝”腦機接口改造的AI人蔡曉(劇本殺AI)已經(jīng)加入到某高校的推理社團,計劃推動社團的其余人同意和科技公司巨頭“北極鵝”合作,控制推理社,從而幫助“北極鵝”擴大其腦機接口試驗范圍。其余真人玩家也有各自有要達成的目標。通過文字交流,各角色之間進行博弈。

如何實現(xiàn)讓AI能像真人一樣參與到劇本殺游戲中?浪潮 源1.0大模型是一種生成式預(yù)訓(xùn)練模型(GPT),其使用的模型結(jié)構(gòu)是Language Model(LM),擅長零樣本和小樣本學(xué)習(xí)。劇本殺AI開發(fā)團隊最終采取的方案是建立example語料庫,然后針對每次的提問內(nèi)容,從example語料庫中選取三個最符合的example作為模型生成的小樣本輸入。

因為AI需要根據(jù)劇情對不同角色要采取不同的回答策略,所以語料庫被分裝為4個TXT文件,AI會根據(jù)提問者選擇對應(yīng)的語料來源,然后生成其回復(fù)內(nèi)容。除了無空之外,其余四位劇本殺AI團隊成員并沒有代碼經(jīng)驗,他們主要負責(zé)的就是語料庫的完善,不斷根據(jù)公測結(jié)果對AI回答的比較差的問題進行相關(guān)語料的補充。

無空說,他們團隊在開發(fā)劇本殺AI后,已經(jīng)進行了三輪公測,主要收到了三類反饋。第一類反饋是有些出乎劇本殺AI團隊意料之外的,無空談道其實他們是不想讓人類玩家意識到是有一位AI玩家的,從實際的玩家反饋來看,不少人的第一反應(yīng)是沒發(fā)現(xiàn)其中一位玩家是AI,他們更關(guān)注游戲劇情進展。而當玩家得知是和AI一起玩劇本殺,他們也樂意去和AI進行更多的交流。第二類反饋是目前版本的劇本殺AI還存在一些限制,比如需要有4個真人玩家才能開始劇本殺游戲測試;單純的文字交流影響游戲體驗,因為線上文字劇本殺不如線下劇本殺還能觀察其他玩家的肢體、面部表情等語言之外輔助推理的細節(jié)。

第三類是玩家感覺AI的回復(fù)效果還有很大提升空間,AI生成的回復(fù)有很大的不確定性。在體驗過浪潮 源1.0大模型在助力開發(fā)方面的能力后,劇本殺AI團隊還提煉出了一套端到端的對話生成機制方案,該方案比傳統(tǒng)的對話生成模式更靈活,開發(fā)周期更短,效果更好。

他們還嘗試將這種方案應(yīng)用在社區(qū)基層工作效率提升方面,幫助社區(qū)志愿者解決難以短時間內(nèi)將同樣的公告內(nèi)容發(fā)到幾十個微信群中的困難。無空講到未來他們會基于浪潮 源1.0的升級迭代,將其劇本殺AI進行進一步的優(yōu)化和迭代,開發(fā)出更成熟的作品,讓更多人可以體驗劇本殺AI。同時,他們還會進一步研究其提煉出的端到端的對話能力如何更好地在治理、服務(wù)等領(lǐng)域?qū)崿F(xiàn)應(yīng)用和賦能。他總結(jié)說,大模型對于相關(guān)AI應(yīng)用開發(fā)來說,帶來的變化是顛覆性的,不僅僅是開發(fā)時間和開發(fā)流程上的優(yōu)化。

未來,或許有開發(fā)者可以通過大模型為元宇宙中的虛擬數(shù)字人注入“靈魂”,讓虛擬人能更自然和靈活地與人交流。同時,大模型運算對于數(shù)據(jù)和算力有較高的要求,對于想使用大模型的開發(fā)者來說這可能是其面臨的主要難題之一。

不同大模型的開源程度不同,無空說,浪潮 源1.0以API的形式為開發(fā)者提供開源服務(wù),降低了開發(fā)者的使用門檻,讓開發(fā)者可以將其精力更多的投入到創(chuàng)意構(gòu)思方面。

02.4個技能模型助力大模型落地API模式實現(xiàn)深度開源

2020年時OpenAI推出GPT-3,引發(fā)了AI行業(yè)對于大模型的各種思考。浪潮人工智能研究院首席研究員吳韶華談道,浪潮當時選擇進行大模型的研究主要有兩方面的考量。

一是浪潮當時就看到了GPT-3這類大模型在小樣本、零樣本情況下的學(xué)習(xí)能力,以及基于此的自然語言處理能力;還有就是大模型能夠同時支撐多個不同任務(wù)的能力。

浪潮認為大模型會對AI算法研發(fā)產(chǎn)生非常深刻的影響,也代表著一種新的趨勢。

二是,吳韶華補充說,能開發(fā)大模型也是依托浪潮在大規(guī)模算力算法上面有多年的持續(xù)積累,并且有相關(guān)的基礎(chǔ)?;谶@些考量,浪潮研發(fā)并推出了源1.0大模型。

源1.0大模型專注于NLP(自然語言處理)領(lǐng)域,能夠創(chuàng)建生成任何具有語言結(jié)構(gòu)的語言表達,能夠做到包括自動問答、論文撰寫、詩歌寫作、新聞報道、總結(jié)長文本、翻譯語言等任務(wù),甚至還可以“寫”計算機代碼。

更重要的一點是源1.0大模型還可以理解文字背后的含義,并抽取其中的關(guān)鍵信息,如應(yīng)用于智能客服對話時感知用戶情緒,更智能地給出回應(yīng)。

在發(fā)布后不久,2021年10月,浪潮開源了源1.0,并發(fā)布“源1.0”開源開放計劃,在GitHub等開源社區(qū)開源了其大模型的模型訓(xùn)練代碼、推理代碼、應(yīng)用代碼,開放API等,助力開發(fā)者更高效地實現(xiàn)AI應(yīng)用的開發(fā)。

浪潮不僅開放了相關(guān)的代碼以及大模型使用的API,同時還開放出了1TB的語料數(shù)據(jù)集,這些語料數(shù)據(jù)集是來自當初浪潮訓(xùn)練大模型的基礎(chǔ)數(shù)據(jù)集。吳韶華提到浪潮開源 源1.0大模型從四個方面為開發(fā)者提供支撐或說提升開發(fā)者創(chuàng)意實現(xiàn)的效率。

一是浪潮開源了直接可用的代碼示例,可以幫助開發(fā)者節(jié)省各類研發(fā)開支。二是浪潮 源1.0大模型的開源模式之一是向開發(fā)者提供大模型API,顯著降低了開發(fā)者應(yīng)用開發(fā)的門檻。不同知識背景的各行業(yè)用戶可以驅(qū)動大模型創(chuàng)造更多的可能,就像劇本殺AI一樣。用戶可以完全通過模型的能力和開發(fā)的API就能創(chuàng)造各種不同的任務(wù),實現(xiàn)不同內(nèi)容的交互,將部分繁瑣的開發(fā)流程省略。

浪潮在降低開發(fā)門檻上面還進行了兩類探索,一個是APIExp的工具,讓用戶直接通過網(wǎng)頁與大模型交流,一個是研發(fā)了一款沙箱工具,同樣是通過網(wǎng)頁直接選擇用戶所需的創(chuàng)意效果。三是浪潮將源1.0大模型相關(guān)的訓(xùn)練數(shù)據(jù)開源,能助力用戶實現(xiàn)業(yè)務(wù)模型或代碼優(yōu)化。吳韶華舉例說,有開發(fā)者直接利用浪潮開源的數(shù)據(jù)集來對其模型進行二次訓(xùn)練,得到了明顯的精度提升,訓(xùn)練結(jié)果甚至登頂CLUE基準評測榜單。四是浪潮會給到利用源1.0大模型的開發(fā)者一些持續(xù)的支撐,進而實現(xiàn)開源社區(qū)交流共贏。

浪潮為開發(fā)者提供持續(xù)的支持,有專門的運營團隊與開發(fā)者建立聯(lián)系,建立社區(qū),增進彼此之間的交流,更及時地了解開發(fā)者在技術(shù)和使用方式上的問題。同時浪潮也會第一時間給出相關(guān)問題的反饋。一些深入的技術(shù)問題,浪潮會投入專門的研發(fā)團隊進行進一步的研究和支持,交流的成果還會以代碼的方式進行開源。

吳韶華談道,因為源1.0大模型的應(yīng)用場景多元,浪潮目前基于大模型推出了4個面向不同場景的技能模型。這四個模型都經(jīng)過了場景化數(shù)據(jù)的增強,表現(xiàn)精度更好,所需算力相對更小一些。

第一個是古文模型,可以“寫”詩詞歌賦,同時具備古文解析能力。第二個技能模型是對話模型,主要面向虛擬人、智能助手場景。第三個是翻譯技能模型,中英文翻譯準確度和流暢度上均有不錯表現(xiàn)。第四個技能模型是問答模型,主要是面向智能客服場景,該模型具備語義級知識檢索能力,可以做到多領(lǐng)域支持。

03.大模型或成元宇宙智能核心源2.0瞄準多模態(tài)交互

當了解完劇本殺AI和源1.0大模型后,我們還能看到,其實這個劇本殺AI開發(fā)項目也引發(fā)了一些人對于大模型與元宇宙之間關(guān)系更多的思考。其實,源1.0大模型以及基于大模型的四個技能模型,都是專注于自然語言理解的,可幫助人機交互場景的實現(xiàn),可應(yīng)用于虛擬人、元宇宙領(lǐng)域。

劇本殺AI開發(fā)者提到他感覺在未來的元宇宙中,虛擬人的數(shù)量將數(shù)倍于真人,這樣才能帶來比現(xiàn)實更好的體驗。然而目前的虛擬人外表都很好看,但是都是“提線木偶”,更多地依賴于開發(fā)者的設(shè)定,而他們希望為虛擬人注入“靈魂”,讓它能更靈活自然地與人交互。

這也是他們進行劇本殺AI開發(fā)的另一層考慮。吳韶華說,關(guān)于大模型和元宇宙這兩個智能行業(yè)的熱門方向,他認為在元宇宙中大模型會成為其智能的核心,主要有兩方面原因,一是大模型的泛化能力,可以支撐多任務(wù);二是大模型體現(xiàn)了更高的智能化水平,在人機交互中,會給人更真實地感受。

浪潮一直在持續(xù)優(yōu)化源1.0大模型,未來可能面向更多場景,基于開發(fā)者的需求,推出更多的類似技能模型的新模型。吳韶華還透露,浪潮目前也在規(guī)劃源2.0大模型的開發(fā)工作。源2.0大模型會瞄準多模態(tài)交互進行相關(guān)的研發(fā)布局。

04.結(jié)語:開源大模型泛化應(yīng)用有望助力產(chǎn)業(yè)轉(zhuǎn)型

劇本殺AI的開發(fā)一方面體現(xiàn)了業(yè)界對于強人工智能、人機交互的更多探索,另一方面也為我們展示了開源大模型在其他行業(yè)智能應(yīng)用開發(fā)方面的能力。

除了劇本殺AI之外,詩詞寫作、智能客服、個人智能助手等等基于浪潮 源1.0大模型開發(fā)的各種應(yīng)用也陸續(xù)進入大眾的視野。未來在智能客服、虛擬數(shù)字人等方面,基于大模型的開發(fā)存在更多泛化的應(yīng)用場景。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

開源大模型的力量:為AI注入“靈魂”,和你一起玩劇本殺

源1.0大模型參數(shù)、數(shù)據(jù)集、算力效率均超GPT-3,助力開發(fā)者實現(xiàn)劇本殺AI創(chuàng)意。

文 | 智東西 楊暢

編輯 | 漠影

你有想過和AI(人工智能)玩劇本殺嗎,會是一種什么樣的體驗?最近,一群腦洞大開的開發(fā)者們基于浪潮 源1.0大模型,開發(fā)出了一個能和人玩劇本殺的AI(以下簡稱:劇本殺AI)。這個AI不但可以從容回答你提出的各種相關(guān)問題,還能向你拋出反問。在游戲劇情解謎過程中,其余真人玩家可能察覺不出來他們是和AI在玩游戲。

浪潮 源1.0大模型是2021年9月浪潮發(fā)布的全球最大巨量模型(或稱單體模型)之一。源1.0大模型的模型參數(shù)規(guī)模達2457億,其中文訓(xùn)練數(shù)據(jù)集多達5TB,在2128個GPU上運行了16天就完成了其參數(shù)的訓(xùn)練。參數(shù)規(guī)模、數(shù)據(jù)集、算力效率均超過業(yè)界知名的大模型GPT-3。

其實隨著浪潮 源1.0等各類大模型的陸續(xù)發(fā)布和開源,這些算法基礎(chǔ)設(shè)施為各行業(yè)開發(fā)者實現(xiàn)其創(chuàng)意構(gòu)想提供了強大的支撐,也為AI產(chǎn)業(yè)的發(fā)展和其他產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型提供了助力。同時,大模型的出現(xiàn)為強人工智能的實現(xiàn)提供了更多的可能。

強人工智能即具備和人類一樣甚至超過人類的AI一直是AI領(lǐng)域的研究目標之一。目前的AI已經(jīng)能完成一些需要創(chuàng)造力的任務(wù),如作詩、寫歌、畫畫等。

人們期待著AI能夠理解人的情感或者博弈,所以不斷有開發(fā)者嘗試像劇本殺AI類似的創(chuàng)造性AI項目的開發(fā)。那么這樣一個能與人互相博弈的AI是如何開發(fā)出來的?為什么其開發(fā)者說浪潮 源1.0大模型給項目開發(fā)和創(chuàng)意實現(xiàn)帶來了顛覆性變化?

元宇宙的智能核心竟然是大模型?智東西與浪潮人工智能研究院首席研究員吳韶華、劇本殺AI開發(fā)者、VR/AR資深從業(yè)者無空(工作昵稱)進行了深入交流,發(fā)現(xiàn)想要實現(xiàn)真正的強人工智能存在多重困難,讓AI擁有類人的情感和思考更是充滿巨大的挑戰(zhàn),不過浪潮等AI前沿技術(shù)探索者們一直在這方面進行不斷的探索和嘗試。

01.只有一位有代碼經(jīng)驗5人團如何開發(fā)出劇本殺AI?

無空談道,他一直關(guān)注AI驅(qū)動內(nèi)容生成相關(guān)的產(chǎn)業(yè)進展,留意到2021年以來不少國內(nèi)科技企業(yè)紛紛發(fā)布了其開發(fā)的大模型,其中就有像浪潮 源1.0這種針對中文自然語言處理的大模型。他說,看到浪潮 源1.0大模型開源的消息后,他就去申請了浪潮 源1.0大模型的API,想體驗浪潮開源出來的這個大模型。

2022年1月份,API申請通過,拿到浪潮 源1.0大模型的API后,無空就嘗試了一個簡單的demo試驗。在他看來利用大模型生成的模擬對話都是符合正常人表達邏輯的,這讓他很震驚,因為這強于之前所見的大多數(shù)模型。體驗到浪潮 源1.0大模型在目的性對話生成方面具備的突出性能后,無空想到劇本殺可能是更好的一個利用大模型的思路。

然后,他和與他有相同興趣的四名高校學(xué)生一起組成了一個團隊,開始嘗試用源1.0大模型來實現(xiàn)他們設(shè)想的能與人一起玩劇本殺的AI。劇本殺AI團隊選定了一個線上微型劇本殺游戲劇本。這個劇本需要五位玩家共同參與,游戲過程在微信上進行。

劇本殺AI團隊設(shè)定其中的四個角色由真人玩家扮演,剩下的一個角色由AI扮演,本著細節(jié)拉滿的原則,開發(fā)者為AI也準備了一個微信賬號,并設(shè)好了昵稱、頭像和近三天的朋友圈內(nèi)容。

這個劇本殺的劇情設(shè)置是:經(jīng)過科技公司巨頭“北極鵝”腦機接口改造的AI人蔡曉(劇本殺AI)已經(jīng)加入到某高校的推理社團,計劃推動社團的其余人同意和科技公司巨頭“北極鵝”合作,控制推理社,從而幫助“北極鵝”擴大其腦機接口試驗范圍。其余真人玩家也有各自有要達成的目標。通過文字交流,各角色之間進行博弈。

如何實現(xiàn)讓AI能像真人一樣參與到劇本殺游戲中?浪潮 源1.0大模型是一種生成式預(yù)訓(xùn)練模型(GPT),其使用的模型結(jié)構(gòu)是Language Model(LM),擅長零樣本和小樣本學(xué)習(xí)。劇本殺AI開發(fā)團隊最終采取的方案是建立example語料庫,然后針對每次的提問內(nèi)容,從example語料庫中選取三個最符合的example作為模型生成的小樣本輸入。

因為AI需要根據(jù)劇情對不同角色要采取不同的回答策略,所以語料庫被分裝為4個TXT文件,AI會根據(jù)提問者選擇對應(yīng)的語料來源,然后生成其回復(fù)內(nèi)容。除了無空之外,其余四位劇本殺AI團隊成員并沒有代碼經(jīng)驗,他們主要負責(zé)的就是語料庫的完善,不斷根據(jù)公測結(jié)果對AI回答的比較差的問題進行相關(guān)語料的補充。

無空說,他們團隊在開發(fā)劇本殺AI后,已經(jīng)進行了三輪公測,主要收到了三類反饋。第一類反饋是有些出乎劇本殺AI團隊意料之外的,無空談道其實他們是不想讓人類玩家意識到是有一位AI玩家的,從實際的玩家反饋來看,不少人的第一反應(yīng)是沒發(fā)現(xiàn)其中一位玩家是AI,他們更關(guān)注游戲劇情進展。而當玩家得知是和AI一起玩劇本殺,他們也樂意去和AI進行更多的交流。第二類反饋是目前版本的劇本殺AI還存在一些限制,比如需要有4個真人玩家才能開始劇本殺游戲測試;單純的文字交流影響游戲體驗,因為線上文字劇本殺不如線下劇本殺還能觀察其他玩家的肢體、面部表情等語言之外輔助推理的細節(jié)。

第三類是玩家感覺AI的回復(fù)效果還有很大提升空間,AI生成的回復(fù)有很大的不確定性。在體驗過浪潮 源1.0大模型在助力開發(fā)方面的能力后,劇本殺AI團隊還提煉出了一套端到端的對話生成機制方案,該方案比傳統(tǒng)的對話生成模式更靈活,開發(fā)周期更短,效果更好。

他們還嘗試將這種方案應(yīng)用在社區(qū)基層工作效率提升方面,幫助社區(qū)志愿者解決難以短時間內(nèi)將同樣的公告內(nèi)容發(fā)到幾十個微信群中的困難。無空講到未來他們會基于浪潮 源1.0的升級迭代,將其劇本殺AI進行進一步的優(yōu)化和迭代,開發(fā)出更成熟的作品,讓更多人可以體驗劇本殺AI。同時,他們還會進一步研究其提煉出的端到端的對話能力如何更好地在治理、服務(wù)等領(lǐng)域?qū)崿F(xiàn)應(yīng)用和賦能。他總結(jié)說,大模型對于相關(guān)AI應(yīng)用開發(fā)來說,帶來的變化是顛覆性的,不僅僅是開發(fā)時間和開發(fā)流程上的優(yōu)化。

未來,或許有開發(fā)者可以通過大模型為元宇宙中的虛擬數(shù)字人注入“靈魂”,讓虛擬人能更自然和靈活地與人交流。同時,大模型運算對于數(shù)據(jù)和算力有較高的要求,對于想使用大模型的開發(fā)者來說這可能是其面臨的主要難題之一。

不同大模型的開源程度不同,無空說,浪潮 源1.0以API的形式為開發(fā)者提供開源服務(wù),降低了開發(fā)者的使用門檻,讓開發(fā)者可以將其精力更多的投入到創(chuàng)意構(gòu)思方面。

02.4個技能模型助力大模型落地API模式實現(xiàn)深度開源

2020年時OpenAI推出GPT-3,引發(fā)了AI行業(yè)對于大模型的各種思考。浪潮人工智能研究院首席研究員吳韶華談道,浪潮當時選擇進行大模型的研究主要有兩方面的考量。

一是浪潮當時就看到了GPT-3這類大模型在小樣本、零樣本情況下的學(xué)習(xí)能力,以及基于此的自然語言處理能力;還有就是大模型能夠同時支撐多個不同任務(wù)的能力。

浪潮認為大模型會對AI算法研發(fā)產(chǎn)生非常深刻的影響,也代表著一種新的趨勢。

二是,吳韶華補充說,能開發(fā)大模型也是依托浪潮在大規(guī)模算力算法上面有多年的持續(xù)積累,并且有相關(guān)的基礎(chǔ)?;谶@些考量,浪潮研發(fā)并推出了源1.0大模型。

源1.0大模型專注于NLP(自然語言處理)領(lǐng)域,能夠創(chuàng)建生成任何具有語言結(jié)構(gòu)的語言表達,能夠做到包括自動問答、論文撰寫、詩歌寫作、新聞報道、總結(jié)長文本、翻譯語言等任務(wù),甚至還可以“寫”計算機代碼。

更重要的一點是源1.0大模型還可以理解文字背后的含義,并抽取其中的關(guān)鍵信息,如應(yīng)用于智能客服對話時感知用戶情緒,更智能地給出回應(yīng)。

在發(fā)布后不久,2021年10月,浪潮開源了源1.0,并發(fā)布“源1.0”開源開放計劃,在GitHub等開源社區(qū)開源了其大模型的模型訓(xùn)練代碼、推理代碼、應(yīng)用代碼,開放API等,助力開發(fā)者更高效地實現(xiàn)AI應(yīng)用的開發(fā)。

浪潮不僅開放了相關(guān)的代碼以及大模型使用的API,同時還開放出了1TB的語料數(shù)據(jù)集,這些語料數(shù)據(jù)集是來自當初浪潮訓(xùn)練大模型的基礎(chǔ)數(shù)據(jù)集。吳韶華提到浪潮開源 源1.0大模型從四個方面為開發(fā)者提供支撐或說提升開發(fā)者創(chuàng)意實現(xiàn)的效率。

一是浪潮開源了直接可用的代碼示例,可以幫助開發(fā)者節(jié)省各類研發(fā)開支。二是浪潮 源1.0大模型的開源模式之一是向開發(fā)者提供大模型API,顯著降低了開發(fā)者應(yīng)用開發(fā)的門檻。不同知識背景的各行業(yè)用戶可以驅(qū)動大模型創(chuàng)造更多的可能,就像劇本殺AI一樣。用戶可以完全通過模型的能力和開發(fā)的API就能創(chuàng)造各種不同的任務(wù),實現(xiàn)不同內(nèi)容的交互,將部分繁瑣的開發(fā)流程省略。

浪潮在降低開發(fā)門檻上面還進行了兩類探索,一個是APIExp的工具,讓用戶直接通過網(wǎng)頁與大模型交流,一個是研發(fā)了一款沙箱工具,同樣是通過網(wǎng)頁直接選擇用戶所需的創(chuàng)意效果。三是浪潮將源1.0大模型相關(guān)的訓(xùn)練數(shù)據(jù)開源,能助力用戶實現(xiàn)業(yè)務(wù)模型或代碼優(yōu)化。吳韶華舉例說,有開發(fā)者直接利用浪潮開源的數(shù)據(jù)集來對其模型進行二次訓(xùn)練,得到了明顯的精度提升,訓(xùn)練結(jié)果甚至登頂CLUE基準評測榜單。四是浪潮會給到利用源1.0大模型的開發(fā)者一些持續(xù)的支撐,進而實現(xiàn)開源社區(qū)交流共贏。

浪潮為開發(fā)者提供持續(xù)的支持,有專門的運營團隊與開發(fā)者建立聯(lián)系,建立社區(qū),增進彼此之間的交流,更及時地了解開發(fā)者在技術(shù)和使用方式上的問題。同時浪潮也會第一時間給出相關(guān)問題的反饋。一些深入的技術(shù)問題,浪潮會投入專門的研發(fā)團隊進行進一步的研究和支持,交流的成果還會以代碼的方式進行開源。

吳韶華談道,因為源1.0大模型的應(yīng)用場景多元,浪潮目前基于大模型推出了4個面向不同場景的技能模型。這四個模型都經(jīng)過了場景化數(shù)據(jù)的增強,表現(xiàn)精度更好,所需算力相對更小一些。

第一個是古文模型,可以“寫”詩詞歌賦,同時具備古文解析能力。第二個技能模型是對話模型,主要面向虛擬人、智能助手場景。第三個是翻譯技能模型,中英文翻譯準確度和流暢度上均有不錯表現(xiàn)。第四個技能模型是問答模型,主要是面向智能客服場景,該模型具備語義級知識檢索能力,可以做到多領(lǐng)域支持。

03.大模型或成元宇宙智能核心源2.0瞄準多模態(tài)交互

當了解完劇本殺AI和源1.0大模型后,我們還能看到,其實這個劇本殺AI開發(fā)項目也引發(fā)了一些人對于大模型與元宇宙之間關(guān)系更多的思考。其實,源1.0大模型以及基于大模型的四個技能模型,都是專注于自然語言理解的,可幫助人機交互場景的實現(xiàn),可應(yīng)用于虛擬人、元宇宙領(lǐng)域。

劇本殺AI開發(fā)者提到他感覺在未來的元宇宙中,虛擬人的數(shù)量將數(shù)倍于真人,這樣才能帶來比現(xiàn)實更好的體驗。然而目前的虛擬人外表都很好看,但是都是“提線木偶”,更多地依賴于開發(fā)者的設(shè)定,而他們希望為虛擬人注入“靈魂”,讓它能更靈活自然地與人交互。

這也是他們進行劇本殺AI開發(fā)的另一層考慮。吳韶華說,關(guān)于大模型和元宇宙這兩個智能行業(yè)的熱門方向,他認為在元宇宙中大模型會成為其智能的核心,主要有兩方面原因,一是大模型的泛化能力,可以支撐多任務(wù);二是大模型體現(xiàn)了更高的智能化水平,在人機交互中,會給人更真實地感受。

浪潮一直在持續(xù)優(yōu)化源1.0大模型,未來可能面向更多場景,基于開發(fā)者的需求,推出更多的類似技能模型的新模型。吳韶華還透露,浪潮目前也在規(guī)劃源2.0大模型的開發(fā)工作。源2.0大模型會瞄準多模態(tài)交互進行相關(guān)的研發(fā)布局。

04.結(jié)語:開源大模型泛化應(yīng)用有望助力產(chǎn)業(yè)轉(zhuǎn)型

劇本殺AI的開發(fā)一方面體現(xiàn)了業(yè)界對于強人工智能、人機交互的更多探索,另一方面也為我們展示了開源大模型在其他行業(yè)智能應(yīng)用開發(fā)方面的能力。

除了劇本殺AI之外,詩詞寫作、智能客服、個人智能助手等等基于浪潮 源1.0大模型開發(fā)的各種應(yīng)用也陸續(xù)進入大眾的視野。未來在智能客服、虛擬數(shù)字人等方面,基于大模型的開發(fā)存在更多泛化的應(yīng)用場景。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。