正在閱讀:

全球AI Agent大盤點(diǎn),大語(yǔ)言模型創(chuàng)業(yè)一定要參考的60個(gè)AI智能體

掃一掃下載界面新聞APP

全球AI Agent大盤點(diǎn),大語(yǔ)言模型創(chuàng)業(yè)一定要參考的60個(gè)AI智能體

隨著AI Agent原理、模式以及構(gòu)建方式越發(fā)明朗,很多受困于技術(shù)、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。

文|王吉偉

百度發(fā)布文心一言正式發(fā)布不久后的4月,很多人還在感嘆文心一言生成的圖片多歡樂(lè),更多人在為ChatGPT、Midjourney各種培訓(xùn)而瘋狂的時(shí)候,Meta創(chuàng)始人兼CEO扎克伯格正在想著如何“以有用且有意義的方式”向全球數(shù)十億人介紹AI Agents的機(jī)會(huì)。

OpenAI完成新一輪3億美元融資的5月,創(chuàng)始人Sam Altman私下對(duì)一些開(kāi)發(fā)者說(shuō)希望將ChatGPT打造成個(gè)人工作助手,知情人士透露的消息則是OpenAI一直在關(guān)注如何使用聊天機(jī)器人來(lái)創(chuàng)建自主AI Agents,相關(guān)功能很有可能部署在ChatGPT助手中。

6月的一次全體員工會(huì)議上,扎克伯格宣布了一系列處于不同開(kāi)發(fā)階段的技術(shù),其中一個(gè)就是將帶來(lái)具有不同個(gè)性和能力的AI Agents為用戶提供幫助或娛樂(lè)。

在國(guó)內(nèi),雖然AutoGPT早在4月份就與國(guó)外同步火了,但限于大部分人對(duì)其背后的AI Agent缺少了解,開(kāi)始的反響并不是太熱烈。

直到7月初OpenAI應(yīng)用人工智能研究負(fù)責(zé)人Lilian Weng那篇關(guān)于AI Agent的博文刷爆AI圈后,媒體圈、學(xué)研界、投資領(lǐng)域才真正開(kāi)始熱烈討論AI Agent。

由此國(guó)內(nèi)真正開(kāi)啟了探索與研究AI Agent的熱潮,并且也有一些廠商開(kāi)始以AI Agent模式重構(gòu)產(chǎn)品架構(gòu)與商業(yè)模式。

隨著AI Agent原理、模式以及構(gòu)建方式越發(fā)明朗,很多受困于技術(shù)、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。

AI Agent不僅讓大家看到了大語(yǔ)言模型(LLM,Large language Model)落地的方向,讓更多創(chuàng)業(yè)者進(jìn)一步燃起了LLM創(chuàng)業(yè)的希望,也讓廣大企業(yè)看到了高效應(yīng)用LLM的未來(lái)趨勢(shì)。

對(duì)于AI Agent創(chuàng)業(yè),OpenAI的聯(lián)合創(chuàng)始人Andrej Karpathy認(rèn)為,普通人、創(chuàng)業(yè)者和極客在構(gòu)建Agents方面比OpenAI更有優(yōu)勢(shì),大家處于平等競(jìng)爭(zhēng)的狀態(tài)。

而大公司一邊,面對(duì)大型科技公司和創(chuàng)業(yè)公司都有可能抓住這次Agent的機(jī)會(huì),比爾蓋茨也表示如果微軟沒(méi)有介入他會(huì)感到失望。

在科技巨頭強(qiáng)勁推動(dòng)、創(chuàng)業(yè)者快速擁抱以及大企業(yè)的積極引入下,AI Agent徹底火爆了。并且與之前LLM缺乏落地的境況不同,這次AI Agent再也不是紙上談兵,目前已經(jīng)有很多公司推出了Agent項(xiàng)目及相關(guān)產(chǎn)品。

有業(yè)內(nèi)人士透露,至少有100+項(xiàng)目正致力于將AI智能體商業(yè)化,近10萬(wàn)名開(kāi)發(fā)人員正在構(gòu)建自主Agent。在這些AI Agents中,既有國(guó)外主要基于GPT與開(kāi)源Agent框架構(gòu)建的Agent項(xiàng)目,也有國(guó)內(nèi)基于國(guó)產(chǎn)大模型(自研領(lǐng)域大模型)+開(kāi)源架構(gòu)的Agent產(chǎn)品。

說(shuō)了那么多,都有哪些公司推出了Agent產(chǎn)品?目前的AI Agent產(chǎn)品又是什么形態(tài)?本文王吉頻道盤點(diǎn)了全球六十個(gè)AI Agent,以讓大家更好地了解AI智能體。

從AI Agent說(shuō)起

雖然LLM具備了足夠的智慧,但想要讓它給出精確答案,還需要輸入足夠精準(zhǔn)的prompt。一個(gè)掌握prompt的人和一個(gè)普通人使用同一個(gè)大模型提問(wèn)問(wèn)題,得到的答案會(huì)有很大區(qū)別:前者可以用多種技巧得到想要的結(jié)果,而后者就只能望LLM興嘆了。

想要用好LLM,就得先學(xué)會(huì)使用prompt,這個(gè)需求已經(jīng)催生出一個(gè)不小的培訓(xùn)市場(chǎng)。prompt提示工程,在增加LLM使用難度的同時(shí),也使得用戶體驗(yàn)有所降低。本來(lái)應(yīng)該盡顯自然語(yǔ)言優(yōu)勢(shì)的LLM,反而因?yàn)榉彪s的prompt而變得對(duì)普通用戶不是那么友好。

這樣,提示工程也就成了橫亙?cè)谄胀ㄈ伺c大模型之間的一座大山。

如何更好地解決這個(gè)問(wèn)題呢?答案正是AI Agent(國(guó)內(nèi)稱作AI智能體)。

AI Agent是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。不同于傳統(tǒng)的AI,AI Agent 具備通過(guò)獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。

而在LLM到來(lái)之后,AI Agent就被定義為基于LLM驅(qū)動(dòng)的Agent實(shí)現(xiàn)對(duì)通用問(wèn)題的自動(dòng)化處理。

我們知道,LLM主要擅長(zhǎng)處理和生成文本。它們可以回答問(wèn)題、寫文章、生成創(chuàng)意內(nèi)容、幫助編程等。但LLM還是一個(gè)被動(dòng)的工具,只在你給它輸入時(shí)才會(huì)產(chǎn)生輸出。

AI Agent提供了更廣泛的功能,特別是在與環(huán)境的交互、主動(dòng)決策和執(zhí)行各種任務(wù)方面??梢哉f(shuō),AI Agent是真正釋放LLM潛能的關(guān)鍵,它能為L(zhǎng)LM核心提供強(qiáng)大的行動(dòng)能力。

AI Agent和大模型的主要區(qū)別在于:大模型與人類之間的交互是基于prompt實(shí)現(xiàn)的。用戶prompt是否清晰明確會(huì)影響大模型回答的效果,沒(méi)有精確有效的prompt,即便是能力最強(qiáng)的ChatGPT也不行。

AI Agent 的工作僅需給定一個(gè)目標(biāo),就能夠針對(duì)目標(biāo)獨(dú)立思考并做出行動(dòng),它會(huì)根據(jù)給定任務(wù)詳細(xì)拆解出每一步的計(jì)劃步驟,依靠來(lái)自外界的反饋和自主思考,為自己創(chuàng)建 prompt以實(shí)現(xiàn)目標(biāo)。

比如讓ChatGPT買一杯咖啡,ChatGPT給出的反饋一般類似“無(wú)法購(gòu)買咖啡,它只是一個(gè)文字AI助手”之類的回答。

但你要告知基于ChatGPT的AI Agent工具讓它買一杯咖啡,它會(huì)首先拆解如何才能為你購(gòu)買一杯咖啡并擬定代用某APP下單以及支付等若干步驟,然后按照這些步驟調(diào)用APP選擇外賣,再調(diào)用支付程序下單支付,過(guò)程無(wú)需人類去指定每一步操作。

雖然AI工具和Agent都是旨在自動(dòng)化任務(wù)的軟件程序,但特定的關(guān)鍵特征將AI智能體區(qū)分為更復(fù)雜的AI 軟件。

當(dāng)AI工具具有以下特征時(shí),就可以將該工具視為AI Agent:

  • 自治(Autonomy):AI 虛擬智能體能夠獨(dú)立執(zhí)行任務(wù),而無(wú)需人工干預(yù)或輸入。
  • 知覺(jué)(Perception):智能體功能通過(guò)各種傳感器(如攝像頭或麥克風(fēng))感知和解釋它們所處的環(huán)境。
  • 反應(yīng)(Reactivity):AI 智能體可以評(píng)估環(huán)境并做出相應(yīng)的響應(yīng)以實(shí)現(xiàn)其目標(biāo)。
  • 推理和決策(Reasoning and decision-making):AI 智能體是智能工具,可以分析數(shù)據(jù)并做出決策以實(shí)現(xiàn)目標(biāo)。他們使用推理技術(shù)和算法來(lái)處理信息并采取適當(dāng)?shù)男袆?dòng)。
  • 學(xué)習(xí)(Learning):他們可以通過(guò)機(jī)器、深度和強(qiáng)化學(xué)習(xí)元素和技術(shù)來(lái)學(xué)習(xí)和提高他們的表現(xiàn)。
  • 通信(Communication):AI 智能體可以使用不同的方法與其他智能體或人類進(jìn)行通信,例如理解和響應(yīng)自然語(yǔ)言、識(shí)別語(yǔ)音以及通過(guò)文本交換消息。
  • 以目標(biāo)為導(dǎo)向(Goal-oriented):它們旨在實(shí)現(xiàn)特定目標(biāo),這些目標(biāo)可以通過(guò)與環(huán)境的交互來(lái)預(yù)定義或?qū)W習(xí)。

在類別上,AI智能體分目前可分為自主智能體(Autonomous Agent)和生成智能體(Generative Agent)。

自主智能體如Auto-GPT,能夠根據(jù)人們通過(guò)自然語(yǔ)言提出的需求,自動(dòng)執(zhí)行任務(wù)并實(shí)現(xiàn)預(yù)期結(jié)果。在這種合作模式下,自主智能體主要是為人類服務(wù),更像是一個(gè)高效的工具。

生成智能體,如斯坦福和谷歌的研究者共同創(chuàng)建的西部世界小鎮(zhèn)或者《西部世界》中的人形機(jī)器人,它們?cè)谕画h(huán)境中生活,擁有自己的記憶和目標(biāo),不僅與人類交往,還會(huì)與其他機(jī)器人互動(dòng)。

關(guān)于AI智能體,最近復(fù)旦大學(xué)自然語(yǔ)言處理團(tuán)隊(duì)(FudanNLP)推出的86頁(yè)LLM-based Agents 綜述論文,全面梳理了基于大型語(yǔ)言模型的智能代理現(xiàn)狀,包括:LLM-based Agent 的背景、構(gòu)成、應(yīng)用場(chǎng)景、以及備受關(guān)注的代理社會(huì)。

說(shuō)了這么多,很多朋友可能仍對(duì)AI智能體沒(méi)有直觀的感受。不要著急,下文我們將通過(guò)一個(gè)對(duì)比案例來(lái)加深大家的認(rèn)知。

Ai 智能體滲透各領(lǐng)域

AiAgent.app是一個(gè)Web 應(yīng)用,它允許用戶創(chuàng)建自定義AI智能體以執(zhí)行特定任務(wù)并實(shí)現(xiàn)目標(biāo)。

下面王吉偉頻道將通過(guò)使用Ai智能體與直接使用LLM的對(duì)比體驗(yàn),看看AI智能體的優(yōu)勢(shì)。

比如想了解過(guò)去一個(gè)月AI行業(yè)的新聞和趨勢(shì),在Claude輸入:過(guò)去一個(gè)月人工智能行業(yè)最新新聞和趨勢(shì)的摘要。

可以看到,Claude只是列出了幾條與AI相關(guān)的新聞資訊摘要。

而在AiAgent.app輸入這段話,它首先會(huì)將你的需求分解成十項(xiàng)任務(wù),然后通過(guò)提示與用戶交互完成每一項(xiàng)任務(wù),并為每項(xiàng)任務(wù)輸出結(jié)果。顯然,在AiAgent.app得到的關(guān)于近期AI行業(yè)的內(nèi)容,要比在直接使用其他LLM獲得的內(nèi)容更加全面。

直接使用大模型能夠獲取這些內(nèi)容嗎?理論上通過(guò)輸入更多的Prompt也能完成,但至少需要輸入十次,也不能保證所輸入Prompt精確性,且有時(shí)甚至不知道想要獲取什么信息。

而在AiAgent.app只需要輸入一句話,它就分析出了你可能的需求并列出相對(duì)全面的內(nèi)容目標(biāo),引導(dǎo)你去完成想要的東西,效率提升數(shù)倍。

兩者對(duì)比下來(lái),在內(nèi)容獲取的豐富度以及效率上,顯然AI Agent更勝一籌。這種資訊內(nèi)容類Agent對(duì)媒體從業(yè)者、行業(yè)分析師等職業(yè)具有非常大的價(jià)值,能夠大大減少研究資料的獲取時(shí)間。

現(xiàn)在已經(jīng)出現(xiàn)了一些面向更精確用戶群體及應(yīng)用場(chǎng)景的此類Agent,比如哥倫比亞大學(xué)推出的GPT Researcher就是一個(gè)基于ChatGPT的面向研究人員的Agent,可以為用戶創(chuàng)建各種研究報(bào)告以促進(jìn)研究。

這個(gè)案例還只是內(nèi)容的獲取,事實(shí)上現(xiàn)在已經(jīng)出現(xiàn)面向多個(gè)應(yīng)用場(chǎng)景的Agent,足以調(diào)動(dòng)更多軟件應(yīng)用乃至硬件設(shè)備完成各項(xiàng)任務(wù)。

比如有些人已經(jīng)通過(guò)AutoGPT實(shí)現(xiàn)了訂餐、訂票、打車以及購(gòu)物;斯坦福西部世界小鎮(zhèn)里的25個(gè)AI Agent每天都在散步、約會(huì)、聊天、喝咖啡以及分享當(dāng)天的新聞;谷歌Deepmind推出了利用機(jī)械臂自動(dòng)執(zhí)行各種工作的robotic agent;亞馬遜也推出了Amazon Bedrock Agents用于自動(dòng)分解企業(yè)AI應(yīng)用開(kāi)發(fā)任務(wù);IBM Watson Health已經(jīng)在很多醫(yī)院幫助醫(yī)生診斷、治療和監(jiān)測(cè)患者。

雖然Ai Agent火爆的時(shí)間還不算長(zhǎng),但一經(jīng)出現(xiàn)就得到了眾多領(lǐng)域諸多企業(yè)的擁戴。大語(yǔ)言模型的多模特能力加上如今更大的算力,讓多年前就提出的Agent快速得到價(jià)值凸顯,并以超強(qiáng)的滲透率在更多領(lǐng)域落地。

而隨著MetaGPT等開(kāi)源AI Agent的出現(xiàn),更多技術(shù)供應(yīng)商與創(chuàng)業(yè)團(tuán)隊(duì)引入Agent,更多組織認(rèn)知并接受Agent,它必然會(huì)快速成為L(zhǎng)LM的落地個(gè)領(lǐng)域的主要模式,助力千行百業(yè)更好的應(yīng)用LLM。

全球60個(gè)AI Agent大盤點(diǎn)

上面案例中所提到的AiAgent.app,是近幾個(gè)月來(lái)風(fēng)頭正盛的AI Agent代表性產(chǎn)品之一。包括這款A(yù)I智能體在內(nèi)的國(guó)內(nèi)外多個(gè)Agent,均可以在下面的項(xiàng)目盤點(diǎn)名單中看到。

為了讓大家更好地了解目前已推出的AI Agent,王吉偉頻道將這些AI Agent分為媒體報(bào)道、國(guó)內(nèi)已推出、行業(yè)型、海外其他以及GitHub項(xiàng)目幾類,以后還會(huì)逐步獎(jiǎng)勵(lì)項(xiàng)目庫(kù),將這些Agent分門別類編入不同類別。

本文所盤點(diǎn)的AI Agents,既包括AI Agents框架及工具,也包括基于一些開(kāi)源框架打造的AGENT產(chǎn)品,同時(shí)大部分項(xiàng)目及產(chǎn)品都為自主智能體。

因?yàn)橐恍S商比較低調(diào)并未對(duì)外宣傳,本文盤點(diǎn)的AI Agent并不完全,所以也叫作AI AGENT不完全名單。歡迎更多廠商及創(chuàng)業(yè)者看到本文后與王吉偉頻道聯(lián)系,大家一起為AI AGENT生態(tài)的繁榮發(fā)展做一份貢獻(xiàn)。

一、媒體報(bào)道的AI Agent

1、Auto-GPT

Auto GPT是Github上的一個(gè)免費(fèi)開(kāi)源項(xiàng)目,結(jié)合了GPT-4和GPT-3.5技術(shù),通過(guò)API創(chuàng)建完整的項(xiàng)目。

與ChatGPT不同的是,用戶不需要不斷對(duì)AI提問(wèn)以獲得對(duì)應(yīng)回答,在AutoGPT中只需為其提供一個(gè)AI名稱、描述和五個(gè)目標(biāo),然后AutoGPT就可以自己完成項(xiàng)目。它可以讀寫文件、瀏覽網(wǎng)頁(yè)、審查自己提示的結(jié)果,以及將其與所說(shuō)的提示歷史記錄相結(jié)合。

Auto-GPT是GPT-4完全自主運(yùn)行的首批示例之一,它突破了人工智能所能做的界限。

2、AgentGPT

AgentGPT允許您配置和部署自主AI智能體。只要為你的自定義AI命名并讓它開(kāi)始任何可以想象的目標(biāo),它就能通過(guò)思考要完成的任務(wù)、執(zhí)行任務(wù)并從結(jié)果中學(xué)習(xí)來(lái)嘗試實(shí)現(xiàn)目標(biāo)。

3、Baby AGI

這是一個(gè)人工智能驅(qū)動(dòng)的任務(wù)管理系統(tǒng)。該系統(tǒng)使用OpenAI和Pinecone API來(lái)創(chuàng)建、確定優(yōu)先級(jí)和執(zhí)行任務(wù)。通過(guò)分析先前任務(wù)的結(jié)果和預(yù)定義的目標(biāo)來(lái)創(chuàng)建任務(wù),并使用 OpenAI 的自然語(yǔ)言處理(NLP)和Chroma在上下文中存儲(chǔ)和檢索任務(wù)結(jié)果。

Baby AGI的吸引力在于它能夠根據(jù)先前任務(wù)的結(jié)果自主解決任務(wù)并保持預(yù)定義的目標(biāo),還能有效地確定任務(wù)的優(yōu)先級(jí)。

4、Jarvis (HuggingGPT)

由Microsoft開(kāi)發(fā)的一種獨(dú)特協(xié)作系統(tǒng),可以使用多個(gè)AI模型來(lái)完成給定的任務(wù),以ChatGPT充當(dāng)任務(wù)控制者。該項(xiàng)目在GitHub上被稱為JARVIS,現(xiàn)在可以在Huggingface(因此稱為HuggingGPT)上試用,這個(gè)Agent與文本、圖像、音頻甚至視頻配合得非常好。

其工作方式類似于OpenAI通過(guò)文本和圖像展示GPT 4的多模態(tài)功能,但JARVIS 更進(jìn)一步集成了用于圖像、視頻、音頻等的各種開(kāi)源 LLM,還可以連接到互聯(lián)網(wǎng)并訪問(wèn)文件。例如,您可以輸入來(lái)自網(wǎng)站的 URL 并詢問(wèn)相關(guān)問(wèn)題。

5、Aiagent.app

Ai Agent是一個(gè)Web 應(yīng)用,允許用戶創(chuàng)建自定義AI智能體以執(zhí)行特定任務(wù)并實(shí)現(xiàn)目標(biāo)。AI 智能體的工作原理是將目標(biāo)分解為較小的任務(wù),并逐個(gè)完成它們。好處包括能夠同時(shí)運(yùn)行多個(gè)AI 智能體,并使對(duì)尖端技術(shù)的訪問(wèn)民主化。

AI Agent還擁有諸如具有語(yǔ)法突出顯示的內(nèi)聯(lián)代碼塊,以及與第三方平臺(tái)的無(wú)縫協(xié)作等功能。該工具是免費(fèi)使用的,它提供了一種簡(jiǎn)化方法來(lái)構(gòu)建AI智能體,無(wú)需更多技術(shù)知識(shí)。

6、Camel AGI

Camel AGI是一個(gè)生成式AI工具,使用戶能夠通過(guò)角色扮演自主AI智能體來(lái)解決給定的任務(wù),當(dāng)然用戶需要啟用Javascript以使用此工具。Camel AGI允許用戶使用AI智能體完成任務(wù),并提供使用Google登錄或在Github上為該工具加星標(biāo)的選項(xiàng)。

7、“Westworld” simulation西部世界小鎮(zhèn)

這個(gè)項(xiàng)目來(lái)自斯坦福大學(xué)和谷歌的研究人員創(chuàng)建了一個(gè)交互式沙盒環(huán)境,其中包含25個(gè)可以模擬人類行為的生成AI智能體。他們?cè)诠珗@里散步,在咖啡館喝咖啡,并與同事分享新聞,表現(xiàn)出令人驚訝的良好社交行為。

比如,從一個(gè)用戶指定的一個(gè)概念開(kāi)始,即一個(gè)智能體想要舉辦情人節(jié)派對(duì),智能體在接下來(lái)的兩天內(nèi)自動(dòng)傳播派對(duì)邀請(qǐng),結(jié)識(shí)新朋友,互相約對(duì)方約會(huì)派對(duì),并協(xié)調(diào)在正確的時(shí)間一起出現(xiàn)在派對(duì)上。

8、GPT-Engineer

GPT-Engineer是一個(gè)開(kāi)源AI工具,允許用戶指定他們想要構(gòu)建的內(nèi)容,然后與AI進(jìn)行澄清對(duì)話以生成所需的代碼庫(kù)。該工具旨在提供簡(jiǎn)單靈活的用戶體驗(yàn),允許用戶根據(jù)自己的需要調(diào)整和擴(kuò)展其功能。

該工具包括指定AI智能體的身份、存儲(chǔ)與GPT4的通信歷史記錄以及重新運(yùn)行消息日志等功能。歡迎對(duì)項(xiàng)目做出貢獻(xiàn),感興趣的個(gè)人可以參考 GitHub 存儲(chǔ)庫(kù)上提供的路線圖、項(xiàng)目和問(wèn)題。GPT-Engineer旨在成為一個(gè)開(kāi)放平臺(tái),供開(kāi)發(fā)人員探索和構(gòu)建其代碼生成工具箱。

9、MetaGPT

MetaGPT是一個(gè)開(kāi)源多智能體框架,采用單行輸入來(lái)生成 API、用戶故事、數(shù)據(jù)結(jié)構(gòu)、競(jìng)爭(zhēng)分析等。該框架可以充當(dāng)產(chǎn)品經(jīng)理、軟件工程師和架構(gòu)師。該框架可以充當(dāng)整個(gè)軟件公司,只需一行代碼即可編排SOP。

MetaGPT與人類SOP流程設(shè)計(jì)集成。因此,基于LLM的智能體生成高質(zhì)量,多樣化,結(jié)構(gòu)化的文檔和設(shè)計(jì)。MetaGPT 的設(shè)計(jì)使為復(fù)雜任務(wù)設(shè)計(jì)解決方案變得容易,并提供幾乎可以與人類智能相媲美的問(wèn)題解決能力。

10、Amazon Bedrock Agents

亞馬遜發(fā)布的Amazon Bedrock Agents,允許開(kāi)發(fā)人員快速創(chuàng)建完全托管的智能體。通過(guò)對(duì)企業(yè)系統(tǒng)執(zhí)行API調(diào)用,Amazon Bedrock智能體加快了可管理和執(zhí)行活動(dòng)的生成式AI應(yīng)用程序的發(fā)布速度。

Amazon Bedrock Agents簡(jiǎn)化了用戶請(qǐng)求任務(wù)的快速工程和編排。設(shè)置完成后,這些智能體可以自主構(gòu)建提示,并使用公司特定的數(shù)據(jù)安全地增強(qiáng)提示,從而向用戶提供自然語(yǔ)言響應(yīng)。這些高級(jí)智能體具有推斷自動(dòng)處理用戶請(qǐng)求的必要操作的能力。

11、nvidia Voyager

由NVIDIA、加州理工學(xué)院等共同推出的Voyager,使用GPT-4來(lái)引導(dǎo)學(xué)習(xí)的Minecraft智能體通過(guò)像素世界,需要說(shuō)明的是,Voyager依賴于代碼生成,而不是強(qiáng)化學(xué)習(xí)。

Voyager是第一個(gè)玩《我的世界》的終身學(xué)習(xí)智能體。與其他使用經(jīng)典強(qiáng)化學(xué)習(xí)技術(shù)的 Minecraft智能體不同,Voyager使用GPT-4來(lái)不斷改進(jìn)自己,通過(guò)編寫、改進(jìn)和傳輸存儲(chǔ)在外部技能庫(kù)中的代碼來(lái)實(shí)現(xiàn)這一點(diǎn)。

這會(huì)產(chǎn)生一些小程序,幫助導(dǎo)航、開(kāi)門、挖掘資源、制作鎬頭或與僵尸作戰(zhàn)。GPT-4解鎖了一種新的范式,在此范式中“訓(xùn)練”是代碼的執(zhí)行,“訓(xùn)練模型”是Voyager迭代組裝的技能代碼庫(kù)。

12、RoboAgent

Meta和CMU 聯(lián)合研究團(tuán)隊(duì)耗時(shí)兩年,成功開(kāi)發(fā)出的RoboAgent 通用機(jī)器人智能體。RoboAgent僅僅通過(guò)7500個(gè)軌跡的訓(xùn)練就實(shí)現(xiàn)了12種不同的復(fù)雜技能,包括烘焙、拾取物品、上茶、清潔廚房等任務(wù),并能在100種未知場(chǎng)景中泛化應(yīng)用。

無(wú)論遇到多大的干擾,RoboAgent 都能堅(jiān)持完成任務(wù)。該研究的目標(biāo)是建立一個(gè)高效的機(jī)器人學(xué)習(xí)范例,解決數(shù)據(jù)集和場(chǎng)景多樣性的挑戰(zhàn)。研究人員提出了多任務(wù)動(dòng)作分塊 Transformer(MT-ACT)架構(gòu),通過(guò)語(yǔ)義增強(qiáng)和高效的策略表示來(lái)處理多模態(tài)多任務(wù)機(jī)器人數(shù)據(jù)集。

13、Inflection AI Pi

Inflection AI公司推出的個(gè)人AI Agent產(chǎn)品Pi,核心大腦是公司研發(fā)的Inflection-1大模型,性能媲美GPT-3.5。Pi與時(shí)下流行的通用聊天機(jī)器人不同,它只能進(jìn)行友好的對(duì)話,提供簡(jiǎn)潔的建議,甚至只是傾聽(tīng)。

它的主要特征是富有同情心、謙虛好奇、幽默創(chuàng)新, 具有良好的情商,可以根據(jù)用戶的獨(dú)特興趣和需求提供無(wú)限的知識(shí)與陪伴。Inflection自開(kāi)發(fā)Pi開(kāi)始,就確定了Pi將作為個(gè)人智能(Personal Intelligence),而不僅僅是輔助人工作的工具。

14、HyperWrite

Hyperwrite是一款A(yù)I寫作智能體工具,可幫助任何級(jí)別的創(chuàng)意作家更快、更自信地寫作。它包括自動(dòng)寫入和提前打字等功能,可生成原始段落并提出克服作家障礙的想法。

該工具作為免費(fèi)的Chrome擴(kuò)展程序提供,可以在任何網(wǎng)站上使用,而不會(huì)中斷工作流程。它被世界各地的專業(yè)人士、學(xué)生和創(chuàng)作者使用和信任,以提高他們的生產(chǎn)力。

15、GPT Researcher

GPT Researcher是一個(gè)基于AI的自主智能體,用于對(duì)各種任務(wù)進(jìn)行全面的在線研究。該工具受到AutoGPT和“計(jì)劃和解決”提示的啟發(fā),旨在改進(jìn)當(dāng)前語(yǔ)言模型中發(fā)現(xiàn)的速度和確定性問(wèn)題,“通過(guò)并行智能體工作提供更穩(wěn)定的性能和更高的速度,而不是同步操作。

根據(jù)該團(tuán)隊(duì)的說(shuō)法,GPT研究員通過(guò)生成相關(guān)的研究問(wèn)題、匯總來(lái)自 20 多個(gè)網(wǎng)絡(luò)資源的數(shù)據(jù)以及利用GPT3.5-turbo-16和GPT-4來(lái)創(chuàng)建全面的研究報(bào)告來(lái)促進(jìn)研究。

國(guó)內(nèi)已推出的AI Agent

經(jīng)過(guò)持續(xù)探索與嘗試,國(guó)內(nèi)AI智能體相關(guān)的產(chǎn)品也開(kāi)始嶄露頭角,下面介紹五款產(chǎn)品。

1、阿里云ModelScopeGPT

阿里云Mota社區(qū)推出的國(guó)內(nèi)首個(gè)大型模型調(diào)用工具魔搭GPT(ModelScopeGPT),通過(guò)這一款工具,使用者們可以通過(guò)一鍵發(fā)送指令調(diào)用Mota社區(qū)中的其他人工智能模型,從而實(shí)現(xiàn)大大小小的模型共同協(xié)作,進(jìn)而完成復(fù)雜的任務(wù)。

ModelScopeGPT基于開(kāi)源大語(yǔ)言模型(LLM)的AI Agent(智能體)開(kāi)發(fā)框架ModelScope-Agent。這是一個(gè)通用的、可定制的Agent框架,用于實(shí)際應(yīng)用程序,其基于開(kāi)源的大語(yǔ)言模型 (LLMs) 作為核心,包含記憶控制、工具使用等模塊。

開(kāi)源 LLM 主要負(fù)責(zé)任務(wù)規(guī)劃、調(diào)度以及回復(fù)生成;記憶控制模塊,主要包含知識(shí)檢索以及 prompt (提示詞)管理;工具使用模塊,包含工具庫(kù)以及工具檢索和工具可定制化。

2、實(shí)在智能TARS-RPA-Agent

實(shí)在智能在超自動(dòng)化領(lǐng)域首發(fā)的TARS-RPA-Agent,是一個(gè)基于“TARS+ISSUT(智能屏幕語(yǔ)義理解)”雙模引擎、有“大腦”,更有“眼睛和手腳”的超自動(dòng)化智能體,是能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式產(chǎn)品。

TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語(yǔ)義理解為基座的技術(shù)框架。該技術(shù)框架分為兩層結(jié)構(gòu):底層是包括通用基礎(chǔ)模型和各個(gè)垂直行業(yè)基礎(chǔ)模型在內(nèi)的TARS系列大模型和智能屏幕語(yǔ)義理解技術(shù);上層是依托這兩項(xiàng)關(guān)鍵技術(shù)完成全面升級(jí)和改造的超自動(dòng)化產(chǎn)品。

TARS-RPA-Agent的核心LLM是實(shí)在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型,TARS大模型具備優(yōu)異的文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理等主流能力。

3、OmBot歐姆智能體

2023 世界人工智能大會(huì)上,聯(lián)匯科技發(fā)布了基于大模型能力的自主智能體(Auto AI Agent )——OmBot 歐姆智能體,并針對(duì)典型場(chǎng)景需求推出了首批應(yīng)用。

聯(lián)匯自主智能體包含了認(rèn)知、記憶、思考、行動(dòng)四大核心能力,作為一種自動(dòng)、自主的智能體,它以最簡(jiǎn)單的形式中在循環(huán)中運(yùn)行,每次迭代時(shí),它們都會(huì)生成自我導(dǎo)向的指令和操作。因此,它不依賴人類來(lái)指導(dǎo)命令,具備高度可擴(kuò)展性。

4、瀾碼科技Ask XBot

瀾碼科技構(gòu)建的Agent平臺(tái)“Ask XBot”,平臺(tái)分兩層:第一層是專家賦能,專家通過(guò)拖、拉、拽以及對(duì)話交互的方式定義工作流程,教給機(jī)器,從而協(xié)助一線員工構(gòu)建更高效工作的方法論;第二層是員工使用Agent,一線員工可以通過(guò)自然語(yǔ)言和Agent溝通并下達(dá)指令,讓Agent協(xié)助完成數(shù)據(jù)分析、資料調(diào)取等工作。

該公司計(jì)劃將Ask XBo打造成一個(gè)兼具通用性和易用性的平臺(tái),把這些API和Agent做好管理,讓Agent包裝不同的API,不同模型的Agent能夠在上面更好地協(xié)作,讓它們可以在平臺(tái)上更有效率、更智能地服務(wù)好客戶。

5、ChatDev

由清華大學(xué)、北京郵電大學(xué)、布朗大學(xué)聯(lián)合研究團(tuán)隊(duì)推出的ChatDev,是一個(gè)生成式智能體。它基于聊天的端到端軟件開(kāi)發(fā)框架,能夠利用大型語(yǔ)言模型(LLMs)促進(jìn)軟件開(kāi)發(fā)過(guò)程中多角色(ChatGPT 的 “gpt3.5-turbo-16k” 版本)之間的有效溝通和協(xié)作。

ChatDev的主要目的是通過(guò)聊天來(lái)進(jìn)行游戲開(kāi)發(fā)。用戶只需提出想法,從設(shè)計(jì)到測(cè)試的整個(gè)流程都由AI完成,整個(gè)過(guò)程只需七分鐘即可完成。

面向不同領(lǐng)域的AI Agent產(chǎn)品

LLM還沒(méi)有出現(xiàn)之前,一些企業(yè)就已在研究傳統(tǒng)AI與Agent的結(jié)合應(yīng)用。因此,AI Agenmt在各領(lǐng)域的落地比大家預(yù)想得要快很多。

下面,是幾個(gè)行業(yè)領(lǐng)域的代表性Agent應(yīng)用。

  • 在醫(yī)療領(lǐng)域,Agent可以幫助診斷、治療和監(jiān)測(cè)患者。IBM Watson Health 是一個(gè)AI智能體,可以分析醫(yī)療數(shù)據(jù),以識(shí)別潛在的健康問(wèn)題并推薦治療方案。
  • 在金融領(lǐng)域,Agent可以分析財(cái)務(wù)數(shù)據(jù)、檢測(cè)欺詐行為并提出投資建議。嘉信理財(cái)(Charles Schwab)使用名為Intelligent Portfolio的人工智能智能體,根據(jù)客戶的投資目標(biāo)創(chuàng)建和管理投資組合。
  • 在零售業(yè)務(wù)場(chǎng)景中,Agent可以提供個(gè)性化推薦,改善供應(yīng)鏈管理,增強(qiáng)客戶體驗(yàn)。亞馬遜的Alexa是一個(gè)AI智能體,可以推薦產(chǎn)品,下訂單和跟蹤發(fā)貨。
  • 在制造業(yè),Agent可以優(yōu)化生產(chǎn)流程,預(yù)測(cè)維護(hù)需求,提高產(chǎn)品質(zhì)量。通用電氣使用名為Predix的AI智能體實(shí)時(shí)監(jiān)控機(jī)器,以預(yù)測(cè)和防止設(shè)備故障。
  • 在運(yùn)輸領(lǐng)域,自主AI Agent可以協(xié)助路線規(guī)劃、交通管理和車輛安全。特斯拉的Autopilot有助于自動(dòng)駕駛車輛,并幫助駕駛員停車、變道和安全駕駛。
  • 在教育行業(yè),Agnet可以提供個(gè)性化的學(xué)習(xí)體驗(yàn),自動(dòng)執(zhí)行管理任務(wù)并分析學(xué)生的表現(xiàn)。培生(Pearson)的AI智能體Aida可以為學(xué)生提供反饋,并建議個(gè)性化的學(xué)習(xí)路徑。
  • 在農(nóng)業(yè)領(lǐng)域,AI Agent可以優(yōu)化作物生產(chǎn)、監(jiān)測(cè)土壤質(zhì)量并預(yù)測(cè)天氣模式。約翰迪爾(John Deere)正在使用一種名為See&Spray的AI智能體來(lái)檢測(cè)和定位雜草,而不會(huì)影響作物。

海外已推出其他AGENT產(chǎn)品

1、Cognosys

Cognosys是基于Web的AI智能體,旨在徹底改變生產(chǎn)力并簡(jiǎn)化復(fù)雜任務(wù),使用最先進(jìn)的 AI 技術(shù)提升您的日常生活。

2、Doanythingmachine

使用“無(wú)所不能”機(jī)器輕松管理您的任務(wù),用戶個(gè)人AI 智能體將為您確定優(yōu)先級(jí)并完成您的任務(wù)

3、alphakit

用于創(chuàng)建和管理目標(biāo)驅(qū)動(dòng)型自主AI智能體團(tuán)隊(duì)的直觀平臺(tái),全部通過(guò)手機(jī)創(chuàng)建和管理 autoGPT AI智能體團(tuán)隊(duì)。只需定義你的目標(biāo),Alphakit負(fù)責(zé)剩下的工作。

4、GPTConsole

GPTConsole是一個(gè)革命性的命令行界面(CLI),旨在為開(kāi)發(fā)人員提供人工智能的優(yōu)勢(shì)。它超越了傳統(tǒng)的終端功能,使用戶能夠使用提示執(zhí)行復(fù)雜的任務(wù)。

5、Fini

提供指向知識(shí)庫(kù)的鏈接,在2分鐘內(nèi)將您的知識(shí)庫(kù)轉(zhuǎn)換為AI聊天。Fini為用戶提供一個(gè)不知疲倦的AI智能體,隨時(shí)準(zhǔn)備24/7立即回答客戶問(wèn)題。

6、Spell

Spell是一款基于GPT4自主AI智能體,可以應(yīng)用于日常高效工作。Spell還具有急需的功能,可幫助您更智能地工作,并學(xué)習(xí)利用生成式AI 的強(qiáng)大功能,生成一個(gè)或多個(gè)創(chuàng)新的自主智能體,這些智能體將致力于解決您的問(wèn)題。

7、Aomni

Aomni是一個(gè)信息檢索AI智能體,能夠?yàn)槟悴檎?、提取和處理互?lián)網(wǎng)上的任何數(shù)據(jù),增強(qiáng)你的研究工作。Aomni可以使用各種工具來(lái)智能地規(guī)劃你的查詢以獲得最終結(jié)果,包括一個(gè)完整的 Web 瀏覽器,允許它訪問(wèn)互聯(lián)網(wǎng)上的任何信息,而無(wú)需 API。

Aomni的查詢規(guī)劃器基于當(dāng)前最先進(jìn)的AutoGPT架構(gòu),智能地計(jì)劃和更新每個(gè)請(qǐng)求,以確保來(lái)源的正確性和多樣性。

8、Fine-Tuner.ai

借助Fine-Tuner.ai,用戶可以構(gòu)建復(fù)雜、量身定制的AI智能體,而無(wú)需技術(shù)技能或編碼,只需輸入你的數(shù)據(jù)和想法即可。十幾個(gè)專業(yè)AI智能體通過(guò)上傳的PDF、CV、PPT、URL 等即時(shí)數(shù)據(jù),可為用戶創(chuàng)建精確的問(wèn)答、文檔搜索、流程自動(dòng)化等。

9、SuperAGI

一個(gè)開(kāi)源的自主AI框架,使您能夠快速可靠地開(kāi)發(fā)和部署有用的自主智能體,用于構(gòu)建、管理和運(yùn)行自主智能體的基礎(chǔ)結(jié)構(gòu)。

10、Yellow.ai

Yellow.ai是領(lǐng)先的企業(yè)級(jí)對(duì)話式人工智能平臺(tái),可以為企業(yè)動(dòng)態(tài)AI智能體提供支持,旨在通過(guò)其無(wú)代碼/低代碼平臺(tái)提供類似人類的交互,從而提高客戶滿意度并提高員工敬業(yè)度。

11、Godmode

使用戶能夠在瀏覽器中運(yùn)行AutoGPT。Godmode允許用戶同時(shí)部署多個(gè)AI智能體以使用AI 完成任務(wù),用戶也可以使用自己的OpenAI API密鑰。

12、E42

E42是一個(gè)認(rèn)知流程自動(dòng)化平臺(tái),企業(yè)可以使用該平臺(tái)創(chuàng)建多功能認(rèn)知智能體,以跨功能自動(dòng)化各種流程。認(rèn)知驅(qū)動(dòng)的無(wú)代碼平臺(tái)與用戶現(xiàn)有的技術(shù)和流程無(wú)縫集成,以釋放跨部門的最高價(jià)值。用戶可使用E42構(gòu)建自己的AI智能體,比如AI分析師以及跨垂直行業(yè)的AI招聘人等。

13、Thankful

Thankful的AI智能體經(jīng)過(guò)培訓(xùn)和量身定制,可在您現(xiàn)有的幫助臺(tái)中工作,通過(guò)電子郵件,聊天,短信和應(yīng)用內(nèi)渠道輕松解決大量客戶查詢。憑借理解、連接、解決、個(gè)性化和通知的能力,ThankfulAI智能體以機(jī)器般的速度和天生可擴(kuò)展的專業(yè)知識(shí)提供類似人類的服務(wù)體驗(yàn)。

14、Aktify

使用Aktify的虛擬AI智能體克隆您的銷售團(tuán)隊(duì),無(wú)需增加員工人數(shù)。Aktify將大規(guī)模處理無(wú)限數(shù)量的無(wú)響應(yīng)潛在客戶),并始終如一地將隨時(shí)可以交談的客戶帶到您的銷售團(tuán)隊(duì)的門口,它不只一個(gè)短信聊天機(jī)器人。

15、TeamSmart AI

通過(guò)一鍵訪問(wèn)TeamSmart AI來(lái)提高您的工作效率。在瀏覽器中直接匯總內(nèi)容、生成代碼、起草推文等。單擊圖標(biāo)或鍵盤快捷鍵即可立即打開(kāi)ChatGPT,無(wú)需登錄,即可即時(shí)訪問(wèn)質(zhì)量提示庫(kù)。

16、BrainstormGPT

BrainstormGPT集成了多個(gè)智能體、LLM和自動(dòng)搜索,以簡(jiǎn)化主題到會(huì)議報(bào)告轉(zhuǎn)換。自定義主題,用戶定義的角色,智能體自主討論,在 20 分鐘內(nèi)輸出的報(bào)告,約等于300 次搜索、10 小時(shí)討論和 100,000 次文本分析。

17、AgentRunner.Ai

AgentRunner.ai是一個(gè)自主AI 智能體創(chuàng)建工具,它利用 GPT-4的強(qiáng)大功能來(lái)創(chuàng)建和訓(xùn)練完全自主的智能體。允許用戶為他們的智能體設(shè)定目標(biāo),并讓他們決定如何實(shí)現(xiàn)這些目標(biāo),而無(wú)需任何技術(shù)知識(shí)或編程技能。

該工具提供的功能包括創(chuàng)建具有獨(dú)特個(gè)性的自主智能體,運(yùn)行智能體以執(zhí)行任務(wù)或?qū)W習(xí)新技能,決定智能體可以做什么以及與OpenAI或Google Cloud帳戶集成。

18、Gista

Gista可幫助企業(yè)與網(wǎng)站訪問(wèn)者互動(dòng)并將其轉(zhuǎn)化為24/7的潛在客戶,其主要功能包括構(gòu)建AI轉(zhuǎn)換智能體和AI銷售智能體。使用 Gista,企業(yè)可以輕松地將網(wǎng)站訪問(wèn)者轉(zhuǎn)化為潛在客戶并建立電子郵件列表。

19、Agent4

Agent4的主要功能之一是能夠創(chuàng)建AI驅(qū)動(dòng)的虛擬智能體,可以回答問(wèn)題,幫助預(yù)訂會(huì)議,收聽(tīng)語(yǔ)音郵件并提供摘要。

您可以輕松地為座席創(chuàng)建自定義交互,使他們能夠用您品牌的聲音回答問(wèn)題并處理各種任務(wù)。您還可以選擇座席如何實(shí)時(shí)響應(yīng)呼叫,并決定是否以及何時(shí)需要與某人交談。

20、Cometcore AI

Cometcore AI是一個(gè)創(chuàng)新平臺(tái),提供一系列多功能的AI驅(qū)動(dòng)的工具,以提高生產(chǎn)力和溝通能力。使用Cometcore,您可以制作、編碼和自動(dòng)化可愛(ài)的智能體。

21、personal-assistant

一個(gè)人工智能代理,旨在處理從預(yù)訂航班到進(jìn)行深入研究以及介于兩者之間的所有任務(wù)。

Github上的AI Agent項(xiàng)目

1、OpenAGI

OpenAGI是一個(gè)開(kāi)源的AGI研究平臺(tái),專門設(shè)計(jì)用于提供復(fù)雜的多步驟任務(wù),并附有特定于任務(wù)的數(shù)據(jù)集,評(píng)估指標(biāo)和各種可擴(kuò)展模型。OpenAGI將復(fù)雜的任務(wù)表述為自然語(yǔ)言查詢,作為L(zhǎng)LM的輸入。LLM隨后選擇,合成和執(zhí)行OpenAGI提供的模型來(lái)解決任務(wù)。

該項(xiàng)目還提出了任務(wù)反饋強(qiáng)化學(xué)習(xí)(RLTF)機(jī)制,該機(jī)制使用任務(wù)解決結(jié)果作為反饋來(lái)提高LLM的任務(wù)解決能力。LLM負(fù)責(zé)綜合各種外部模型來(lái)解決復(fù)雜任務(wù),而RLTF提供反饋以提高其任務(wù)解決能力,為自我改進(jìn)的AI提供反饋循環(huán)。LLM操作各種專家模型來(lái)解決復(fù)雜任務(wù)的范式是AGI的一種有前途的方法。

2、Agent-LLM

Agent-LLM是一個(gè)人工智能自動(dòng)化平臺(tái),旨在為跨多個(gè)提供商的高效AI指令管理提供動(dòng)力。

該智能體配備了自適應(yīng)內(nèi)存,這種多功能解決方案提供了一個(gè)強(qiáng)大的插件系統(tǒng),支持各種命令,包括網(wǎng)頁(yè)瀏覽。隨著對(duì)眾多人工智能提供商和模型的支持不斷增加,Agent-LLM不斷發(fā)展以增強(qiáng)各種應(yīng)用程序。

3、AutoGPT-Next-Web

該智能體可以實(shí)現(xiàn)一鍵式即在Vercel上部署精心設(shè)計(jì)的AutoGPT-Next-Web Web UI,一鍵免費(fèi)部署你的私人AutoGPT-Next-Web 網(wǎng)頁(yè)應(yīng)用?;贏utoGPT-Next-Web,用戶可在1 分鐘內(nèi)使用Vercel 免費(fèi)一鍵部署,搭建個(gè)人的AutoGPT網(wǎng)站。

4、MiniGPT-4

這款A(yù)gent,可以使用高級(jí)大語(yǔ)言模型增強(qiáng)視覺(jué)語(yǔ)言理解。

5、Mini-AGI

Mini-AGI是基于GPT3.5/4的最小通用自主智能體。它結(jié)合了強(qiáng)大的提示,一組最少的工具和短期記憶(思想鏈),通過(guò)矢量存儲(chǔ)的數(shù)據(jù)增強(qiáng)將很快添加,可以分析股票價(jià)格、執(zhí)行網(wǎng)絡(luò)安全測(cè)試、創(chuàng)作藝術(shù)品和訂購(gòu)披薩。

6、Teenage-AGI

此智能項(xiàng)目受幾個(gè)與Auto-GPT相關(guān)的項(xiàng)目(主要是BabyAGI)和論文“生成智能體:人類行為的交互式模擬”的啟發(fā),這個(gè)Python項(xiàng)目使用OpenAI和Pinecone為AI智能體提供記憶,并允許它在采取行動(dòng)(輸出文本)之前“思考”。

7、FastGPT

FastGPT 是一個(gè)基于 LLM 大語(yǔ)言模型的知識(shí)庫(kù)問(wèn)答系統(tǒng),提供開(kāi)箱即用的數(shù)據(jù)處理、模型調(diào)用等能力。同時(shí)可以通過(guò) Flow 可視化進(jìn)行工作流編排,從而實(shí)現(xiàn)復(fù)雜的問(wèn)答場(chǎng)景

8、DemoGPT

使用DemoGPT,只需使用簡(jiǎn)單句子即可快速創(chuàng)建演示。

9、LocalAGI

基于LLMDA、ChatGLM 等模型的本地運(yùn)行AGI項(xiàng)目。

10、ai-town(游戲類)

著名投資機(jī)構(gòu)a16z開(kāi)源的AI小鎮(zhèn),一個(gè)MIT 許可的、可部署的入門工具包,用于構(gòu)建和定制您自己的AI城鎮(zhèn)版本。這是一個(gè) AI 角色生活、聊天和社交的虛擬城鎮(zhèn)。

11、gptrpg(游戲類)

gptrpg此存儲(chǔ)庫(kù)包含兩件事:一個(gè)簡(jiǎn)單的類似RPG游戲的環(huán)境,用于支持 LLM 的 AI 智能體;連接到 OpenAI API 以存在于該環(huán)境中的簡(jiǎn)單 AI 智能體。

12、SFighterAI(游戲類)

該項(xiàng)目是一個(gè)使用深度強(qiáng)化學(xué)習(xí)訓(xùn)練的AI智能體,以擊敗游戲《街頭霸王II:特別冠軍版》中的最終BOSS。AI 智能體僅根據(jù)游戲屏幕的 RGB 像素值做出決策。在提供的保存狀態(tài)下,智能體在最終關(guān)卡的第一輪中達(dá)到 100% 的勝率。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

OpenAI

  • Meta公司AR眼鏡團(tuán)隊(duì)前負(fù)責(zé)人宣布加入OpenAI
  • 機(jī)器人軟件創(chuàng)企Physical Intelligence獲貝索斯和OpenAI投資

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

全球AI Agent大盤點(diǎn),大語(yǔ)言模型創(chuàng)業(yè)一定要參考的60個(gè)AI智能體

隨著AI Agent原理、模式以及構(gòu)建方式越發(fā)明朗,很多受困于技術(shù)、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。

文|王吉偉

百度發(fā)布文心一言正式發(fā)布不久后的4月,很多人還在感嘆文心一言生成的圖片多歡樂(lè),更多人在為ChatGPT、Midjourney各種培訓(xùn)而瘋狂的時(shí)候,Meta創(chuàng)始人兼CEO扎克伯格正在想著如何“以有用且有意義的方式”向全球數(shù)十億人介紹AI Agents的機(jī)會(huì)。

OpenAI完成新一輪3億美元融資的5月,創(chuàng)始人Sam Altman私下對(duì)一些開(kāi)發(fā)者說(shuō)希望將ChatGPT打造成個(gè)人工作助手,知情人士透露的消息則是OpenAI一直在關(guān)注如何使用聊天機(jī)器人來(lái)創(chuàng)建自主AI Agents,相關(guān)功能很有可能部署在ChatGPT助手中。

6月的一次全體員工會(huì)議上,扎克伯格宣布了一系列處于不同開(kāi)發(fā)階段的技術(shù),其中一個(gè)就是將帶來(lái)具有不同個(gè)性和能力的AI Agents為用戶提供幫助或娛樂(lè)。

在國(guó)內(nèi),雖然AutoGPT早在4月份就與國(guó)外同步火了,但限于大部分人對(duì)其背后的AI Agent缺少了解,開(kāi)始的反響并不是太熱烈。

直到7月初OpenAI應(yīng)用人工智能研究負(fù)責(zé)人Lilian Weng那篇關(guān)于AI Agent的博文刷爆AI圈后,媒體圈、學(xué)研界、投資領(lǐng)域才真正開(kāi)始熱烈討論AI Agent。

由此國(guó)內(nèi)真正開(kāi)啟了探索與研究AI Agent的熱潮,并且也有一些廠商開(kāi)始以AI Agent模式重構(gòu)產(chǎn)品架構(gòu)與商業(yè)模式。

隨著AI Agent原理、模式以及構(gòu)建方式越發(fā)明朗,很多受困于技術(shù)、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。

AI Agent不僅讓大家看到了大語(yǔ)言模型(LLM,Large language Model)落地的方向,讓更多創(chuàng)業(yè)者進(jìn)一步燃起了LLM創(chuàng)業(yè)的希望,也讓廣大企業(yè)看到了高效應(yīng)用LLM的未來(lái)趨勢(shì)。

對(duì)于AI Agent創(chuàng)業(yè),OpenAI的聯(lián)合創(chuàng)始人Andrej Karpathy認(rèn)為,普通人、創(chuàng)業(yè)者和極客在構(gòu)建Agents方面比OpenAI更有優(yōu)勢(shì),大家處于平等競(jìng)爭(zhēng)的狀態(tài)。

而大公司一邊,面對(duì)大型科技公司和創(chuàng)業(yè)公司都有可能抓住這次Agent的機(jī)會(huì),比爾蓋茨也表示如果微軟沒(méi)有介入他會(huì)感到失望。

在科技巨頭強(qiáng)勁推動(dòng)、創(chuàng)業(yè)者快速擁抱以及大企業(yè)的積極引入下,AI Agent徹底火爆了。并且與之前LLM缺乏落地的境況不同,這次AI Agent再也不是紙上談兵,目前已經(jīng)有很多公司推出了Agent項(xiàng)目及相關(guān)產(chǎn)品。

有業(yè)內(nèi)人士透露,至少有100+項(xiàng)目正致力于將AI智能體商業(yè)化,近10萬(wàn)名開(kāi)發(fā)人員正在構(gòu)建自主Agent。在這些AI Agents中,既有國(guó)外主要基于GPT與開(kāi)源Agent框架構(gòu)建的Agent項(xiàng)目,也有國(guó)內(nèi)基于國(guó)產(chǎn)大模型(自研領(lǐng)域大模型)+開(kāi)源架構(gòu)的Agent產(chǎn)品。

說(shuō)了那么多,都有哪些公司推出了Agent產(chǎn)品?目前的AI Agent產(chǎn)品又是什么形態(tài)?本文王吉頻道盤點(diǎn)了全球六十個(gè)AI Agent,以讓大家更好地了解AI智能體。

從AI Agent說(shuō)起

雖然LLM具備了足夠的智慧,但想要讓它給出精確答案,還需要輸入足夠精準(zhǔn)的prompt。一個(gè)掌握prompt的人和一個(gè)普通人使用同一個(gè)大模型提問(wèn)問(wèn)題,得到的答案會(huì)有很大區(qū)別:前者可以用多種技巧得到想要的結(jié)果,而后者就只能望LLM興嘆了。

想要用好LLM,就得先學(xué)會(huì)使用prompt,這個(gè)需求已經(jīng)催生出一個(gè)不小的培訓(xùn)市場(chǎng)。prompt提示工程,在增加LLM使用難度的同時(shí),也使得用戶體驗(yàn)有所降低。本來(lái)應(yīng)該盡顯自然語(yǔ)言優(yōu)勢(shì)的LLM,反而因?yàn)榉彪s的prompt而變得對(duì)普通用戶不是那么友好。

這樣,提示工程也就成了橫亙?cè)谄胀ㄈ伺c大模型之間的一座大山。

如何更好地解決這個(gè)問(wèn)題呢?答案正是AI Agent(國(guó)內(nèi)稱作AI智能體)。

AI Agent是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。不同于傳統(tǒng)的AI,AI Agent 具備通過(guò)獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。

而在LLM到來(lái)之后,AI Agent就被定義為基于LLM驅(qū)動(dòng)的Agent實(shí)現(xiàn)對(duì)通用問(wèn)題的自動(dòng)化處理。

我們知道,LLM主要擅長(zhǎng)處理和生成文本。它們可以回答問(wèn)題、寫文章、生成創(chuàng)意內(nèi)容、幫助編程等。但LLM還是一個(gè)被動(dòng)的工具,只在你給它輸入時(shí)才會(huì)產(chǎn)生輸出。

AI Agent提供了更廣泛的功能,特別是在與環(huán)境的交互、主動(dòng)決策和執(zhí)行各種任務(wù)方面??梢哉f(shuō),AI Agent是真正釋放LLM潛能的關(guān)鍵,它能為L(zhǎng)LM核心提供強(qiáng)大的行動(dòng)能力。

AI Agent和大模型的主要區(qū)別在于:大模型與人類之間的交互是基于prompt實(shí)現(xiàn)的。用戶prompt是否清晰明確會(huì)影響大模型回答的效果,沒(méi)有精確有效的prompt,即便是能力最強(qiáng)的ChatGPT也不行。

AI Agent 的工作僅需給定一個(gè)目標(biāo),就能夠針對(duì)目標(biāo)獨(dú)立思考并做出行動(dòng),它會(huì)根據(jù)給定任務(wù)詳細(xì)拆解出每一步的計(jì)劃步驟,依靠來(lái)自外界的反饋和自主思考,為自己創(chuàng)建 prompt以實(shí)現(xiàn)目標(biāo)。

比如讓ChatGPT買一杯咖啡,ChatGPT給出的反饋一般類似“無(wú)法購(gòu)買咖啡,它只是一個(gè)文字AI助手”之類的回答。

但你要告知基于ChatGPT的AI Agent工具讓它買一杯咖啡,它會(huì)首先拆解如何才能為你購(gòu)買一杯咖啡并擬定代用某APP下單以及支付等若干步驟,然后按照這些步驟調(diào)用APP選擇外賣,再調(diào)用支付程序下單支付,過(guò)程無(wú)需人類去指定每一步操作。

雖然AI工具和Agent都是旨在自動(dòng)化任務(wù)的軟件程序,但特定的關(guān)鍵特征將AI智能體區(qū)分為更復(fù)雜的AI 軟件。

當(dāng)AI工具具有以下特征時(shí),就可以將該工具視為AI Agent:

  • 自治(Autonomy):AI 虛擬智能體能夠獨(dú)立執(zhí)行任務(wù),而無(wú)需人工干預(yù)或輸入。
  • 知覺(jué)(Perception):智能體功能通過(guò)各種傳感器(如攝像頭或麥克風(fēng))感知和解釋它們所處的環(huán)境。
  • 反應(yīng)(Reactivity):AI 智能體可以評(píng)估環(huán)境并做出相應(yīng)的響應(yīng)以實(shí)現(xiàn)其目標(biāo)。
  • 推理和決策(Reasoning and decision-making):AI 智能體是智能工具,可以分析數(shù)據(jù)并做出決策以實(shí)現(xiàn)目標(biāo)。他們使用推理技術(shù)和算法來(lái)處理信息并采取適當(dāng)?shù)男袆?dòng)。
  • 學(xué)習(xí)(Learning):他們可以通過(guò)機(jī)器、深度和強(qiáng)化學(xué)習(xí)元素和技術(shù)來(lái)學(xué)習(xí)和提高他們的表現(xiàn)。
  • 通信(Communication):AI 智能體可以使用不同的方法與其他智能體或人類進(jìn)行通信,例如理解和響應(yīng)自然語(yǔ)言、識(shí)別語(yǔ)音以及通過(guò)文本交換消息。
  • 以目標(biāo)為導(dǎo)向(Goal-oriented):它們旨在實(shí)現(xiàn)特定目標(biāo),這些目標(biāo)可以通過(guò)與環(huán)境的交互來(lái)預(yù)定義或?qū)W習(xí)。

在類別上,AI智能體分目前可分為自主智能體(Autonomous Agent)和生成智能體(Generative Agent)。

自主智能體如Auto-GPT,能夠根據(jù)人們通過(guò)自然語(yǔ)言提出的需求,自動(dòng)執(zhí)行任務(wù)并實(shí)現(xiàn)預(yù)期結(jié)果。在這種合作模式下,自主智能體主要是為人類服務(wù),更像是一個(gè)高效的工具。

生成智能體,如斯坦福和谷歌的研究者共同創(chuàng)建的西部世界小鎮(zhèn)或者《西部世界》中的人形機(jī)器人,它們?cè)谕画h(huán)境中生活,擁有自己的記憶和目標(biāo),不僅與人類交往,還會(huì)與其他機(jī)器人互動(dòng)。

關(guān)于AI智能體,最近復(fù)旦大學(xué)自然語(yǔ)言處理團(tuán)隊(duì)(FudanNLP)推出的86頁(yè)LLM-based Agents 綜述論文,全面梳理了基于大型語(yǔ)言模型的智能代理現(xiàn)狀,包括:LLM-based Agent 的背景、構(gòu)成、應(yīng)用場(chǎng)景、以及備受關(guān)注的代理社會(huì)。

說(shuō)了這么多,很多朋友可能仍對(duì)AI智能體沒(méi)有直觀的感受。不要著急,下文我們將通過(guò)一個(gè)對(duì)比案例來(lái)加深大家的認(rèn)知。

Ai 智能體滲透各領(lǐng)域

AiAgent.app是一個(gè)Web 應(yīng)用,它允許用戶創(chuàng)建自定義AI智能體以執(zhí)行特定任務(wù)并實(shí)現(xiàn)目標(biāo)。

下面王吉偉頻道將通過(guò)使用Ai智能體與直接使用LLM的對(duì)比體驗(yàn),看看AI智能體的優(yōu)勢(shì)。

比如想了解過(guò)去一個(gè)月AI行業(yè)的新聞和趨勢(shì),在Claude輸入:過(guò)去一個(gè)月人工智能行業(yè)最新新聞和趨勢(shì)的摘要。

可以看到,Claude只是列出了幾條與AI相關(guān)的新聞資訊摘要。

而在AiAgent.app輸入這段話,它首先會(huì)將你的需求分解成十項(xiàng)任務(wù),然后通過(guò)提示與用戶交互完成每一項(xiàng)任務(wù),并為每項(xiàng)任務(wù)輸出結(jié)果。顯然,在AiAgent.app得到的關(guān)于近期AI行業(yè)的內(nèi)容,要比在直接使用其他LLM獲得的內(nèi)容更加全面。

直接使用大模型能夠獲取這些內(nèi)容嗎?理論上通過(guò)輸入更多的Prompt也能完成,但至少需要輸入十次,也不能保證所輸入Prompt精確性,且有時(shí)甚至不知道想要獲取什么信息。

而在AiAgent.app只需要輸入一句話,它就分析出了你可能的需求并列出相對(duì)全面的內(nèi)容目標(biāo),引導(dǎo)你去完成想要的東西,效率提升數(shù)倍。

兩者對(duì)比下來(lái),在內(nèi)容獲取的豐富度以及效率上,顯然AI Agent更勝一籌。這種資訊內(nèi)容類Agent對(duì)媒體從業(yè)者、行業(yè)分析師等職業(yè)具有非常大的價(jià)值,能夠大大減少研究資料的獲取時(shí)間。

現(xiàn)在已經(jīng)出現(xiàn)了一些面向更精確用戶群體及應(yīng)用場(chǎng)景的此類Agent,比如哥倫比亞大學(xué)推出的GPT Researcher就是一個(gè)基于ChatGPT的面向研究人員的Agent,可以為用戶創(chuàng)建各種研究報(bào)告以促進(jìn)研究。

這個(gè)案例還只是內(nèi)容的獲取,事實(shí)上現(xiàn)在已經(jīng)出現(xiàn)面向多個(gè)應(yīng)用場(chǎng)景的Agent,足以調(diào)動(dòng)更多軟件應(yīng)用乃至硬件設(shè)備完成各項(xiàng)任務(wù)。

比如有些人已經(jīng)通過(guò)AutoGPT實(shí)現(xiàn)了訂餐、訂票、打車以及購(gòu)物;斯坦福西部世界小鎮(zhèn)里的25個(gè)AI Agent每天都在散步、約會(huì)、聊天、喝咖啡以及分享當(dāng)天的新聞;谷歌Deepmind推出了利用機(jī)械臂自動(dòng)執(zhí)行各種工作的robotic agent;亞馬遜也推出了Amazon Bedrock Agents用于自動(dòng)分解企業(yè)AI應(yīng)用開(kāi)發(fā)任務(wù);IBM Watson Health已經(jīng)在很多醫(yī)院幫助醫(yī)生診斷、治療和監(jiān)測(cè)患者。

雖然Ai Agent火爆的時(shí)間還不算長(zhǎng),但一經(jīng)出現(xiàn)就得到了眾多領(lǐng)域諸多企業(yè)的擁戴。大語(yǔ)言模型的多模特能力加上如今更大的算力,讓多年前就提出的Agent快速得到價(jià)值凸顯,并以超強(qiáng)的滲透率在更多領(lǐng)域落地。

而隨著MetaGPT等開(kāi)源AI Agent的出現(xiàn),更多技術(shù)供應(yīng)商與創(chuàng)業(yè)團(tuán)隊(duì)引入Agent,更多組織認(rèn)知并接受Agent,它必然會(huì)快速成為L(zhǎng)LM的落地個(gè)領(lǐng)域的主要模式,助力千行百業(yè)更好的應(yīng)用LLM。

全球60個(gè)AI Agent大盤點(diǎn)

上面案例中所提到的AiAgent.app,是近幾個(gè)月來(lái)風(fēng)頭正盛的AI Agent代表性產(chǎn)品之一。包括這款A(yù)I智能體在內(nèi)的國(guó)內(nèi)外多個(gè)Agent,均可以在下面的項(xiàng)目盤點(diǎn)名單中看到。

為了讓大家更好地了解目前已推出的AI Agent,王吉偉頻道將這些AI Agent分為媒體報(bào)道、國(guó)內(nèi)已推出、行業(yè)型、海外其他以及GitHub項(xiàng)目幾類,以后還會(huì)逐步獎(jiǎng)勵(lì)項(xiàng)目庫(kù),將這些Agent分門別類編入不同類別。

本文所盤點(diǎn)的AI Agents,既包括AI Agents框架及工具,也包括基于一些開(kāi)源框架打造的AGENT產(chǎn)品,同時(shí)大部分項(xiàng)目及產(chǎn)品都為自主智能體。

因?yàn)橐恍S商比較低調(diào)并未對(duì)外宣傳,本文盤點(diǎn)的AI Agent并不完全,所以也叫作AI AGENT不完全名單。歡迎更多廠商及創(chuàng)業(yè)者看到本文后與王吉偉頻道聯(lián)系,大家一起為AI AGENT生態(tài)的繁榮發(fā)展做一份貢獻(xiàn)。

一、媒體報(bào)道的AI Agent

1、Auto-GPT

Auto GPT是Github上的一個(gè)免費(fèi)開(kāi)源項(xiàng)目,結(jié)合了GPT-4和GPT-3.5技術(shù),通過(guò)API創(chuàng)建完整的項(xiàng)目。

與ChatGPT不同的是,用戶不需要不斷對(duì)AI提問(wèn)以獲得對(duì)應(yīng)回答,在AutoGPT中只需為其提供一個(gè)AI名稱、描述和五個(gè)目標(biāo),然后AutoGPT就可以自己完成項(xiàng)目。它可以讀寫文件、瀏覽網(wǎng)頁(yè)、審查自己提示的結(jié)果,以及將其與所說(shuō)的提示歷史記錄相結(jié)合。

Auto-GPT是GPT-4完全自主運(yùn)行的首批示例之一,它突破了人工智能所能做的界限。

2、AgentGPT

AgentGPT允許您配置和部署自主AI智能體。只要為你的自定義AI命名并讓它開(kāi)始任何可以想象的目標(biāo),它就能通過(guò)思考要完成的任務(wù)、執(zhí)行任務(wù)并從結(jié)果中學(xué)習(xí)來(lái)嘗試實(shí)現(xiàn)目標(biāo)。

3、Baby AGI

這是一個(gè)人工智能驅(qū)動(dòng)的任務(wù)管理系統(tǒng)。該系統(tǒng)使用OpenAI和Pinecone API來(lái)創(chuàng)建、確定優(yōu)先級(jí)和執(zhí)行任務(wù)。通過(guò)分析先前任務(wù)的結(jié)果和預(yù)定義的目標(biāo)來(lái)創(chuàng)建任務(wù),并使用 OpenAI 的自然語(yǔ)言處理(NLP)和Chroma在上下文中存儲(chǔ)和檢索任務(wù)結(jié)果。

Baby AGI的吸引力在于它能夠根據(jù)先前任務(wù)的結(jié)果自主解決任務(wù)并保持預(yù)定義的目標(biāo),還能有效地確定任務(wù)的優(yōu)先級(jí)。

4、Jarvis (HuggingGPT)

由Microsoft開(kāi)發(fā)的一種獨(dú)特協(xié)作系統(tǒng),可以使用多個(gè)AI模型來(lái)完成給定的任務(wù),以ChatGPT充當(dāng)任務(wù)控制者。該項(xiàng)目在GitHub上被稱為JARVIS,現(xiàn)在可以在Huggingface(因此稱為HuggingGPT)上試用,這個(gè)Agent與文本、圖像、音頻甚至視頻配合得非常好。

其工作方式類似于OpenAI通過(guò)文本和圖像展示GPT 4的多模態(tài)功能,但JARVIS 更進(jìn)一步集成了用于圖像、視頻、音頻等的各種開(kāi)源 LLM,還可以連接到互聯(lián)網(wǎng)并訪問(wèn)文件。例如,您可以輸入來(lái)自網(wǎng)站的 URL 并詢問(wèn)相關(guān)問(wèn)題。

5、Aiagent.app

Ai Agent是一個(gè)Web 應(yīng)用,允許用戶創(chuàng)建自定義AI智能體以執(zhí)行特定任務(wù)并實(shí)現(xiàn)目標(biāo)。AI 智能體的工作原理是將目標(biāo)分解為較小的任務(wù),并逐個(gè)完成它們。好處包括能夠同時(shí)運(yùn)行多個(gè)AI 智能體,并使對(duì)尖端技術(shù)的訪問(wèn)民主化。

AI Agent還擁有諸如具有語(yǔ)法突出顯示的內(nèi)聯(lián)代碼塊,以及與第三方平臺(tái)的無(wú)縫協(xié)作等功能。該工具是免費(fèi)使用的,它提供了一種簡(jiǎn)化方法來(lái)構(gòu)建AI智能體,無(wú)需更多技術(shù)知識(shí)。

6、Camel AGI

Camel AGI是一個(gè)生成式AI工具,使用戶能夠通過(guò)角色扮演自主AI智能體來(lái)解決給定的任務(wù),當(dāng)然用戶需要啟用Javascript以使用此工具。Camel AGI允許用戶使用AI智能體完成任務(wù),并提供使用Google登錄或在Github上為該工具加星標(biāo)的選項(xiàng)。

7、“Westworld” simulation西部世界小鎮(zhèn)

這個(gè)項(xiàng)目來(lái)自斯坦福大學(xué)和谷歌的研究人員創(chuàng)建了一個(gè)交互式沙盒環(huán)境,其中包含25個(gè)可以模擬人類行為的生成AI智能體。他們?cè)诠珗@里散步,在咖啡館喝咖啡,并與同事分享新聞,表現(xiàn)出令人驚訝的良好社交行為。

比如,從一個(gè)用戶指定的一個(gè)概念開(kāi)始,即一個(gè)智能體想要舉辦情人節(jié)派對(duì),智能體在接下來(lái)的兩天內(nèi)自動(dòng)傳播派對(duì)邀請(qǐng),結(jié)識(shí)新朋友,互相約對(duì)方約會(huì)派對(duì),并協(xié)調(diào)在正確的時(shí)間一起出現(xiàn)在派對(duì)上。

8、GPT-Engineer

GPT-Engineer是一個(gè)開(kāi)源AI工具,允許用戶指定他們想要構(gòu)建的內(nèi)容,然后與AI進(jìn)行澄清對(duì)話以生成所需的代碼庫(kù)。該工具旨在提供簡(jiǎn)單靈活的用戶體驗(yàn),允許用戶根據(jù)自己的需要調(diào)整和擴(kuò)展其功能。

該工具包括指定AI智能體的身份、存儲(chǔ)與GPT4的通信歷史記錄以及重新運(yùn)行消息日志等功能。歡迎對(duì)項(xiàng)目做出貢獻(xiàn),感興趣的個(gè)人可以參考 GitHub 存儲(chǔ)庫(kù)上提供的路線圖、項(xiàng)目和問(wèn)題。GPT-Engineer旨在成為一個(gè)開(kāi)放平臺(tái),供開(kāi)發(fā)人員探索和構(gòu)建其代碼生成工具箱。

9、MetaGPT

MetaGPT是一個(gè)開(kāi)源多智能體框架,采用單行輸入來(lái)生成 API、用戶故事、數(shù)據(jù)結(jié)構(gòu)、競(jìng)爭(zhēng)分析等。該框架可以充當(dāng)產(chǎn)品經(jīng)理、軟件工程師和架構(gòu)師。該框架可以充當(dāng)整個(gè)軟件公司,只需一行代碼即可編排SOP。

MetaGPT與人類SOP流程設(shè)計(jì)集成。因此,基于LLM的智能體生成高質(zhì)量,多樣化,結(jié)構(gòu)化的文檔和設(shè)計(jì)。MetaGPT 的設(shè)計(jì)使為復(fù)雜任務(wù)設(shè)計(jì)解決方案變得容易,并提供幾乎可以與人類智能相媲美的問(wèn)題解決能力。

10、Amazon Bedrock Agents

亞馬遜發(fā)布的Amazon Bedrock Agents,允許開(kāi)發(fā)人員快速創(chuàng)建完全托管的智能體。通過(guò)對(duì)企業(yè)系統(tǒng)執(zhí)行API調(diào)用,Amazon Bedrock智能體加快了可管理和執(zhí)行活動(dòng)的生成式AI應(yīng)用程序的發(fā)布速度。

Amazon Bedrock Agents簡(jiǎn)化了用戶請(qǐng)求任務(wù)的快速工程和編排。設(shè)置完成后,這些智能體可以自主構(gòu)建提示,并使用公司特定的數(shù)據(jù)安全地增強(qiáng)提示,從而向用戶提供自然語(yǔ)言響應(yīng)。這些高級(jí)智能體具有推斷自動(dòng)處理用戶請(qǐng)求的必要操作的能力。

11、nvidia Voyager

由NVIDIA、加州理工學(xué)院等共同推出的Voyager,使用GPT-4來(lái)引導(dǎo)學(xué)習(xí)的Minecraft智能體通過(guò)像素世界,需要說(shuō)明的是,Voyager依賴于代碼生成,而不是強(qiáng)化學(xué)習(xí)。

Voyager是第一個(gè)玩《我的世界》的終身學(xué)習(xí)智能體。與其他使用經(jīng)典強(qiáng)化學(xué)習(xí)技術(shù)的 Minecraft智能體不同,Voyager使用GPT-4來(lái)不斷改進(jìn)自己,通過(guò)編寫、改進(jìn)和傳輸存儲(chǔ)在外部技能庫(kù)中的代碼來(lái)實(shí)現(xiàn)這一點(diǎn)。

這會(huì)產(chǎn)生一些小程序,幫助導(dǎo)航、開(kāi)門、挖掘資源、制作鎬頭或與僵尸作戰(zhàn)。GPT-4解鎖了一種新的范式,在此范式中“訓(xùn)練”是代碼的執(zhí)行,“訓(xùn)練模型”是Voyager迭代組裝的技能代碼庫(kù)。

12、RoboAgent

Meta和CMU 聯(lián)合研究團(tuán)隊(duì)耗時(shí)兩年,成功開(kāi)發(fā)出的RoboAgent 通用機(jī)器人智能體。RoboAgent僅僅通過(guò)7500個(gè)軌跡的訓(xùn)練就實(shí)現(xiàn)了12種不同的復(fù)雜技能,包括烘焙、拾取物品、上茶、清潔廚房等任務(wù),并能在100種未知場(chǎng)景中泛化應(yīng)用。

無(wú)論遇到多大的干擾,RoboAgent 都能堅(jiān)持完成任務(wù)。該研究的目標(biāo)是建立一個(gè)高效的機(jī)器人學(xué)習(xí)范例,解決數(shù)據(jù)集和場(chǎng)景多樣性的挑戰(zhàn)。研究人員提出了多任務(wù)動(dòng)作分塊 Transformer(MT-ACT)架構(gòu),通過(guò)語(yǔ)義增強(qiáng)和高效的策略表示來(lái)處理多模態(tài)多任務(wù)機(jī)器人數(shù)據(jù)集。

13、Inflection AI Pi

Inflection AI公司推出的個(gè)人AI Agent產(chǎn)品Pi,核心大腦是公司研發(fā)的Inflection-1大模型,性能媲美GPT-3.5。Pi與時(shí)下流行的通用聊天機(jī)器人不同,它只能進(jìn)行友好的對(duì)話,提供簡(jiǎn)潔的建議,甚至只是傾聽(tīng)。

它的主要特征是富有同情心、謙虛好奇、幽默創(chuàng)新, 具有良好的情商,可以根據(jù)用戶的獨(dú)特興趣和需求提供無(wú)限的知識(shí)與陪伴。Inflection自開(kāi)發(fā)Pi開(kāi)始,就確定了Pi將作為個(gè)人智能(Personal Intelligence),而不僅僅是輔助人工作的工具。

14、HyperWrite

Hyperwrite是一款A(yù)I寫作智能體工具,可幫助任何級(jí)別的創(chuàng)意作家更快、更自信地寫作。它包括自動(dòng)寫入和提前打字等功能,可生成原始段落并提出克服作家障礙的想法。

該工具作為免費(fèi)的Chrome擴(kuò)展程序提供,可以在任何網(wǎng)站上使用,而不會(huì)中斷工作流程。它被世界各地的專業(yè)人士、學(xué)生和創(chuàng)作者使用和信任,以提高他們的生產(chǎn)力。

15、GPT Researcher

GPT Researcher是一個(gè)基于AI的自主智能體,用于對(duì)各種任務(wù)進(jìn)行全面的在線研究。該工具受到AutoGPT和“計(jì)劃和解決”提示的啟發(fā),旨在改進(jìn)當(dāng)前語(yǔ)言模型中發(fā)現(xiàn)的速度和確定性問(wèn)題,“通過(guò)并行智能體工作提供更穩(wěn)定的性能和更高的速度,而不是同步操作。

根據(jù)該團(tuán)隊(duì)的說(shuō)法,GPT研究員通過(guò)生成相關(guān)的研究問(wèn)題、匯總來(lái)自 20 多個(gè)網(wǎng)絡(luò)資源的數(shù)據(jù)以及利用GPT3.5-turbo-16和GPT-4來(lái)創(chuàng)建全面的研究報(bào)告來(lái)促進(jìn)研究。

國(guó)內(nèi)已推出的AI Agent

經(jīng)過(guò)持續(xù)探索與嘗試,國(guó)內(nèi)AI智能體相關(guān)的產(chǎn)品也開(kāi)始嶄露頭角,下面介紹五款產(chǎn)品。

1、阿里云ModelScopeGPT

阿里云Mota社區(qū)推出的國(guó)內(nèi)首個(gè)大型模型調(diào)用工具魔搭GPT(ModelScopeGPT),通過(guò)這一款工具,使用者們可以通過(guò)一鍵發(fā)送指令調(diào)用Mota社區(qū)中的其他人工智能模型,從而實(shí)現(xiàn)大大小小的模型共同協(xié)作,進(jìn)而完成復(fù)雜的任務(wù)。

ModelScopeGPT基于開(kāi)源大語(yǔ)言模型(LLM)的AI Agent(智能體)開(kāi)發(fā)框架ModelScope-Agent。這是一個(gè)通用的、可定制的Agent框架,用于實(shí)際應(yīng)用程序,其基于開(kāi)源的大語(yǔ)言模型 (LLMs) 作為核心,包含記憶控制、工具使用等模塊。

開(kāi)源 LLM 主要負(fù)責(zé)任務(wù)規(guī)劃、調(diào)度以及回復(fù)生成;記憶控制模塊,主要包含知識(shí)檢索以及 prompt (提示詞)管理;工具使用模塊,包含工具庫(kù)以及工具檢索和工具可定制化。

2、實(shí)在智能TARS-RPA-Agent

實(shí)在智能在超自動(dòng)化領(lǐng)域首發(fā)的TARS-RPA-Agent,是一個(gè)基于“TARS+ISSUT(智能屏幕語(yǔ)義理解)”雙模引擎、有“大腦”,更有“眼睛和手腳”的超自動(dòng)化智能體,是能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式產(chǎn)品。

TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語(yǔ)義理解為基座的技術(shù)框架。該技術(shù)框架分為兩層結(jié)構(gòu):底層是包括通用基礎(chǔ)模型和各個(gè)垂直行業(yè)基礎(chǔ)模型在內(nèi)的TARS系列大模型和智能屏幕語(yǔ)義理解技術(shù);上層是依托這兩項(xiàng)關(guān)鍵技術(shù)完成全面升級(jí)和改造的超自動(dòng)化產(chǎn)品。

TARS-RPA-Agent的核心LLM是實(shí)在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型,TARS大模型具備優(yōu)異的文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理等主流能力。

3、OmBot歐姆智能體

2023 世界人工智能大會(huì)上,聯(lián)匯科技發(fā)布了基于大模型能力的自主智能體(Auto AI Agent )——OmBot 歐姆智能體,并針對(duì)典型場(chǎng)景需求推出了首批應(yīng)用。

聯(lián)匯自主智能體包含了認(rèn)知、記憶、思考、行動(dòng)四大核心能力,作為一種自動(dòng)、自主的智能體,它以最簡(jiǎn)單的形式中在循環(huán)中運(yùn)行,每次迭代時(shí),它們都會(huì)生成自我導(dǎo)向的指令和操作。因此,它不依賴人類來(lái)指導(dǎo)命令,具備高度可擴(kuò)展性。

4、瀾碼科技Ask XBot

瀾碼科技構(gòu)建的Agent平臺(tái)“Ask XBot”,平臺(tái)分兩層:第一層是專家賦能,專家通過(guò)拖、拉、拽以及對(duì)話交互的方式定義工作流程,教給機(jī)器,從而協(xié)助一線員工構(gòu)建更高效工作的方法論;第二層是員工使用Agent,一線員工可以通過(guò)自然語(yǔ)言和Agent溝通并下達(dá)指令,讓Agent協(xié)助完成數(shù)據(jù)分析、資料調(diào)取等工作。

該公司計(jì)劃將Ask XBo打造成一個(gè)兼具通用性和易用性的平臺(tái),把這些API和Agent做好管理,讓Agent包裝不同的API,不同模型的Agent能夠在上面更好地協(xié)作,讓它們可以在平臺(tái)上更有效率、更智能地服務(wù)好客戶。

5、ChatDev

由清華大學(xué)、北京郵電大學(xué)、布朗大學(xué)聯(lián)合研究團(tuán)隊(duì)推出的ChatDev,是一個(gè)生成式智能體。它基于聊天的端到端軟件開(kāi)發(fā)框架,能夠利用大型語(yǔ)言模型(LLMs)促進(jìn)軟件開(kāi)發(fā)過(guò)程中多角色(ChatGPT 的 “gpt3.5-turbo-16k” 版本)之間的有效溝通和協(xié)作。

ChatDev的主要目的是通過(guò)聊天來(lái)進(jìn)行游戲開(kāi)發(fā)。用戶只需提出想法,從設(shè)計(jì)到測(cè)試的整個(gè)流程都由AI完成,整個(gè)過(guò)程只需七分鐘即可完成。

面向不同領(lǐng)域的AI Agent產(chǎn)品

LLM還沒(méi)有出現(xiàn)之前,一些企業(yè)就已在研究傳統(tǒng)AI與Agent的結(jié)合應(yīng)用。因此,AI Agenmt在各領(lǐng)域的落地比大家預(yù)想得要快很多。

下面,是幾個(gè)行業(yè)領(lǐng)域的代表性Agent應(yīng)用。

  • 在醫(yī)療領(lǐng)域,Agent可以幫助診斷、治療和監(jiān)測(cè)患者。IBM Watson Health 是一個(gè)AI智能體,可以分析醫(yī)療數(shù)據(jù),以識(shí)別潛在的健康問(wèn)題并推薦治療方案。
  • 在金融領(lǐng)域,Agent可以分析財(cái)務(wù)數(shù)據(jù)、檢測(cè)欺詐行為并提出投資建議。嘉信理財(cái)(Charles Schwab)使用名為Intelligent Portfolio的人工智能智能體,根據(jù)客戶的投資目標(biāo)創(chuàng)建和管理投資組合。
  • 在零售業(yè)務(wù)場(chǎng)景中,Agent可以提供個(gè)性化推薦,改善供應(yīng)鏈管理,增強(qiáng)客戶體驗(yàn)。亞馬遜的Alexa是一個(gè)AI智能體,可以推薦產(chǎn)品,下訂單和跟蹤發(fā)貨。
  • 在制造業(yè),Agent可以優(yōu)化生產(chǎn)流程,預(yù)測(cè)維護(hù)需求,提高產(chǎn)品質(zhì)量。通用電氣使用名為Predix的AI智能體實(shí)時(shí)監(jiān)控機(jī)器,以預(yù)測(cè)和防止設(shè)備故障。
  • 在運(yùn)輸領(lǐng)域,自主AI Agent可以協(xié)助路線規(guī)劃、交通管理和車輛安全。特斯拉的Autopilot有助于自動(dòng)駕駛車輛,并幫助駕駛員停車、變道和安全駕駛。
  • 在教育行業(yè),Agnet可以提供個(gè)性化的學(xué)習(xí)體驗(yàn),自動(dòng)執(zhí)行管理任務(wù)并分析學(xué)生的表現(xiàn)。培生(Pearson)的AI智能體Aida可以為學(xué)生提供反饋,并建議個(gè)性化的學(xué)習(xí)路徑。
  • 在農(nóng)業(yè)領(lǐng)域,AI Agent可以優(yōu)化作物生產(chǎn)、監(jiān)測(cè)土壤質(zhì)量并預(yù)測(cè)天氣模式。約翰迪爾(John Deere)正在使用一種名為See&Spray的AI智能體來(lái)檢測(cè)和定位雜草,而不會(huì)影響作物。

海外已推出其他AGENT產(chǎn)品

1、Cognosys

Cognosys是基于Web的AI智能體,旨在徹底改變生產(chǎn)力并簡(jiǎn)化復(fù)雜任務(wù),使用最先進(jìn)的 AI 技術(shù)提升您的日常生活。

2、Doanythingmachine

使用“無(wú)所不能”機(jī)器輕松管理您的任務(wù),用戶個(gè)人AI 智能體將為您確定優(yōu)先級(jí)并完成您的任務(wù)

3、alphakit

用于創(chuàng)建和管理目標(biāo)驅(qū)動(dòng)型自主AI智能體團(tuán)隊(duì)的直觀平臺(tái),全部通過(guò)手機(jī)創(chuàng)建和管理 autoGPT AI智能體團(tuán)隊(duì)。只需定義你的目標(biāo),Alphakit負(fù)責(zé)剩下的工作。

4、GPTConsole

GPTConsole是一個(gè)革命性的命令行界面(CLI),旨在為開(kāi)發(fā)人員提供人工智能的優(yōu)勢(shì)。它超越了傳統(tǒng)的終端功能,使用戶能夠使用提示執(zhí)行復(fù)雜的任務(wù)。

5、Fini

提供指向知識(shí)庫(kù)的鏈接,在2分鐘內(nèi)將您的知識(shí)庫(kù)轉(zhuǎn)換為AI聊天。Fini為用戶提供一個(gè)不知疲倦的AI智能體,隨時(shí)準(zhǔn)備24/7立即回答客戶問(wèn)題。

6、Spell

Spell是一款基于GPT4自主AI智能體,可以應(yīng)用于日常高效工作。Spell還具有急需的功能,可幫助您更智能地工作,并學(xué)習(xí)利用生成式AI 的強(qiáng)大功能,生成一個(gè)或多個(gè)創(chuàng)新的自主智能體,這些智能體將致力于解決您的問(wèn)題。

7、Aomni

Aomni是一個(gè)信息檢索AI智能體,能夠?yàn)槟悴檎?、提取和處理互?lián)網(wǎng)上的任何數(shù)據(jù),增強(qiáng)你的研究工作。Aomni可以使用各種工具來(lái)智能地規(guī)劃你的查詢以獲得最終結(jié)果,包括一個(gè)完整的 Web 瀏覽器,允許它訪問(wèn)互聯(lián)網(wǎng)上的任何信息,而無(wú)需 API。

Aomni的查詢規(guī)劃器基于當(dāng)前最先進(jìn)的AutoGPT架構(gòu),智能地計(jì)劃和更新每個(gè)請(qǐng)求,以確保來(lái)源的正確性和多樣性。

8、Fine-Tuner.ai

借助Fine-Tuner.ai,用戶可以構(gòu)建復(fù)雜、量身定制的AI智能體,而無(wú)需技術(shù)技能或編碼,只需輸入你的數(shù)據(jù)和想法即可。十幾個(gè)專業(yè)AI智能體通過(guò)上傳的PDF、CV、PPT、URL 等即時(shí)數(shù)據(jù),可為用戶創(chuàng)建精確的問(wèn)答、文檔搜索、流程自動(dòng)化等。

9、SuperAGI

一個(gè)開(kāi)源的自主AI框架,使您能夠快速可靠地開(kāi)發(fā)和部署有用的自主智能體,用于構(gòu)建、管理和運(yùn)行自主智能體的基礎(chǔ)結(jié)構(gòu)。

10、Yellow.ai

Yellow.ai是領(lǐng)先的企業(yè)級(jí)對(duì)話式人工智能平臺(tái),可以為企業(yè)動(dòng)態(tài)AI智能體提供支持,旨在通過(guò)其無(wú)代碼/低代碼平臺(tái)提供類似人類的交互,從而提高客戶滿意度并提高員工敬業(yè)度。

11、Godmode

使用戶能夠在瀏覽器中運(yùn)行AutoGPT。Godmode允許用戶同時(shí)部署多個(gè)AI智能體以使用AI 完成任務(wù),用戶也可以使用自己的OpenAI API密鑰。

12、E42

E42是一個(gè)認(rèn)知流程自動(dòng)化平臺(tái),企業(yè)可以使用該平臺(tái)創(chuàng)建多功能認(rèn)知智能體,以跨功能自動(dòng)化各種流程。認(rèn)知驅(qū)動(dòng)的無(wú)代碼平臺(tái)與用戶現(xiàn)有的技術(shù)和流程無(wú)縫集成,以釋放跨部門的最高價(jià)值。用戶可使用E42構(gòu)建自己的AI智能體,比如AI分析師以及跨垂直行業(yè)的AI招聘人等。

13、Thankful

Thankful的AI智能體經(jīng)過(guò)培訓(xùn)和量身定制,可在您現(xiàn)有的幫助臺(tái)中工作,通過(guò)電子郵件,聊天,短信和應(yīng)用內(nèi)渠道輕松解決大量客戶查詢。憑借理解、連接、解決、個(gè)性化和通知的能力,ThankfulAI智能體以機(jī)器般的速度和天生可擴(kuò)展的專業(yè)知識(shí)提供類似人類的服務(wù)體驗(yàn)。

14、Aktify

使用Aktify的虛擬AI智能體克隆您的銷售團(tuán)隊(duì),無(wú)需增加員工人數(shù)。Aktify將大規(guī)模處理無(wú)限數(shù)量的無(wú)響應(yīng)潛在客戶),并始終如一地將隨時(shí)可以交談的客戶帶到您的銷售團(tuán)隊(duì)的門口,它不只一個(gè)短信聊天機(jī)器人。

15、TeamSmart AI

通過(guò)一鍵訪問(wèn)TeamSmart AI來(lái)提高您的工作效率。在瀏覽器中直接匯總內(nèi)容、生成代碼、起草推文等。單擊圖標(biāo)或鍵盤快捷鍵即可立即打開(kāi)ChatGPT,無(wú)需登錄,即可即時(shí)訪問(wèn)質(zhì)量提示庫(kù)。

16、BrainstormGPT

BrainstormGPT集成了多個(gè)智能體、LLM和自動(dòng)搜索,以簡(jiǎn)化主題到會(huì)議報(bào)告轉(zhuǎn)換。自定義主題,用戶定義的角色,智能體自主討論,在 20 分鐘內(nèi)輸出的報(bào)告,約等于300 次搜索、10 小時(shí)討論和 100,000 次文本分析。

17、AgentRunner.Ai

AgentRunner.ai是一個(gè)自主AI 智能體創(chuàng)建工具,它利用 GPT-4的強(qiáng)大功能來(lái)創(chuàng)建和訓(xùn)練完全自主的智能體。允許用戶為他們的智能體設(shè)定目標(biāo),并讓他們決定如何實(shí)現(xiàn)這些目標(biāo),而無(wú)需任何技術(shù)知識(shí)或編程技能。

該工具提供的功能包括創(chuàng)建具有獨(dú)特個(gè)性的自主智能體,運(yùn)行智能體以執(zhí)行任務(wù)或?qū)W習(xí)新技能,決定智能體可以做什么以及與OpenAI或Google Cloud帳戶集成。

18、Gista

Gista可幫助企業(yè)與網(wǎng)站訪問(wèn)者互動(dòng)并將其轉(zhuǎn)化為24/7的潛在客戶,其主要功能包括構(gòu)建AI轉(zhuǎn)換智能體和AI銷售智能體。使用 Gista,企業(yè)可以輕松地將網(wǎng)站訪問(wèn)者轉(zhuǎn)化為潛在客戶并建立電子郵件列表。

19、Agent4

Agent4的主要功能之一是能夠創(chuàng)建AI驅(qū)動(dòng)的虛擬智能體,可以回答問(wèn)題,幫助預(yù)訂會(huì)議,收聽(tīng)語(yǔ)音郵件并提供摘要。

您可以輕松地為座席創(chuàng)建自定義交互,使他們能夠用您品牌的聲音回答問(wèn)題并處理各種任務(wù)。您還可以選擇座席如何實(shí)時(shí)響應(yīng)呼叫,并決定是否以及何時(shí)需要與某人交談。

20、Cometcore AI

Cometcore AI是一個(gè)創(chuàng)新平臺(tái),提供一系列多功能的AI驅(qū)動(dòng)的工具,以提高生產(chǎn)力和溝通能力。使用Cometcore,您可以制作、編碼和自動(dòng)化可愛(ài)的智能體。

21、personal-assistant

一個(gè)人工智能代理,旨在處理從預(yù)訂航班到進(jìn)行深入研究以及介于兩者之間的所有任務(wù)。

Github上的AI Agent項(xiàng)目

1、OpenAGI

OpenAGI是一個(gè)開(kāi)源的AGI研究平臺(tái),專門設(shè)計(jì)用于提供復(fù)雜的多步驟任務(wù),并附有特定于任務(wù)的數(shù)據(jù)集,評(píng)估指標(biāo)和各種可擴(kuò)展模型。OpenAGI將復(fù)雜的任務(wù)表述為自然語(yǔ)言查詢,作為L(zhǎng)LM的輸入。LLM隨后選擇,合成和執(zhí)行OpenAGI提供的模型來(lái)解決任務(wù)。

該項(xiàng)目還提出了任務(wù)反饋強(qiáng)化學(xué)習(xí)(RLTF)機(jī)制,該機(jī)制使用任務(wù)解決結(jié)果作為反饋來(lái)提高LLM的任務(wù)解決能力。LLM負(fù)責(zé)綜合各種外部模型來(lái)解決復(fù)雜任務(wù),而RLTF提供反饋以提高其任務(wù)解決能力,為自我改進(jìn)的AI提供反饋循環(huán)。LLM操作各種專家模型來(lái)解決復(fù)雜任務(wù)的范式是AGI的一種有前途的方法。

2、Agent-LLM

Agent-LLM是一個(gè)人工智能自動(dòng)化平臺(tái),旨在為跨多個(gè)提供商的高效AI指令管理提供動(dòng)力。

該智能體配備了自適應(yīng)內(nèi)存,這種多功能解決方案提供了一個(gè)強(qiáng)大的插件系統(tǒng),支持各種命令,包括網(wǎng)頁(yè)瀏覽。隨著對(duì)眾多人工智能提供商和模型的支持不斷增加,Agent-LLM不斷發(fā)展以增強(qiáng)各種應(yīng)用程序。

3、AutoGPT-Next-Web

該智能體可以實(shí)現(xiàn)一鍵式即在Vercel上部署精心設(shè)計(jì)的AutoGPT-Next-Web Web UI,一鍵免費(fèi)部署你的私人AutoGPT-Next-Web 網(wǎng)頁(yè)應(yīng)用?;贏utoGPT-Next-Web,用戶可在1 分鐘內(nèi)使用Vercel 免費(fèi)一鍵部署,搭建個(gè)人的AutoGPT網(wǎng)站。

4、MiniGPT-4

這款A(yù)gent,可以使用高級(jí)大語(yǔ)言模型增強(qiáng)視覺(jué)語(yǔ)言理解。

5、Mini-AGI

Mini-AGI是基于GPT3.5/4的最小通用自主智能體。它結(jié)合了強(qiáng)大的提示,一組最少的工具和短期記憶(思想鏈),通過(guò)矢量存儲(chǔ)的數(shù)據(jù)增強(qiáng)將很快添加,可以分析股票價(jià)格、執(zhí)行網(wǎng)絡(luò)安全測(cè)試、創(chuàng)作藝術(shù)品和訂購(gòu)披薩。

6、Teenage-AGI

此智能項(xiàng)目受幾個(gè)與Auto-GPT相關(guān)的項(xiàng)目(主要是BabyAGI)和論文“生成智能體:人類行為的交互式模擬”的啟發(fā),這個(gè)Python項(xiàng)目使用OpenAI和Pinecone為AI智能體提供記憶,并允許它在采取行動(dòng)(輸出文本)之前“思考”。

7、FastGPT

FastGPT 是一個(gè)基于 LLM 大語(yǔ)言模型的知識(shí)庫(kù)問(wèn)答系統(tǒng),提供開(kāi)箱即用的數(shù)據(jù)處理、模型調(diào)用等能力。同時(shí)可以通過(guò) Flow 可視化進(jìn)行工作流編排,從而實(shí)現(xiàn)復(fù)雜的問(wèn)答場(chǎng)景

8、DemoGPT

使用DemoGPT,只需使用簡(jiǎn)單句子即可快速創(chuàng)建演示。

9、LocalAGI

基于LLMDA、ChatGLM 等模型的本地運(yùn)行AGI項(xiàng)目。

10、ai-town(游戲類)

著名投資機(jī)構(gòu)a16z開(kāi)源的AI小鎮(zhèn),一個(gè)MIT 許可的、可部署的入門工具包,用于構(gòu)建和定制您自己的AI城鎮(zhèn)版本。這是一個(gè) AI 角色生活、聊天和社交的虛擬城鎮(zhèn)。

11、gptrpg(游戲類)

gptrpg此存儲(chǔ)庫(kù)包含兩件事:一個(gè)簡(jiǎn)單的類似RPG游戲的環(huán)境,用于支持 LLM 的 AI 智能體;連接到 OpenAI API 以存在于該環(huán)境中的簡(jiǎn)單 AI 智能體。

12、SFighterAI(游戲類)

該項(xiàng)目是一個(gè)使用深度強(qiáng)化學(xué)習(xí)訓(xùn)練的AI智能體,以擊敗游戲《街頭霸王II:特別冠軍版》中的最終BOSS。AI 智能體僅根據(jù)游戲屏幕的 RGB 像素值做出決策。在提供的保存狀態(tài)下,智能體在最終關(guān)卡的第一輪中達(dá)到 100% 的勝率。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。