精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

教AI Agents學會協作&競爭!首個大模型多智能體框架CAMEL已斬獲3.6k星

人工智能 新聞
AI Agents是當下大模型領域備受關注的話題,用戶可以引入多個扮演不同角色的LLM Agents參與到實際的任務中,Agents之間會進行競爭和協作等多種形式的動態交互,進而產生驚人的群體智能效果。本文介紹了來自KAUST研究團隊的大模型心智交互CAMEL框架(駱駝),CAMEL框架是最早基于ChatGPT的autonomous agents知名項目,目前已被頂級人工智能會議NeurIPS 2

「什么神奇的技巧讓我們變得智能?竅門就是沒有竅門。智慧的力量源于我們巨大的多樣性,而不是任何單一的、完美的原則。」

——人工智能先驅 馬文·明斯基(Marvin Minsky)

目前來看,在機器通向高級智能的道路上,以ChatGPT為代表的大模型(LLMs)應該是必須經過的里程碑之一,它們以聊天對話的人機交互方式在多個領域的復雜任務解決方面取得了非常耀眼的成就。

隨著LLMs的發展,AI Agents(AI智能體)之間的交互框架也逐漸興起,尤其是在一些復雜的專業領域,以角色扮演等模式預置的智能體完全有能力代替人類用戶在任務中扮演的角色,同時,智能體之間通過以協作和競爭形式的動態交互往往能夠帶來意想不到的效果,這就是被OpenAI人工智能專家Andrej Karpathy等人看作是「通向AGI最重要的前沿研究方向」的AI Agents。

該領域發展的時間線如下[2]:

  • 「CAMEL」(駱駝:大模型心智交互框架)- 發布于2023.3.21
  • 「AutoGPT」 - 發布于2023.3.30
  • 「BabyGPT」 - 發布于2023.4.3
  • 「Westworld」 simulation(斯坦福西部世界小鎮) — 發布于2023.4.7

作為最早基于ChatGPT的autonomous agents知名項目,KAUST研究團隊的大模型心智交互CAMEL框架(駱駝)重點探索了一種稱為角色扮演(role-playing)的新型合作代理框架,該框架可以有效緩解智能體對話過程中出現的錯誤現象,從而有效引導智能體完成各種復雜的任務,人類用戶只需要輸入一個初步的想法就可以啟動整個過程。目前,CAMEL已經被國際人工智能頂級會議NeurIPS 2023錄用。

論文鏈接:https://ghli.org/camel.pdf

項目主頁:https://www.camel-ai.org/

AI Agents是當下大模型領域備受關注的話題,用戶可以引入多個扮演不同角色的LLM Agents參與到實際的任務中,Agents之間會進行競爭和協作等多種形式的動態交互,進而產生驚人的群體智能效果。

作者對CAMEL框架設計了靈活的模塊化功能,包括不同代理的實現、各種專業領域的提示示例和AI數據探索框架等,因此CAMEL可以作為一個基礎的Agents后端,支持AI研究者和開發者更加輕松地開發有關于多智能體系統、合作人工智能、博弈論模擬、社會分析、人工智能倫理等方面的應用。

具體的,作者通過涉及兩種角色扮演的合作場景,生成了兩個大型的指令數據集AI Society和AI Code,以及兩個單輪問答數據集AI Math和AI Science,用于探索LLM涌現能力的研究。

CAMEL框架

下圖展示了CAMEL中的role-playing框架,人類用戶需要首先制定一個想要實現的想法或目標,例如:開發一個用于股市場的交易機器人。

這項任務涉及的角色是AI助理智能體(使其扮演Python程序員角色)和AI用戶智能體。

作者首先為CAMEL設置了一個任務細化器(Task Specifier),該細化器會根據輸入的想法來制定一個較為詳細的實現步驟,隨后AI助理智能體(AI Assistant)和AI用戶智能體(AI User)通過聊天的方式來進行協作通信,各自一步步完成指定的任務。

其中協作通信通過系統級的消息傳遞機制來實現,令  為傳遞給AI助理智能體的系統消息, 為傳遞給AI用戶智能體的系統消息。
隨后為AI助理智能體和AI用戶智能體分別實例化為兩個ChatGPT模型  和 ,相應得到AI助理智能體  和AI用戶智能體  。
角色分配完成后,AI助理智能體和AI用戶智能體會按照指令跟隨的方式協作完成任務,令  為時間  時刻獲得的用戶指令消息, 為AI助理智能體給出的解決方案,因而  時刻得到的對話消息集為:

圖片

在下一個時刻  ,AI用戶智能體  會根據歷史對話消息集  ,來生成新的指令  。然后再將新指令消息與歷史對話消息集一起傳遞給AI助理智能體  來生成新一時刻的解決方案:

圖片

CAMEL使用示例

1. 協作角色扮演(cooperate role-playing)

CAMEL內置的協作式role-playing框架可以在人類用戶不具備專業知識的情況下,通過Agents之間的協作方式完成復雜任務,下圖展示了CAMEL開發股市場交易機器人的例子,其中AI助理智能體的扮演的角色是一名Python程序員,而AI用戶智能體扮演的角色為一名股交易員。


圖片

在role-playing框架中,AI智能體都具有特定領域的專業知識,此時我們只需要指定一個原始想法的Prompt,隨后兩個AI智能體就會圍繞著這一想法展開工作,在上圖中,用戶智能體提出交易機器人需要有對股評論的情緒分析功能,隨后助理智能體直接給出了安裝情緒分析和股交易所需的python庫的腳本。

圖片

隨著任務的進行,用戶智能體給出的指示也會越來越明確,上圖中的指示為:定義一個函數以使用Yahoo Finance API獲取特定股的最新股價。助理智能體會根據該指示直接生成一段代碼來解決需求。

2. 具身智能體(embodied agent)

在先前的研究中,AI Agents可以理解為在模擬一些操作,而沒有與現實世界交互或使用外部工具執行操作,目前的LLMs已經具備與互聯網或其他工具API交互的能力,CAMEL也提供了能夠在物理世界中執行各種操作的具身智能體(embodied agent),它們可以瀏覽互聯網、閱讀文檔、創建圖像、音頻和視頻等內容,甚至可以直接執行代碼。

圖片

上圖展示了CAMEL通過使用embodied agent調用HuggingFace提供的Stable Diffusion工具鏈生成駱駝科圖像的樣例,在這一過程中,embodied agent首先會推理出駱駝科所包含的所有動物,隨后調用擴散模型生成圖像并進行保存。

3. critic在環(critic-in-the-loop)

為了增強role-playing框架的可控性,作者團隊還為CAMEL設計了一種critic-in-the-loop,這種機制受到了蒙特卡洛樹搜索(MTCS)方法的啟發,它可以結合人類偏好實現樹搜索的決策邏輯來解決任務,CAMEL可以設置一個中間評價智能體(critic)來根據用戶智能體和助理智能體出的各種觀點進行決策來完成最終任務,整體流程如下圖所示。

圖片

考慮這樣一個場景,我們讓CAMEL主持一場很具體的科研項目討論會,而科研項目的主題「大型語言模型」,CAMEL可以將用戶智能體的角色設置為一個博士后,將助理智能體的角色設置為博士生,而中間評價智能體的角色設置為教授。任務指示博士生來幫助博士后制定研究計劃,需要圍繞大模型的倫理展開研究。

在接到任務后,博士后智能體首先拋出了關于這一項目的三個觀點,表明項目應該首先從調研大模型倫理方面的相關工作著手。

隨后教授智能體會根據這三個觀點給出自己的看法。并且認為觀點2最為合理的,即研究大模型歧視性算法。同時還會給出另外兩個觀點的缺陷,例如觀點1缺乏更加清晰的結構,觀點3的研究范圍太窄等等。

圖片

在教授發言之后,博士生智能體會進行更加具體的項目規劃,例如直接列出一些大模型倫理安全方向的相關文獻,并且討論如何開展具體的研究。

實驗效果

本文的性能評估主要從三個方面進行,并且采用兩個gpt-3.5-turbo作為實驗智能體,實驗的數據集使用CAMEL框架生成的四個AI數據集,其中AI Society和AI Code側重于智能體的對話效果,而AI Math和AI Science側重于智能體的問題解決能力。

1. Agent評估

在這一部分,作者從AI Society和AI Code數據集中分別隨機選擇 100 個任務進行評估,然后使用CAMEL框架和單個gpt-3.5-turbo進行對比實驗。

結果評估方面分為兩部分,一方面由人類受試者對兩種方法給出的解決方案給出453份投票數據,來決定哪種方案更加可行。另一方面,作者提示GPT4模型對兩種方案直接給出評分,具體的對比數據如下表所示。

從上表中可以看出,CAMEL框架給出的解決方案在人類評估和GPT4評估中均大幅優于gpt-3.5-turbo給出的解決方案,其中人類評估和GPT4評估的總體趨勢高度一致。

2. 使用GPT-4對ChatBot評估

在這一部分,作者在CAMEL生成的四個數據集上對LLaMA-7B模型進行了逐步的微調,通過向LLM中不斷注入來自社會、代碼、數學和科學等不同領域的知識,來觀察模型對知識發現的接受效果。

作者首先從AI Society數據集開始,讓模型了解人類的互動常識和社會動態,隨后AI Code和其他數據集的注入,模型獲得了編程邏輯和語法的知識,同時拓寬了模型對科學理論、經驗觀察和實驗方法的理解。

上表展示了模型在20個Society任務、20個代碼編寫任務、20個數學任務和60個科學任務上的測試效果,可以看到在每次添加數據集時,模型在已訓練過的任務域上都會表現得更好。

3. HumanEval

為了進一步評估CAMEL框架的代碼編寫任務解決能力,作者在HumanEval和HumanEval+兩個評估基準上進行了實驗,實驗結果如下表所示。

圖片

上表中清楚地證明了CAMEL框架的卓越性能,它不僅遠遠超過了LLaMA-7B模型,而且還大大超過了Vicuna-7B模型,這表明使用CAMEL生成的數據集在增強LLM處理編碼相關任務方面有獨特的效果。

CAMEL AI開源社區

值得一提的是,CAMEL作者團隊正在構建了一個非常完善的CAMEL AI開源社區,社區Github倉庫已經得到了3600+的star數,社區中涵蓋了CAMEL中各種智能體的實現、數據生成pipeline、數據分析工具和已生成的數據集,以支持AI Agents及其他方面的研究,社區目前已吸引了諸多開源愛好者貢獻代碼。

距離CAMEL項目編寫第一行代碼到現在已有9個月,CAMEL-AI.org開源研究技術社區已經吸引超過20名來自KAUST/劍橋/索邦大學/NUS/CMU/芝加哥大學/斯坦福/杜克大學/北大/上交/哈工大/西電/東北大學/成信大以及工業界等獨立代碼貢獻者。

社區正在尋找全職/兼職/實習貢獻者、工程師和研究人員加入一起學習和探索如何推動構建智能體社會的邊界,杰出貢獻者有機會參與框架和其他研究項目論文的撰寫投稿。

如果感興趣加入CAMEL-AI.org的社區,可以將簡歷發送至camel.ai.team@gmail.com或者添加微信號CamelAIOrg進行咨詢!

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-11-30 16:34:18

2025-07-28 01:33:00

2025-09-25 12:42:33

2025-07-04 16:50:07

工具AI模型

2025-06-09 08:56:00

2025-06-03 09:08:00

2024-08-14 15:00:00

模型數據

2025-04-25 02:30:00

機械臂大模型多模態

2025-04-28 08:29:04

AIMCP智能體

2025-05-22 06:59:53

2025-06-17 06:28:08

2025-07-25 10:31:52

2025-06-10 09:28:31

智能體開發工具

2025-07-29 09:24:21

2025-06-23 10:05:40

2025-08-25 08:45:00

模型代碼開源

2025-09-18 09:00:47

2024-09-12 15:10:00

AI智能體

2024-10-15 17:28:05

點贊
收藏

51CTO技術棧公眾號

午夜欧美精品久久久久久久| 国产激情综合| 国产视频一区二区在线| 国产视频福利一区| 久久久久国产精品夜夜夜夜夜| 第四色中文综合网| 欧美性三三影院| 国产专区在线视频| 国产黄在线观看免费观看不卡| 激情综合色播五月| 欧美做受高潮电影o| 国产美女高潮视频| 奇米影视777在线欧美电影观看| 欧美天堂一区二区三区| 六月婷婷在线视频| www在线免费观看视频| 91捆绑美女网站| 亚洲影院高清在线| 亚洲欧美另类在线视频| 午夜日韩电影| 最近2019免费中文字幕视频三 | 欧美激情 一区| 盗摄系列偷拍视频精品tp| 欧美久久久久中文字幕| 国产成人无码一二三区视频| 污视频网站免费在线观看| 国产精品人妖ts系列视频| 国产在线精品一区二区三区》| 国产精品伦一区二区三区| 亚洲欧美卡通另类91av| 欧美激情欧美激情在线五月| 中文字幕91视频| 国产一区二区三区91| 亚洲国产成人91精品| 久久精品一二三四| 欧美大片网站| 在线观看日韩毛片| 欧美深夜福利视频| 牛牛电影国产一区二区| 亚洲日本护士毛茸茸| 视频一区二区三区免费观看| 青青草在线免费视频| www..com久久爱| 国产九色精品| 日本高清视频免费观看| 福利一区二区在线| 亚洲自拍偷拍在线| 99在线观看免费| 国产一区二区调教| 91在线观看免费| 97人妻一区二区精品免费视频| 免费高清在线视频一区·| 日本视频久久久| www.国产一区二区| 亚洲免费中文| 国产精品第七十二页| 日本一本在线观看| 久久综合图片| 国产精品一区二区性色av| 免费黄色一级大片| 日本aⅴ亚洲精品中文乱码| 国产精品爱啪在线线免费观看| 无码人妻熟妇av又粗又大| 久久久久中文| 国产精品小说在线| 亚洲一卡二卡在线观看| 韩国v欧美v日本v亚洲v| 91精品视频在线免费观看| 国产精品嫩草影院精东| 国产一区二区三区av电影| 91综合免费在线| 免费av一级片| 久久一区二区视频| 视频一区视频二区视频| 麻豆视频网站在线观看| 亚洲综合男人的天堂| 人人妻人人做人人爽| 亚洲日本天堂| 欧美猛男超大videosgay| 一起草最新网址| 国产精品高潮呻吟久久久久| 精品一区二区三区四区在线| 精品日韩在线视频| 亚洲欧美日韩高清在线| 欧美激情一区二区久久久| 五月天综合激情| 蓝色福利精品导航| 成人动漫在线观看视频| 黄色片在线免费看| 国产精品二三区| 国产真人做爰毛片视频直播| 日韩国产激情| 欧美一区二区三区婷婷月色| 制服丝袜第二页| 五月婷婷亚洲| 欧美亚洲午夜视频在线观看| 亚洲一卡二卡在线观看| 成人精品亚洲人成在线| 色综合久久久久久久久五月| 欧美极品少妇videossex| 日韩欧美精品网址| 青青草精品在线| 久久av影视| 欧美黄色www| 在线免费看av片| 北条麻妃国产九九精品视频| 神马影院午夜我不卡| h片在线观看视频免费免费| 在线观看成人免费视频| 日韩少妇一区二区| 亚洲不卡av不卡一区二区| 51精品在线观看| 性一交一乱一精一晶| 国产欧美日韩三区| 青青草精品视频在线| 羞羞视频在线观看一区二区| 精品丝袜一区二区三区| 国产亚洲精品av| 九九九久久久精品| 奇米精品在线| 日韩激情电影| 亚洲精品在线免费播放| 全网免费在线播放视频入口| 三级影片在线观看欧美日韩一区二区| 国产乱码精品一区二区三区卡| 日本在线免费看| 在线免费一区三区| 国精产品一区一区三区免费视频 | 欧美成人高清视频| 国产真人无遮挡作爱免费视频| 成人av网址在线| 国内精品国产三级国产99| 日本a人精品| 伊人av综合网| 99re热视频| 国产欧美日韩中文久久| 欧美精品色婷婷五月综合| 国产精品任我爽爆在线播放| 欧美成人一二三| 国产理论视频在线观看| 中文字幕日本乱码精品影院| 欧美三级理论片| 欧洲乱码伦视频免费| 清纯唯美日韩制服另类| 青青草在线免费视频| 日韩欧美在线视频日韩欧美在线视频| 少妇户外露出[11p]| 日韩天天综合| 蜜桃传媒一区二区| 亚洲欧美一区二区三区| 亚洲欧美www| 日韩国产成人在线| 国产目拍亚洲精品99久久精品| 欧美日韩在线成人| 成人一区不卡| 91精品美女在线| 成码无人av片在线观看网站| 日韩一区二区三区视频在线 | 一色道久久88加勒比一| 日韩精品成人一区二区在线| 日韩久久久久久久| 欧美日韩破处视频| 久久国产精品久久国产精品| 精品人妻伦一二三区久久| 亚洲午夜久久久久久久久电影网 | 欧美日韩国产在线看| 中文字幕一区二区三区人妻| 日韩成人一区二区| 一区二区精品视频| 试看120秒一区二区三区| 欧美激情一区二区三区成人| 三级视频在线| 欧美色图在线观看| 黄色一级大片在线免费观看| 国产a级毛片一区| 免费观看美女裸体网站| 精品国产一区二区三区噜噜噜| 国产在线观看不卡| 欧美xxxx做受欧美88bbw| 亚洲精品久久7777777| 日韩精品在线一区二区三区| 中文字幕中文字幕一区| av不卡中文字幕| 爽好久久久欧美精品| 天堂av在线中文| 三级小说欧洲区亚洲区| 国产精品综合不卡av| 超碰在线网站| 亚洲美女自拍视频| 国产三级伦理片| 日韩欧美高清在线视频| 日韩av手机在线免费观看| 成人国产在线观看| 日本在线观看免费视频| 国产主播精品| 婷婷亚洲婷婷综合色香五月| japanese色系久久精品| 国产精品久久中文| 97超碰在线免费| y97精品国产97久久久久久| 午夜美女福利视频| 欧美在线free| 日韩三级视频在线播放| 中文字幕中文在线不卡住| 国产毛片毛片毛片毛片毛片毛片| 麻豆成人91精品二区三区| 久久久久久免费看| 亚洲综合激情在线| 日韩视频在线观看国产| 国产伦精品一区二区三区免费优势| 国产精品久久久久久久久久三级 | 国产精品旅馆在线| 超碰激情在线| 久久国产精品影片| 国产精品四虎| 亚洲精品www| www久久久com| 欧美猛男男办公室激情| 波多野结衣电车| 好吊成人免视频| 精品人妻在线播放| 亚洲色图清纯唯美| 欧美丰满老妇熟乱xxxxyyy| av资源站一区| 亚洲精品第二页| 国产精品18久久久久久久久久久久| 亚洲老女人av| 丝袜美腿亚洲一区| 日韩精品一区二区三区色欲av| 亚洲精品国产日韩| 国产女教师bbwbbwbbw| 亚洲一区在线| 亚洲黄色网址在线观看| 水蜜桃久久夜色精品一区| 色一情一乱一伦一区二区三欧美| 精品成人影院| 欧美一区二区三区四区夜夜大片| 欧美激情影院| 精品蜜桃一区二区三区| 久久动漫网址| 国产尤物91| 丝袜美腿综合| 欧美性bbwbbwbbwhd| 深夜福利久久| 日本日本精品二区免费| 伊人成综合网yiren22| 麻豆亚洲一区| 国产一区二区三区四区| 午夜欧美性电影| 小小影院久久| 国产精品videossex国产高清 | 亚洲精品白浆高清| 蜜桃传媒视频第一区入口在线看| 亚洲精品进入| 日韩在线电影一区| 欧美wwwww| 久久久无码中文字幕久...| 你懂的国产精品| 久青草视频在线播放| 亚洲第一区色| 日韩福利视频在线| 久久精品久久综合| 成人免费黄色av| 成人av在线资源| 国产免费看av| 亚洲色图一区二区| 国产成人在线观看网站| 色哦色哦哦色天天综合| 中文字幕一区二区三区人妻四季 | 91成人影院| 国产av熟女一区二区三区 | 亚洲视频一二三四| 国产成人av电影在线播放| 91丨porny丨对白| 国产视频911| 国产97免费视频| 偷偷要91色婷婷| 免费黄色片视频| 欧美一级精品大片| 日韩a在线看| 日韩一区二区福利| 2019中文字幕在线电影免费 | 亚洲国产精品激情在线观看| 91高清免费观看| 亚洲成人动漫精品| 最新黄色网址在线观看| 精品伦理精品一区| 国产午夜在线观看| 九九九久久久久久| 新片速递亚洲合集欧美合集| 成人乱人伦精品视频在线观看| 老司机aⅴ在线精品导航| 先锋影音欧美| 亚洲高清自拍| 久久久精品高清| 99久久婷婷国产综合精品电影| 日韩一区二区三区四区视频| 精品免费在线视频| 国产日韩欧美一区二区东京热| 亚洲欧美日韩一区二区在线| av黄在线观看| 国产精品入口福利| 日本中文字幕在线一区| 一区二区三区一级片| 亚洲综合激情| 亚洲少妇一区二区三区| 中文字幕欧美一| 国产又粗又猛又爽又| 日韩电视剧在线观看免费网站| 国产福利视频在线观看| 国产精品草莓在线免费观看| 高潮按摩久久久久久av免费| 国产a级片免费看| 日韩福利视频导航| 精品国产人妻一区二区三区| 亚洲精选在线视频| 中文字幕在线观看欧美| 日韩精品免费在线| 国产三级伦理在线| 91九色视频导航| 残酷重口调教一区二区| 欧美综合在线观看视频| a在线播放不卡| xxxxxx国产| 精品久久五月天| 伊人手机在线| 亚洲一区二区三区久久 | 国产亚洲美州欧州综合国| 日韩久久久久久久久| 欧美zozozo| 丝袜美女在线观看| 亚洲一区二区三区777| 99久久婷婷这里只有精品| 国产一线二线三线在线观看| 91色porny| 日本一级一片免费视频| 精品国偷自产国产一区| 人交獸av完整版在线观看| 亚洲aⅴ日韩av电影在线观看| 日韩在线理论| 一道本在线免费视频| 国产精品国模大尺度视频| 在线观看毛片网站| xxxxx成人.com| 青青久久精品| 伊人再见免费在线观看高清版 | 免费一区视频| 人妻精品久久久久中文字幕| 色综合久久88色综合天天6| 欧美日韩免费做爰大片| 日本亚洲欧洲色| 欧美性感美女一区二区| 亚洲天堂2018av| 亚洲视频一二三区| 超碰在线观看av| 久久久这里只有精品视频| 久久这里只有精品一区二区| 自拍日韩亚洲一区在线| 久久亚区不卡日本| 特级西西444www大胆免费看| 在线观看日韩欧美| 爱情电影网av一区二区| av在线免费观看国产| 成人爱爱电影网址| 九九热在线免费观看| 亚洲小视频在线| 成人短视频软件网站大全app| 日本一级黄视频| 99视频一区二区三区| 久久久久久久久久成人| 中文字幕一区二区精品| 欧美片网站免费| 国产l精品国产亚洲区久久| 亚洲国产成人私人影院tom| 国产日韩欧美视频在线观看| 91精品国产高清久久久久久91| 要久久电视剧全集免费| 潘金莲激情呻吟欲求不满视频| 一区二区国产视频| 天堂网www中文在线| 国产日产久久高清欧美一区| 欧美日韩国产亚洲一区| 国产手机在线观看| 正在播放亚洲一区| 一区二区精品伦理...| 一区二区视频在线免费| 成人av影院在线| 一区二区三区在线免费观看视频| 欧美日韩aaaa| 欧美日韩国产免费观看视频| 亚洲女则毛耸耸bbw| 欧美午夜精品久久久久久超碰| 日韩精品亚洲人成在线观看| 欧美久久在线| 国产.精品.日韩.另类.中文.在线.播放| 中文字幕av影院| 欧美国产日本高清在线| 久久国产成人精品| 一本色道综合久久欧美日韩精品 | 性猛交xxxx|