精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多LLM協同作戰!清華等開源多智能體框架AgentVerse:合作打造Minecraft物品,還能訓練寶可夢

人工智能
一個值得注意的觀察是智能體的適應性和合作本能,例如,在最初的幾輪比賽中,當Alice努力淘汰皮革所需的三頭奶牛時,Bob輔助完成了指定的任務,他注意到了Alice面臨的困難,從而介入并提供幫助。

人類之所以能夠爬到地球的食物鏈頂端,甚至還能繼續探索外太空,除了個人的頭腦外,更離不開群體的協作力量。

對應到大型語言模型(LLM),雖然單個模型的能力已經非常強大,但想要完成更復雜的任務,或是提升任務的完成效率,還需要多個智能體之間的協作。

最近,受人類群體動力學(human group dynamics)的啟發,來自清華大學、北郵和騰訊的研究人員提出了一個多智能體框架AgentVerse,可以讓多個模型之間進行協作,并動態調整群體的組成,實現1+1>2的效果。

圖片圖片

論文鏈接:https://arxiv.org/pdf/2308.10848.pdf

開源鏈接:https://github.com/OpenBMB/AgentVerse

AgentVerse的主要特點包括三點:

1. 高效的環境搭建:框架中提供了多個基本構建模塊,只需要在配置文件中添加幾行代碼,即可輕松搭建多智能體環境,如LLM聊天室等,研究人員只需要關注實驗過程和結果分析即可。

2. 可定制的組件:多智能體環境被分為五個功能模塊,并定義各自的接口,用戶可以基于自己的需求重新定義不同模塊的功能。

3. 工具(插件)利用:支持BMTools中提供的工具。

實驗結果表明,該框架可以有效地部署多智能體群組,其性能優于單智能體,并且涌現了協作等社會行為。

AgentVerse框架

解決問題(Problem Solving)的過程是人類群體中一系列迭代階段,最初,該小組評估當前狀態和預期目標之間的差異,動態調整其組成以加強決策中的協作,隨后執行明智的行動。

為了增強自主多智能體群體實現其目標的有效性,我們模擬了一個人類群體的問題解決過程,提出了AGENTVERSE框架,該框架由四個關鍵階段組成:專家招募、協作決策、行動執行和評估。

圖片圖片

整個過程可以建模為馬爾可夫決策過程(MDP),表征為元組(S,a,T,R,G)。這包括自主代理和環境狀態空間S、解決方案和行動空間A、轉移函數T:S × A→S、獎勵函數R和目標空間G。

1. 專家招募(Expert Recruitment)

專家招募階段決定了多智能體群體的構成,是決定群體能力上限的重要模塊,已經有經驗證據表明,人類群體內部的多樣性引入了不同的觀點,從而提高了群體在不同任務中的表現。

也有研究結果表明,為自主智能體脂定一個特定角色,類似于招募專家組建團隊,可以提高運行效率。

不過,目前為智能體分配角色描述的方法主要依賴于人類直覺和先驗知識,需要基于任務理解進行手動分配,所以可擴展性仍然不明確,尤其是在面對多樣化且復雜的問題環境時。

鑒于此,AgentVerse采用自動化的方式來招募專家,目的是增強配置智能體的可擴展性。

對于給定的目標g∈G,特定的自主智能體Mr被指定為招聘者(recruiter),類似于人力資源經理;Mr 不依賴預定義的專家描述,而是根據當前目標g動態地生成一組專家描述。

然后根據不同的專家描述提示以及目標g,得到多個不同的智能體形成專家組M = Mr(g)

并且,多智能體群體的組成將根據評估階段的反饋進行動態調整,也使得框架能夠根據當前狀態(收到的獎勵)組建最有效的多智能體群體,以便在后續回合中做出更好的決策。

2. 協同決策

此階段主要是聚集專家智能體進行協同決策,研究人員選擇兩種經典的溝通結構來提升決策效率:

橫向溝通 ( Horizontal Communication)

圖片圖片

每個智能體(表示為mi∈M)積極共享并細化其決策,這種民主的溝通結構鼓勵智能體之間的相互理解和協作。

然后將智能體的集體意見結合起來,使用一個集成函數f來形成當前回合的群體決策。

在需要創造性想法或需要大量協調的場景中,例如頭腦風暴、咨詢或合作游戲等,橫向溝通可能是更好的選擇。

縱向溝通 (Vertical Communication)

縱向溝通的特點是職責分工,由一個智能體提出初始決策,其余的智能體充當評審人,對解決方案提供反饋;根據反饋,不斷完善決策,直到所有的評審智能體就解決方案達成共識,或者達到最大迭代次數。

圖片圖片

在需要針對特定目標迭代完善決策的場景中,例如軟件開發,垂直溝通是更好的選擇。

3. 行動執行(Action Execution)

在決策制定完畢后,智能體需要執行指定的動作,具體取決于實現方式,某些智能體可能會不執行任何操作,然后對環境狀態進行更新。

4. 評估(Evaluation)

評估對于下一輪專家組的構成調整和提升起到至關重要的作用,使用獎勵反饋機制評估當前狀態與期望目標之間的差距,并給出口頭反饋,解釋為什么當前狀態仍然不令人滿意并提供建設性建議,討論下一輪如何改進。

其中獎勵反饋機制可以由人工定義(人機協作循環),也可以由自動反饋模型定義,具體取決于實現方式。

如果確定尚未達到預期目標,則獎勵反饋循環回到初始階段,即專家招募;在下一輪專家招募階段會利用該反饋信號結合初始目標來調整專家組的構成,從而演化出更有效的多智能體群組,以供后續決策和行動執行。

實驗部分

為了證明AgentVerse能夠指導智能體群組高效地完成任務,研究人員對基準任務進行了定量實驗,并對更復雜和實際的應用進行了案例研究。

實驗設置

研究人員選擇了兩個語言模型作為底層支持:GPT-3.5-Turbo-0613和GPT-4-0613

在數據集和評估指標的選擇上,主要考察多智能體群組在四個方面的能力:

1. 對話(Conversation)能力

第一個數據集為對話(Dialogue)回復數據集FED,給定多輪聊天歷史記錄,智能體需要生成回復內容,使用GPT-4作為評估器,對模型生成的回復和人類編寫的回復進行評分,并報告模型的勝率。

第二個數據集為約束生成Commongen-Challenge,給定20個概念,智能體需要生成一個語義連貫且語法正確的段落,并且應當包含盡可能多的概念。

2、數學計算(Mathematical Calculation)能力

利用MGSM 的英語子集,包含小學級別數學問題,指標為正確答案的百分比。

3. 邏輯推理(Logical Reasoning)能力

利用BigBench的邏輯網格謎題(logic grid puzzle)任務,其中包含需要多步驟邏輯推理的邏輯問題,使用準確率指標。

4. 編碼(Coding)

利用代碼補全數據集Humaneval,使用Pass@1指標進行評估。

實驗結果

性能分析

單個智能體(Single)使用給定的提示直接生成答案,而用AgentVerse構建的多智能體群組(Multiple)以協作的方式解決問題。

圖片

從結果中可以看出,無論使用GPT-3.5-Turbo還是GPT-4,多智能體始終優于單智能體。

由于GPT-3.5-Turbo很難在邏輯網格謎題數據集上給出正確的推理結果,所以表中省略了相應的實驗結果。

協作決策分析

圖片圖片

與縱向溝通相比,水平溝無法促進數學計算任務 (MGSM) 上的多智能體群組有效決策,進一步分析可以發現,溝通架構對于塑造決策結果來說至關重要。

在橫向溝通中,智能體以順序的方式進行溝通,某個智能體可能會提出有缺陷的解決方案或質疑其他智能體的正確主張,其他智能體往往不會糾正錯誤,而是遵循錯誤的決策,導致性能低于單智能體。

而在縱向溝通中,其他智能體只需要提供反饋,雖然建議可能會存在缺陷,但大多數智能體有建設性的批評通常會緩解錯誤,從而使核心智能體可以保留準確的解決方案。

不過這也不意味著橫向溝通效率較低,只是說在需要精確答案的任務上,縱向溝通更合適;而在咨詢等需要不同解決方案的任務中,橫向溝通更合適。

案例研究:軟件開發

研究人員在文中設計了三個案例任務,下面以軟件開發為例

圖片圖片

任務描述

視頻游戲中往往會提供復雜的虛擬環境,可以有效測試智能體的能力邊界,研究人員以沙盒游戲《我的世界》(Minecraft)為實驗平臺,游戲的機制和大量可制作的物品集合要求智能體不僅要執行任務,還要計劃、協調和適應動態場景。

研究人員的目標是利用AgentVerse整合多個智能體來合作制作特定的物品,測試智能體在復雜的環境中共享知識、資源和協作的能力。

實驗分析

實驗中,要求三個智能體合作制作一個書架,其過程至少包含九個基本步驟,如收集木材和皮革等材料,制作書籍等中間物品,最后組裝書架。

圖片圖片

由于游戲中只有玩家一種身份,所以AgentVerse框架中的專家招募階段可以省略,直接通過提示指定模型扮演《我的世界》中經驗豐富的玩家即可。

智能體可以將制作書架的整體目標分解成正確的子任務,戰略性地分配并分發執行。

一個值得注意的觀察是智能體的適應性和合作本能,例如,在最初的幾輪比賽中,當Alice努力淘汰皮革所需的三頭奶牛時,Bob輔助完成了指定的任務,他注意到了Alice面臨的困難,從而介入并提供幫助。

類似的涌現行為非常關鍵,凸顯了智能體在面臨意想不到的挑戰時的健壯性和靈活性。

參考資料:

https://github.com/OpenBMB/AgentVerse

責任編輯:武曉燕 來源: 新智元
相關推薦

2009-09-21 16:06:48

2024-10-15 17:28:05

2025-11-10 04:15:00

2024-01-22 07:08:00

2023-05-04 15:53:34

強化學習開發

2021-07-22 15:25:14

開源技術 框架

2023-05-05 17:49:23

2024-10-12 12:30:18

2025-06-30 05:30:00

2025-01-22 15:17:43

2025-06-10 09:28:31

智能體開發工具

2025-11-04 08:43:00

智能體數據推理

2025-10-09 09:10:00

AI開源模型

2011-01-24 14:07:13

網秦云安全移動安全

2024-03-25 00:30:00

AI框架

2010-06-21 11:41:00

融合通信無線集群通信捷思銳

2025-09-11 13:46:59

2025-07-24 11:38:40

2025-04-25 02:30:00

機械臂大模型多模態

2023-04-14 13:58:17

代碼智能
點贊
收藏

51CTO技術棧公眾號

亚洲成a人片77777在线播放| 成人黄视频在线观看| 久久久久国产一区二区| 亚洲色图第三页| 久久撸在线视频| av免费看在线| 久久综合色婷婷| 国产主播欧美精品| 日本三级网站在线观看| 国产探花在线精品| 日韩精品综合一本久道在线视频| 亚洲精品久久久久久久蜜桃臀| 手机在线观看毛片| 美女网站色91| 91精品国产色综合| 天堂а√在线中文在线鲁大师| 亚洲不卡视频| 色综合色狠狠天天综合色| 中日韩在线视频| 天天干天天草天天射| 激情久久五月天| 欧洲成人免费视频| 欧美黄色免费看| 日本不卡免费一区| 日韩av一区在线观看| 日本中文字幕二区| 成人欧美大片| 亚洲一区二区三区爽爽爽爽爽| 日本一区免费在线观看| 性网爆门事件集合av| 欧美aaa在线| 4444欧美成人kkkk| 妺妺窝人体色www聚色窝仙踪| 国产中文精品久高清在线不| 日韩欧美国产午夜精品| 午夜精品在线免费观看| 538在线精品| 亚洲免费高清视频在线| 欧美日韩精品中文字幕一区二区| 日韩有码第一页| 国产大陆精品国产| 国产综合视频在线观看| 精品久久久久久久久久久久久久久久久久 | 蜜桃一区二区三区| 精品国产99国产精品| 中文字幕亚洲影院| 国外成人福利视频| 欧美亚洲动漫精品| 91视频免费版污| av在线日韩| 日本乱人伦一区| 国语对白做受xxxxx在线中国| 日韩另类在线| 亚洲综合色在线| 欧美a级免费视频| 3d玉蒲团在线观看| 一区二区视频在线| 激情小视频网站| 超碰在线97国产| 亚洲一区在线电影| av日韩一区二区三区| 欧美hdxxxxx| 亚洲国产中文字幕| 国产人妻777人伦精品hd| 黄色的视频在线观看| 亚洲一区二区三区四区的| 免费网站在线观看视频| 毛片在线不卡| 一区二区成人在线视频| 日韩欧美猛交xxxxx无码| 视频在线观看入口黄最新永久免费国产| 亚洲日本电影在线| 黄色a级片免费看| 牛牛精品一区二区| 色国产精品一区在线观看| 久久午夜夜伦鲁鲁一区二区| 国产福利亚洲| 日韩欧美一区中文| www.日本高清| 欧美亚洲国产激情| 免费91麻豆精品国产自产在线观看| 美女福利视频在线观看| 99国产精品久久久久久久| 欧美在线视频a| 亚洲天堂2021av| 国产精品一级在线| 久久99精品久久久久久水蜜桃| 国产一级片在线播放| 亚洲欧洲三级电影| 久久99久久久久久| 日韩欧美少妇| 欧美第一区第二区| 小早川怜子久久精品中文字幕| 成人av动漫在线观看| 欧美精品性视频| 日本熟女毛茸茸| 国产一区二区三区四区五区入口| 成人资源av| 国产在线一在线二| 亚洲精品视频自拍| 无码无遮挡又大又爽又黄的视频| 日韩第二十一页| 亚洲精品www久久久久久广东| 黄色片在线观看免费| 欧美日韩国产免费观看| 日韩美女免费线视频| 99国产精品一区二区三区| 不卡免费追剧大全电视剧网站| 日韩中文字幕一区| 97人人在线视频| 777亚洲妇女| 亚洲av综合一区二区| 欧美黄色一区| 国产精品爽爽爽| 人人妻人人澡人人爽精品日本 | 国产欧美在线一区二区| 99re热久久这里只有精品34| 五月天亚洲精品| 99精品视频国产| 国产日产精品_国产精品毛片| 欧美激情在线一区| 国产又粗又黄又爽的视频| 91免费在线看| 欧美日韩福利在线| 成人国产精品一区二区网站| 一道本无吗dⅴd在线播放一区| 精品午夜福利视频| 韩国视频一区二区| 手机看片福利永久国产日韩| 青青青免费在线视频| 欧美刺激午夜性久久久久久久| 性爱在线免费视频| 葵司免费一区二区三区四区五区| 国产日本一区二区三区| www国产在线观看| 欧美日韩国产综合一区二区| 久久只有这里有精品| 一区二区福利| 国产日韩精品一区观看| 青春草视频在线观看| 欧美一区二区三区精品| 永久免费看片视频教学| 日韩经典中文字幕一区| 免费在线国产精品| 制服丝袜专区在线| 亚洲精品999| 日本少妇激情舌吻| 97久久精品人人澡人人爽| 奇米777四色影视在线看| 国产亚洲高清一区| 久久成人这里只有精品| 一本色道久久综合精品婷婷| 国产精品看片你懂得| xx欧美撒尿嘘撒尿xx| 欧洲三级视频| 国产精品视频公开费视频| 国产高清免费在线播放| 欧美色图第一页| 影音先锋男人资源在线观看| 另类人妖一区二区av| 一区二区免费在线视频| 在线欧美激情| 欧美日韩国产成人高清视频| 亚洲av无码乱码在线观看性色| 亚洲综合网站在线观看| 日本一区二区在线免费观看| 国产亚洲亚洲| 亚洲 国产 日韩 综合一区| 美女网站视频一区| 精品国产一区久久久| 精品黑人一区二区三区在线观看 | 亚洲免费在线精品一区| 国产香蕉久久| 欧美日韩第一页| 亚洲欧美日韩免费| 欧美在线不卡一区| 少妇人妻丰满做爰xxx| 成人午夜激情在线| 99re在线视频免费观看| 成人女性视频| 风间由美一区二区三区| 擼擼色在线看观看免费| 亚洲无av在线中文字幕| 91好色先生tv| 亚洲h动漫在线| 国产免费无遮挡吸奶头视频| 麻豆国产欧美一区二区三区| 99热这里只有精品免费| 亚洲精华一区二区三区| 国产久一一精品| 大黄网站在线观看| 亚洲午夜激情免费视频| jlzzjlzzjlzz亚洲人| 天天操天天干天天综合网| 亚洲一二三精品| 国产98色在线|日韩| 欧美三级午夜理伦三级| 天天综合网91| 免费精品视频一区| 国产一区二区三区国产精品| 51ⅴ精品国产91久久久久久| www久久日com| 一本色道久久综合亚洲精品小说 | 成人影院网站| 欧美床上激情在线观看| 国产高清免费在线播放| 亚洲二区中文字幕| 国产又黄又大又爽| 91久久精品一区二区三| 九九久久免费视频| 国产精品欧美经典| 可以直接看的无码av| 国产伦理精品不卡| 制服丝袜综合网| 99热精品在线| 99久久99久久精品| 欧美aaaaaaaaaaaa| 欧美色图亚洲自拍| 久久精品国产亚洲5555| 91中文字幕一区| 成人黄色视屏网站| 欧美在线视频网站| av日韩国产| 欧美xxxx做受欧美| 日本中文字幕电影在线免费观看| 亚洲美女av网站| 少妇高潮一区二区三区99小说| 欧美另类变人与禽xxxxx| 亚洲天堂五月天| 日韩欧美成人区| 日本天堂在线视频| 亚洲一区二区三区美女| 日日噜噜夜夜狠狠久久波多野| 国产亚洲婷婷免费| 丰满圆润老女人hd| 2欧美一区二区三区在线观看视频| 欧美高清精品一区二区| 韩国v欧美v亚洲v日本v| 污版视频在线观看| 免费成人在线视频观看| 大香煮伊手机一区| 美女国产一区| 久久综合久久色| 老牛国产精品一区的观看方式| 免费黄色福利视频| 国产精品日本欧美一区二区三区| 久青草视频在线播放| 午夜精品视频| 欧美另类videosbestsex日本| 亚洲精品午夜av福利久久蜜桃| 福利网在线观看| 欧美日本精品| 日韩欧美精品免费| 国产农村妇女精品一二区| 欧美 日韩 亚洲 一区| 亚洲理伦在线| 国产亚洲天堂网| 日韩高清一级片| 国产三级国产精品国产专区50| 毛片一区二区三区| 亚洲怡红院在线| 国产sm精品调教视频网站| 国产女主播在线播放| 成人18精品视频| 粉嫩av蜜桃av蜜臀av| 国产亚洲精品精华液| 日韩不卡av在线| 18欧美乱大交hd1984| 欧美成人一区二区三区高清| 亚洲成精国产精品女| 国产午夜免费福利| 欧美午夜宅男影院| 国产女18毛片多18精品| 亚洲第一视频在线观看| 日本a一级在线免费播放| 国产午夜精品全部视频播放 | 欧美激情成人在线视频| 操人在线观看| 国产精品999| 精品中文视频| 免费日韩av电影| 91日韩在线| 激情小视频网站| 日本亚洲三级在线| 欧美人与性动交α欧美精品| 成人av网址在线| 四虎成人免费影院| 亚洲一区精品在线| 日本视频www色| 日韩欧美激情一区| 国产视频三级在线观看播放| 久久精品视频网站| 依依综合在线| 91视频国产高清| 日韩欧美中文字幕电影| 亚洲精品中文字幕乱码三区不卡| 欧美日韩国产综合网| 欧美日韩中文在线视频| 国产中文一区二区三区| 国产人妻黑人一区二区三区| 欧美激情在线一区二区三区| 久久婷婷一区二区| 精品视频在线看| 少妇精品视频一区二区| 久热精品视频在线| 亚州一区二区三区| 国产精品一区视频网站| 日韩精品免费一区二区在线观看| 国产av人人夜夜澡人人爽麻豆| 蜜臀99久久精品久久久久久软件| 性农村xxxxx小树林| 国产精品久久影院| 精品人妻一区二区三区潮喷在线 | 日本护士...精品国| 欧美成人一区二区三区电影| 精品肉辣文txt下载| 激情久久av| 欧美成人日韩| 日本美女视频一区| 国产三级一区二区| 亚洲另类欧美日韩| 精品国产一区久久| 最新黄网在线观看| 国产一区二区在线免费| 免费欧美一区| 日韩中文字幕在线视频观看| 国产精品1024| 黄色录像二级片| 欧美日韩一区在线| 黄色片在线播放| 国产69精品久久久久久| 国产精品丝袜在线播放| 激情六月天婷婷| 国产精品一区二区久久精品爱涩| 少妇一级黄色片| 欧洲一区二区三区免费视频| 同心难改在线观看| 91禁国产网站| 精品网站aaa| 欧美黑人经典片免费观看 | 欧美 日韩 国产 成人 在线观看 | 麻豆精品久久久久久久99蜜桃| 亚洲精品v欧美精品v日韩精品| 2021中文字幕在线| 国产区日韩欧美| 亚洲美女少妇无套啪啪呻吟| 2一3sex性hd| 欧美性猛交丰臀xxxxx网站| 无码精品人妻一区二区三区影院| 亚洲91精品在线| 嫩草国产精品入口| 六月丁香婷婷激情| 久久奇米777| 国产精品自拍第一页| 中文字幕9999| 精品入口麻豆88视频| 51xx午夜影福利| 国产91丝袜在线播放九色| 国产黄色片视频| 日韩精品久久久久久久玫瑰园| 性欧美18~19sex高清播放| 欧美激情www| 美女精品自拍一二三四| 久久av红桃一区二区禁漫| 欧美剧在线免费观看网站 | 中文字幕 91| 亚洲免费伊人电影| 国内爆初菊对白视频| 91国内免费在线视频| 色综合中文网| 91pony九色| 亚洲永久免费视频| 黄色软件在线| 91九色蝌蚪国产| 在线欧美三区| 熟女少妇内射日韩亚洲| 欧美日本高清视频在线观看| a黄色片在线观看| 精品在线一区| 蜜臀av性久久久久蜜臀aⅴ流畅 | 五月婷婷亚洲| 国产视频久久久久久| 欧美在线影院一区二区| 国产二区三区在线| 精品视频第一区| 久久国产夜色精品鲁鲁99| 麻豆国产尤物av尤物在线观看| 亚洲乱亚洲乱妇无码| 99久久99九九99九九九| 可以在线看的av网站| 国产精品天美传媒| 蜜桃视频在线观看www| 国产精品免费网站| 亚洲国产电影| 三级黄色片在线观看| 亚洲电影免费观看高清完整版在线观看| 韩日成人影院| www成人免费| 国产精品国产精品国产专区不蜜 | 国产亚洲一区精品|