精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

三個Agent頂個GPT-4,基于開源小模型的那種

人工智能 新聞
本文為基于開源小模型的多智能體協作打開了新思路,并在多個工具調用benchmark上取得了超過單模型Agent baseline,比肩GPT-4的工具調用結果。

真·“三個臭皮匠,頂個諸葛亮”——

基于開源小模型的三個Agent協作,比肩GPT-4的工具調用效果!

話不多說,直接來看兩個系統執行記錄。

用戶表示自己是一個音樂愛好者,想探索不同的音樂流派以及音樂家。于是指定模型使用Deezer和Shazam的API來搜尋一些音樂曲目以及相應藝術家信息。

之后“飾演”三個不同的角色的Agent分工協作,在兩步之內完成了任務

圖片

更難一點的,不指定工具,讓模型找一個最受歡迎的風景畫教程視頻以及上傳該視頻的頻道詳情。

在這種情況下,模型通常會遇到工具狀態變化,出現工具被下架或工具所需參數定義變化的問題。

圖片

然而使用上述方法,模型在第0步試圖使用video_for_simple_youtube_search來獲取視頻詳細信息,但發現這個API已經被破壞,無法調用。

因此飾演planner角色的Agent轉換思路,告訴飾演caller角色的Agent需要嘗試另外一個API,并最終通過嘗試新的API發現了詳細信息,解決了用戶的任務。

這就是中山大學、阿里通義實驗室聯合提出的一種基于開源小模型的多模型協作Agent框架——α-UMi

圖片

α-UMi通過微調多個開源小模型,實現協同作戰,在工具調用等數據集效果比肩GPT-4。

總的來說,相比于其他的基于閉源API框架,α-UMi的優勢有以下幾點:

  • 基于α-UMi多模型協同框架,通過三個小模型:planner、caller和summarizer分別負責路徑規劃、工具調用和總結回復,對小模型進行工作負荷的卸載。
  • 相比單模型Agent支持更靈活的prompt設計。其在ToolBench,ToolAlpaca corpus等多個benchmark上超過單模型Agent框架,獲得比肩GPT-4的性能。
  • 提出了一種“全局-局部”的多階段微調范式(GLPFT),該范式成功在開源小模型上訓練了多模型協作框架,實驗結果表明這種兩階段范式為目前探索出的最佳訓練多模型協作Agent范式,可以被廣泛應用。

多模型協作框架α-UMi長啥樣?

目前,基于大模型調用API、function和代碼解釋器的工具學習Agent,例如OpenAI code interpretor、AutoGPT等項目,在工業界和學術界均引起了廣泛關注。

在外部工具的加持下,大模型能夠自主完成例如網頁瀏覽、數據分析、地址導航等更復雜的任務,因此AI Agent也被譽為大模型落地的一個重要方向。

但上述一些主流項目主要基于閉源ChatGPT、GPT-4大模型,其本身在推理、步驟規劃、調用請求生成和總結回復等能力上已經足夠強。

相比之下開源小模型,由于模型容量和預訓練能力獲取的限制,單個模型無法在推理和規劃、工具調用、回復生成等任務上同時獲得比肩大模型等性能。

為了解決這一問題,本文研究人員提出了α-UMi。

α-UMi包含三個小模型planner、caller和summarizer

圖片

其中planner模型為系統的核心大腦,負責在某一Agent執行步驟內激活caller或summarizer,并給予對應的推理(rationale)指導;

而caller和summarizer則分別負責接收planner的指導完成該步后續工作,caller負責生成于工具交互的指令,summarizer負責總結最終的回復反饋給用戶。

這三個模型都是基于開源小模型進行不同類型數據微調實現的。

此外,研究人員提出了全局-局部多階段微調范式——GLPFT

基于開源小模型,實現多模型協作框架并非一件簡單的事,有兩個作用截然相反的影響因素:

一是生成Rationale,Action和Final Answer三個任務在訓練中可以相互促進的,同時也能增強模型對于Agent任務的全局理解。因此目前大部分工作均訓練單個模型同時生成rationale, action和final answer。

二是模型容量,不同任務的數據配比等也限制了我們很難訓練單個模型同時在三個任務上獲得表現峰值。

下圖中,單模型Agent在各項指標上達到峰值所需的數據量是不同的,很難找到一個在所有指標上達到峰值的數據量和模型檢查點。

而通過多模型協作,可以解決這個問題。

圖片

綜合考慮上述兩點,研究人員提出了一種“全局-局部”的多階段訓練方法,目標在于利用充分利用Rationale,Action和Final Answer在訓練中相互促進的優勢,獲得一個較好的單模型初始化,再進行多模型微調,專攻子任務性能的提升。

圖片

上圖展示了這種多階段微調的流程,在第一階段中,使用預訓練LLM在完成工具調用Agent任務上微調,獲得一個單模型的Agent LLM初始化。

接著,在第二階段中,研究人員對工具調用Agent任務的訓練數據進行重構,分解成生成rationale,生成工具交互action和生成最終回復三個子任務,并將第一階段訓練好的Single-LLM Agent底座復制三份,分別在不同子任務上進一步微調。

性能比肩GPT-4

靜態評估

圖片

在靜態評估中,本文將所有對比baseline的輸出結果與標注輸出進行對比,可以看到:

  • α-UMi系統表現顯著超過了ChatGPT和工具調用開源模型ToolLLaMA,性能與GPT-4比肩。

值得一提的是,ToolLLaMA需要8192的輸出長度以獲得令人滿意的結果,而α-UMi只需要4096的輸入長度,得益于多模型框架帶來的更靈活的prompt設計。

  • 在多模型協作框架模型的微調方案對比上,直接微調三個模型、或單個模型多任務微調均無法使多模型協作框架發揮效果,只有使用多階段微調GLPFT才能達到最佳性能,為后續多模型協同訓練打開了思路。

真實API調用評估

作者也在ToolBench數據集上引入了一種真實API調用的評估方式,實驗結果如下:

圖片

在真實API調用實驗結果中,α-UMi 依然戰勝了ChatGPT和ToolLLaMA,并在成功率上取得了與GPT-4比肩的結果。

模型開銷

看到這可能有人問了,多模型協作會不會引入更多成本?作者也探究了多模型協作框架在訓練、推理及儲存階段的開銷對比:

圖片

總體來說,多模型協作框架確實會在訓練和模型參數儲存上引入更高的開銷,但其推理速度與單模型框架相當。

當然,考慮到多模型協作Agent框架使用7B底座的性能遠超13B單模型Agent性能,總開銷也更少。這意味著可以選擇小模型為底座的多模型協作Agent框架來降低開銷,并超過大模型的單模型Agent框架。

最后研究人員總結道,多智能體協作是未來智能體發展的趨勢,而如何訓練提升開源小模型的多智能體協作能力,是實際落地很關鍵的一環,本文為基于開源小模型的多智能體協作打開了新思路,并在多個工具調用benchmark上取得了超過單模型Agent baseline,比肩GPT-4的工具調用結果。

后續將會增強planner的泛化性,使其使用于更廣泛的Agent任務場景,進行caller模型的本地私有化,使其專注于本地工具調用任務,以及云端大模型結合本地小模型的“大-小”模型協同框架。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-04-25 16:56:14

GPT-4大模型人工智能

2023-03-28 08:23:38

2023-06-19 08:19:50

2024-01-12 19:07:26

GPT-4AI產品

2023-04-09 16:17:05

ChatGPT人工智能

2023-06-08 11:27:10

模型AI

2023-12-26 08:17:23

微軟GPT-4

2025-04-16 09:35:03

2024-01-18 11:45:35

視覺模型蘋果

2023-05-29 09:29:52

GPT-4語言模型

2023-04-04 09:09:10

GPT-4編程程序員

2024-03-27 09:12:52

自動化智能體

2025-05-30 07:40:56

2023-09-11 15:57:16

人工智能模型GPT-4

2023-08-17 08:00:00

2023-05-22 08:30:35

GPT-4智能編程助手

2022-05-20 10:43:30

AI模型

2023-03-13 00:17:15

GPT-4模型API

2024-02-01 14:56:13

GPT-4開源模型

2024-01-16 12:31:13

OpenAIGLM-4大模型
點贊
收藏

51CTO技術棧公眾號

亚洲精品自在久久| 亚洲人成网站精品片在线观看| 久久99热这里只有精品国产| 精人妻一区二区三区| 久久sese| 亚洲精品成人悠悠色影视| 麻豆av一区二区三区| 夜夜嗨aⅴ一区二区三区| 国产精品mv在线观看| 日韩精品在线免费播放| 国产精品视频中文字幕| 国产黄大片在线观看| 国产精品欧美经典| 久久大片网站| av综合在线观看| 三级影片在线观看欧美日韩一区二区| 久久精品一区中文字幕| 狠狠人妻久久久久久综合蜜桃| 天天综合91| 高跟丝袜一区二区三区| 992tv成人免费观看| 欧美捆绑视频| 成人免费观看视频| 91免费视频国产| 在线观看日本网站| 在线观看日韩av电影| 视频一区视频二区国产精品 | 日韩视频免费直播| 国产一级特黄a大片免费| 爱情岛亚洲播放路线| 18欧美亚洲精品| 色狠狠久久av五月综合|| 三级小视频在线观看| 国产一本一道久久香蕉| 国产精品久久久久久av下载红粉| 国产成人一区二区三区影院在线| 亚洲国产精品91| 中日韩美女免费视频网址在线观看 | sm在线观看| 亚洲资源中文字幕| 日本精品福利视频| 1769免费视频在线观看| 中文字幕亚洲区| 亚洲高清视频一区| 国产区av在线| 中文字幕乱码久久午夜不卡| 欧美日韩电影一区二区| 色av男人的天堂免费在线| av在线不卡免费看| 国产精品伊人日日| 日本国产在线观看| 成人动漫在线一区| 国产有色视频色综合| 粉嫩小泬无遮挡久久久久久| 国产精品香蕉一区二区三区| 91精品国产91久久久久青草| aaa级黄色片| 国产高清精品网站| 国产精品二区三区四区| 亚洲黄色小说网址| 成人一道本在线| 国严精品久久久久久亚洲影视| 人妻少妇精品无码专区久久| 波多野结衣中文字幕一区| 国产欧美一区二区视频| 午夜视频福利在线| 久久一区二区视频| 视频一区二区在线观看| 日本最新在线视频| 怡红院av一区二区三区| 隔壁人妻偷人bd中字| 国产中文在线播放| 色欧美片视频在线观看在线视频| 午夜视频在线瓜伦| 国产精品中文| 亚洲精品一区二区三区四区高清| 欧亚乱熟女一区二区在线| 妖精视频一区二区三区| 最好看的2019的中文字幕视频| 亚洲一区电影在线观看| 欧美喷水视频| 欧美亚洲国产日本| 91成人国产综合久久精品| 国产精品亚洲一区二区三区在线 | 日韩久久综合| 欧美成人一区二区三区电影| 日韩成年人视频| 奇米影视7777精品一区二区| 亚洲在线第一页| 天天干,夜夜操| 国产精品卡一卡二| 日本一本中文字幕| 欧美成a人片免费观看久久五月天| 欧美精品第一页| 北岛玲一区二区| 99久久精品网站| 欧美在线播放视频| 91精品国产乱码久久久| 99国产精品视频免费观看| 亚洲不卡1区| 国产不卡123| 7799精品视频| 蜜桃无码一区二区三区| 欧美日韩 国产精品| 国产精品嫩草影院久久久| 精品人妻一区二区三区三区四区| 91麻豆国产在线观看| 精品日韩在线播放| 深夜成人影院| 亚洲福利在线观看| 青花影视在线观看免费高清| 国产精品久久777777毛茸茸| 亚洲自拍偷拍网址| 免费在线国产| 亚洲午夜视频在线| 久久久久xxxx| 亚洲欧美综合一区二区| 欧美sss在线视频| 日韩中文字幕在线| 羞羞影院体验区| 国产成人在线网站| 一区二区在线观看网站| 惠美惠精品网| 亚洲白拍色综合图区| 中文字幕五月天| 麻豆一区二区99久久久久| 欧美一级二级三级九九九| 波多野结衣在线播放| 欧美一区二区美女| 国产67194| 狠狠色伊人亚洲综合成人| 欧洲亚洲一区二区三区四区五区| a国产在线视频| 精品人伦一区二区色婷婷| 亚洲视频重口味| 麻豆精品久久久| 色吧亚洲视频| 99蜜月精品久久91| 这里只有精品在线播放| 日本成人一级片| 日本一区二区高清| 中文字幕永久视频| 青青草成人影院| 日本乱人伦a精品| 国产黄在线观看免费观看不卡| 欧美日韩一区二区三区| 麻豆免费在线观看视频| 欧美日韩视频一区二区三区| 99久久精品免费看国产四区| 91香蕉在线观看| 精品奇米国产一区二区三区| 国产黄色片视频| www.成人网.com| 日韩av黄色网址| 国产精品探花在线观看| 日韩av成人在线观看| 国产精品一级伦理| 欧美日韩一区二区在线观看视频| 国产精品麻豆免费版现看视频| 另类成人小视频在线| 三年中文高清在线观看第6集| 欧美一级做a| 欧美成人精品不卡视频在线观看| 性一交一乱一色一视频麻豆| 午夜视频一区二区三区| 亚洲午夜久久久久久久久红桃| 久久激情一区| 亚洲v国产v在线观看| 欧美经典一区| 91黑丝高跟在线| 黄色av网址在线免费观看| 欧美日高清视频| 欧美人与禽zozzo禽性配| va亚洲va日韩不卡在线观看| 黄色片久久久久| 91精品99| 九色91在线视频| 欧美亚洲人成在线| 国内精品久久久| 国产精品麻豆一区二区三区| 91精品国产综合久久久久久| 久久久久久久99| 中文字幕不卡在线观看| 乳色吐息在线观看| 久久精品综合| 日本三级中文字幕在线观看| 国产一区二区在线视频你懂的| 国产91对白在线播放| 日本天堂在线观看| 亚洲第一区中文字幕| 一级特黄免费视频| 亚洲影视资源网| 黄色片在线观看免费| 国产91富婆露脸刺激对白| 成年人观看网站| 综合一区在线| 日韩国产精品一区二区| www.神马久久| 成人福利网站在线观看11| 色在线视频观看| 欧美成人高清视频| 成人jjav| 日韩精品中文字幕久久臀| 99精品在线看| 日本道色综合久久| 日韩成人av毛片| 亚洲免费毛片网站| 大胸美女被爆操| 久久综合视频网| 一二三区视频在线观看| 麻豆91精品视频| av网址在线观看免费| 欧美日韩成人| 少妇熟女一区二区| 欧美美女视频| 久久青青草综合| 高潮按摩久久久久久av免费| 91久久国产精品| 日本黄色一区| 日本久久久久久久久| 九色porny自拍视频在线播放| 欧美精品一区三区| 嫩草在线视频| 中文字幕最新精品| 精品无人乱码| 亚洲精品一区二区三区婷婷月| 国产 欧美 精品| 欧美一区二区三区婷婷月色 | 久久国产精品久久久久久电车| 欧美做受777cos| 在线免费观看日本欧美爱情大片| 日本一区二区三区视频免费看| 日韩av影院| 国产一区免费在线| 精品久久ai| 狠狠色伊人亚洲综合网站色| 亚洲性视频在线| 91嫩草视频在线观看| 国产精品久久久久久久久久久久久久久| 国产精品爱啪在线线免费观看| 亚洲性受xxx喷奶水| 91国产美女视频| 欧美另类老肥妇| 欧美一性一乱一交一视频| 国产夫妻在线播放| 欧美亚洲国产视频| 芒果视频成人app| 日韩av色在线| 78精品国产综合久久香蕉| 热久久视久久精品18亚洲精品| 在线免费三级电影网站| 欧美一级黄色网| 欧美男男tv网站在线播放| 91极品视频在线| 美女福利一区二区| 国产精品久久久久久久久久久久久久 | 亚洲成人一区在线| 日本亚洲色大成网站www久久| 午夜国产不卡在线观看视频| 四虎精品永久在线| 在线观看免费一区| 国产又黄又粗又硬| 日韩欧美一区在线观看| 日韩一区免费视频| 亚洲九九九在线观看| jizz在线观看视频| 久久久91精品国产| free性m.freesex欧美| 欧美一区二区三区免费观看| 欧美成人精品三级网站| 成人黄色av播放免费| 亚洲码欧美码一区二区三区| 国产视频精品网| 久久97视频| 欧美日韩视频免费在线观看| 亚洲区第一页| 日日躁夜夜躁aaaabbbb| 国产不卡一区视频| 受虐m奴xxx在线观看| 国产精品国产三级国产aⅴ无密码| 精品国产精品国产精品| 欧美性69xxxx肥| 亚洲在线观看av| 亚洲国产天堂网精品网站| aⅴ在线视频男人的天堂 | 久久久精品视频免费| 色婷婷综合久久久中文一区二区| 亚洲天堂狠狠干| 亚洲а∨天堂久久精品9966 | 欧美日韩一区二区三区四区不卡 | 好吊日免费视频| 亚洲欧美综合色| 国产精品500部| 欧美精品久久久久久久多人混战 | 人妻一区二区三区| 中文字幕精品av| 9765激情中文在线| 国产日韩欧美在线播放| 美女av一区| 在线观看日本一区| 久久不射2019中文字幕| 91网址在线观看精品| 国产欧美一二三区| 日韩和一区二区| 91精品国产综合久久蜜臀| 欧洲天堂在线观看| 欧美激情精品久久久久久变态| av亚洲一区二区三区| 国内一区二区在线视频观看 | 欧美在线观看成人| 国产精品一卡二| 精品少妇一区二区三区密爱| 欧美日韩午夜视频在线观看| 国产av无码专区亚洲av麻豆| 亚洲最新av网址| 精品极品在线| 国产厕所精品在线观看| 国产精品久久天天影视| 久久久久国产精品熟女影院| 99久久99久久久精品齐齐| 91porn在线视频| 制服丝袜日韩国产| 国产黄色片在线观看| 国产91成人在在线播放| 久久香蕉精品香蕉| www插插插无码免费视频网站| 久久成人免费电影| 久久久久久成人网| 在线视频国内自拍亚洲视频| 天天综合网在线| 国内精品小视频在线观看| 91精品入口| 成人黄色片免费| 国产高清视频一区| 欧美日韩精品一区二区三区视频播放| 在线播放亚洲一区| 欧美极品视频| 91青草视频久久| 一区二区免费不卡在线| 久久精品一卡二卡| 一区二区在线观看免费| www.桃色av嫩草.com| 欧美日韩国产成人高清视频| 日韩视频1区| 成年人深夜视频| 成人妖精视频yjsp地址| 精品一级少妇久久久久久久| 亚洲精品在线观看视频| www中文字幕在线观看| 国内成+人亚洲| 久久久久久久波多野高潮日日| 久久久久久亚洲中文字幕无码| 色8久久精品久久久久久蜜 | 欧美大奶子在线| 亚洲综合影院| 国产精品国产亚洲精品看不卡| 99riav久久精品riav| 99久久精品国产亚洲| 亚洲午夜av久久乱码| 一区二区三区黄色片| 欧美不卡一区| 好吊妞无缓冲视频观看| 久久一留热品黄| 中文字幕人妻色偷偷久久| 色偷偷88888欧美精品久久久 | 超碰在线影院| 91精品国产综合久久香蕉最新版 | 91大神xh98hx在线播放| 国产欧美一区二区| 一区二区日韩欧美| 国产精品无码一区二区三| 日韩欧美在线看| 免费在线看黄| 国产精品视频一区二区三区经| 亚洲综合另类| 国产精品suv一区二区88| 日韩女优视频免费观看| 亚洲欧美韩国| 一区二区三区视频| 不卡视频在线观看| av首页在线观看| 欧美激情亚洲一区| 国产精品羞羞答答在线观看| 男男受被啪到高潮自述| 欧美午夜激情小视频| 免费a级毛片在线播放| 国产专区一区二区三区| 日韩avvvv在线播放| 精品无码人妻一区二区三区品| 亚洲欧洲免费视频| 欧美日韩午夜电影网| 黄色一级一级片| 亚洲黄色小视频| 精品久久久久一区二区三区| 亚洲自拍av在线| 日本欧美大码aⅴ在线播放| 久久精品免费av| www.欧美精品一二三区| 日韩成人动漫在线观看| www.桃色.com|