精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MACT:如何用多Agent框架思路實現表格問答

發布于 2025-1-14 12:10
瀏覽
0收藏

1. 表格問答的現狀

表格問答(TQA,Table Question Answering)是指依據表格形式的數據來回答問題。表格問答任務的任務也越來越復雜,要解決這些復雜任務,就得執行多個推理步驟(多步驟)或者運用不同的推理策略(多類別)。。

處理 TQA 中這些復雜實例的一種常見方法是規劃,生成詳細的逐步計劃并引導推理過程。該方向有兩種方法:

? 針對開源大型語言模型(LLMs)進行微調,但微調需要高質量的數據,通常難以獲取

? 使用閉源的商業 LLMs,閉源商業 LLMs 成本高

為了解決以上問題,作者提出了一個結合工具使用的多智能體協作框架(MACT,Multi-Agent Collaboration with Tool)。既不依賴閉源 LLMs,也無需微調。

2. 什么是MACT?

MACT是一個為 TQA 配備了一組工具的多智能體協作框架。如下圖所示,包含了四個主要模塊:內存、規劃智能體、編碼智能體、工具集。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

MACT包括五個核心階段動作:動作生成、動作選擇、工具選擇/代碼創建、觀察計算以及內存狀態更新。

2.1 動作生成(Action Generation)

作者參考了ReAct方法,鑒于之前有研究表明生成動作時,一同生成想法能帶來性能的提升,所以作者采用了完整的ReAct方法:即想法、動作和觀察一起生成。

把一個動作定義為兩部分:意圖和指令。

例如,“檢索 [檢索法國和德國的出口數量]”。意圖是動作的目的,比如“檢索”就是從輸入表中提取信息。指令(用括號標記)詳細說明了意圖。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表展示了框架中定義的六種意圖類型及其對應的指令示例。

? 檢索:執行從表中提取信息的所有操作,包括直接查詢、過濾和分組。

? 計算:需要計算、計數或比較的指令則由“計算”來處理。

? 搜索:為了滿足表或文本上下文中不存在的外部(事實性)知識的需求,增加了“搜索”意圖。

? 讀取:涵蓋了表-文本問答中對上下文推理的需求,指的是從作為TQA實例提供的文本中提取信息的指令。

? 完成:規劃智能體停止生成更多動作,并結束迭代執行,提供相應的指令中的最終答案。

? 詢問:基于規劃智能體的內部知識來檢索答案.

2.2 動作選擇(Action Selection)

運用選擇函數從動作集合中挑選最有潛力的動作。選擇函數采用了自洽性(self-consistency),從采樣動作集合中輸出最頻繁的動作。若出現平局,則選擇最先采樣的那個最頻繁動作。

2.3 工具選擇與使用

為了滿足【搜索】、【計算】、【檢索】這些意圖,作者引入了一組工具:Wiki百科搜索工具、計算器工具、Python代碼工具。

? Wiki百科搜索工具:維基百科搜索API,接收指令中指定的目標實體,并返回相應維基百科條目的第一段。

? 計算器工具:由Python解釋器驅動,接受生成的公式,并輸出答案。“計算”的指令也可以是文本描述,比如“計算表中每個國家的平均獎牌數量”。

? Python代碼工具:【檢索】意圖由Python代碼工具完成,根據指令生成的Python代碼檢索表中的目標單元格,返回執行結果。

對于“讀取”“詢問”和“完成”,不使用工具。

3. 效果評估

對 MACT 在四個 TQA 基準上的性能與 SoTA TQA 系統進行了對比評估。

3.1 與其他TQA模型(框架)相比

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

如上圖所示,當GPT-3.5作為底層模型時,MACT超越了所有的TQA模型(除在 WTQ 上的 Mix-SC)。表明與單代理 TQA 模型相比,代理策略是有效的。

猜測MACT與 Mix-SC 之間的性能差距源于 Mix-SC 中特定于數據的表清理和答案格式控制。相比之下,MACT 不包含任何特定于數據集的預處理或后處理步驟,從而能普遍適用于任何數據集。

MACT 在各個數據集中都優于各種開源 LLM,證明了智能體的有效性。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表還給出了使用不同模型作為不同智能體部分的MACT的結果。

比如:MACT (Qw + CL)是指 Qwen 作為規劃代理,CodeLLaMA 作為編碼代理。

MACT (Qw + CL)比單獨使用 Qwen 和 CodeLLaMA 獲得了更高的 EM 分數,證明使用多個智能體進行規劃和編碼的有效性。

MACT (Qw + CL)在所有數據集中平均比 _SC(Qw + CL)高出約 6 個 EM 點,凸顯了我們的協作技術相對于簡單采用兩個獨立代理的最頻繁預測的優越性。我們還發現,擁有用于代碼生成的專家編碼代理(MACT (Qw + Qw)與 MACT (Qw + CL))顯著提高了性能。

3.2 與微調的TQA模型相比

MACT 在數據集之間的泛化能力優于微調的 TQA 系統。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表展示了與先前微調的 TQA 模型進行了比較。通常,微調模型在用于微調的數據集上的性能相當高,但在其他數據集上測試時 EM 會大幅下降。

相比之下,MACT 不使用微調模型,因此能夠應用于任何具有良好泛化性能的數據集。當使用 LlaMA-7b 作為規劃代理時,MACT 展現出了與 Protrix 相當的結果,盡管它未進行微調。使用更好的規劃代理會帶來更好的結果。這也體現了 MACT 在骨干模型方面的穩健性。

3.3 MACT調用LLM次數對比

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表展示了MACT與其他方法調用LLM次數對比。對于 Binder 和 Dater,無論問題復雜程度如何,SC 都執行固定次數。導致每個實例的提示數量很多,因而效率低下。

相比之下,MACT 在生成方面具有靈活性,因為迭代次數取決于問題的復雜性。例如,對于 WTQ,大多數問題可以在三步內解決,使得每個實例最多總共提示 25 次。如果結合效率優化模塊,這可能節省多達三分之一的迭代,每個實例的生成總數甚至更低(約 15 次),使 MACT 在效率方面與其他方法相當。MACT 的迭代性質可能導致更高的生成上限。然而,它也能處理更復雜的問題,使該方法更貼合現實生活的需求。

3.4 多智能體協作與工具使用的效果

通過三種情形展開消融研究,探究 MACT 中專業智能體和工具使用的有效性。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表結果表明,工具和編碼工具均對框架性能有所貢獻。然而,它們對最終性能的貢獻各異。

比如,去除搜索工具對結果幾乎無影響,而進一步去除編碼代理和 Python 解釋器時,性能大幅下降。或許是由于工具和編碼代理的使用頻率所致。

發現搜索工具幾乎未被使用,而編碼代理在幾乎每次查詢中都會被調用。可能由于維基百科是 LLM 常見的預訓練語料庫,多數信息可能已被編碼。不過,鑒于 LLM 已知會出現幻覺且編碼知識可能未及時更新,搜索工具仍可能有所幫助。

消融操作對 WTQ 和 TAT 的影響大于 CRT 和 SCITAB。可能歸因于數據集特征:CRT 包含眾多是非問題,SCITAB 由三元分類數據集轉換而來。因此,在諸如 WTQ 和 TAT 這類答案分布更豐富的數據集上,猜測正確最終答案的幾率高于前者。通過評估 CRT 中除是非答案之外的實例,發現當消融工具和編碼代理時,性能下降 8.23 。

3.5 錯誤分析

從每個數據集中隨機抽取 MACT 失敗的 50 個實例并進行錯誤分析。

? 約一半的錯誤源自編碼代理生成的無效或錯誤代碼。要么是未能理解指令從而生成錯誤代碼,要么因復雜的表數據類型導致代碼執行不成功。這表明表預處理的重要性。

? 第二種錯誤類型可歸因于評估。發現約三分之一的失敗源于嚴格的評估指標(精確匹配準確率)。這對 TAT 數據集上 MACT 的性能影響最大,因為其答案為長文本字符串。

? 其余錯誤情況在很大程度上可歸咎于規劃代理的失敗。意味著規劃代理未能正確分解問題。

4. 局限性

? 由于具備多表復雜推理的數據集稀缺,MACT 主要在單表設置下進行評估。雖然該框架通過在輸入中連接多個表能夠輕松擴展以處理多表情況,但在多表設置中的效果尚不明確。

? 僅在英語語境中研究 TQA,然而存在眾多多語言 TQA 基準和挑戰。

本文轉載自 ??大語言模型論文跟蹤??,作者:HuggingAGI

收藏
回復
舉報
回復
相關推薦
亚洲激情在线观看视频免费| 久久久久久久久久看片| 欧美日韩xxxxx| www国产视频| 偷拍精品精品一区二区三区| 亚洲色图视频网站| 麻豆久久久9性大片| 91在线观看喷潮| 国产精品视区| 美女福利精品视频| 永久免费毛片在线观看| 中文在线免费一区三区| 欧美午夜寂寞影院| 中文字幕无码精品亚洲资源网久久| 大乳在线免费观看| 不卡视频一二三| 成人夜晚看av| 日韩黄色片网站| 99国产精品久久久久久久成人热| 中文字幕av一区二区| 亚洲一级Av无码毛片久久精品| 外国电影一区二区| 欧美日韩国产影院| 欧美大片免费播放| 77777影视视频在线观看| 成人在线视频一区| 成人av.网址在线网站| 高清乱码免费看污| 夜夜嗨一区二区| 欧美另类在线播放| 夫妻性生活毛片| 日韩国产综合| 国产亚洲精品久久久久动| 日韩综合第一页| 日韩av综合| 欧美人伦禁忌dvd放荡欲情| 黄色一级大片在线观看| 三级中文字幕在线观看| 亚洲图片一区二区| 国产1区2区3区中文字幕| 国产美女福利在线| 18涩涩午夜精品.www| 亚洲精品国产精品久久| av中文在线| 中文字幕不卡在线观看| 日本一区二区三区视频在线观看| 日本福利片高清在线观看| 波多野结衣中文一区| 国产精品久久亚洲| 高h震动喷水双性1v1| 国产成人免费在线视频| 99国产超薄丝袜足j在线观看| 国产伦一区二区| 国产黑丝在线一区二区三区| 91九色蝌蚪成人| 不卡的日韩av| 成人精品国产福利| 国产一区二区三区四区五区在线| 亚洲黄色在线免费观看| 福利电影一区二区| 精品一区二区三区自拍图片区| 日本高清视频免费看| 99久久国产综合精品色伊| 久中文字幕一区| youjizz在线播放| 国产精品久久久久一区二区三区共| 亚洲欧美99| 国产福利视频在线| 亚洲已满18点击进入久久| 阿v天堂2018| 亚洲欧美一区二区三区| 在线观看成人免费视频| 最新天堂在线视频| 欧一区二区三区| 亚洲国产精品中文| 亚洲女优在线观看| 91精品国产自产拍在线观看蜜| 欧美国产日本在线| 成人免费毛片男人用品| 久草在线在线精品观看| 国产精品一区二区三区免费| 天堂av网在线| 精品一区在线| 在线播放日韩专区| 久久久久久久久久久网 | 97久久精品人人爽人人爽蜜臀| 蜜桃av噜噜一区二区三| 麻豆传媒视频在线| 精品久久久久久中文字幕大豆网| 天天天干夜夜夜操| 成人av动漫| 中文字幕欧美精品日韩中文字幕| 中文字幕av播放| 销魂美女一区二区三区视频在线| 国产剧情久久久久久| 狠狠人妻久久久久久综合麻豆| 久久久精品免费免费| www国产免费| 免费欧美电影| 欧美不卡一二三| 久久久精品成人| 亚洲国产网站| 成人在线小视频| 裸体xxxx视频在线| 一区二区三区免费观看| 成人免费xxxxx在线视频| 66精品视频在线观看| 在线午夜精品自拍| 亚洲日本视频在线观看| 国产精品综合av一区二区国产馆| 欧美福利精品| 国产极品人妖在线观看| 欧美亚洲图片小说| 亚洲天堂2024| 欧美国产三区| 成人深夜直播免费观看| 久草在线免费福利资源| 亚洲福利一二三区| 国产精品999.| 日韩欧美中文| 国产精品aaa| 欧美香蕉爽爽人人爽| 亚洲福利一二三区| 国内自拍偷拍视频| 欧美日韩国内| 成人免费看黄网站| a√在线中文网新版址在线| 色狠狠综合天天综合综合| 国产草草浮力影院| 伊人蜜桃色噜噜激情综合| 51精品国产人成在线观看| 里番在线观看网站| 欧美日韩精品高清| 国产精品成人在线视频| 蜜桃视频一区| 欧美日韩最好看的视频| av资源亚洲| 日韩久久免费电影| 欧美一区二区三区四| 99精品热视频| 97国产在线播放| 好吊妞国产欧美日韩免费观看网站| 欧美成人一区二区三区电影| 国产精品一区二区人人爽| 中文字幕一区二区视频| 日韩av在线中文| 国产精品国产三级国产在线观看 | 国产欧美日韩三区| 超碰在线人人爱| 久久亚洲成人| 成人欧美在线观看| 日本不卡影院| 日韩国产精品亚洲а∨天堂免| 中文字幕第15页| 久久久久久电影| 日韩av片网站| 亚洲乱码免费伦视频| 91视频免费在线| 精精国产xxxx视频在线中文版| 精品久久久久久无| 中文字幕亚洲精品一区| 久久久久99精品一区| 中文字幕第100页| 91精品一区国产高清在线gif| 91久久爱成人| 三级在线观看视频| 中文字幕日韩精品在线| www.精品视频| 欧美性精品220| 在线免费看视频| 国产久卡久卡久卡久卡视频精品| 97干在线视频| 精品精品久久| 91av一区二区三区| а√在线天堂官网| 中文字幕精品在线视频| 精品久久久久成人码免费动漫| 亚洲国产成人av网| 性猛交ⅹxxx富婆video | 99在线观看视频| 黑人极品ⅴideos精品欧美棵| 精品视频在线观看日韩| 一二区在线观看| 亚洲一区二区三区四区在线| 欧美图片一区二区| 国产精品综合av一区二区国产馆| 国产黄页在线观看| 97精品国产福利一区二区三区| 成人h视频在线观看| 一根才成人网| 欧美国产中文字幕| av免费在线一区二区三区| 精品久久久久久久人人人人传媒| 久久午夜鲁丝片| 亚洲高清免费观看| 亚洲一区电影在线观看| av日韩在线网站| 九九热精品国产| 久久久久欧美精品| 欧美激情亚洲天堂| 欧美偷拍自拍| 久久av一区二区| 久久九九精品视频| 国产精品美女无圣光视频| 国产丝袜在线播放| 精品国产一区二区在线| 四虎影视精品成人| 精品欧美一区二区在线观看| 中文字幕人妻丝袜乱一区三区| 香蕉影视欧美成人| 91视频免费在线看| 日韩理论片一区二区| 久久国产柳州莫菁门| 99re66热这里只有精品3直播| 在线a免费观看| 蜜臀av一级做a爰片久久| 免费av观看网址| 国内久久视频| 粉嫩av一区二区三区天美传媒 | 波多野结衣一二区| 亚洲成av人片一区二区| 草视频在线观看| 国产精品麻豆欧美日韩ww| 中文字幕av观看| www.一区二区| 中文字幕18页| 国产91丝袜在线播放九色| 免费黄频在线观看| 精品亚洲国内自在自线福利| 蜜臀视频一区二区三区| 久久午夜av| 成人羞羞国产免费网站| 久久精品30| 99色精品视频| 久久九九免费| 免费在线激情视频| 久久xxxx| 国产偷人视频免费| 天堂va蜜桃一区二区三区漫画版| 久久精品国产精品亚洲色婷婷| 夜久久久久久| 免费毛片小视频| 久久成人精品| 日本老熟妇毛茸茸| 男女性色大片免费观看一区二区| 黄色a级片免费| 日韩精彩视频在线观看| 国产精品igao| 免费精品视频最新在线| 无尽裸体动漫2d在线观看| 韩国三级电影一区二区| 亚洲成人手机在线观看| 成人午夜视频在线| 亚洲精品中文字幕在线播放| 久久午夜电影网| 老司机福利在线观看| 国产精品福利影院| 1024手机在线视频| 亚洲图片一区二区| 久草视频一区二区| 欧美日韩在线三区| jlzzjlzz亚洲女人18| 欧美mv日韩mv亚洲| 四虎精品在线| 日韩在线观看视频免费| 2020国产在线视频| 91国语精品自产拍在线观看性色| 婷婷综合六月| 亚洲一区二区免费在线| 欧美日韩一区二区三区四区不卡 | 国产在线91| 亚洲国产免费| 免费国产a级片| 一道本一区二区| 欧美一级裸体视频| 黑人巨大精品欧美一区| 日本wwwxx| 久久蜜桃av一区二区天堂| 亚洲天堂av中文字幕| 亚洲黄色免费网站| 可以免费在线观看的av| 欧美日韩一区二区三区在线| www.蜜臀av.com| 国产一区二区av| 免费在线中文字幕| 国产精品久久久av久久久| 麻豆精品久久| 日韩欧美三级一区二区| 午夜激情一区| www.xxx亚洲| 成人免费毛片片v| 国产精品高清无码在线观看| 亚洲色图在线播放| 国产精品国产三级国产专区52| 欧美日韩国产成人在线91| 欧美 日韩 国产 成人 在线| 自拍偷拍亚洲在线| 欧美xxxhd| 99国产盗摄| 久久综合av| 国产免费成人在线| 国产成人精品网址| 貂蝉被到爽流白浆在线观看| 精品久久中文字幕| 国产ts人妖调教重口男| 伊人成人开心激情综合网| 成全电影大全在线观看| 国产欧美日韩综合精品| 天堂俺去俺来也www久久婷婷 | 手机在线播放av| 欧美国产视频在线| 日韩在线播放中文字幕| 精品国一区二区三区| 国产原厂视频在线观看| 国产精品普通话| 美女久久99| 久久成人免费观看| 懂色av一区二区三区蜜臀| 国产精品视频看看| 欧美日韩美少妇| 国产在线视频网站| 青青久久aⅴ北条麻妃| 老司机成人在线| 国产成人综合av| 猫咪成人在线观看| 久久久久久免费看| 国产91精品在线观看| 中文字幕在线2021| 91.com视频| 毛片av在线| 91精品中文在线| 66视频精品| 亚洲色图偷拍视频| 亚洲欧美成人一区二区三区| 97超碰人人草| 在线观看亚洲视频| 91福利精品在线观看| 日韩欧美一区二区三区四区五区 | 99久久久久| 中文字幕中文在线| 综合欧美亚洲日本| 国产伦精品一区二区三区视频痴汉| 丝袜亚洲另类欧美重口| 久久麻豆视频| 男插女免费视频| 国产精品99久久久久久似苏梦涵| 欧美日韩在线观看免费| 日韩午夜精品电影| 黑人极品ⅴideos精品欧美棵| 国产精品久久亚洲7777| 亚洲毛片视频| 人妻少妇一区二区| 欧美综合天天夜夜久久| 在线观看免费版| 亚洲aⅴ日韩av电影在线观看 | 亚洲国产精品黑人久久久| 最近中文字幕av| 久久精品最新地址| av日韩精品| 欧美日韩亚洲一二三| 国产精品久久看| 亚洲黄色在线观看视频| 欧美在线视频观看| 日韩高清欧美| 午夜性福利视频| 无吗不卡中文字幕| 国产高清视频在线播放| 91青草视频久久| 在线播放一区| 极品蜜桃臀肥臀-x88av| 91精品国产91久久综合桃花| 91九色在线播放| 日韩国产高清一区| 国产精品18久久久久久久久久久久| 日本视频免费在线| 中日韩美女免费视频网址在线观看 | 91女主播在线观看| 91中文在线视频| 亚洲一区视频| 国产黄色小视频网站| 亚洲精品按摩视频| 黄页免费欧美| 成人精品视频在线播放| 日本一区二区三区高清不卡| 国产黄色av片| 国产精品高潮呻吟视频| 国内成人在线| 五月婷婷六月香| 亚洲精品wwwww| 二区三区精品| www.日日操| 亚洲国产成人tv| 美女免费久久| 欧美美乳视频网站在线观看| 国产美女一区二区三区| 日韩黄色片网站| 97免费视频在线| 欧美~级网站不卡| eeuss中文字幕| 亚洲免费伊人电影在线观看av|