精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AgentAuditor:讓智能體安全評估器的精確度達到人類水平

人工智能 新聞
來自紐約大學、南洋理工大學、伊利諾伊大學香檳分校、KTH 皇家理工學院、悉尼大學、新加坡國立大學的研究者們,推出?AgentAuditor—— 一個通用、免訓練、具備記憶增強推理能力的框架,讓 LLM 評估器達到了人類專家的評估水平,精準識別智能體的安全風險。

LLM 智能體(LLM Agent)正從 “紙上談兵” 的文本生成器,進化為能自主決策、執行復雜任務的 “行動派”。它們可以使用工具、實時與環境互動,向著通用人工智能(AGI)大步邁進。然而,這份 “自主權” 也帶來了新的問題:智能體在自主交互中,是否安全?

研究者們為這一問題提出了許多基準(benchmark),嘗試評估現有智能體的安全性。然而,這些基準卻面臨著一個共同的問題:沒有足夠有效、精準的評估器(evaluator)。傳統的 LLM 安全評估在單純的評估生成內容上表現優異,但對智能體的復雜的環境交互和決策過程卻 “鞭長莫及”。現有的智能體評估方法,無論是基于規則還是依賴大模型,都面臨著 “看不懂”、“看不全”、“看不準” 的困境:難以捕捉微妙風險、忽略小問題累積、對模糊規則感到困惑。基于規則的評估方法往往僅依靠環境中某個變量的變化來判斷是否安全,難以正確識別智能體在交互過程中引入的微妙風險;而基于大模型的評估方法,無論使用最為強大的通用大模型還是專門為安全判斷任務微調的專用模型,在精確度上均不如人意。

為了解決這一難題,來自紐約大學、南洋理工大學、伊利諾伊大學香檳分校、KTH 皇家理工學院、悉尼大學、新加坡國立大學的研究者們,推出 AgentAuditor—— 一個通用、免訓練、具備記憶增強推理能力的框架,讓 LLM 評估器達到了人類專家的評估水平,精準識別智能體的安全風險。

圖片

  • 論文題目:AgentAuditor: Human-Level Safety and Security Evaluation for LLM Agents
  • 論文鏈接: https://arxiv.org/abs/2506.00641
  • 代碼 / 項目主頁:https://github.com/Astarojth/AgentAuditor-ASSEBench

方法概覽:AgentAuditor 如何解決精確度難題

AgentAuditor 將結構化記憶和 RAG(檢索強化推理)結合在一起,賦予了 LLM 評估器類似人類的學習和理解復雜的交互記錄的能力,最終極大地增強了 LLM 評估器的性能。它通過三個關鍵階段實現:

  • 特征記憶構建 (Feature Memory Construction): 將原始、雜亂的智能體交互記錄,轉化為結構化、向量化的 “經驗數據庫”。這里不僅有交互內容,更有場景、風險類型、智能體行為模式等深度語義信息。
  • 推理記憶構建 (Reasoning Memory Construction): 從特征記憶中篩選出最具代表性的 “案例”,并由 LLM(AgentAuditor 內部使用的同一個 LLM,確保自洽性)生成高質量的思維鏈(CoT)推理過程。這些 CoT 就像人類專家的 “判案經驗”,為后續評估提供指導。
  • 記憶增強推理 (Memory-Augmented Reasoning): 面對新的智能體交互案例,AgentAuditor 通過多階段、上下文感知的檢索機制,從推理記憶中動態調取最相關的 “判案經驗”(CoT),輔助 LLM 評估器做出更精準、更魯棒的判斷。

圖片

數據集:ASSEBench 的構建 

為了全面驗證 AgentAuditor 的實力,并填補智能體安全(Safety)與安全(Security)評估基準的空白,研究團隊還精心打造了 ASSEBench (Agent Safety & Security Evaluator Benchmark)。這一基準:

  • 規模宏大: 包含 4 個子集,共 2293 條精心標注的真實智能體交互記錄。
  • 覆蓋廣泛: 涵蓋 15 種風險類型、528 個交互環境、橫跨 29 個應用場景以及 26 種智能體行為模式。
  • 標注精細: 采用創新的人機協同標注流程,并對模糊風險情況引入 “嚴格” 和 “寬松” 兩種判斷標準,評估更細致。
  • 雙管齊下: 同時關注智能體的 “Safety”(避免無意犯錯)和 “Security”(抵御惡意攻擊)兩大方面。

圖片

實驗效果:AgentAuditor 讓 LLM 評估器的精確度達到人類水平

在 ASSEBench 及 R-Judge 等多個基準上的廣泛實驗表明:

  • 普遍提升顯著: AgentAuditor 能顯著提升各種 LLM 評估器在所有數據集上的表現。例如,Gemini-2-Flash-Thinking 在 ASSEBench-Safety 上的 F1 分數提升了高達 48.2%!
  • 直逼人類水平: 搭載 AgentAuditor 的 Gemini-2-Flash-Thinking 在多個數據集上取得了 SOTA 成績,其評估準確率(如在 R-Judge 上達到 96.1% Acc)已接近甚至超越單個人類標注員的平均水平。
  • 強大的自適應能力: 面對 ASSEBench-Strict 和 ASSEBench-Lenient 這兩個針對模糊場景設計的不同標準子集,AgentAuditor 能自適應調整其推理策略,顯著縮小不同模型在不同標準下的性能差距。

圖片

上圖分別展示了 AgentAuditor 與現有方法及人類評估水平的對比。左圖比較了 AgentAuditor 與直接使用 LLM 的評估方法在 R-Judge 基準上的準確率(Acc)和 F1 分數;右圖則比較了 AgentAuditor 的準確率與在無討論情況下單個人類評估者在多個benchmark中的的平均準確率。

AgentAuditor 的核心貢獻

  • 系統性分析挑戰: 深入剖析了當前自動化評估 Agent 安全面臨的核心難題。
  • 創新框架: 通過自適應代表性樣本選擇、結構化記憶、RAG 和自動生成 CoT,顯著增強 LLM 評估能力。
  • 首個專用基準: ASSEBench 填補了領域空白,為人機協同標注提供了新范式。
  • 人類級表現: 實驗證明其評估準確性和可靠性已達到專業人類水準。

結語

AgentAuditor 和 ASSEBench 的提出,為構建更值得信賴的 LLM 智能體提供了強有力的評估工具和研究基礎。這項工作不僅推動了 LLM 評估器的發展,也為未來構建更安全、更可靠的智能體防御系統指明了方向。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-18 15:20:00

2025-07-15 04:00:00

AI智能體人工智能

2010-04-06 13:58:33

2020-12-28 08:26:51

Python機器學習數據集

2009-08-17 22:52:41

IT運維管理Mocha ITOM工摩卡

2024-04-29 09:16:33

2023-03-27 14:33:50

ChatGPT

2021-10-16 07:02:53

人工智能心理健康AI

2024-07-24 11:36:02

2024-11-08 15:10:00

模型智能體

2015-10-21 13:48:12

機器學習干貨數據

2022-06-21 14:08:25

AIGitHub模仿人類

2021-03-31 10:15:27

人工智能美國技術

2024-07-25 12:31:06

2014-01-17 15:31:43

智能數據中心PDU

2023-08-15 14:18:19

智能研究

2022-07-26 14:05:58

人工智能人機交互心智

2025-03-13 10:09:48

2022-07-04 13:43:18

AI游戲人工智能
點贊
收藏

51CTO技術棧公眾號

国产一区二区三区黄片| 久久久久久久久久久久久久国产| 97caocao| 黄色成人91| 亚洲婷婷在线视频| 亚洲视频在线免费观看| 五月婷婷深爱五月| 久热国产在线| 成年人午夜久久久| 国产成人精品999| 国产高清视频免费在线观看| 超碰在线成人| 欧美日韩免费观看一区三区| 欧美久久久久久久久久久久久久| 婷婷伊人综合中文字幕| 久久99国产精品久久99大师| 色悠久久久久综合欧美99| 亚洲欧美日本国产有色| 国产成人在线免费观看视频| 国产在线观看91一区二区三区| 欧美精品vⅰdeose4hd| 欧美日韩不卡在线视频| 欧美jizz18hd性欧美| 亚洲综合99| 精品播放一区二区| 无码内射中文字幕岛国片| 伊人手机在线| 国产精品不卡一区| 久久av一区二区三区漫画| av网站免费大全| 日本伊人午夜精品| 2019亚洲日韩新视频| 美女福利视频在线观看| 精品一区二区三区亚洲| 91久久精品国产91性色tv| 久久99久久久久久| 免费在线你懂的| 国产三级欧美三级| 农村寡妇一区二区三区| 亚洲另类欧美日韩| 你懂的视频一区二区| 最近中文字幕mv在线一区二区三区四区 | 午夜一区二区视频| 欧美××××黑人××性爽| 亚洲国产一区二区在线播放| 男人草女人视频| 日韩子在线观看| 欧美激情一区二区三区全黄| 蜜桃av色综合| 亚洲 欧美 激情 小说 另类| 成人在线综合网| 99三级在线| 亚洲精品97久久中文字幕无码| 激情久久五月天| 国产日韩换脸av一区在线观看| 国产精品午夜影院| 亚洲美女黄色| 5566成人精品视频免费| 国产三级av片| 亚洲综合国产| 日产精品久久久一区二区福利 | 欧美性生活久久| 一级黄色香蕉视频| 巨胸喷奶水www久久久免费动漫| 国产亚洲一区字幕| 日韩精品不卡| 在线观看免费网站黄| 欧美韩日一区二区三区| 亚洲国产欧美日韩| 毛片网站在线免费观看| 亚洲免费毛片网站| 免费视频爱爱太爽了| 91www在线| 欧美日韩国产一中文字不卡 | 久久狠狠婷婷| 日韩小视频在线| 中文字幕美女视频| 综合精品一区| 在线观看成人黄色| 国产一二三av| 欧美精品97| 91chinesevideo永久地址| 国产精品一区无码| 久久精品国产在热久久| 亚洲一区中文字幕| 天堂av一区二区三区| 久久精品一级爱片| 亚洲第一精品区| 超黄网站在线观看| 在线观看亚洲精品视频| 国产高清av片| 果冻天美麻豆一区二区国产| 亚洲精品在线视频| 黄色精品视频在线观看| 亚洲国产mv| 国产精品海角社区在线观看| 国内精品国产成人国产三级| 2020国产成人综合网| 亚洲欧洲另类精品久久综合| wwwww亚洲| 精品婷婷伊人一区三区三| 免费黄色av网址| 成人3d动漫在线观看| 欧美大片免费看| 国产suv精品一区二区33| 国产美女视频一区| 任我爽在线视频精品一| 亚洲奶水xxxx哺乳期| 欧洲色大大久久| 国产综合内射日韩久| blacked蜜桃精品一区| 欧美黄色www| 黄色一区二区视频| 99久久国产综合精品麻豆| 中文字幕av导航| 婷婷激情一区| 亚洲成人激情视频| 亚洲欧美精品aaaaaa片| 日日摸夜夜添夜夜添国产精品| 18成人在线| yw193.com尤物在线| 精品国产鲁一鲁一区二区张丽| 岛国毛片在线播放| 中文字幕av一区二区三区人| 日韩电影中文字幕在线| 欧美老熟妇一区二区三区| 视频在线观看一区| 国产综合精品一区二区三区| 手机看片一区二区| 亚洲青青青在线视频| 高清一区二区视频| 午夜先锋成人动漫在线| 亚洲品质视频自拍网| 日本少妇久久久| 国产精品亚洲成人| 这里只有精品66| 99欧美精品| 国产亚洲精品久久久久久777| www.国产高清| 成人综合在线网站| 97av中文字幕| 精品999日本久久久影院| 色婷婷成人综合| 国产精品第6页| 国产色91在线| 日韩精品你懂的| 精品国产乱码| 国产精品∨欧美精品v日韩精品| 亚洲 另类 春色 国产| 亚洲成人动漫一区| 91精品啪在线观看国产| 精品成人一区| 精品在线观看一区二区| 日本在线啊啊| 亚洲人成亚洲人成在线观看| 亚洲天堂男人av| 中文字幕高清不卡| 伊人国产精品视频| 中文字幕免费一区二区三区| 亚洲综合在线中文字幕| 特级毛片在线| 亚洲护士老师的毛茸茸最新章节| 亚洲国产精品午夜在线观看| 91色九色蝌蚪| 国产成人精品无码播放| 精品国产a一区二区三区v免费| 国产精品日韩在线播放| 含羞草www国产在线视频| 欧美一区二区视频在线观看2022| 青娱乐免费在线视频| a在线播放不卡| 国产男女无遮挡| 国产一区2区| 91精品久久久久久久久| 日本精品600av| 日韩成人在线视频网站| av黄色在线看| 国产精品美女久久久久久久| 欧美一级免费在线| 伊人久久久大香线蕉综合直播| 精品伦理一区二区三区| 日韩毛片一区| 欧美理论电影在线观看| 成人一级免费视频| 国产精品久久久久久久久免费桃花| www.桃色.com| 亚洲综合激情| 中文字幕一区二区三区四区五区| 亚洲乱码一区| 日本中文字幕不卡免费| 动漫一区在线| 日韩精品极品在线观看播放免费视频 | 色哟哟中文字幕| 日韩欧美成人网| 日韩一区二区三区四区视频| 在线日韩欧美| 欧美精美视频| 国产成人在线播放| 美女隐私在线观看| 精品国产一区二区亚洲人成毛片| 丁香六月婷婷综合| 国产精品二三区| 国产精品成人无码专区| 日韩国产一区二| 欧美视频在线第一页| 久久成人av| 懂色一区二区三区av片| 天然素人一区二区视频| 欧美黑人狂野猛交老妇| 成人免费在线电影| 亚洲国产欧美精品| 国产绿帽刺激高潮对白| 精品久久香蕉国产线看观看亚洲| 91免费在线看片| 久久伊99综合婷婷久久伊| 在线观看av免费观看| 日本在线不卡视频一二三区| 日本网站免费在线观看| 91精品蜜臀一区二区三区在线| 美日韩精品免费| 婷婷综合国产| 国产一区视频在线| 欧美gay视频| 久久免费少妇高潮久久精品99| 麻豆传媒免费在线观看| 亚洲免费av片| 日本黄色三级视频| 欧美一区二区三区视频| 中文在线字幕av| 欧美性猛交99久久久久99按摩| 在线免费日韩av| 中文字幕日韩精品一区| 中文字幕在线观看免费高清| 91在线精品秘密一区二区| 一卡二卡三卡四卡五卡| 偷窥自拍亚洲色图精选| 97人人做人人人难人人做| 精品三级在线| 国产精品美女视频网站| 写真福利精品福利在线观看| 亚洲精品资源美女情侣酒店| 国内精品久久久久久久久久久| 欧美美女黄视频| 中文字幕+乱码+中文乱码www| 色婷婷久久久综合中文字幕 | 青青草国产成人a∨下载安卓| 精品久久一区二区三区蜜桃| 9l亚洲国产成人精品一区二三 | 国外色69视频在线观看| 色操视频在线| 九九热这里只有精品免费看| 成人日日夜夜| 欧美精品在线播放| 青春草视频在线| 久久久噜噜噜久久中文字免| 俺来也官网欧美久久精品| 久久免费高清视频| 女海盗2成人h版中文字幕| 97国产精品久久| 毛片在线网站| 国产成人精品免费久久久久 | 95av在线视频| 999久久久久久久久6666| 国产精品免费在线播放| 丁香5月婷婷久久| 久久精品国产精品国产精品污| 亚洲精品国模| 日韩欧美在线电影| 操欧美老女人| 一二三四中文字幕| 亚洲人成高清| 欧美日韩亚洲一二三| 免费在线观看一区二区三区| 日本一二区免费| 国产黄色成人av| 在线免费观看黄色小视频| 国产亚洲一区二区在线观看| 日本高清不卡免费| 图片区小说区区亚洲影院| 伊人中文字幕在线观看| 欧美精品 国产精品| 亚洲精品久久久久久无码色欲四季| 亚洲国产欧美精品| 成人影院免费观看| 美女av一区二区三区| 国产精品13p| 国产乱人伦真实精品视频| 色妞ww精品视频7777| 蜜桃麻豆www久久国产精品| 三级电影一区| 欧美一级片免费播放| 男人的天堂亚洲一区| 欧美成人精品一区二区综合免费| 99r国产精品| 小嫩苞一区二区三区| 亚洲成av人片在线观看| 懂色av蜜臀av粉嫩av喷吹| 日韩免费看网站| 成人在线视频成人| 欧美激情在线有限公司| av亚洲一区| 国产伦精品一区二区三区照片| 成人国产精品一级毛片视频| 久久av综合网| 久久er精品视频| 色无极影院亚洲| 亚洲永久免费av| 中文在线免费看视频| 亚洲精品美女久久久| 婷婷丁香在线| 国产一区二区视频在线观看| 欧美日韩123| 热99这里只有精品| 国产乱淫av一区二区三区| 性欧美精品中出| av电影在线观看一区| 九九热久久免费视频| 欧美性xxxxxxxxx| 超碰在线观看99| 色噜噜狠狠狠综合曰曰曰88av| 美女av在线免费看| 国产99午夜精品一区二区三区| 久久综合av| 日本xxxxxxx免费视频| 成人动漫一区二区| 欧美激情一区二区视频| 欧美人动与zoxxxx乱| 三级视频网站在线| 亚洲午夜未删减在线观看 | 日本女优一区| 六月丁香婷婷在线| 99久久久久久| 日韩美女黄色片| 欧美成人三级在线| sm国产在线调教视频| 成人免费大片黄在线播放| 日韩精品一区二区三区免费观看| www日韩视频| 久久久久久久久99精品| 五月婷婷亚洲综合| 亚洲精品xxxx| 欧美另类老肥妇| 国产欧美日韩伦理| 亚洲美女一区| 亚洲AV无码国产精品| 午夜精品福利在线| 涩涩视频免费看| 久久久亚洲影院| 国产精品任我爽爆在线播放| 日韩视频在线视频| 成人午夜又粗又硬又大| 日本熟妇成熟毛茸茸| 亚洲成人国产精品| 国产亚洲成av人片在线观看| 高清视频在线观看一区| 亚洲经典三级| 亚欧洲乱码视频| 在线观看日韩毛片| 1pondo在线播放免费| 国产女人18毛片水18精品| 偷拍欧美精品| 亚洲欧美日韩中文字幕在线观看| 亚洲一区二区三区四区在线 | 正在播放亚洲1区| 欧美123区| 日韩 欧美 自拍| 高清在线成人网| 日日噜噜噜噜人人爽亚洲精品| 亚洲欧美日韩精品久久| 成人在线观看免费视频| 日日噜噜夜夜狠狠久久丁香五月| 国产mv日韩mv欧美| 好吊操这里只有精品| 亚洲视频自拍偷拍| 欧美性aaa| 日本wwwcom| 久久久久9999亚洲精品| 在线观看免费视频一区| 久久夜色精品国产亚洲aⅴ| 99ri日韩精品视频| 国产l精品国产亚洲区久久| 国产精品五月天| 亚洲第一成年人网站| 日本精品免费观看| 欧美gay男男猛男无套| 精品人妻在线视频| 欧美亚洲一区二区在线| 欧美6一10sex性hd| 青娱乐一区二区| 国产成人免费在线视频| 日日噜噜噜噜人人爽亚洲精品| 久久国产一区二区三区| 欧美成人午夜77777| 超碰在线播放91| 亚洲一区二区五区| 第三区美女视频在线| 成人黄视频免费| 奇米影视7777精品一区二区| 九九热精品在线观看| 中文字幕在线成人|