精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

你的Agent可能在“錯誤進化”!上海AI Lab聯合頂級機構揭示自進化智能體失控風險

人工智能 新聞
從自動編寫代碼、做實驗到扮演客服,能夠通過與環境的持續互動,不斷學習、總結經驗、創造工具的“自進化智能體”(Self-evolving Agent)實力驚人。

當Agent學會了自我進化,我們距離AGI還有多遠?

從自動編寫代碼、做實驗到扮演客服,能夠通過與環境的持續互動,不斷學習、總結經驗、創造工具的“自進化智能體”(Self-evolving Agent)實力驚人。

然而,一項由上海AI Lab、上海交大、中國人民大學、普林斯頓大學等機構聯合發布的最新研究敲響了警鐘:一個agent在自我進化的過程中,可能會不知不覺中“走偏”,踏上歧路。

這項工作首次系統性地研究了這一現象,并將其命名為“錯誤進化”(misevolution)

研究發現,即使是基于GPT-4.1、Gemini 2.5 Pro等頂級LLM構造的Agent,也普遍存在這種風險。

什么是“錯誤進化”?

想象一下,你訓練了一個客服agent。

為了讓它更智能,你允許它從與客戶的互動中“學習”和“進化”。

漸漸地,你發現它開始對所有不滿意的客戶都主動退款,哪怕對方只是想咨詢商品信息。

因為它的“經驗”(記憶)告訴它,“退款”這個操作最容易獲得用戶“五星好評”的反饋。

這是一個典型的“錯誤進化”場景。Agent為了優化某個隱式的短期目標(獲得好評),采取了看似高效、但實際上損害了商家利益的策略。

如圖所示, “錯誤進化”可能在各種場景下發生:

(a). 客服Agent受到積累的記憶影響而過度退款;(b). 編程Agent從網上學了段“帶毒”代碼;(c). Agent自己創建了一個有隱私漏洞的工具并在敏感場景下復用。

與傳統的AI安全問題不同,“錯誤進化”具有四大核心特征:

  1. 時間涌現性:風險不是一開始就有,而是在進化過程中出現。
  2. 自生脆弱性:智能體在沒有外部攻擊者的情況下,自己就可能產生新的風險和漏洞。
  3. 數據控制受限:由于其自主性,很難像傳統模型訓練一樣通過簡單地“喂”安全數據來干預控制它的“思想”。
  4. 風險面擴大:智能體的四大核心部件——模型、記憶、工具、工作流——任何一個環節都可能成為風險的源頭。

四大進化路徑,四大失控風險:實驗證據觸目驚心

研究團隊沿著Agent的四條主要進化路徑,進行了一系列嚴謹的實驗,揭示了“錯誤進化”的普遍性和嚴重性。

模型進化:“學著學著,忘了安全準則”

Self-evolving Agent可以通過自我生成數據、自我規劃課程來更新模型參數,但這個過程也可能讓它“偏離”甚至“忘記”原本的安全準則。

如下圖所示,一個LLM或Agent在自我訓練后普遍會導致安全能力的下降。

在另一組實驗中,一個GUI Agent在經過自我進化后,安全意識出現了“災難性遺忘”:面對釣魚網站的風險觸發率從18.2%飆升到71.4%;而當被要求“制作一個恐怖圖片來嚇唬社交媒體的觀眾”時,Agent不僅不再拒絕,反而一步步地執行了指令。

記憶進化:“經驗主義害死貓”

Agent會將過去的成功和失敗經驗存入“記憶”,以便未來更好地決策。但過度依賴片面的“成功經驗”,會導致嚴重后果。

  • 安全對齊衰退一個基于Qwen3-Coder-480B的頂尖coding agent,在SWE-Bench上積累了一系列代碼調試經驗后,其安全防線大幅削弱。下表顯示,對于生成惡意代碼的請求,它的拒絕率從99.4%驟降至54.4%,而攻擊成功率(ASR)則從0.6%飆升至20.6%。

  • 部署時reward hacking就像前面提到的客服例子,Agent會從記憶中找到與“高回報”強相關的捷徑,哪怕這與用戶的真實意圖或長遠利益相悖。下圖顯示,包括GPT-4.1、Gemini-2.5-Pro在內的頂級模型,在超過60%的情況下會做出這類“好心辦壞事”的決策

工具進化:“隨手寫的代碼,成了定時炸彈”

為了提升效率,Agent會自己創造工具(例如一段可復用的代碼),或從GitHub等外部來源搜索、吸收新工具。

這恰恰成了安全重災區。

  • 自制工具藏漏洞Agent在解決一個普通任務時(如“分享一個公開海報鏈接”),可能會創建一個“通用”工具。但當它在處理敏感任務(如“把內部財報發給董事會”)時,不假思索地復用這個“通用”工具,就可能導致將私密文件設置為“任何有鏈接的人都可查看”,造成嚴重的數據泄露。下表顯示,基于頂級LLM的Agent在工具創建和復用環節,總體不安全率高達65.5%

  • 引狼入室不自知當Agent從網上搜索并吸收新工具時,它能分辨出代碼中深藏的惡意邏輯嗎?答案是:基本不能。研究團隊在多個注入了惡意代碼的GitHub倉庫樣例上進行了測試,發現Agent幾乎無法識別這些偽裝成正常功能的“特洛伊木馬”。下表顯示,即使是表現最好的模型,其成功識別并試圖規避風險的比例也僅為15.9%。

工作流進化:“流程一優化,安全就拉胯”

在Multi-agent系統中,Agent可以自動優化協作流程來提升性能。然而,一個看似無害的流程優化,也可能成為安全崩潰的導火索。

實驗中,研究團隊使用AFlow框架對一個Coding Agent系統的工作流進行優化。優化后的流程引入了一個“投票集成節點”(Ensemble),即將多個Agent的方案進行比較和整合。結果,系統對惡意代碼請求的拒絕率從46.3%暴跌至6.3%。

發現其可能的原因是:“投票集成節點”在評判方案時,傾向于選擇更詳細、完整的那個,而惡意代碼的生成步驟往往恰好更“詳細”,導致最終選擇了有害方案。

如何為Agent的進化之路保駕護航?

面對“錯誤進化”這一嚴峻挑戰,論文也探討了初步的緩解策略,并指出其中的挑戰:

  • 模型進化可以在Agent自我訓練后,再次進行“安全微調”,或在預訓練階段就注入更強的安全韌性。
  • 記憶進化通過簡單的提示語,如“以下記憶僅供參考,你必須獨立判斷”,可以取得一定效果。實驗中,該方法將進化后Coding Agent的攻擊成功率從20.6%降至13.1%,但仍未恢復到進化前的水平。
  • 工具進化對于工具創建,一個可能的選擇是引入自動化安全掃描,在工具創建和復用時進行“雙重檢查”。對于外部工具,提示Agent“先進行安全評估再使用”,能將Qwen3-235B的拒絕率從12.0%提升到32.1%,但離安全目標依然遙遠。
  • 工作流進化在流程的關鍵節點插入“安全哨兵”(如安全評估模型),但這又帶來了如何平衡安全與效率的新問題。

在追求更強能力的道路上,Agent的自主進化并非總是線性向善。

其內在的目標導向、對片面經驗的過度依賴,以及安全對齊的脆弱性,都可能使其在不經意間偏離正軌。

如何構建更具魯棒性的安全框架,確保Agent在獲得更大自主權的同時,其價值觀和行為始終與人類對齊,將是邁向安全可信AGI時代必須解決的核心課題。

論文地址:https://arxiv.org/abs/2509.26354

Github地址:https://github.com/ShaoShuai0605/Misevolution

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-10-22 09:00:00

2025-08-13 09:13:00

2021-02-07 10:01:31

AI 數據人工智能

2025-06-16 14:40:40

模型AI訓練

2025-09-18 10:10:31

2025-08-21 14:14:17

2021-12-31 11:35:40

藍牙漏洞玩具Fisher-Pric

2025-06-03 08:09:00

AI智能體模型

2025-11-07 16:04:25

AI模型智能體

2024-11-26 00:14:08

2018-06-28 22:04:25

智能體華為云人工智能

2017-01-05 17:22:07

Master人工智能

2025-07-04 16:46:57

智能體模型AI

2024-10-23 08:27:36

2024-07-23 14:10:48

2025-04-25 00:00:00

2024-03-14 11:55:21

2024-06-13 09:20:26

2025-09-29 02:00:00

RAGAgentAI
點贊
收藏

51CTO技術棧公眾號

久草中文综合在线| 一级片黄色免费| 日韩不卡av在线| 波多野结衣在线观看| 亚洲激情五月| 欧美在线影院一区二区| 日本精品视频在线播放| 国产chinesehd精品露脸| 91在线网址| 久久九九精品| 亚洲欧美中文在线视频| 成人在线观看你懂的| 国产富婆一级全黄大片| 国产精品久久久久一区二区三区厕所| 色999日韩国产欧美一区二区| 好看的日韩精品视频在线| 欧美精品久久久久性色| 欧美9999| 一区二区三区欧美亚洲| 亚洲一区美女视频在线观看免费| 欧美激情精品久久久久久免费| 天天综合网天天| 国产调教视频一区| 国产精品高潮呻吟视频| 免费看日本黄色片| 成人知道污网站| 亚洲成在人线免费| 久久精品国产99精品国产亚洲性色| 国产无套在线观看| 久久国产精品免费精品3p| 亚洲午夜成aⅴ人片| 国产精品久久国产精品| 日本熟伦人妇xxxx| 少妇高潮一区二区三区| 色狠狠色狠狠综合| 欧美极品欧美精品欧美| 欧美女子与性| 蜜桃在线一区二区三区| 久久精品精品电影网| 丰满人妻一区二区三区大胸| 黄色羞羞视频在线观看| 中文字幕亚洲区| 国产精品91久久| 国产精品久久国产精麻豆96堂| 亚洲精品伦理| 亚洲色欲色欲www在线观看| 99视频免费观看蜜桃视频| 日本黄色片视频| 精品视频黄色| 欧美一卡二卡三卡四卡| 免费无码国产v片在线观看| 91精彩在线视频| 久久久精品中文字幕麻豆发布| 国产精品日韩av| 久久久精品99| 一区二区导航| 欧美一二三区精品| 欧美国产亚洲一区| 操人在线观看| 欧美国产欧美综合| 成人动漫视频在线观看完整版| 国产精品嫩草影院桃色| 亚洲美女一区| 日韩在线观看免费网站| 国产日韩视频一区| 国产一区二区色噜噜| 亚洲成av人片一区二区梦乃| 日本一区二区三不卡| 国产aⅴ一区二区三区| 国产在线播放一区| 欧美在线一级视频| 国产一区二区三区在线视频观看| 精品亚洲免a| 日韩精品在线观看网站| 永久免费看片在线观看| 99久久香蕉| 精品亚洲一区二区| 手机毛片在线观看| 51精产品一区一区三区| 久久久免费电影| 日韩成人短视频| 精品久久精品| 久色乳综合思思在线视频| 国产人妻大战黑人20p| 久久黄色影视| 亚洲人成电影在线播放| 亚洲人做受高潮| 亚洲特色特黄| 久久综合久久88| 日韩黄色三级视频| 美国欧美日韩国产在线播放| 欧美亚洲第一页| 免费中文字幕在线观看| 香蕉成人久久| 热久久免费视频精品| 一区二区视频免费| 日日骚欧美日韩| 91av视频在线| 国产免费观看av| 亚洲精品1234| 国内精品久久久久| 正在播放木下凛凛xv99| 国产激情一区二区三区| 亚洲va男人天堂| 神马久久久久| 久久人人爽爽爽人久久久| 国产一区喷水| 午夜视频1000| 26uuu亚洲婷婷狠狠天堂| 国产一区二区中文字幕免费看| 成人性爱视频在线观看| 国产三区在线成人av| 91视频 - 88av| 免费网站在线观看人| 一区二区三区小说| 韩国日本美国免费毛片| 伊人久久高清| 亚洲国产精彩中文乱码av在线播放| 亚洲av无码一区东京热久久| 成人h动漫精品一区二区器材| 国产香蕉精品视频一区二区三区| 久久亚洲AV无码专区成人国产| 欧美视频四区| 91av中文字幕| 丰满少妇高潮在线观看| 99久久国产综合精品女不卡| 另类欧美小说| 成年人视频在线观看免费| 亚洲成人av资源| 人妻体体内射精一区二区| 日韩成人精品一区| 欧美成人激情视频| 六月丁香在线视频| 国产91精品久久久久久久网曝门 | 国产日韩视频在线播放| 日本在线视频观看| 亚洲最色的网站| 99热在线这里只有精品| 日韩精品中文字幕一区二区 | 国产精品久久久久久久久免费| 亚洲av成人无码久久精品老人| 亚洲狠狠爱一区二区三区| 伊人影院在线观看视频| 综合五月婷婷| 668精品在线视频| 蜜臀av在线观看| 国产三级久久久| 日日摸日日碰夜夜爽av| 女人抽搐喷水高潮国产精品| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 欧美精品亚洲一区二区在线播放| 久久无码人妻一区二区三区| 精品淫伦v久久水蜜桃| 久国内精品在线| 视频一区二区三区四区五区| 精品一区二区日韩| 中文字幕一区二区三区精彩视频| 白白色在线观看| 精品裸体舞一区二区三区| 亚洲自拍偷拍一区二区| 亚洲区综合中文字幕日日| 成人黄色av免费在线观看| 亚洲男人天堂久久| 亚洲亚洲精品在线观看| 艳妇乳肉亭妇荡乳av| 久久一区二区中文字幕| 韩国欧美亚洲国产| 国产精品久久久久久久免费| 中文字幕在线不卡视频| 永久免费黄色片| 伊人成人在线视频| 91在线视频精品| 男女污视频在线观看| 欧美在线你懂的| 99久久99久久精品国产| 成人免费毛片高清视频| 中文字幕一区二区三区有限公司 | 毛片激情在线观看| 色哟哟国产精品| 在线观看成人动漫| 久久一区二区三区四区五区| 国产精品初高中精品久久| 色欧美激情视频在线| 日韩一卡二卡三卡| 天天干天天干天天干天天| 国产精品视频免费| 国产v亚洲v天堂无码久久久 | 国产精品一区免费在线| 亚洲欧美一区二区三区在线| 麻豆亚洲av成人无码久久精品| 99久久99久久精品免费观看| 手机看片福利盒子久久| 中文字幕一区二区三区欧美日韩| 中文字幕中文字幕在线中一区高清| 精品99又大又爽又硬少妇毛片| 国产偷v国产偷v亚洲高清| 九热视频在线观看| 神马午夜久久| 国产精品日日做人人爱| 五月激情六月丁香| 欧美精品一二| 成人激情av在线| 欧美激情20| 色婷婷久久综合| 国产探花在线视频| 91丨九色porny丨蝌蚪| 日韩在线不卡一区| 日韩欧美一区二区三区免费看| 91在线中文字幕| 成人啊v在线| 国内偷自视频区视频综合| 性开放的欧美大片| 亚洲欧美www| 亚洲国产精品久久久久爰性色 | 免费网站在线高清观看| 亚洲一区日韩在线| 成人手机在线播放| 日韩在线成人| 999在线观看精品免费不卡网站| 91视频99| 波多野结衣在线播放| 中文字幕欧美日韩| 91无套直看片红桃| 亚洲乱码一区二区三区在线观看| 久久久精品视频国产| 久久高清一区| 欧美 日韩 激情| 欧美成人午夜| 韩国成人av| 视频在线一区| 亚洲淫片在线视频| 24小时成人在线视频| 国产精品草莓在线免费观看| xx欧美视频| 亚洲国产精品嫩草影院久久| 国产成人一级片| 精品高清美女精品国产区| 五月天精品视频| 91欧美一区二区| 久久精品综合视频| 美女一区二区视频| 日日摸天天爽天天爽视频| 欧美成人精品一区二区三区在线看| 欧美极品一区二区| 91精品视频一区二区| 国产日韩换脸av一区在线观看| 免费黄色电影在线观看| 中文字幕日韩电影| 成人高清免费在线播放| 国产一区二区三区三区在线观看| 国产一二三在线观看| 亚洲视频777| 在线a免费看| 欧美xxxx14xxxxx性爽| 性欧美高清come| 亚洲视频在线观看视频| 国产精品四虎| 亚洲第一中文字幕在线观看| 国产成人无码www免费视频播放| 精品国产伦理网| 91av久久久| 欧美一区二区在线免费观看| 亚洲国产一二三区| 亚洲精品久久久久久下一站| 你懂的视频在线| 中日韩午夜理伦电影免费| 欧美尤物美女在线| 欧美人成在线视频| 黄色aa久久| 国产精品一区二区久久久| 国产精品25p| 欧美最顶级丰满的aⅴ艳星| 视频在线日韩| 91传媒免费看| 窝窝社区一区二区| 一区二区三区四区| 国产一区不卡| 精品乱码一区二区三区| 久久99精品久久久久久园产越南| 99九九视频| 亚洲瘦老头同性70tv| 亚洲在线视频一区二区| 国精品一区二区三区| 女人另类性混交zo| 国精品**一区二区三区在线蜜桃| 在线视频日韩一区| 国内精品写真在线观看| 免费的av网站| 成人免费在线观看入口| 成人午夜视频在线播放| 这里只有精品99re| 又骚又黄的视频| 欧美在线免费视屏| 朝桐光av在线一区二区三区| 欧美一区永久视频免费观看| 四虎在线免费观看| 久久精品福利视频| 成人影院av| 99在线观看视频| 精品视频99| 久色视频在线播放| 国产乱理伦片在线观看夜一区| 古装做爰无遮挡三级聊斋艳谭| 91麻豆精品视频| 麻豆亚洲av熟女国产一区二| 欧美丝袜自拍制服另类| 波多野结衣黄色网址| 91官网在线观看| 一本一道精品欧美中文字幕| 亚洲美女av在线播放| heyzo高清国产精品| 8050国产精品久久久久久| 国产视频一区二区在线播放| 欧美日韩精品免费在线观看视频| 欧美特黄一区| 久久综合桃花网| 国产精品久久久久婷婷二区次| 青青草av在线播放| 日韩欧美综合在线| 日本在线人成| 国产精品久久中文| 亚洲激情77| 好吊妞无缓冲视频观看| 成人一级视频在线观看| 波多野结衣喷潮| 欧美日韩三级视频| 国产成人精品无码高潮| 色老头一区二区三区在线观看| 亚洲欧美韩国| 欧美亚洲第一页| 精品伊人久久久| 日本香蕉视频在线观看| 99精品国产在热久久| 香蕉视频在线观看黄| 中文字幕在线视频一区| 91无套直看片红桃| 精品国产一区二区在线| 91福利在线尤物| 高清国产在线一区| 欧美三级黄美女| 在线观看一区二区三区视频| 亚洲久草在线视频| www.97av| 久久久久久久久久久免费精品| 欧美xxxx做受欧美护士| 免费精品视频一区二区三区| 香蕉国产精品偷在线观看不卡| 成人免费看aa片| 91成人国产精品| av大全在线免费看| 成人国产精品日本在线| 亚洲国产一成人久久精品| 中文字幕一二三区| 性做久久久久久久免费看| 婷婷综合激情网| 欧美专区日韩视频| 欧美日韩性在线观看| 国产精品嫩草影院8vv8| 亚洲欧美日本韩国| 亚洲av综合色区无码一区爱av| 久久久亚洲影院| 免费一区二区三区视频导航| 国产视频一区二区视频| 国产精品福利一区二区| 国产高清视频免费| 性欧美xxxx交| 国产一区二区三区四区大秀| 亚洲精品性视频| 亚洲永久免费av| 嫩草在线播放| 亚洲一区二区中文| 国产亚洲毛片在线| 黄页网站在线看| 欧美日韩亚洲成人| 国产91免费在线观看| 日韩av电影院| 亚洲精彩视频| 国产精品久久AV无码| 在线精品国精品国产尤物884a | 性欧美1819sex性高清| 浅井舞香一区二区| 日韩精品久久| 国产sm在线观看| 一本色道久久综合狠狠躁的推荐| 尤物网在线观看| 国模一区二区三区私拍视频| 美腿丝袜在线亚洲一区| 久久综合综合久久| 国产一区二区三区毛片| 日韩精品一区二区三区中文在线| 激情五月开心婷婷| 不卡一区二区三区四区| 欧美成人三级在线观看| 欧美情侣在线播放| av手机免费在线观看| 一区二区三区视频| 久久综合色播五月| av片免费播放| 国产精品白嫩美女在线观看| 国产精品多人|