精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

強化學習成幫兇,對抗攻擊LLM有了新方法

人工智能 新聞
近日,威斯康星大學麥迪遜分校的一個研究團隊發(fā)現(xiàn),可以通過強化學習對模型實施有效的黑盒逃避攻擊(Black-Box Evasion Attacks)。

事物都有多面性,正如水,既能載舟,亦能覆舟,還能煮粥。強化學習也是如此。它既能幫助 AlphaGo 擊敗頂級圍棋棋手,還能幫助 DeepSeek-R1 獲得強大的推理能力,但它也可能被惡意使用,成為攻擊 AI 模型的得力武器。

近日,威斯康星大學麥迪遜分校的一個研究團隊發(fā)現(xiàn),可以通過強化學習對模型實施有效的黑盒逃避攻擊(Black-Box Evasion Attacks)。研究團隊表示:「從安全角度來看,這項工作展示了一種強大的新攻擊媒介,即使用強化學習來有效且大規(guī)模地攻擊機器學習模型。」

圖片

  • 論文標題:Adversarial Agents: Black-Box Evasion Attacks with Reinforcement Learning
  • 論文地址:https://arxiv.org/pdf/2503.01734

下面我們就來簡單看看這項研究。

首先,為什么要研究如何攻擊模型?答案自然是為了安全。

現(xiàn)在 AI 發(fā)展迅猛,各種應(yīng)用層出不窮,并且已經(jīng)給許多領(lǐng)域帶來了巨大變革。而隨著應(yīng)用的普及,攻擊這些模型也漸漸開始變得有利可圖,其中一類攻擊方式是:生成能夠欺騙 AI 模型的輸入,從而繞過安全過濾器。這個領(lǐng)域被稱為對抗機器學習(AML),研究的是能針對目標模型生成對抗樣本的算法。

現(xiàn)有的 AML 通常使用優(yōu)化算法來最小化施加到輸入的變化(稱為擾動),使得受害者機器學習模型對帶有擾動的輸入進行分類時會犯錯。不過,技術(shù)社區(qū)對模型防御和對抗能力的理解依然有限。

對抗樣本生成算法依賴基于梯度的優(yōu)化,該優(yōu)化與任何其他信息無關(guān)。這些方法無法利用從以前的攻擊中獲得的信息來改進對其他數(shù)據(jù)的后續(xù)攻擊。

這是 AML 研究中的一個空白,即研究對抗樣本是否可以學習 —— 攻擊的有效性和效率是否會隨著經(jīng)驗的積累而提高。那么,對受害者模型訪問權(quán)限有限(稱為黑盒訪問)的對手能夠大規(guī)模生成對抗樣本(例如分布式拒絕服務(wù)攻擊)嗎?

將強化學習引入對抗攻擊

考慮到最近強化學習的成功,該團隊猜想能否將 AML 對手建模為強化學習智能體 —— 這樣一來,或許能讓攻擊策略隨著時間而變得越來越高效和有效。

他們按照這個思路進行了研究,提出了基于強化學習生成對抗樣本的攻擊方法并對其進行了評估。

他們發(fā)現(xiàn),當把對手建模成強化學習智能體時,其就能學習到哪些擾動最能欺騙模型。一旦學會了策略,對手就會使用該策略生成對抗樣本。因此,對抗性智能體無需昂貴的梯度優(yōu)化即可完成對模型的攻擊。

具體來說,該團隊將對抗樣本生成過程建模成了馬爾可夫決策過程(MDP)。如此一來,便可以輕松地使用強化學習,實現(xiàn)對攻擊的底層語義的封裝:輸入樣本和受害者模型輸出為狀態(tài),擾動為動作,對抗性目標的差異為獎勵。

該團隊提出了兩種強化學習攻擊方法:RL Max Loss 和 RL Min Norm。它們對應(yīng)于兩類傳統(tǒng)的 AML 算法。

圖片

其攻擊流程是這樣的:首先使用一個強化學習算法來訓(xùn)練智能體,然后在策略評估設(shè)置中使用攻擊來生成對抗樣本。

圖片

實驗評估

為了驗證強化學習攻擊方法的有效性,該團隊在 CIFAR-10 圖像分類任務(wù)上,使用一個 ResNet50 受害者模型進行了評估,使用的算法是近端策略優(yōu)化(PPO)。該團隊在此框架下進行多步驟評估,評估內(nèi)容包括 (a) 學習、(b) 微調(diào)和 (c) 相對于已知方法的準確度。

圖片

首先,他們評估了強化學習智能體能否學習對抗樣本。換句話說,強化學習能否在訓(xùn)練過程中提高對抗樣本的有效性和效率?

結(jié)果發(fā)現(xiàn),RL Max Loss 和 RL Min Norm 攻擊都會增加訓(xùn)練過程中的平均回報,從而驗證了強化學習技術(shù)學習任務(wù)的能力。

圖片

圖片

在整個訓(xùn)練過程中,對抗樣本的產(chǎn)生速度平均提升了 19.4%,而與受害者模型的交互量平均減少了 53.2%。

這些結(jié)果表明,通過高效地生成更多對抗樣本,智能體可在訓(xùn)練過程中變得更加強大。

接下來,他們還分析了 RL Max Loss 和 RL Min Norm 中的獎勵和轉(zhuǎn)換超參數(shù)會如何影響對抗樣本。

ε 參數(shù)控制的是 RL Max Loss 智能體在給定輸入上允許的失真量。c 參數(shù)控制的是 RL Min Norm 智能體因降低受害者模型置信度而不是最小化失真而獲得獎勵的程度。

雖然訓(xùn)練智能體可以提高這兩種攻擊的性能,但他們的研究表明這也取決于 ε 和 c 的選擇。具體實驗中,他們根據(jù)平衡對抗性目標的敏感性分析選擇了 ε = 0.5 和 c = 1.0。當對手使用這些攻擊時,為了達到預(yù)期目標,必須在攻擊之前考慮它們。

圖片

最后,該團隊還評估了經(jīng)過訓(xùn)練的智能體如何將對抗樣本泛化到未見過的數(shù)據(jù),以及它相對于廣泛使用的基于優(yōu)化的 SquareAttack 算法的表現(xiàn)如何。

在訓(xùn)練外的未見過的數(shù)據(jù)集上,訓(xùn)練后的智能體的錯誤分類率、中位數(shù)查詢和對抗樣本的平均失真都落在訓(xùn)練對抗樣本的分布中。

圖片

在與 SquareAttack 的黑盒比較中,他們將 5000 episode 的強化學習攻擊與其它 SOTA 技術(shù)進行了比較,結(jié)果表明學習對抗樣本讓強化學習攻擊能夠生成多 13.1% 的對抗樣本。

圖片

這些結(jié)果表明,如果對手通過強化學習方法學習對抗樣本,會比現(xiàn)有方法更有效。

你怎么看待這項研究,我們又該怎么防御對手的強化學習攻擊呢?

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2022-05-31 10:45:01

深度學習防御

2017-06-10 16:19:22

人工智能智能體強化學習

2025-10-28 15:42:32

AlphaGo強化學習算法

2025-04-25 09:12:00

2025-10-20 08:50:00

2014-05-19 09:25:33

2018-11-16 10:10:09

2025-06-27 04:00:00

RLSC強化學習微調(diào)

2021-10-11 17:15:30

AI 數(shù)據(jù)人工智能

2021-09-27 10:12:42

欺騙防御rMTD網(wǎng)絡(luò)攻擊

2023-12-06 13:20:00

AI模型

2023-11-15 14:55:00

2025-05-28 02:25:00

2024-12-30 07:11:00

大型視覺語言模型VLMs人工智能

2025-04-27 09:12:00

AI模型技術(shù)

2021-01-15 23:08:01

區(qū)塊鏈食品安全供應(yīng)鏈

2010-04-01 09:30:57

2015-08-21 09:14:40

大數(shù)據(jù)

2015-10-15 15:31:50

2025-06-10 11:22:09

強化學習AI模型
點贊
收藏

51CTO技術(shù)棧公眾號

青青在线视频| 国产三区在线播放| 中文字幕伦av一区二区邻居| 亚洲成人高清在线| 国产在线精品一区二区三区》| 精品亚洲永久免费| 欧美绝顶高潮抽搐喷水合集| 色哦色哦哦色天天综合| 伊人色综合久久天天五月婷| 免费黄色小视频在线观看| 欧美丝袜丝交足nylons172| 91精品1区2区| 中文字幕精品一区日韩| 性色av蜜臀av| 久久av在线| 久久精品国亚洲| 波多野结衣视频播放| 亚洲性色av| 亚洲精品视频自拍| 免费看成人午夜电影| 国语对白永久免费| 天天综合网网欲色| 精品国产sm最大网站免费看| 精品99在线视频| av在线免费播放| 91香蕉国产在线观看软件| 欧美性资源免费| 精品在线观看一区| 日韩在线麻豆| 欧美视频精品在线观看| 9久久9毛片又大又硬又粗| 69视频在线| 成人亚洲精品久久久久软件| 国产精品偷伦免费视频观看的| 欧美日韩精品亚洲精品| 欧美三级美国一级| 91精品国产综合久久久久久漫画| 免费观看日韩毛片| 亚洲奶水xxxx哺乳期| 91一区二区三区在线观看| 成人观看高清在线观看免费| www.国产一区二区| 一区在线视频观看| 久久亚洲精品毛片| xxxx日本黄色| 久久狠狠久久| 欧美一区二区三区成人| 黄色三级视频在线| 最近高清中文在线字幕在线观看1| 亚洲欧洲av色图| 欧美日韩在线播放一区二区| 丰满熟女一区二区三区| 久久99久久99| 国产精品久久久久久久久久久久久久| 久久精品免费在线| 欧美激情1区2区3区| 日韩中文字幕在线观看| 人妻av无码一区二区三区| 国语精品视频| 91精品国产福利| 欧美一级特黄aaa| 久久三级毛片| 欧美视频完全免费看| 日本精品免费在线观看| 一区二区三区电影大全| 在线欧美日韩精品| 手机视频在线观看| japansex久久高清精品| 日韩欧美自拍偷拍| 中文字幕在线视频播放| 欧美日韩一本| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 国产毛片毛片毛片毛片毛片毛片| 给我免费播放日韩视频| 日韩av在线直播| 国产精久久一区二区三区| 成人区精品一区二区婷婷| 俺去了亚洲欧美日韩| 国产女人被狂躁到高潮小说| 亚洲激情视频| 国产精品久久久久久久久久尿| 中文字幕av资源| 国产一区在线视频| 国产一区国产精品| 成人欧美亚洲| 一区二区三区四区在线| 六月丁香激情网| 国产福利亚洲| 欧美videossexotv100| 精品夜夜澡人妻无码av| 成人一区不卡| 国内久久久精品| 国产性生活视频| 国产乱国产乱300精品| 精品国产一区二区三区免费| 91高清在线| 亚洲第一综合色| 亚洲天堂av线| 第四色中文综合网| 伊人久久久久久久久久| 久久久国产精华液| 日韩av一区二区三区四区| 4444kk亚洲人成电影在线| 欧洲亚洲精品视频| 亚洲九九爱视频| 精品久久久久久久无码| 成人爽a毛片| 色999日韩欧美国产| 日韩三级一区二区三区| 久久99精品久久久| 麻豆视频成人| 欧美aaaaaaa| 6080亚洲精品一区二区| 亚洲码无人客一区二区三区| 国语对白精品一区二区| 国产精品一区久久| 四虎精品成人影院观看地址| 一区二区在线观看av| 日韩av手机版| 夜夜春成人影院| 欧美日韩国产二区| 一级黄色短视频| 久久久久九九视频| 国产69精品久久久久久久| 国产一区二区三区黄网站 | 日韩伦理在线观看| 日韩欧美国产激情| 国产国语老龄妇女a片| 91精品久久久久久久久久不卡| 国产成人精品av| 深夜福利视频在线观看| 午夜a成v人精品| 深夜视频在线观看| 综合国产精品| 成人亚洲激情网| 日本激情在线观看| 欧美三级资源在线| 中国xxxx性xxxx产国| 欧美激情第二页| 91人成网站www| 色大18成网站www在线观看| 欧美三级资源在线| 五月婷婷六月香| 美女视频网站久久| 亚洲一区二区不卡视频| 成人国产在线| 日韩有码在线播放| 91一区二区视频| 国产精品久久久久久久久免费相片 | 日韩成人中文电影| 男女视频免费看| 91老师国产黑色丝袜在线| 精品欧美一区免费观看α√| 欧美午夜寂寞| 秋霞av国产精品一区| 日韩av视屏| 欧美亚日韩国产aⅴ精品中极品| 亚洲v国产v欧美v久久久久久| 视频在线观看91| 亚洲v日韩v欧美v综合| 四虎地址8848精品| 欧美精品少妇videofree| 国产成人av免费看| 亚洲国产一二三| 国产麻豆xxxvideo实拍| 亚洲欧美日本视频在线观看| 鲁片一区二区三区| 成人黄色免费观看| 精品国产一区二区三区在线观看| 国产理论视频在线观看| 一区二区三区欧美| 男人网站在线观看| 翔田千里一区二区| 四虎一区二区| 日本免费精品| 97婷婷涩涩精品一区| 色视频在线看| 欧美亚洲国产一区在线观看网站| 男的操女的网站| 99re视频精品| 伊人网在线综合| 激情久久一区| 日韩三级电影免费观看| 国产午夜久久av| 欧美在线观看日本一区| 国产69精品久久app免费版| 欧美丰满高潮xxxx喷水动漫| 国产在线视频你懂的| 国产亚洲综合色| 欧美国产在线一区| 午夜在线一区二区| 日本一区二区免费高清视频| 美腿丝袜亚洲图片| 国产精品免费久久久久久| 欧美另类tv| 在线成人免费网站| www.蜜臀av| 精品视频全国免费看| 国产精品9191| 国产精品成人免费| 精品人妻一区二区三区香蕉| 激情av综合网| 黄色一级一级片| 狠狠爱成人网| 中文字幕剧情在线观看一区| 日本久久成人网| 91国产在线免费观看| 国产另类xxxxhd高清| 欧美激情视频在线免费观看 欧美视频免费一 | 久久这里只有精品8| blacked蜜桃精品一区| 国产视频在线观看一区| 国产精品一级在线观看| 国产精品日本精品| 免费在线小视频| 久久91精品国产91久久跳| 婷婷在线视频| 亚洲性生活视频| 无码国产精品高潮久久99| 日韩精品一区二| 夜夜躁狠狠躁日日躁av| 在线观看视频一区| 在线能看的av| 亚洲成人免费在线| 欧美激情一区二区视频| 亚洲色图都市小说| 正在播放国产对白害羞| 久久精品人人爽人人爽| 天天插天天射天天干| 粉嫩13p一区二区三区| 亚洲高清av一区二区三区| 蜜臀av一区二区在线免费观看| 欧美日韩黄色一级片| 伊人精品在线| 国产中文字幕乱人伦在线观看| 亚洲五月综合| 色乱码一区二区三区熟女 | 久久亚洲春色中文字幕久久久| 久久久久国产免费| 国产成人在线免费| 国产又粗又猛又爽又黄| 国产精品77777竹菊影视小说| av亚洲天堂网| 精品一区二区三区的国产在线播放| 污污的网站18| 久草中文综合在线| 在线观看国产福利| 韩国v欧美v日本v亚洲v| www.cao超碰| 国产一区二区在线免费观看| 免费黄频在线观看| 国产精品影视在线观看| 日本泡妞xxxx免费视频软件| 成人性生交大合| 女同性恋一区二区三区| 972aa.com艺术欧美| 亚洲精品成人无码熟妇在线| 久久中文娱乐网| xxxx日本黄色| 亚洲三级小视频| 免费在线观看av网址| 午夜激情久久久| 欧美日韩一级黄色片| 在线精品视频免费观看| 中文字幕一级片| 欧美一区二区三区视频| 欧洲精品久久一区二区| 精品无码久久久久久国产| 激情小视频在线观看| 色噜噜狠狠狠综合曰曰曰88av| 黄色的网站在线观看| 欧美国产极速在线| 免费看男女www网站入口在线| 国产精品久久99久久| 99综合久久| 久久狠狠久久综合桃花| 欧美日韩一区二区综合 | 国产精品国产三级国产专业不| 国产精品久久影院| 久久久久久久久久久网| 色哟哟一区二区三区| 一区二区三区日| 亚洲国产日韩精品在线| 国产尤物视频在线| 久久国产色av| 在线天堂新版最新版在线8| 国产精品网站视频| 91九色鹿精品国产综合久久香蕉| 欧美第一黄网| 亚洲影视一区| 中文字幕乱码人妻综合二区三区| 久久99久久久久| 丰满少妇一区二区三区| 亚洲精选视频在线| av首页在线观看| 欧美成人官网二区| 成人在线免费视频| 久久全国免费视频| 日韩成人一区| 欧美激情导航| 欧美性色综合| 色乱码一区二区三区在线| av电影在线观看一区| 国产人妻精品一区二区三区不卡| 欧美日韩国产精品专区 | 中国 免费 av| 老鸭窝毛片一区二区三区| 无码人妻一区二区三区一| 国产清纯美女被跳蛋高潮一区二区久久w | 丝袜av一区| 青青青在线观看视频| 久久精品999| 免费看污片的网站| 亚洲国产视频在线| 国产农村妇女毛片精品| 亚洲人精选亚洲人成在线| а√在线中文在线新版| 亚洲一区免费网站| 91亚洲一区| 欧洲熟妇精品视频| 久久这里只精品最新地址| 精品无码久久久久久久久| 欧美日韩高清一区二区三区| 黄色在线播放| 人人做人人澡人人爽欧美| 国产一区二区三区不卡av| 国产情侣第一页| 国产一区在线精品| www日韩在线| 欧美精品99久久久**| 国产51人人成人人人人爽色哟哟 | 国产精品成人国产| 奇米精品在线| 香蕉久久夜色精品国产| 9.1成人看片| 一本大道av一区二区在线播放| 天天色综合久久| 久久久久久成人精品| 2020国产精品极品色在线观看| 日本xxx免费| 国产在线精品一区二区夜色| 午夜激情视频在线播放| 欧美日韩成人综合在线一区二区| 北条麻妃在线| 国产精品偷伦视频免费观看国产| 国产在视频线精品视频www666| 国产免费一区二区三区视频| www久久精品| 高清乱码免费看污| 一区二区在线免费视频| 日韩一级视频| 裸体大乳女做爰69| 国产高清成人在线| 国产乡下妇女做爰视频| 亚洲国产欧美一区二区三区同亚洲 | 亚洲人成网站色在线观看| 国产精品色综合| 久久91精品国产91久久跳| а√中文在线天堂精品| 日韩a∨精品日韩在线观看| 99精品视频中文字幕| 精品欧美一区二区三区免费观看 | 黄av在线免费观看| 91色精品视频在线| 午夜久久福利| 性高潮免费视频| 精品国产电影一区| 高清日韩av电影| 成人免费视频a| 亚洲狠狠婷婷| 变态另类ts人妖一区二区| 欧美肥胖老妇做爰| 成人bbav| 曰韩不卡视频| 成人自拍视频在线观看| www亚洲视频| 久久精品国产电影| 波多野结衣在线一区二区 | 日韩精品在线免费播放| 欧美大片1688网站| 亚洲小视频在线播放| 91丝袜美腿高跟国产极品老师| 国产成人av免费| 九九久久综合网站| 亚洲婷婷影院| 6080国产精品| 色综合激情五月| 黄色在线免费看| 免费久久一级欧美特大黄| 精品一二线国产| 亚洲国产综合久久| 色妞一区二区三区| 成人精品动漫一区二区三区| 老熟妇仑乱视频一区二区| 亚洲麻豆国产自偷在线| 国产在线网站| 国产精品一区二区欧美黑人喷潮水| 日韩国产精品久久久| 精品午夜福利视频| 日韩在线视频网|