精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2024 | 如何防御對抗性提示攻擊?AdvUnlearn讓圖片生成風險驟降

人工智能 新聞
隨著生成式 AI 的應用范圍不斷擴大,如何確保模型的安全性和可靠性成為一個關鍵問題。

本文第一作者為密歇根州立大學計算機系博士生張益萌,為 OPTML 實驗室成員,指導教師為劉思佳助理教授。OPtimization and Trustworthy Machine Learning (OPTML) 實驗室的研究興趣涵蓋機器學習 / 深度學習、優化、計算機視覺、安全、信號處理和數據科學領域,重點是開發學習算法和理論,以及魯棒且可解釋的人工智能。

擴散模型(Diffusion Models, DMs)已經成為文本到圖像生成領域的核心技術之一。憑借其卓越的性能,這些模型可以生成高質量的圖像,廣泛應用于各類創作場景,如藝術設計、廣告生成等。然而,隨著擴散模型的日益普及,其帶來的安全問題也逐漸顯現。模型在處理開放式互聯網數據時,可能會在生成過程中輸出有害的、不適當的內容,例如裸露、暴力、侵犯版權的圖像等,這為其實際應用帶來了道德和法律上的挑戰。

為應對這些問題,研究者提出了機器遺忘(Machine Unlearning)技術,也稱為概念擦除(Concept Erasing)[1-3]。通過這一技術,我們能夠有選擇性地 “抹去” 擴散模型中的某些不應生成的概念。然而,盡管這一技術能夠在非對抗性環境中取得一定效果,現有的概念擦除方法在面對對抗性提示攻擊(Adversarial Prompt Attacks)時仍然存在明顯的脆弱性。攻擊者可以通過對輸入提示的微小修改,誘導模型生成本應被擦除的內容,這使得現有的概念擦除技術不夠魯棒。

對抗性提示攻擊:機器遺忘中的隱患

對抗性提示攻擊的關鍵在于通過改變文本輸入提示的細微細節,誘使模型生成不當的內容。這類攻擊可能會通過調整拼寫、加入特定符號、或是改變句子結構來規避模型的防護。例如,即便模型已經接受了擦除 “裸露” 相關內容的訓練,但通過輸入一些巧妙設計的提示詞,攻擊者依然可能讓模型重新生成被擦除的圖像。這種攻擊的成功率顯示了現有擦除技術在對抗惡意輸入時的薄弱性。

為了解決這一問題,我們提出了 AdvUnlearn 框架這是一個將對抗性訓練(Adversarial Training, AT)與概念擦除相結合的框架,旨在提升擴散模型在概念擦除任務中的魯棒性,防止模型在面對對抗性攻擊時再次生成被遺忘的內容。

圖片


  • 論文題目:Defensive Unlearning with Adversarial Training for Robust Concept Erasure in Diffusion Models
  • 論文地址:https://arxiv.org/abs/2405.15234  
  • 代碼地址:https://github.com/OPTML-Group/AdvUnlearn  
  •  Unlearned Diffusion Model Benchmark:  https://huggingface.co/spaces/Intel/UnlearnDiffAtk-Benchmark 

圖片

AdvUnlearn 框架:對抗性訓練與概念擦除的融合

AdvUnlearn 框架的獨特之處在于,它系統性地結合了對抗性訓練與概念擦除方法,從而提升模型在對抗惡意輸入時的安全性和魯棒性。傳統的對抗性訓練主要應用于圖像分類任務,而 AdvUnlearn 首次將其引入到擴散模型的概念擦除中。通過雙層優化策略,AdvUnlearn 能夠在增強模型魯棒性的同時保持其圖像生成質量。

雙層優化(Bi-level Optimization):AdvUnlearn 框架的優化分為兩個主要層次:

  1. 下層優化(Lower-level Optimization):這一層的任務是生成對抗性提示,即通過對輸入文本提示的細微擾動,生成能夠誘使模型生成本應被擦除的內容的提示。這個過程的目標是找到這些對抗性提示,使得模型在面對這些提示時生成不合規內容。
  2. 上層優化(Upper-level Optimization):這一層的任務是通過最小化模型對目標概念的響應來強化模型的魯棒性,同時確保模型生成質量不受影響。我們通過更新模型參數 θ,優化概念擦除的效果,同時保留模型的正常生成能力。

圖片

其中圖片為目標遺忘內容,圖片為遺忘目標函數,圖片為生成攻擊的目標函數。

保留效用的正則化(Utility-Retaining Regularization)

一個重大挑戰是,直接引入對抗性訓練可能會導致圖像生成質量下降。這是因為模型在面對對抗性提示時,往往會過于專注于抵御不當輸入,而忽視了對其他正常內容的生成能力。為此,我們提出了保留效用的正則化方法

該方法的核心思想是引入一個 “保留集” (圖片),這是一組與目標概念無關的文本提示。這些提示用于確保模型在訓練過程中保留其生成正常內容的能力。例如,在處理 “裸露” 相關概念時,保留集中的提示可能涉及描述風景、動物、建筑等非敏感內容。

保留集的選擇尤為重要。我們用 COCO 和 ImageNet 等數據集中的非敏感的物體類別制作成文本提示作為保留集,并通過大模型進行篩選,確保保留集中的提示與待擦除概念無關。這些提示集通過以下正則化項加入優化目標:

圖片

其中圖片為未經過機器遺忘的初始模型參數。通過該機制,AdvUnlearn 框架能夠有效解決對抗性訓練帶來的質量下降問題,確保生成圖像的多樣性和精度。

最佳優化模塊的選擇 (Modularity Exploriation):  文本編碼器 vs. UNet

擴散模型通常由多個核心模塊組成,其中文本編碼器(Text Encoder)和 UNet 是兩個主要組件。UNet 通常用于處理圖像的逐步去噪過程,而文本編碼器則將文本提示轉換為適合生成圖像的表示。

在傳統的概念擦除方法中,UNet 被視為模型生成圖像的核心,因此大多數現有技術都集中在 UNet 上進行優化。然而,在我們的研究中,我們發現文本編碼器在應對對抗性提示攻擊時表現更佳。文本編碼器在處理輸入提示的過程中,負責將文本信息轉化為圖像生成的關鍵特征。因此,對文本編碼器進行優化,可以更好地控制模型對輸入中細微變化的反應,從而提升模型在面對惡意輸入時的魯棒性。

具體來說,我們發現,優化文本編碼器能夠顯著降低對抗性攻擊的成功率,同時保留生成高質量圖像的能力。此外,經過對抗性訓練優化的文本編碼器可以作為一個 “即插即用” 的模塊,適用于不同類型的擴散模型,從而提高了框架的擴展性和通用性。

實證結果:AdvUnlearn 在多個任務中的表現

為了驗證 AdvUnlearn 框架的有效性,我們進行了廣泛的實驗證明。實驗涵蓋了多個概念擦除任務,包括裸露概念擦除、藝術風格擦除和對象擦除。UnlearnDiffAtk [4] 作為默認的對抗性提示攻擊來檢查遺忘模型的魯棒性。

裸露概念擦除

在處理敏感的 “裸露” 概念時,AdvUnlearn 展現了卓越的性能。相比傳統的概念擦除方法,AdvUnlearn 顯著降低了對抗性提示攻擊的成功率(ASR)。例如,在常見的對抗性提示攻擊場景下,ASR 從原始模型的 100% 下降至 21.13%,表明模型能夠有效抵御惡意輸入。同時,通過引入保留集,模型在生成無關內容(如風景或物體圖像)時保持了高質量,FID 僅比標準模型略微上升。

圖片

藝術風格擦除

我們還對 “梵高風格” 的擦除進行了實驗。在這一任務中,AdvUnlearn 同樣表現出了優異的性能。經過對抗性訓練后的模型,能夠有效抵御對抗性提示攻擊,成功率降至 2%。相比之下,未經優化的模型在攻擊下幾乎無法抵御,生成的圖像仍保留了梵高的風格。此外,AdvUnlearn 在這一任務中成功保持了高質量的圖像生成能力。

圖片

對象概念擦除

在對象擦除任務中,我們對 “教堂” 這一具體對象進行了擦除實驗。AdvUnlearn 不僅能夠有效抹去生成 “教堂” 圖像的能力,還能在對抗性提示攻擊下維持圖像生成的質量。與其他擦除方法相比,AdvUnlearn 框架能夠在保證生成質量的前提下,顯著提升魯棒性,使得模型在面對惡意輸入時更加可靠。

圖片

總結與展望

AdvUnlearn 框架是首個結合對抗性訓練和概念擦除技術的系統性方法,旨在提升擴散模型在概念擦除任務中的魯棒性。通過對文本編碼器進行優化,以及引入保留效用的正則化機制,AdvUnlearn 成功平衡了魯棒性和模型效用。我們的實驗結果顯示,AdvUnlearn 能夠在多種場景下有效抵御對抗性提示攻擊,并保持高質量的圖像生成。

隨著生成式 AI 的應用范圍不斷擴大,如何確保模型的安全性和可靠性成為一個關鍵問題。AdvUnlearn 框架為解決這一問題提供了新的路徑,并為未來的生成模型技術提供了重要的參考。如果你想深入了解 AdvUnlearn 框架的技術細節或實驗結果,歡迎訪問 GitHub 項目頁面(https://github.com/OPTML-Group/AdvUnlearn)。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-12-30 12:05:38

對抗性攻擊機器學習

2023-04-17 11:42:07

2022-07-01 12:25:34

AI機器學習系統

2024-04-01 08:00:00

2022-01-10 15:50:30

自動駕駛數據人工智能

2022-01-21 09:05:34

機器學習工具安全

2024-09-23 14:41:54

2023-11-06 09:00:00

2024-01-07 22:58:56

2021-01-26 16:02:58

安卓機器學習模型

2023-04-28 12:16:31

2021-01-13 19:30:28

神經網絡AI人工智能

2024-07-29 14:47:06

2020-12-29 19:09:41

AI模型機器學習神經網絡

2019-07-21 22:22:37

圖像識別AI機器視覺

2025-07-15 04:00:00

網絡安全人工智能

2024-01-09 16:15:33

2013-10-12 13:40:09

2025-05-14 06:24:11

2024-08-26 09:35:00

模型文生圖
點贊
收藏

51CTO技術棧公眾號

久久久久网站| 日韩av网站在线免费观看| 国产精品电影一区二区| 91久久极品少妇xxxxⅹ软件| 免费观看一级视频| 国产a久久精品一区二区三区 | 精品日韩久久久| а√资源新版在线天堂| 白白色 亚洲乱淫| 国产精品一二三在线| 美女视频黄免费| 精品国产91| 欧美成人bangbros| 亚洲国产精品三区| 黄视频免费在线看| 亚洲天堂精品视频| 牛人盗摄一区二区三区视频| 一区二区www| 亚洲第一精品影视| 久久精品久久精品亚洲人| 国产香蕉精品视频| 日本成人一区二区| 欧美视频在线看| www.夜夜爱| 在线看黄色av| 久久亚洲精品小早川怜子| 18成人在线| 在线观看xxxx| 久久国产66| 韩国19禁主播vip福利视频| 九一在线免费观看| 五月天亚洲色图| 精品国产第一区二区三区观看体验 | 欧洲中文字幕精品| 国产h视频在线播放| 超碰人人在线| 国产精品国产a| 色综合久久久久久久久五月| 亚欧在线观看视频| 不卡一二三区首页| 国产精品免费一区二区三区四区| 国产精品伦一区二区三区| 久久午夜精品| 日韩av第一页| 精品国产午夜福利| 中文字幕中文字幕在线中心一区 | 亚洲美女屁股眼交3| 亚洲三区在线观看| 成在在线免费视频| 国产色一区二区| 奇米视频888战线精品播放| 亚州视频一区二区三区| 99久久精品情趣| 国产视频一区二区三区四区| 动漫av一区二区三区| 国产盗摄一区二区三区| 99久久伊人精品影院| 国产草草影院ccyycom| 国产精品一区久久久久| 91亚洲精品丁香在线观看| 国内毛片毛片毛片毛片| 国产精品一区二区黑丝| 99中文字幕| 五月婷婷久久久| 久久蜜臀中文字幕| 日韩欧美在线一区二区| 97电影在线| 亚洲日本中文字幕区| 成人午夜免费在线视频| xxx.xxx欧美| 色综合久久88色综合天天免费| 91看片就是不一样| 小说区图片区亚洲| 日韩一区二区三区电影| 日韩综合第一页| 欧美日韩播放| 俺也去精品视频在线观看| 极品颜值美女露脸啪啪| 一区二区三区四区五区精品视频| 人体精品一二三区| 国产又大又粗又硬| 成人爱爱电影网址| 免费一区二区三区| 蜜桃av在线免费观看| 一区二区三区欧美亚洲| 欧美性久久久久| 欧美91在线|欧美| 精品久久久久久久人人人人传媒| jizz日本免费| 日韩在线精品| 国内久久久精品| 91麻豆精品在线| 国产精品亚洲第一区在线暖暖韩国| 狠狠色噜噜狠狠狠狠色吗综合| 精品视频二区| 一区二区三区产品免费精品久久75| 免费看国产曰批40分钟| 久久久久久久性潮| 亚洲第一网中文字幕| 影音先锋男人在线| 亚洲国内精品| 91精品久久久久久久久久久久久久| 精品人妻一区二区三区换脸明星 | 久久久久久精| 成人高清免费在线| 色网综合在线观看| 伊人影院在线观看视频| 九九亚洲视频| 欧美激情一区二区三区成人 | 91精品国产综合久久小美女| 国产乱了高清露脸对白| 国产精品久久久久久久| 欧美亚洲午夜视频在线观看| 99热这里只有精品9| 国产午夜亚洲精品理论片色戒 | 日韩va欧美va亚洲va久久| 成人午夜电影在线播放| avtt在线播放| 色婷婷综合久色| 91视频在线免费| 欧美全黄视频| 91在线视频一区| 二区在线观看| 色综合久久天天| 91丝袜在线观看| 欧美三级免费| 91视频网页| 久热国产在线| 欧美日韩精品一区视频| 女人又爽又黄免费女仆| 亚洲在线观看| 久久精品日韩| a级片在线免费| 日韩欧美一级二级| 国产va在线播放| 黑人精品欧美一区二区蜜桃| 亚洲国产精品123| 国产日韩另类视频一区| 日韩精品在线影院| 国产成人精品一区二三区| 成人小视频在线| a级黄色片免费| 国产美女视频一区二区| 久久综合电影一区| 国产精品自产拍| 亚洲色图视频网站| www.cao超碰| 久久久人成影片免费观看| 国产免费一区视频观看免费| av在线中文| 欧美日韩国产a| 91麻豆精品成人一区二区| 六月丁香婷婷色狠狠久久| 亚洲人成77777| 日韩免费在线电影| 日韩国产精品91| 成人a在线视频| 黄色网址视频在线观看| 欧美一区二区国产| 久久国产免费观看| 99免费精品视频| 那种视频在线观看| 成人在线免费观看视频| 国产日韩在线视频| 呦呦在线视频| 日韩av最新在线| 自拍偷拍校园春色| 国产精品乱人伦中文| 黄色片免费网址| 黄色欧美日韩| 鲁丝一区二区三区免费| 欧美va在线观看| 久久天堂av综合合色| 亚洲国产精品久久久久久久| 午夜电影网亚洲视频| 成人午夜福利一区二区| 久久99精品久久久久久国产越南 | 欧美日韩大陆在线| 日韩影院一区二区| 99精品欧美一区二区三区小说| 免费在线观看毛片网站| 午夜精品毛片| 精品一区2区三区| 韩日精品一区| 欧美国产日韩一区| 国产精品视频一区二区久久| 91精品免费观看| aaaaaa毛片| 亚洲摸摸操操av| 日本xxx在线播放| 国产精品自拍网站| 成人午夜视频免费在线观看| 日韩免费av| 国产亚洲欧美一区二区| 国产a亚洲精品| 韩国视频理论视频久久| 午夜视频成人| 日韩av在线直播| 一卡二卡在线视频| 日韩欧美国产网站| 青青草免费av| 国产精品国产三级国产三级人妇 | 欧美禁忌电影网| 亚洲最大的成人网| 成人日韩精品| 97高清免费视频| 超碰人人在线| 国产一区二区日韩| 亚洲色欧美另类| 日韩欧美国产电影| 6—12呦国产精品| 欧美性猛交xxxx免费看| 激情五月少妇a| 国产精品灌醉下药二区| 亚洲久久久久久久| gogo大胆日本视频一区| 日韩 国产 一区| 日本一不卡视频| 免费av网址在线| 亚洲欧洲一级| 欧美交换配乱吟粗大25p| 久久国产成人精品| 日本一区免费在线观看| 久久久久97| 国产厕所精品在线观看| 欧美视频三区| 成人久久久久久久| 国产原创一区| 国产精自产拍久久久久久| 人人鲁人人莫人人爱精品| 97精品久久久中文字幕免费| 四虎影视国产在线视频| 久久亚洲国产成人| 欧美私人网站| 俺去啦;欧美日韩| 亚洲麻豆精品| 日韩在线欧美在线| 免费黄网站在线播放| 色偷偷噜噜噜亚洲男人的天堂| 风间由美一区| 久久精品国产96久久久香蕉| 777电影在线观看| 色爱精品视频一区| 91网页在线观看| 综合国产在线视频| 亚洲欧美视频一区二区| 久久亚洲精品视频| 午夜dj在线观看高清视频完整版| 欧美精品在线网站| 日韩av官网| 午夜精品www| 国产理论在线| 国产精品v片在线观看不卡| 欧美色999| 国产日韩在线免费| 精品麻豆剧传媒av国产九九九| 亚洲综合最新在线| 看全色黄大色大片免费久久久| 国产伦精品一区二区三区视频免费 | 成人高清免费在线| 欧美国产精品日韩| 国产拍在线视频| 国产ts一区二区| 精品176极品一区| 亚洲在线免费观看| 美女一区2区| 日韩欧美在线一区二区| 91精品国产91久久久久久黑人| 麻豆视频传媒入口| 一区二区三区福利| 亚洲一级免费观看| 国产精品2024| 无码人妻精品一区二区三区温州| 久久久精品tv| 丰满少妇被猛烈进入一区二区| 亚洲一区二区视频在线| 国产精品黄色大片| 欧美三级电影在线看| 亚洲AV无码成人片在线观看| 日韩精品视频在线观看网址 | 亚洲8888| gogogo免费高清日本写真| 亚洲私人影院| wwwwxxxx日韩| 福利91精品一区二区三区| 中文字幕国产专区| 夜夜爽夜夜爽精品视频| 中文字幕在线播| 欧美一二三区精品| 黄视频在线观看免费| 欧美精品做受xxx性少妇| 性感女国产在线| 成人日韩在线电影| 亚欧日韩另类中文欧美| 最近中文字幕免费mv| 久久久水蜜桃av免费网站| 日本亚洲一区二区三区| 久久亚洲二区三区| 久久成人国产精品入口| 欧美在线观看一区二区| 亚洲乱码在线观看| 丝袜一区二区三区| 午夜欧美激情| 动漫精品视频| 久久精品国产99久久| 欧美一区二区中文字幕| 国产精品一区二区在线观看网站| 亚洲人成人无码网www国产| 亚洲一区二区av电影| 夜夜狠狠擅视频| 亚洲三级免费看| caoporn视频在线| 91亚洲精品久久久久久久久久久久| 婷婷综合成人| 国产日韩av网站| 国产精品综合一区二区三区| 亚洲精品国产精品国自| 欧美日韩国产综合新一区| www.我爱av| 久久久久北条麻妃免费看| 四虎成人在线| 欧美日韩免费高清| 国产视频一区在线观看一区免费| 欧美性猛交xx| 成人欧美一区二区三区白人| 成年人视频免费| 亚洲乱码国产乱码精品精天堂| av伦理在线| 国产精品二区在线观看| 中文字幕免费一区二区三区| av中文字幕网址| 国产精品嫩草影院com| 在线观看国产区| 亚洲网站在线观看| 性欧美18一19sex性欧美| 免费日韩电影在线观看| 久久国产福利| 粉嫩av蜜桃av蜜臀av| 欧美性xxxx极品hd欧美风情| 少妇无码一区二区三区| 97色伦亚洲国产| 国产香蕉精品| 无罩大乳的熟妇正在播放| jlzzjlzz亚洲日本少妇| 久久黄色精品视频| 精品视频一区在线视频| 成人av观看| 日本精品一区| 老司机免费视频一区二区三区| 久久视频一区二区三区| 欧美老女人在线| 国产美女在线观看| 成人黄色在线免费观看| 樱桃成人精品视频在线播放| 黑丝av在线播放| 欧美性猛交xxxx乱大交3| 成人精品一区二区三区校园激情| 国产精品久久久av久久久| 色婷婷亚洲mv天堂mv在影片| 91热视频在线观看| 亚洲在线成人精品| 日韩三级电影网| 国产精品日日摸夜夜添夜夜av| 99久久99久久精品国产片果冰| 色综合五月婷婷| 午夜精品免费在线观看| 免费在线毛片| 91久久精品国产91久久性色| 欧美搞黄网站| 亚洲专区区免费| 欧美日韩一级黄| 免费在线观看av电影| 久久66热这里只有精品| 日本欧美一区二区在线观看| 亚洲波多野结衣| 亚洲成人av资源网| 欧美日韩尤物久久| 国产在线拍揄自揄拍无码| av毛片久久久久**hd| 国产成人精品亚洲| 欧美激情久久久| 国产91精品对白在线播放| www.桃色.com| 欧美日韩裸体免费视频| 日本精品在线| 精品无码久久久久国产| 久久99精品久久久久久久久久久久| 日韩av男人天堂| 色妞色视频一区二区三区四区| 超碰在线一区| 黄色手机在线视频| 欧美日韩亚洲高清| 黄色av电影在线播放| 免费观看成人高| 国产精品白丝av| 日韩久久久久久久久久| 欧美激情一区二区三级高清视频| 成人久久一区| 7788色淫网站小说| 日韩欧美一区在线观看|