精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

四款擴散大語言模型全部破防?上交&上海AI Lab發現致命安全缺陷

人工智能 新聞
當前擴散語言模型存在根本性架構安全缺陷,在某些攻擊場景下,幾乎毫無防御能力。

擴散語言模型(Diffusion-based LLMs,簡稱 dLLMs)以其并行解碼、雙向上下文建模、靈活插入masked token進行解碼的特性,成為一個重要的發展方向。

相較傳統的自回歸語言模型,dLLMs 既可以一次性生成多個位置的詞,也能更自然地完成文本插入、改寫、補全等任務,被廣泛應用于交互式問答、代碼生成、甚至多模態場景。

圖片

但在這股看似技術躍遷的浪潮背后,一場潛藏的安全危機正在醞釀:能否繼續沿用自回歸模型的對齊與防護機制,保障dLLM的輸出安全?

答案是:不能。

在最新研究《The Devil behind the mask: An emergent safety vulnerability of Diffusion LLMs》中,來自上海交通大學, 上海人工智能實驗室和中山大學的研究團隊指出:

當前擴散語言模型存在根本性架構安全缺陷,在某些攻擊場景下,幾乎毫無防御能力。

圖片

他們提出的DIJA攻擊框架,不需要訓練,也不需要改寫模型參數,就能令多個dLLMs大概率生成有害、非法、違規內容。這項研究不僅擊穿了擴散語言模型的“對齊護盾”,也正式拉開了dLLMs 安全研究時代的序幕。

為什么dLLMs更容易被攻破?

從自回歸LLM到擴散LLM

  • 自回歸LLM: 一次生成一個token,順序解碼,現有的對齊策略按照自回歸LLM生成方式構建,實行安全對齊后自回歸LLM能夠對危險內容拒絕采樣。
  • 擴散LLM: 同時生成多個掩碼位置token,基于雙向上下文建模,追求上下文邏輯一致性,并行速度快,可以在文本任意位置插入掩碼進行生成。

擴散語言模型的”雙刃劍”:雙向建模和并行解碼

  • 生成是并行進行的,沒有上下文順序性,無法逐token拒絕采樣
  • 輸入支持任意位置插入掩碼,模型被設計為無條件預測上下文掩碼
  • 現有的安全對齊訓練目標大多針對”整體輸入-整體輸出”,面對局部掩碼提示時束手無策

揭開 dLLMs 無感防線的“真空地帶”

攻擊理念:從生成機制出發,讓模型“自己說出危險內容”

DIJA(Diffusion LLMs Jailbreak Attack)不會對越獄提示中的危險內容進行任何掩蓋或者改寫,完整的暴露給dLLMs,只需要將原始的越獄提示改造為掩碼文本交錯的越獄提示(如上文圖一所示),dLLMs即使意識到這是危險的指示,依然”不由自主”的輸出非法內容。

圖片

自動攻擊構建:一句 prompt 都不用手寫,攻擊全自動生成

相比一些傳統的越獄攻擊需要精心設計提示詞,團隊提出了一套全自動的攻擊構建管線,借助強大的語言模型(如Qwen2.5或GPT-4o)實現“只需示范幾例、無需手動改寫”的零人工攻擊生成。

團隊設計了三大關鍵策略,使得構造出的掩碼文本交錯的攻擊提示既自然流暢,又具強攻擊性:

  • 多樣化提示詞生成(Prompt Diversification):精心挑選多種類型的jailbreak示例(如對話、清單、Markdown 格式等),涵蓋多個危險行為類別,并注入風格擾動(如語氣、啰嗦程度等),以增強通用性與抗檢測性。
  • 多粒度掩碼策略(Masking Pattern Selection):不僅構造多樣化的提示詞內容,還在結構層面引入多粒度的掩碼操作(例如整段掩碼、關鍵動詞掩碼、逐步掩碼等),誘導模型生成更具威脅性的補全,同時實現對攻擊行為的精細控制。
  • 上下文對齊插入(Benign Separator Insertion):為了保持流暢性與隱蔽性,在掩碼位置插入短小、無害的上下文句子(如說明性、敘述性短語),讓攻擊提示詞在形式上看似正常,整體更加流暢,精準誘導模型生成高危內容。

通過上述設計,最終生成的攻擊提示詞具備以下三大優勢:

  • 結構自然:讀起來毫無違和感 - 上下文扎實:精心控制模型走向 - 攻擊效果強:自動生成即能突破對齊防線!

DIJA無需任何人工重寫,無需藏污納垢式 prompt變形改寫,真正實現了高效、穩健、可控的規模化攻擊生成。

圖片

實驗結果:多種dLLMs模型在DIJA攻擊下“全面潰敗”

研究團隊在4款代表性dLLM上全面測試DIJA攻擊效果,使用多種評估指標:

  • ASR-k:基于關鍵詞匹配的攻擊成功率
  • ASR-e &StrongREJECTscore:基于評估模型的攻擊成功率或攻擊成功分數
  • Harmfulnessscore:GPT-4o對模型回答的危險性評分

擴散語言模型的對齊效果與內在防御力

研究團隊首先探究了現有的擴散語言模型的安全對齊效果,如圖3,利用兩種越獄攻擊方法在三個benchmark上對4種擴散LLMs和自回歸LLMs的評估結果顯示,擴散語言模型的防御力整體上與自回歸語言模型相當甚至略微優于自回歸語言模型,在dLLMs中Dream-Instruct的安全性最好, MMaDA-MixCoT的安全性最差。

圖片

關鍵結果亮點

如表1,表2,表3所示:

  • DIJA在所有benchmarks上的ASR-k均取得了最高,這表明在DIJA攻擊下dLLMs幾乎不會拒絕回答任何危險性話題
  • 對于安全性最好的Dream-Instruct, DIJA 在 JailbreakBench的ASR-e上比最好的baseline ReNeLLM提升高達78.5%, 在StrongREJECT score上提升37.7

圖片

如圖5所示,DIJA 在面對兩種防御方法(Self-reminder 和 RPO)時依然保持攻擊效果,展現出極強的魯棒性。

圖片

dLLMs的安全短板不是bug,而是設計特性

DIJA攻擊之所以成功,不是模型“沒學好”,而是dLLM的基本設計可能本就無法阻止此類攻擊

模型失效的根本原因:

上下文雙向建模 → 掩碼可被“誘導性填充”:模型會根據前后文自動完成掩碼位,不區分是否含有危險語義。

并行解碼機制 → 無法逐位審查或中止生成:一次性輸出全部或者多個token,無中途拒絕機制。

當前缺乏局部安全對齊:當前alignment方法只在“完整任務”層面對模型進行調優,對單個token位置無感知。

結果就是,**攻擊者“只需掩碼,模型自動越界”。

dLLM安全時代剛剛開始,DIJA只是序章

這篇論文不僅提出了DIJA攻擊框架,更代表著一個新的研究方向開啟:“掩碼安全性”(Mask-Aware Safety)將成為未來擴散語言模型安全的新核心。研究者呼吁:

  • 設計基于掩碼位置的拒絕機制,例如局部風險評分 + 掩碼內容審查器;
  • 構建專為dLLM架構設計的對齊訓練流程;
  • 重新審視“生成控制”的語義單元,從輸出句子到token層面微調對抗。

作者簡介

本文由上海交通大學,上海人工智能實驗室和中山大學聯合完成。 主要作者包括上海交通大學博士生溫子辰,上海人工智能實驗室實習生屈嘉樹,青年研究員劉東瑞(Project lead)等。通訊作者為上海交通大學人工智能學院助理教授張林峰和上海人工智能實驗室青年科學家何聰輝

論文地址: https://arxiv.org/abs/2507.11097
代碼:https://github.com/ZichenWen1/DIJA

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-11-03 08:40:00

2025-06-24 08:50:00

模型數據AI

2025-06-18 09:03:07

2024-10-25 14:30:00

模型AI

2025-08-11 17:58:00

AI圖像生成數據

2025-10-20 09:02:00

2024-07-03 12:12:33

訓練模型

2024-05-17 16:02:00

2025-10-31 08:55:00

2025-07-28 09:13:00

2024-10-23 14:04:24

2023-09-03 16:20:30

2025-06-11 09:17:00

2024-04-25 14:40:47

2023-06-05 10:09:03

研究人工智能

2025-04-22 08:08:37

2025-05-27 01:27:00

LLM大模型數學推理

2023-09-14 12:35:59

2025-07-21 08:47:00

AI框架模型

2009-11-06 13:34:53

點贊
收藏

51CTO技術棧公眾號

国产精品一区二区三区在线播放 | 欧美激情91| 欧美一区二区三区的| 成年人午夜免费视频| а√天堂中文在线资源bt在线| 久久99日本精品| 久久男人的天堂| 麻豆精品免费视频| 欧美成年网站| 在线影院国内精品| 免费人成自慰网站| 巨大荫蒂视频欧美另类大| caoporm超碰国产精品| 国产精品视频大全| wwwxxx亚洲| 亚洲九九在线| 亚洲午夜国产成人av电影男同| 苍井空张开腿实干12次| 成人四虎影院| 欧美日韩国产限制| 香港三级日本三级a视频| yes4444视频在线观看| av在线综合网| 92国产精品视频| 成人黄色三级视频| 国产精品呻吟| 久久免费观看视频| 男人操女人的视频网站| 欧美性感美女一区二区| 日韩久久精品成人| 99re这里只有| 1204国产成人精品视频| 3d成人h动漫网站入口| 大陆极品少妇内射aaaaa| 2024最新电影在线免费观看| 国产精品二三区| 欧美在线激情| 青青草娱乐在线| 91在线观看地址| 国产亚洲欧美一区二区三区| www.日韩在线观看| 国产精品亚洲一区二区三区妖精 | 国内精品免费| 精品久久一区二区三区| 日本网站在线看| 国产色99精品9i| 欧美日本国产视频| 天天综合网久久| 欧美爱爱视频| 欧美日韩激情一区二区| 久久婷五月综合| 久久久成人av毛片免费观看| 欧美在线制服丝袜| 免费看污污网站| 8av国产精品爽爽ⅴa在线观看| 色先锋资源久久综合| 无码精品国产一区二区三区免费| 亚洲人体影院| 色一区在线观看| 麻豆三级在线观看| av日韩久久| 日韩一区二区三区三四区视频在线观看 | 视频一区亚洲| 麻豆传媒在线观看| 一区二区在线观看免费| 福利视频免费在线观看| 蜜桃视频在线观看免费视频| 日本久久电影网| 在线观看的毛片| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 久久久水蜜桃| 成年人视频在线观看免费| 国产精品美女www爽爽爽| 桥本有菜av在线| 精精国产xxxx视频在线中文版| 欧美日韩国产影院| 亚洲不卡视频在线| 精品国产一区二| 亚洲成色www8888| 久久久久亚洲av成人无码电影 | 久久综合久久网| 中文字幕人成乱码在线观看| 欧美系列在线观看| 韩国三级hd中文字幕有哪些| 日韩深夜影院| xxxx性欧美| 国产精品18p| 久久经典综合| 18成人在线| 青青草免费在线| 日韩一区在线免费观看| 老太脱裤让老头玩ⅹxxxx| 国产91在线播放精品| 精品国产三级电影在线观看| 亚洲理论片在线观看| 午夜精品婷婷| 国产精品成人观看视频国产奇米| 国产欧美日韩成人| 国产性做久久久久久| 黄色一级片国产| 91成人在线| 国产手机视频精品| 国产精品成人免费观看| 日韩黄色小视频| 国产精品亚洲一区| 麻豆影院在线| 在线视频欧美区| 在线观看一区二区三区四区| 色呦哟—国产精品| 日韩免费在线看| 手机在线观看毛片| 亚洲精品乱码久久久久| 9久久婷婷国产综合精品性色| 国产精品毛片av| 伦伦影院午夜日韩欧美限制| 欧美一区免费看| 97精品视频在线观看自产线路二| 久久精品国产精品亚洲精品色| 婷婷综合六月| 日韩av在线直播| 成人免费看片98| 国产一区二区女| 视频一区二区在线| videos性欧美另类高清| 亚洲激情成人网| 欧美日韩一级在线观看| 久久se精品一区二区| 日本一区免费观看| 中文字幕在线看片| 日韩电影免费观看中文字幕| 久草视频在线资源站| 国内精品伊人久久久久影院对白| 五月婷婷综合色| 日韩一区二区三区在线免费观看| 日韩成人黄色av| 一级片免费网址| 成人午夜私人影院| 日韩一级特黄毛片| 粉嫩av一区二区| 欧美精品久久久久久久免费观看 | 欧美精品亚洲精品日韩精品| 国产一区二区毛片| 中文字幕の友人北条麻妃| 高清一区二区| 欧美老妇交乱视频| 精品黑人一区二区三区国语馆| 亚洲日穴在线视频| 天天爽夜夜爽视频| 韩国久久久久| 精品一区二区国产| 国产欧美一区二区三区精品酒店| 国产视频精品va久久久久久| 日韩人妻精品中文字幕| 久久久久久久国产精品影院| 国产精品人人妻人人爽人人牛| 国产调教一区二区三区| 国产精品视频免费在线观看| 免费观看久久久久| 欧美不卡一二三| 日韩aaaaaa| 国产欧美久久久精品影院| 亚洲最大综合网| 亚洲理论电影网| 国产精品久久久久久久久久久久冷| av在线不卡免费| 日韩精品免费在线观看| 日韩精品在线一区二区三区| 亚洲欧美综合在线精品| 男插女视频网站| 亚洲视频播放| 亚洲高清不卡一区| 亚洲欧美日本国产| 欧美在线视频网站| 中文字幕日本在线| 日韩欧美专区在线| 亚洲伊人成人网| 国产精品久久影院| 性活交片大全免费看| 石原莉奈一区二区三区在线观看| 亚洲精蜜桃久在线| 国产厕拍一区| 国产精品嫩草影院久久久| 国产福利视频在线| 亚洲精品大尺度| 亚洲一区精品在线观看| 亚洲成人7777| 五月婷婷六月香| 成人晚上爱看视频| 91看片在线免费观看| 一区二区亚洲精品| 亚洲精品一品区二品区三品区 | 国产一级二级三级视频| 久久久久久电影| 精品国产午夜福利在线观看| 免费日韩av片| 久久久天堂国产精品| 精品在线观看入口| 成人在线免费观看一区| 欧美精品资源| 韩日欧美一区二区| 午夜免费视频在线国产| 亚洲精品美女久久| 国产jzjzjz丝袜老师水多| 日本精品一区二区三区高清| 日本少妇裸体做爰| 自拍偷在线精品自拍偷无码专区| av无码av天天av天天爽| 国产高清久久久久| 九九精品久久久| 久久久久99| 成人免费观看cn| 亚洲欧美伊人| 亚洲欧洲三级| 北条麻妃国产九九九精品小说| 精品国产乱码久久久久久108| 精品国产亚洲一区二区三区大结局 | 亚洲欧美一区二区激情| 亚洲AV无码精品色毛片浪潮| 欧美日本一区二区三区| 国产字幕在线观看| 欧美午夜激情在线| 日本三级欧美三级| 亚洲一区中文日韩| 久久免费看少妇高潮v片特黄| 亚洲国产精品成人综合色在线婷婷| 国产精品久久AV无码| 成人免费av网站| 伊人av在线播放| 国产精品99久久久久久宅男| 成人日韩在线视频| 免费成人av资源网| 日本黄大片一区二区三区| 久久亚洲电影| 成人在线观看a| 久久久成人网| 999精品视频在线| 日韩**一区毛片| 亚洲黄色小视频在线观看| 日韩专区中文字幕一区二区| 漂亮人妻被中出中文字幕| 日韩一区二区久久| 乱妇乱女熟妇熟女网站| 男人天堂欧美日韩| 日本免费一级视频| 日本不卡一区二区三区| 美女网站视频黄色| 国产主播一区二区三区| 久久久久久久久久久久久久久国产| 久久av资源站| 在线观看日本www| 国产成人自拍网| 国产高潮失禁喷水爽到抽搐| 成+人+亚洲+综合天堂| 国产中文字幕一区二区| 久久影视一区二区| 欧美一区二区三区粗大| 亚洲日本在线a| 久久精品免费在线| 懂色av影视一区二区三区| 在线观看日本视频| 欧美日韩成人激情| 精品国产亚洲av麻豆| 亚洲精品www久久久久久广东| 黄色av网站在线看| zzijzzij亚洲日本成熟少妇| 欧美v亚洲v| 91精品国产91久久久久久久久| 人成在线免费网站| 国产精品专区一| 久久99精品国产.久久久久久| 97视频在线观看播放| 日韩理论视频| 国产精品欧美日韩久久| 亚洲男人在线| 国产精品视频在线免费观看| 欧美美女在线| 精品一区二区三区毛片| 一本色道久久综合一区| 中文字幕有码av| 国产成a人亚洲精| 99久久久无码国产精品性| 日韩一区欧美一区| 精品成人久久久| 欧美日韩国产一级二级| 秋霞视频一区二区| www.午夜精品| аⅴ资源天堂资源库在线| 国产精品视频xxxx| 国内视频在线精品| 影音先锋欧美在线| 国产日韩专区| 一级黄色高清视频| 久久久不卡网国产精品一区| 国产精品视频一区二区三| 欧美日韩亚洲系列| 国产黄a三级三级三级| 亚洲人成电影网站| 蜜臀av国内免费精品久久久夜夜| 国产成人高清激情视频在线观看| 日韩精品一区国产| 亚洲欧美日产图| av成人天堂| 久久久久无码精品| 国产精品免费网站在线观看| 香蕉免费毛片视频| 日韩一区二区免费在线观看| a中文在线播放| 69视频在线免费观看| 日韩精品一级| 99精品一级欧美片免费播放| 日本亚洲最大的色成网站www| 人妻换人妻a片爽麻豆| 国产精品福利电影一区二区三区四区| 国内精品福利视频| 欧美精品一区二区精品网| 超碰免费在线播放| 国产精品网址在线| 国产探花在线精品一区二区| 少妇av一区二区三区无码| 国产高清精品久久久久| 国产免费一区二区三区四区| 欧美性受xxxx| 九色视频成人自拍| 日本国产精品视频| 精品视频自拍| www.av毛片| 成人黄页在线观看| 久久久久久久九九九九| 8v天堂国产在线一区二区| 中文字幕在线免费| 成人福利网站在线观看| 日韩国产一区二区| 天天色综合天天色| 中文字幕欧美三区| 日本丰满少妇做爰爽爽| 亚洲午夜激情免费视频| 日韩成人动漫| 日韩欧美三级一区二区| 日本强好片久久久久久aaa| 男人天堂av电影| 欧美性大战久久久久久久蜜臀| 久久精品色图| 日本高清不卡的在线| 国产免费av一区二区三区| 精品国产成人av在线免| 国产午夜精品一区二区三区四区| 国产女主播喷水视频在线观看 | 国产精品伊人日日| 激情久久一区| 在线免费播放av| 色噜噜久久综合| 色的视频在线免费看| 91免费在线视频网站| 亚洲最新av| 中国极品少妇xxxx| 福利视频导航一区| 第九色区av在线| 成人国内精品久久久久一区| 在线成人超碰| 国产高潮视频在线观看| 欧美日韩一区二区三区在线免费观看| 男女av在线| 成人h猎奇视频网站| 国产一区欧美| 91精品人妻一区二区三区| 精品婷婷伊人一区三区三| 国产激情视频在线| 国内外成人免费视频| 午夜在线精品偷拍| 成人18视频免费69| 精品日韩在线一区| 日韩精品影片| 国产大尺度在线观看| 91亚洲精品久久久蜜桃| 在线免费av片| 久久人91精品久久久久久不卡| 精品在线99| 日本55丰满熟妇厨房伦| 欧美日韩中文字幕综合视频| 日本在线免费中文字幕| 国产精品对白一区二区三区| 视频一区二区不卡| 日本天堂中文字幕| 亚洲欧洲国产伦综合| 不卡的国产精品| 精品久久一二三| 亚洲四区在线观看| 男男电影完整版在线观看| 亚洲综合av影视| 免费久久99精品国产自在现线| 成人三级视频在线观看| 亚洲精品国产精品久久清纯直播 | 国产在线播放一区二区| 美腿丝袜亚洲综合| 伊人久久综合视频| 久久精品精品电影网| 亚洲另类av| 人妻互换一二三区激情视频| 欧美色大人视频| 精品丝袜在线|