精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華團(tuán)隊攻破GPT-4V、谷歌Bard等模型,商用多模態(tài)大模型也脆弱?

人工智能 新聞
為了更好地理解商用 MLLMs 的漏洞,清華朱軍教授領(lǐng)銜的人工智能基礎(chǔ)理論創(chuàng)新團(tuán)隊圍繞商用 MLLM 的對抗魯棒性展開了研究。

GPT-4 近日開放了視覺模態(tài)(GPT-4V)。以 GPT-4V、谷歌 Bard 為代表的多模態(tài)大語言模型 (Multimodal Large Language Models, MLLMs) 將文本和視覺等模態(tài)相結(jié)合,在圖像描述、視覺推理等各種多模態(tài)任務(wù)中展現(xiàn)出了優(yōu)異的性能。然而,視覺模型長久以來存在對抗魯棒性差的問題,而引入視覺模態(tài)的 MLLMs 在實際應(yīng)用中仍然存在這一安全風(fēng)險。最近一些針對開源 MLLMs 的研究已經(jīng)證明了該漏洞的存在,但更具挑戰(zhàn)性的非開源商用 MLLMs 的對抗魯棒性還少有人探索。

為了更好地理解商用 MLLMs 的漏洞,清華朱軍教授領(lǐng)銜的人工智能基礎(chǔ)理論創(chuàng)新團(tuán)隊圍繞商用 MLLM 的對抗魯棒性展開了研究。盡管 GPT-4V、谷歌 Bard 等模型開放了多模態(tài)接口,但其內(nèi)部模型結(jié)構(gòu)和訓(xùn)練數(shù)據(jù)集仍然未知,且配備了復(fù)雜的防御機(jī)制。盡管如此,研究發(fā)現(xiàn),通過攻擊白盒圖像編碼器或 MLLMs,生成的對抗樣本可以誘導(dǎo)黑盒的商用 MLLMs 輸出錯誤的圖像描述,針對 GPT-4V 的攻擊成功率達(dá)到 45%,Bard 的攻擊成功率達(dá)到 22%,Bing Chat 的攻擊成功率達(dá)到 26%。同時,團(tuán)隊還發(fā)現(xiàn),通過對抗攻擊可以成功繞過 Bard 等模型對于人臉檢測和圖像毒性檢測等防御機(jī)制,導(dǎo)致模型出現(xiàn)安全風(fēng)險。

圖片

  • 論文鏈接:https://arxiv.org/abs/2309.11751
  • 代碼鏈接:https://github.com/thu-ml/ares/tree/attack_bard

圖片

圖 1:對抗攻擊多模態(tài)大模型示例,可以使模型產(chǎn)生錯誤預(yù)測或者繞過安全性檢測模塊

下圖展示了針對 Bard 的攻擊測試。當(dāng)輸入自然樣本圖片時,Bard 可以正確描述出圖片中的主體(“a panda’s face(一個熊貓的臉)”);當(dāng)輸入對抗樣本時,Bard 會將該圖片的主體錯分類為 “a woman’s face(一個女人的臉)”。

圖片

對抗攻擊方法

MLLMs 通常使用視覺編碼器提取圖像特征,然后將圖像特征通過對齊后輸入大語言模型生成相應(yīng)的文本描述。因此該研究團(tuán)隊提出了兩種對抗攻擊 MLLMs 的方法:圖像特征攻擊、文本描述攻擊。圖像特征攻擊使對抗樣本的特征偏離原始圖像的特征,因為如果對抗樣本可以成功破壞圖像的特征表示,則生成的文本將不可避免地受到影響。另一方面,文本描述攻擊直接針對整個流程進(jìn)行攻擊,使生成的描述與正確的描述不同。

圖像特征攻擊:令 圖片 表示自然樣本,圖片 表示替代圖像編碼器的集合,則圖像特征攻擊的目標(biāo)函數(shù)可以表示為:

圖片

其中,通過最大化對抗樣本 x 和自然樣本 圖片 的圖像特征之間的距離進(jìn)行優(yōu)化,同時還確保 x 和 圖片 之間的 圖片 距離小于擾動規(guī)模圖片

文本描述攻擊:令 圖片 表示替代 MLLMs 的集合,其中 圖片 可以在給定圖片 x ,文本提示 p 以及之前預(yù)測的詞 圖片 時,預(yù)測出下一個詞圖片的概率分布,表示為 圖片。因此,文本描述攻擊可以表述為最大化預(yù)測目標(biāo)句子 圖片的對數(shù)似然:

圖片

值得注意的是文本描述攻擊是針對給定目標(biāo)句子的有目標(biāo)攻擊,而不是最小化真實描述的對數(shù)似然的無目標(biāo)攻擊,這是因為存在對圖像的多個正確描述。

攻擊方法:為了解決上述對抗樣本的優(yōu)化問題,該研究團(tuán)隊采用了自研的目前遷移性最好的對抗攻擊方法 Common Weakness Attack (CWA)[1]。

數(shù)據(jù)集:在 NIPS17 數(shù)據(jù)集 [2] 中隨機(jī)選取 100 張圖片作為自然樣本。

替代模型:對于圖像特征攻擊選用的替代模型為 ViT-B/16、CLIP 和 BLIP-2 的圖像編碼器;對于文本描述攻擊選用 BLIP-2、InstructBLIP 和 MiniGPT-4。

評價指標(biāo):測量攻擊成功率來評估的魯棒性。認(rèn)為只有當(dāng)圖像中的主體被錯誤地預(yù)測時,攻擊才成功,其他錯誤的細(xì)節(jié),如幻覺,物體計數(shù),顏色或背景,被認(rèn)為是不成功的攻擊。

下圖分別展示了針對 GPT-4V、Bard、Bing Chat 上對抗樣本攻擊成功的示例。

圖 2:攻擊 GPT-4V 示例,將羚羊描述為手。

圖片

圖 3:攻擊 Bard 示例,將大熊貓描述為女人的臉

圖片

圖 4:攻擊 Bing Chat 示例,將白頭雕識別為貓和狗

圖片

圖 5:攻擊文心一言示例,將咖啡識別為手表

下表中展示了上述方法針對不同商用模型的攻擊成功率。可以看到,Bing Chat 存在很大的幾率拒絕回答帶有噪聲的圖像。整體上谷歌 Bard 的魯棒性最好。

圖片

表 1:針對商用多模態(tài)大模型的攻擊效果

針對 Bard 防御機(jī)制的攻擊

在該研究團(tuán)隊對 Bard 的評估中,發(fā)現(xiàn) Bard 部署了(至少)兩種防御機(jī)制,包括人臉檢測和毒性檢測。Bard 將直接拒絕包含人臉或有毒內(nèi)容的圖像(例如,暴力、血腥或色情圖像)。這些防御機(jī)制被部署以保護(hù)人類隱私并避免濫用。然而,對抗攻擊下的防御魯棒性是未知的。因此,該研究團(tuán)隊針對這兩種防御機(jī)制進(jìn)行了評估。

人臉檢測器攻擊:為了使 Bard 的人臉檢測器無法識別到對抗樣本中的人臉并輸出帶有人臉信息的預(yù)測,研究者針對白盒人臉檢測器進(jìn)行攻擊,降低模型對人臉圖像的識別置信度。攻擊方法仍然采用 CWA 方法,在 LFW 和 FFHQ 等數(shù)據(jù)集上進(jìn)行實驗。

下圖為人臉對抗樣本在 Bard 上攻擊成功的示例。總體上對 Bard 人臉檢測模塊的對抗攻擊成功率達(dá)到了 38%,即有 38% 的人臉圖片無法被 Bard 檢測到,并輸出對應(yīng)的描述。

圖片

圖 6:攻擊 Bard 的人臉檢測模型

毒性檢測器攻擊:為了防止提供對有毒圖像的描述,Bard 采用毒性檢測器來過濾掉此類圖像。為了攻擊它,需要選擇某些白盒毒性檢測器作為替代模型。該研究團(tuán)隊發(fā)現(xiàn)一些現(xiàn)有的毒性檢測器是預(yù)訓(xùn)練視覺模型 CLIP 上進(jìn)行微調(diào)得到的。針對這些替代模型的攻擊,只需要擾動這些預(yù)訓(xùn)練模型的特征即可。因此,可以采用與圖像特征攻擊完全相同的目標(biāo)函數(shù)。并使用相同的攻擊方法 CWA。

該研究團(tuán)隊手動收集了一組 100 張含有暴力、血腥或色情內(nèi)容的有毒圖像,對 Bard 的毒性探測器的攻擊成功率達(dá)到 36%。如下圖所示,毒性檢測器不能識別具有對抗性噪聲的毒性圖像。因此,Bard 為這些圖像提供了不適當(dāng)?shù)拿枋觥T搶嶒瀼娬{(diào)了惡意攻擊者利用 Bard 生成有害內(nèi)容的不合適描述的可能性。

圖片

圖 7:攻擊 Bard 的毒性檢測模型

討論與總結(jié)

上述研究表明,通過使用最先進(jìn)的基于遷移的攻擊來優(yōu)化圖像特征或文本描述的目標(biāo),目前主流的商用多模態(tài)大模型也會被成功的欺騙誤導(dǎo)。作為大型基礎(chǔ)模型(例如,ChatGPT、Bard)已經(jīng)越來越多地被人類用于各種任務(wù),它們的安全問題成為公眾關(guān)注的一個大問題。對抗攻擊技術(shù)還可以破壞 LLM 的安全與對齊,帶來更加嚴(yán)重的安全性問題。

此外,為保證大模型的安全性,需要針對性進(jìn)行防御。經(jīng)典的對抗訓(xùn)練方法由于計算成本較高,應(yīng)用于大規(guī)模預(yù)訓(xùn)練模型較為困難。而基于圖像預(yù)處理的防御更適合于大模型,可以通過即插即用的方式使用。一些最近的工作利用了先進(jìn)的生成模型(例如,擴(kuò)散模型)以凈化對抗擾動(例如,似然最大化 [3]),這可以作為防御對抗樣本的有效策略,但是總體來說如何提升大模型的魯棒性和抗干擾能力,仍然是一個開放的問題,尚有很大的探索和提升空間。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-10-12 13:05:00

谷歌AI

2024-01-03 12:56:39

2024-02-02 21:53:58

AI訓(xùn)練

2024-04-14 19:53:44

2023-10-12 09:28:17

2023-08-30 13:23:00

模型訓(xùn)練

2024-06-27 13:10:21

2024-06-04 14:11:00

2023-10-10 13:42:56

訓(xùn)練數(shù)據(jù)

2025-01-08 08:21:16

2024-06-11 08:16:00

2024-05-11 07:00:00

GPT4VGemini大模型

2023-04-28 15:27:06

微軟模型

2023-09-19 13:48:31

AI數(shù)據(jù)

2025-09-16 09:35:52

2024-03-01 11:58:26

MLLMs大語言模型人工智能

2023-09-20 08:55:00

模型工具

2023-05-19 13:01:10

ChatGPT模型

2024-06-12 11:50:23

點贊
收藏

51CTO技術(shù)棧公眾號

先锋在线资源一区二区三区| 久久综合亚洲社区| 欧美激情国产精品日韩| 国产在线观看免费网站| 另类小说欧美激情| 欧美精品xxx| 久久av无码精品人妻系列试探| 欧洲成人一区| 亚洲午夜私人影院| 日韩经典在线视频| 午夜精品在线播放| 日韩电影免费在线看| 欧美高清激情视频| 人人妻人人澡人人爽| 欧美日本三级| 日本乱码高清不卡字幕| 奇米777四色影视在线看| 欧美少妇另类| 国产精品主播直播| 国产精品99久久久久久白浆小说| 国产又黄又爽又无遮挡| 国产成人三级| 精品国产乱码久久久久久图片 | 视频二区在线| 激情五月激情综合网| 国产91精品高潮白浆喷水| 国产中文av在线| 亚洲人成精品久久久 | 欧美最猛性xxxxx免费| 国产精品丝袜一区二区| 国产精品视频一区二区三区四蜜臂| 日韩一级片网站| 我要看一级黄色大片| 亚洲国产欧美日本视频| 亚洲国产精品久久人人爱| 一区二区三区久久网| 每日更新在线观看av| 成人a区在线观看| 亚洲一区免费网站| 亚洲无码久久久久| 日韩精品免费视频人成| 91成人免费观看网站| 国产精品30p| 欧美高清一区| 不用播放器成人网| 韩国一级黄色录像| 国产精品7m凸凹视频分类| 国产亚洲精品高潮| 欧美成人午夜精品免费| 国内自拍欧美| 亚洲国产欧美一区二区三区同亚洲| 岛国大片在线免费观看| 免费看日产一区二区三区| 欧美日本一道本在线视频| 性欧美1819| 欧美a一级片| 欧美嫩在线观看| 污污网站免费看| 欧美电影在线观看网站| 欧美偷拍一区二区| jizz大全欧美jizzcom| 国产福利一区二区三区在线播放| 欧美这里有精品| 国产一级特黄a大片免费| 高清av一区| 欧美日韩精品系列| 潘金莲激情呻吟欲求不满视频| 日韩黄色三级在线观看| 91麻豆精品国产自产在线| 日日干日日操日日射| 精品国产一区二区三区2021| 日韩三区在线观看| 丰满岳乱妇一区二区| 欧美大胆视频| 亚洲人成欧美中文字幕| 日本人亚洲人jjzzjjz| 日韩精品第一区| 久久在线精品视频| 精品无码人妻一区二区三| 日韩天天综合| 国产精品盗摄久久久| 亚洲系列第一页| 国产不卡在线一区| 精品一区二区日本| av在线女优影院| 亚洲精品老司机| 成人毛片一区二区| 福利一区视频| 精品久久久久香蕉网| 无码熟妇人妻av| 国产精品毛片一区二区在线看| 色综合久久88色综合天天看泰| 国产 欧美 日韩 在线| 日韩精品成人一区二区三区| 91九色国产社区在线观看| 六月丁香色婷婷| 国产欧美一区二区精品忘忧草| 一级黄色录像免费看| 密臀av在线播放| 欧美精品色综合| 欧美肉大捧一进一出免费视频| 欧美猛男做受videos| 欧美成人在线网站| 日本久久综合网| 国产成人在线视频网站| 欧美日韩一区二区三| 中文字幕中文字幕在线十八区| 欧美日韩在线免费| 久久aaaa片一区二区| 欧美女王vk| 欧美另类xxx| 毛片在线免费播放| 不卡欧美aaaaa| 大桥未久一区二区| 欧美日韩美女| 精品免费视频一区二区| 91禁男男在线观看| 在线综合欧美| av在线亚洲男人的天堂| 日韩精品毛片| 日本久久一区二区三区| 一级欧美一级日韩片| 香蕉视频官网在线观看日本一区二区| 4p变态网欧美系列| 亚洲国产www| 亚洲女人的天堂| 污视频免费在线观看网站| 色吊丝一区二区| 国内精品视频一区| 丰满少妇一级片| 亚洲欧美激情小说另类| 最新天堂中文在线| 精品一区二区三| 欧美亚洲成人网| 韩国av永久免费| 一区二区三区国产| 国产高清999| 久久久久美女| 91免费观看网站| 麻豆电影在线播放| 欧美日韩精品欧美日韩精品| 无码少妇精品一区二区免费动态| 午夜宅男久久久| 国产在线精品一区二区三区| 欧洲在线视频| 亚洲成人精品视频| 免费在线观看日韩| 国产福利电影一区二区三区| 中文字幕一区二区三区四区五区人| 亚洲伦理久久| 久久艳片www.17c.com| 国产一区二区在线不卡| 日韩美女久久久| 亚洲天堂av一区二区三区| 亚洲精品在线观看91| 亚洲自拍偷拍网址| 四虎影院观看视频在线观看| 欧美大片日本大片免费观看| 久久免费黄色网址| 成人18视频日本| 国产精品沙发午睡系列| 中文字幕精品影院| 国产精品午夜一区二区欲梦| 亚洲欧美视频一区二区| 在线播放国产精品二区一二区四区| 国产suv精品一区二区68| 国产精品一品视频| 日韩中字在线观看| 自拍偷拍精品| 国产一区香蕉久久| 午夜在线激情影院| 亚洲精品99久久久久中文字幕| 青青青国产在线| 国产精品丝袜一区| 少妇愉情理伦片bd| 亚洲精品少妇| 亚洲高清资源综合久久精品| 国产aⅴ精品一区二区四区| 久久久久久久久爱| 国产高清在线看| 91精品国产欧美一区二区| 久久久国产成人| 2024国产精品| 浓精h攵女乱爱av| 欧美69视频| 精品国产免费一区二区三区 | 国产精品视频成人| 超碰人人在线| 亚洲免费精彩视频| 国产精品人人爽| 午夜久久久久久久久久一区二区| 男女做爰猛烈刺激| 国产一区二区在线影院| 狠狠干 狠狠操| 99久久99久久精品国产片桃花| 国产精品theporn88| 高清电影一区| 色综合久久精品亚洲国产| 狠狠狠综合7777久夜色撩人| 欧美一区二区免费观在线| 欧美一区二区激情视频| 亚洲欧洲www| 欧美多人猛交狂配| 国产精品资源在线| 成人免费在线观看视频网站| 亚洲国产裸拍裸体视频在线观看乱了中文| 欧美日韩亚洲一区二区三区在线观看 | 一区二区免费av| 在线亚洲一区| 超薄肉色丝袜足j调教99| 国内精品视频在线观看| 国产精品国色综合久久| 永久免费观看精品视频| 国产91网红主播在线观看| 欧美videossex| 久久天天躁狠狠躁夜夜躁| 国产三级电影在线观看| 欧美精品一区二区三区蜜桃视频 | 美女视频网站久久| 国产精品沙发午睡系列| 国产一区观看| 女女百合国产免费网站| 亚洲中文字幕一区| 噜噜噜在线观看免费视频日韩| 乱子伦一区二区| 成人激情在线| 欧美高清视频一区| 亚洲精品国产九九九| 成人看片人aa| 欧洲精品久久久久毛片完整版| 日韩av三级在线观看| xxx.xxx欧美| 欧美寡妇偷汉性猛交| 毛片激情在线观看| 色综合伊人色综合网| 黄色视屏网站在线免费观看| 亚洲精品国产综合久久| 欧美特级特黄aaaaaa在线看| 日韩一区二区在线免费观看| 国产又粗又猛又色又| 欧美美女bb生活片| 一级特黄aa大片| 婷婷综合激情| 在线日韩精品视频| 深夜福利免费在线观看| 日韩精品中文字幕一区二区三区| 国产精品伦理一区| 国户精品久久久久久久久久久不卡| 一本久道久久综合| 日本欧美视频| 亚洲国产精品一区在线观看不卡| 九色精品91| 日韩av不卡播放| 精品久久久中文字幕| 日韩亚洲视频| 色男人天堂综合再现| 一区二区三区四区国产| 99国产精品一区二区| 亚洲图片小说在线| 亚洲视频电影在线| 日韩一级片一区二区| 狠狠噜噜久久| 91视频 - 88av| 最新日韩在线| 99福利在线观看| 日本亚洲欧美天堂免费| 中文av字幕在线观看| 国产成人av网站| 无码人妻精品一区二区三区温州 | 四虎精品成人免费网站| 亚洲视频自拍偷拍| 久久亚洲天堂| 国模吧一区二区| 人人鲁人人莫人人爱精品| 国产一区二区香蕉| 国产精品国产| 日本亚洲欧洲精品| 中文字幕日韩欧美精品高清在线| 波多野结衣av一区二区全免费观看| 日韩亚洲精品在线| 亚洲精品高清无码视频| 国内成人免费视频| 天堂www中文在线资源| 国产亚洲欧洲一区高清在线观看| 波兰性xxxxx极品hd| 亚洲国产精品久久一线不卡| 波多野结衣黄色| 精品国产91洋老外米糕| 精品乱码一区二区三四区视频 | 99热这里只有精品4| 亚洲地区一二三色| 中文字幕欧美在线观看| 精品嫩草影院久久| 中文字幕在线播放| 午夜精品99久久免费| 久久国产三级| 久久大片网站| 你懂的一区二区| 天天操天天摸天天爽| 成人美女在线视频| 艳妇荡乳欲伦69影片| 精品免费在线视频| 国产欧美一区二区三区视频在线观看| 精品爽片免费看久久| 超碰caoporn久久| 国产成人精品最新| 国产精品视屏| 艳母动漫在线免费观看| 日韩国产精品大片| 91玉足脚交白嫩脚丫| 日韩毛片高清在线播放| 无码日韩精品一区二区| 精品久久久久一区二区国产| 免费网站免费进入在线| 久久精品国产精品青草| 天天做天天干天天操| 91亚洲精品一区二区乱码| 丝袜美腿小色网| 亚洲免费看片| 亚洲国模精品一区| 国产精品一卡二卡三卡| 日本一欧美一欧美一亚洲视频| 98视频精品全部国产| 在线国产99| 蜜桃传媒麻豆第一区在线观看| 一级特级黄色片| 亚洲国产成人av好男人在线观看| 一级黄色a视频| 国产午夜精品视频免费不卡69堂| 成人国产电影在线观看| 99久久伊人精品影院| 91高清一区| 国产成人在线综合| 国产亚洲欧美激情| 4438国产精品一区二区| 日韩精品久久久久久福利| wwww亚洲| 成人av播放| 国产精品va| 国产精品成人免费一区久久羞羞| 亚洲激情图片qvod| 国产999久久久| 美女精品视频一区| 亚洲免费一区三区| 黄色网在线视频| 丁香亚洲综合激情啪啪综合| 精品午夜福利在线观看| 精品三级在线看| 超清av在线| 精品国产_亚洲人成在线| 亚洲看片一区| 成人网站免费观看| 在线国产电影不卡| 生活片a∨在线观看| 成人美女av在线直播| 亚洲网色网站| 久久久久亚洲av无码网站| 亚洲一区二区三区影院| 人妻精品一区一区三区蜜桃91| 久久久久久亚洲精品中文字幕| 精品中国亚洲| 日本免费一级视频| 国产欧美一区二区三区沐欲| 夜夜爽8888| 欧美裸体男粗大视频在线观看| 视频一区国产| 无码专区aaaaaa免费视频| 91欧美一区二区| 国产女优在线播放| 久久精品视频在线| ccyy激情综合| 日韩欧美在线播放视频| 国产精品久久毛片av大全日韩| 99草在线视频| 97国产精品人人爽人人做| 欧美日韩一区二区综合 | 久久99国内精品| 国产av无码专区亚洲av毛网站| 欧美精品一区男女天堂| 亚洲va中文在线播放免费| 一本一道久久a久久精品综合| 国产激情视频一区二区在线观看 | 伊人久久大香线蕉av超碰演员| 精品人妻一区二区免费视频| 在线观看国产精品网站| 国产精品久久麻豆| 国产伦精品一区二区三区免| 久久人人超碰| 国模无码国产精品视频| 日韩精品在线影院| 国产精品高清一区二区| 免费在线激情视频| 亚洲欧美aⅴ...| 国产视频三级在线观看播放| 91在线在线观看| 日韩精品乱码免费| 日韩精品一区二区三区国语自制| 亚洲一级黄色av| 成人春色在线观看免费网站| 狠狠躁狠狠躁视频专区|