精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為什么安全團(tuán)隊(duì)不能僅僅依賴AI護(hù)欄

安全
研究發(fā)現(xiàn),當(dāng)前AI模型依賴的防護(hù)欄防御系統(tǒng)存在根本性漏洞,攻擊者使用表情符號(hào)、Unicode標(biāo)簽隱藏等簡(jiǎn)單技術(shù)即可實(shí)現(xiàn)近100%繞過(guò),其核心問(wèn)題在于防護(hù)欄的預(yù)處理標(biāo)記器會(huì)因設(shè)計(jì)權(quán)衡而 "凈化 "對(duì)抗性內(nèi)容,導(dǎo)致分類器誤判。

為了防御提示詞注入攻擊(prompt injection),許多LLM都配備了防護(hù)欄,這些防護(hù)欄負(fù)責(zé)檢查和過(guò)濾輸入的提示詞,然而,這些防護(hù)欄本身通常也是基于AI的分類器,正如Mindgard的研究所示,它們?cè)谀承╊愋偷墓裘媲巴瑯哟嗳酢?/p>

防護(hù)欄被譽(yù)為L(zhǎng)LM的關(guān)鍵防御手段。從你的角度來(lái)看,關(guān)于防護(hù)欄在實(shí)際應(yīng)用中的有效性,最大的誤解是什么?

如果退一步問(wèn)任何安全專家:“我會(huì)放心地依賴Web應(yīng)用防火墻(WAF)作為保護(hù)企業(yè)的唯一關(guān)鍵防御手段嗎?”答案(希望如此)將是否定的。防護(hù)欄的作用類似于防火墻,試圖檢測(cè)和阻止惡意提示詞。盡管它們是防御體系的一部分,但確保有效的防御需要部署的不僅僅是單一解決方案,另一方面,一個(gè)常見(jiàn)的誤解是,它們?cè)诿鎸?duì)稍微有動(dòng)力的攻擊者時(shí)仍然有效。

防護(hù)欄使用AI模型進(jìn)行檢測(cè),而這些模型本身存在盲點(diǎn)。阻止“明顯”的惡意或有害指令是一回事,但當(dāng)提示詞可以以極其多種組合方式(改變字母、單詞、改寫等)編寫時(shí),人類可能能夠理解,但防護(hù)欄卻難以應(yīng)對(duì)。

研究表明,使用表情符號(hào)和Unicode隱藏(smuggling)等簡(jiǎn)單技術(shù),繞過(guò)防護(hù)欄的成功率接近100%。為什么這些基本方法對(duì)那些本應(yīng)檢測(cè)操縱行為的系統(tǒng)如此有效?

表情符號(hào)和Unicode標(biāo)簽隱藏技術(shù)之所以如此有效,是因?yàn)樗鼈兝昧朔雷o(hù)欄自然語(yǔ)言處理(NLP)管道中預(yù)處理和標(biāo)記化階段的弱點(diǎn)。防護(hù)欄系統(tǒng)依賴于標(biāo)記器將輸入文本分割并編碼為離散單元,以便模型進(jìn)行分類,然而,當(dāng)對(duì)抗性內(nèi)容嵌入到復(fù)雜的Unicode結(jié)構(gòu)中(如表情符號(hào)變化選擇器或標(biāo)簽序列)時(shí),標(biāo)記器往往無(wú)法保留嵌入的語(yǔ)義。

例如,當(dāng)文本被注入到表情符號(hào)的元數(shù)據(jù)中或使用Unicode標(biāo)簽修飾符附加時(shí),標(biāo)記器可能會(huì)將序列折疊成一個(gè)單一的、無(wú)害的標(biāo)記,或者完全丟棄它。結(jié)果,嵌入的內(nèi)容從未以原始形式到達(dá)分類器,這意味著模型看到的是一個(gè)經(jīng)過(guò)凈化的輸入,不再代表實(shí)際的提示詞,這導(dǎo)致了系統(tǒng)性的誤分類。

這些失敗并不一定是標(biāo)記器中的錯(cuò)誤,而是設(shè)計(jì)上的權(quán)衡,優(yōu)先考慮了規(guī)范化和效率而非對(duì)抗性魯棒性。標(biāo)準(zhǔn)標(biāo)記器并非為解釋或保留對(duì)抗性構(gòu)造的Unicode序列中的語(yǔ)義意義而構(gòu)建。除非防護(hù)欄融入了專門設(shè)計(jì)用于檢測(cè)或解包這些編碼的預(yù)處理層,否則它們?nèi)匀粚?duì)嵌入的有效載荷視而不見(jiàn)。這凸顯了攻擊者編碼意義的方式與分類器處理它的方式之間的根本差距。

在對(duì)抗性機(jī)器學(xué)習(xí)中,擾動(dòng)被設(shè)計(jì)為對(duì)人類來(lái)說(shuō)不可察覺(jué)。這是否為開發(fā)可解釋或可理解的防御手段帶來(lái)了獨(dú)特的挑戰(zhàn)?

不可察覺(jué)的擾動(dòng)確實(shí)為開發(fā)可解釋的防御手段帶來(lái)了獨(dú)特的挑戰(zhàn)。AI模型對(duì)數(shù)據(jù)的解釋方式與人類完全不同,對(duì)我們來(lái)說(shuō)不會(huì)改變內(nèi)容上下文或語(yǔ)義意義的擾動(dòng),可能會(huì)極大地改變AI模型的決策。這種脫節(jié)使得解釋為什么模型會(huì)無(wú)法分類我們憑直覺(jué)就能理解的文本變得困難。這種脫節(jié)反過(guò)來(lái)又降低了開發(fā)者基于對(duì)抗性擾動(dòng)改進(jìn)防御手段的有效性。

論文指出,防護(hù)欄檢測(cè)的內(nèi)容與LLM理解的內(nèi)容之間存在脫節(jié)。安全團(tuán)隊(duì)?wèi)?yīng)如何解決這種行為和訓(xùn)練數(shù)據(jù)之間的根本不匹配?

核心問(wèn)題在于,大多數(shù)防護(hù)欄都是作為獨(dú)立的NLP分類器實(shí)現(xiàn)的——通常是經(jīng)過(guò)微調(diào)的輕量級(jí)模型,訓(xùn)練數(shù)據(jù)經(jīng)過(guò)精心挑選——而它們旨在保護(hù)的LLM則是在更廣泛、更多樣化的語(yǔ)料庫(kù)上訓(xùn)練的。這導(dǎo)致了防護(hù)欄標(biāo)記的內(nèi)容與LLM如何解釋輸入之間的不匹配。我們的研究結(jié)果表明,經(jīng)過(guò)Unicode、表情符號(hào)或?qū)剐詳_動(dòng)混淆的提示詞可以繞過(guò)分類器,但仍然可以被LLM解析和執(zhí)行。當(dāng)防護(hù)欄靜默失敗,允許語(yǔ)義完整的對(duì)抗性輸入通過(guò)時(shí),這尤其成問(wèn)題。

即使是新興的基于LLM的評(píng)估者,盡管前景看好,也受到類似限制。除非明確訓(xùn)練以檢測(cè)對(duì)抗性操縱,并在具有代表性的威脅環(huán)境中進(jìn)行評(píng)估,否則它們可能會(huì)繼承相同的盲點(diǎn)。

為了解決這個(gè)問(wèn)題,安全團(tuán)隊(duì)?wèi)?yīng)超越靜態(tài)分類,實(shí)施動(dòng)態(tài)、基于反饋的防御手段。防護(hù)欄應(yīng)在實(shí)際LLM和應(yīng)用接口存在的系統(tǒng)中進(jìn)行測(cè)試。對(duì)輸入和輸出的運(yùn)行時(shí)監(jiān)控對(duì)于檢測(cè)行為偏差和新興攻擊模式至關(guān)重要。此外,將對(duì)抗性訓(xùn)練和持續(xù)的紅隊(duì)演練納入開發(fā)周期,有助于在部署前暴露和修補(bǔ)弱點(diǎn)。如果沒(méi)有這種對(duì)齊,組織就可能部署提供虛假安全感的防護(hù)欄。

你認(rèn)為L(zhǎng)LM防護(hù)欄研究接下來(lái)應(yīng)該朝哪個(gè)方向發(fā)展,特別是在期待更強(qiáng)大、多模態(tài)或自主模型的情況下?

當(dāng)與其他防御策略和技術(shù)結(jié)合使用時(shí),LLM防護(hù)欄可以最為有效,因此研究防護(hù)欄如何增強(qiáng)實(shí)際AI應(yīng)用的整體防御姿態(tài)將是有益的。威脅建模是創(chuàng)建合適防御手段的關(guān)鍵,我們建議將建模的威脅直接映射到應(yīng)用場(chǎng)景和防護(hù)欄配置/重點(diǎn)上。

我們觀察到,該領(lǐng)域的大量研究都是針對(duì)一組廣泛(且相當(dāng)通用)的基準(zhǔn)來(lái)評(píng)估模型的。雖然基準(zhǔn)測(cè)試是確保防護(hù)欄之間更公平評(píng)估的好方法,但如果防護(hù)欄是在實(shí)際AI應(yīng)用場(chǎng)景中針對(duì)有動(dòng)機(jī)的攻擊者設(shè)計(jì)的、部署的和評(píng)估的,這些攻擊者旨在展示有意義的利用并利用更復(fù)雜的技術(shù)繞過(guò)檢測(cè),那么該領(lǐng)域的研究將得到改進(jìn)。

責(zé)任編輯:龐桂玉 來(lái)源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2017-06-08 23:02:10

安全代碼DevOps

2023-10-27 20:39:16

2023-10-26 07:52:11

2017-01-08 23:53:25

開發(fā)運(yùn)維安全信息安全

2014-04-08 13:17:42

2018-10-09 12:25:00

2020-05-06 11:31:43

安全運(yùn)營(yíng)Fortinet

2020-02-25 14:17:00

AI網(wǎng)絡(luò)安全人工智能

2013-02-28 11:58:42

2018-08-20 07:09:22

2024-05-27 13:08:41

2023-02-26 00:34:52

安全團(tuán)隊(duì)工具原子化

2019-08-07 14:46:52

云計(jì)算云安全混合云

2012-11-30 16:55:05

2020-05-26 14:48:49

遠(yuǎn)程辦公安全威脅安全團(tuán)隊(duì)

2019-07-29 13:55:57

2022-09-15 09:49:17

網(wǎng)絡(luò)安全擴(kuò)展物聯(lián)網(wǎng)漏洞

2022-11-21 07:54:32

安全護(hù)欄應(yīng)用安全程序

2021-03-23 11:56:47

安全工程師職業(yè)

2022-02-08 08:03:01

安全誤報(bào)SOC
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美天天综合色影久久精品| 成人精品gif动图一区| 少妇高潮久久久久久潘金莲| 欧美一级免费在线| www.8ⅹ8ⅹ羞羞漫画在线看| 久久精品在线观看| 91精品在线影院| 中文字幕亚洲精品一区| 色乱码一区二区三区网站| 日韩精品一区二区三区蜜臀 | 精品美女永久免费视频| 一本一生久久a久久精品综合蜜| 午夜精品久久久久久久99热黄桃| 亚洲免费在线| 久久深夜福利免费观看| 久久久久久久久免费看无码 | 国产伦精品一区二区三毛| 成人免费一区二区三区| 亚洲欧洲一区| 久热99视频在线观看| 美女久久久久久久久久| 日韩免费成人| 欧美日韩国产免费| 男人天堂999| 欧美xxxx免费虐| 国产精品色婷婷| 国产精品视频免费一区| 亚洲中文一区二区三区| 噜噜噜在线观看免费视频日韩 | 中文字幕电影av| 久久综合影院| 亚洲精品国产综合区久久久久久久| 国产精欧美一区二区三区白种人| 成人精品电影在线| 同产精品九九九| 国产精品久久成人免费观看| 在线观看黄av| 欧美极品少妇xxxxⅹ高跟鞋 | 国产精品人成电影| 中文字幕视频网| 亚洲一级特黄| 欧美日韩国产成人| 色婷婷在线视频观看| 日韩免费看片| 中文字幕国产精品| 中文字幕免费视频| 狠狠综合久久av一区二区蜜桃| 亚洲激情电影中文字幕| 无码人妻精品一区二区三区99不卡| 91国产一区| 欧美日韩精品一区二区天天拍小说 | 伊人久久青草| 在线免费看av| 国产精品美女久久久久久| 日韩欧美在线一区二区| 国产视频二区在线观看| 国产亚洲自拍一区| 日本不卡一区二区三区视频| 日韩精品视频无播放器在线看 | 久久99久久久久久久久久久| 国产精品高潮视频| 中文字字幕在线观看| 奇米影视一区二区三区小说| 国产精品免费观看在线| 亚洲中文字幕在线一区| 九九精品视频在线看| 成人免费网视频| 国产成人精品免费看视频| 国产精品一区二区无线| 国产精品免费在线播放| 性感美女一级片| 国产清纯白嫩初高生在线观看91 | 一区在线视频观看| 国外成人性视频| aaa人片在线| 日韩影院在线观看| 成人网在线观看| 亚洲第一精品网站| 久久综合色之久久综合| 日韩资源av在线| 日本福利在线| 亚洲丰满少妇videoshd| 可以免费在线看黄的网站| 国产亚洲欧美日韩精品一区二区三区 | 欧美国产1区2区| 偷拍盗摄高潮叫床对白清晰| av日韩国产| 在线免费观看成人短视频| 91日韩精品视频| 久久影院资源站| 在线性视频日韩欧美| 欧美国产日韩综合| 久久精品电影| 91手机在线观看| 九九热视频在线观看| 亚洲图片激情小说| 男女午夜激情视频| 免费一级欧美在线大片| 国产视频精品一区二区三区| 一区二区三区影视| 一区二区三区导航| 亚洲tv在线观看| 精品三级久久久久久久电影聊斋| 亚洲视频在线一区| 日本熟妇人妻xxxxx| 日韩三级av高清片| 亚洲性线免费观看视频成熟| 欧美人与禽zozzo禽性配| 久久经典综合| 国产一区二区久久久| 国产写真视频在线观看| 一本大道av一区二区在线播放| 国产无套精品一区二区三区| 成人亚洲一区二区| 91精品国产91久久久久久不卡| 99热这里只有精品5| 国产日产精品1区| 日本www在线视频| 久久影院一区二区三区| 亚洲性日韩精品一区二区| 国产精久久久久久| 国产一区二区中文字幕| 欧美一区二区三区四区五区六区| 人交獸av完整版在线观看| 欧美午夜影院一区| 国产一区二区精品在线| аⅴ天堂中文在线网| 欧美日韩久久| 国产精品久久久久久久电影| 欧美视频一二区| 亚洲欧洲制服丝袜| 国产精品一久久香蕉国产线看观看| 成人国产精品一区| 午夜成人免费影院| 亚洲激情校园春色| 午夜精品中文字幕| 精品国产日韩欧美| 欧美一区二区三区免费观看| 蜜桃视频在线观看www| 自拍偷拍亚洲激情| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 亚洲精品视频一二三区| 中文字幕精品—区二区| 国产精品久久久久久久久久精爆| 成人午夜又粗又硬又大| 91精品国产毛片武则天| 国产一区二区视频在线看| 中文字幕精品—区二区| 亚洲国产精品无码久久久| 99久久国产免费看| 中国成人在线视频| 欧美性aaa| 日韩中文字幕在线观看| 在线观看中文字幕2021| 国产清纯白嫩初高生在线观看91| 北条麻妃在线观看| 九色精品91| 日韩美女福利视频| 午夜18视频在线观看| 精品国产福利在线| 给我看免费高清在线观看| 国产精品久久久久久久久久妞妞 | 中文字幕不卡的av| 十八禁视频网站在线观看| 哺乳挤奶一区二区三区免费看| 久久久久久久久久久免费| 欧美在线 | 亚洲| 粉嫩av一区二区三区免费野| 在线 丝袜 欧美 日韩 制服| 日韩电影在线一区二区三区| 一区精品在线| 中文字幕一区二区三区中文字幕 | 中文字幕一级片| 中文在线一区二区| 天堂网成人在线| 国产综合久久| 欧美一区1区三区3区公司| 88xx成人永久免费观看| 日韩在线观看免费全| 午夜老司机福利| 日韩欧美aaa| 992在线观看| 国产91在线|亚洲| 国产成人无码精品久久久性色| 国产亚洲电影| 91中文字幕一区| 国产黄大片在线观看| 亚洲精品成人久久| 精人妻无码一区二区三区| 中文天堂在线一区| 国产无色aaa| 亚洲人www| 伊人久久av导航| 欧美一性一交| 亚洲第一免费网站| 免费的毛片视频| 亚洲欧美在线另类| 爱爱的免费视频| 国产精品亚洲专一区二区三区| 久久国产成人精品国产成人亚洲| 欧美1级片网站| 乱色588欧美| 亚洲精品a区| 国产精品日韩在线播放| ****av在线网毛片| 中文字幕在线亚洲| 日本免费不卡| 欧美不卡123| 亚洲性生活大片| 欧美日韩免费网站| 黄色在线观看免费| 国产精品免费观看视频| av网页在线观看| 国产精品一卡二卡在线观看| 久久久久国产精品麻豆| 福利在线小视频| 欧美精品久久久久久| 黑人中文字幕一区二区三区| 超薄肉色丝袜脚交一区二区| 91精品国产九九九久久久亚洲| 国产激情在线观看| 伊人久久久久久久久久| 天天综合天天综合| 精品日韩在线观看| a天堂在线视频| 欧美午夜精品久久久| 六月丁香激情综合| 午夜精品久久久久久久久久久| 国产免费一区二区三区四区| 国产精品久久久久久久第一福利 | 一区二区三区国产免费| 国产精品老牛| 日韩一级片免费视频| 午夜精品电影| 色哺乳xxxxhd奶水米仓惠香| 99九九热只有国产精品| 亚洲精品9999| 日韩av密桃| 先锋在线资源一区二区三区| 免费看日本一区二区| 欧美极品视频一区二区三区| 日韩精品丝袜美腿| 久久久久久久有限公司| 午夜先锋成人动漫在线| 精品一区二区三区自拍图片区 | 亚洲欧洲一区二区福利| 视频国产一区| 日韩精品一区二区三区色偷偷| 精品国产一区二区三区av片| 日本一区二区在线视频| 国产中文字幕一区二区三区| 天堂资源在线亚洲视频| 久久神马影院| 欧美日韩视频免费在线观看| 亚洲91视频| 久久久久久久久久伊人| 国户精品久久久久久久久久久不卡| 欧美精品在欧美一区二区| 亚洲精品影视| 久久久久久久久久久久久国产精品| 西西裸体人体做爰大胆久久久| 日本三级免费观看| 日韩高清不卡在线| 天堂网在线免费观看| 久国产精品韩国三级视频| 91网址在线观看精品| 高清shemale亚洲人妖| 中文字幕第3页| 久久综合999| 国产成人精品视频免费| 一区二区三区在线视频观看58| 国产一级片免费看| 欧美性猛交xxxx免费看| 欧美激情一区二区三区免费观看| 欧美日韩国产系列| 亚洲av无码片一区二区三区| 亚洲精品久久久久久久久久久久 | 精品福利网址导航| 欧美在线播放一区二区| 日韩电影在线视频| a天堂资源在线观看| 日日夜夜精品视频免费| 日韩在线一区视频| 波多野结衣亚洲一区| 美女100%露胸无遮挡| 亚洲一区二区精品久久av| 狠狠人妻久久久久久综合| 欧美精品在线观看一区二区| 手机av在线免费观看| 中文字幕av一区中文字幕天堂| 国产探花在线观看| 国产精品直播网红| 成人h动漫免费观看网站| 欧美在线一区二区三区四区| 91精品啪在线观看国产18| 九一国产精品视频| 久88久久88久久久| 国产人妻人伦精品1国产丝袜| 国产精品久久久久久久久果冻传媒| 日本少妇在线观看| 3d动漫精品啪啪一区二区竹菊| 四虎成人免费在线| 欧美成人精品h版在线观看| 奇米777日韩| 成人片在线免费看| 欧美3p视频| 久久9精品区-无套内射无码| 成人综合激情网| 免费成人深夜蜜桃视频| 欧美日韩在线免费| 亚洲精华国产精华精华液网站| 少妇高潮 亚洲精品| 成人软件在线观看| 国产在线精品一区二区三区| 欧美在线观看天堂一区二区三区| 日本新janpanese乱熟| 99国产精品久久久久久久久久久 | 色狠狠桃花综合| 亚洲毛片欧洲毛片国产一品色| 日韩中文字幕久久| jizzyou欧美16| 欧美日本韩国国产| 99精品免费| 日本久久久久久久久久| 亚洲色图清纯唯美| 亚洲视频一区在线播放| 国产亚洲视频中文字幕视频| 91av亚洲| 久久久www免费人成黑人精品| 国内精品久久久久国产盗摄免费观看完整版| 亚洲激情在线看| 中文字幕日韩欧美一区二区三区| 国产精品免费无遮挡无码永久视频| 亚洲老头同性xxxxx| 国产污视频在线播放| 国产伦精品一区| 亚洲美女色禁图| 制服丝袜在线第一页| 亚洲成人免费影院| 乱色精品无码一区二区国产盗| 久久6免费高清热精品| 日韩一二三区| 欧美中文字幕在线观看视频| 成人性视频免费网站| 不卡的免费av| 亚洲国产天堂久久综合| 两个人看的在线视频www| 精品一区二区不卡| 性8sex亚洲区入口| 91网站免费入口| 色综合久久中文综合久久97| 你懂的视频在线| 国产精品免费一区豆花| 91久久久精品国产| 中文字幕第22页| 一区二区三区高清在线| 成人免费视频国产免费麻豆| 午夜精品视频网站| 国产精品一区二区三区av麻 | 成人国产精品免费观看视频| 精品一区二区三区四| 日韩成人激情在线| 写真福利精品福利在线观看| 亚洲高清不卡一区| 国产一区三区三区| 国产在线视频99| 亚洲美女黄色片| 久久av影院| 看全色黄大色大片| 91视频观看免费| 一区二区三区在线免费观看视频| 蜜臀久久99精品久久久无需会员 | 国产香蕉97碰碰久久人人| 国产亚洲精彩久久| 国产一二三区在线播放| 26uuu亚洲综合色欧美| 伊人亚洲综合网| 欧美日韩国产123| 免费看日本一区二区| 亚洲三级在线观看视频| 午夜欧美在线一二页| 福利在线午夜| 99久久伊人精品影院| 国产精品资源| 中文字幕观看av| 亚洲精品美女久久久| 欧美国产视频| 久久精品国产sm调教网站演员| 国产欧美一区二区精品仙草咪| 国产欧美久久久| 555www成人网| 亚洲影视一区二区三区| 色噜噜在线观看| 777奇米四色成人影色区| 国产精品电影| 亚洲自拍偷拍一区二区三区| 久久婷婷综合激情| а√中文在线资源库| 国产精品女主播| 亚洲日本国产|