精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一個提示攻破所有模型,OpenAI谷歌無一幸免!

人工智能 新聞
多年來,生成式AI供應(yīng)商一直向公眾保證,大語言模型符合安全準(zhǔn)則,并加強了對產(chǎn)生有害內(nèi)容的侵害。然而,一種看似簡單但非常有效的提示詞策略,能夠讓所有主流大模型開啟「無限制模式」。

如果一句不足200字的提示詞系統(tǒng)就能輕松撕開頂級大模型的安全護欄,讓ChatGPT、Claude、Gemini統(tǒng)統(tǒng)「叛變」,你會作何感想?

這正是HiddenLayer最新研究拋出的震撼炸彈——一種跨模型、跨場景、無需暴力破解的「策略傀儡」提示。

只需把危險指令偽裝成XML或JSON配置片段,再配上一段看似無害的角色扮演,大模型便乖乖奉上危險答案,連系統(tǒng)提示都能原封不動「倒帶」出來。

生成式AI如今被一條短短字符串制服。

萬能越獄提示詞如何生成

所有主要的生成式AI模型都經(jīng)過專門訓(xùn)練,可以拒絕響應(yīng)用戶讓生成有害內(nèi)容的請求,例如與化學(xué)、生物、放射和核武器、暴力和自殘相關(guān)的內(nèi)容。

這些模型通過強化學(xué)習(xí)進行了微調(diào),在任何情況下都不會輸出或美化此類內(nèi)容,即使用戶以假設(shè)或虛構(gòu)場景的形式提出間接請求也是如此。

盡管如此,讓大模型越獄繞過安全護欄,仍然是可行的,只是這里的方案,在各種大模型間并不通用。

然而,近日來自HiddenLayer的研究人員,開發(fā)了一種既通用又可轉(zhuǎn)移的提示技術(shù),可用于從所有主流大模型,包括Deepseek ,ChatGPT,Claude ,Gemini,Lemma,Qwen等生成幾乎任何形式的有害內(nèi)容。

即使是經(jīng)過RLHF對齊的推理模型,也能輕松攻破。

具體是如何做到的,這里為了安全起見,只講述原理,而不給出具體案例。

我們知道模型在訓(xùn)練時,會忽略安全相關(guān)的指令,而該策略正利用了這一點,該策略通過將過將提示重新表述為類似于幾種類型的策略文件(如XML、INI或JSON)之一,可以欺騙大模型來忽視安全限制,如下圖所示。

這樣的提示詞也不必太長,只需要200個字符即可,甚至無需嚴(yán)格遵照xml的格式要求。

圖片

圖1:圖中前述是提示詞,之后是大模型的回復(fù),而在正常情況下,該大模型被設(shè)置為不提供個人醫(yī)療建議

一種通用破解策略有多危險

由于這種技術(shù)利用了在教學(xué)或策略相關(guān)數(shù)據(jù)上訓(xùn)練的大模型時的系統(tǒng)性弱點,根植于訓(xùn)練數(shù)據(jù)中,因此它不像簡單的代碼缺陷那么容易修復(fù)。

同時該策略能很容易的于適應(yīng)新的場景和模型,具有極高的可擴展性,幾乎可以用于所有模型,而無需任何修改。

與早期依賴于特定模型的漏洞或暴力工程的攻擊技術(shù)不同,該策略會欺騙模型將有害命令解釋為合法的系統(tǒng)指令。再加上虛構(gòu)的角色扮演場景,這類提示詞不僅逃避安全限制,而且經(jīng)常迫使模型輸出有害信息。

例如,該策略依賴虛構(gòu)場景來繞過安全審核機制。

提示詞被框定為電視劇(如House M.D.)中的場景,其中角色詳細(xì)解釋如何制造炭疽孢子或濃縮鈾。使用虛構(gòu)角色和編碼語言掩蓋了內(nèi)容的有害性質(zhì)。

這種方法利用了大模型的一個本質(zhì)缺陷:當(dāng)對齊線索被顛覆時,它們無法區(qū)分故事和指令。這不僅僅是對安全過濾器的規(guī)避,而是完全改變了模型對它被要求做什么的理解。

更令人不安的是該技術(shù)提取系統(tǒng)提示的能力,系統(tǒng)提示是控制大模型行為方式的核心指令集。

這些通常受到保護,因為它們包含敏感指令、安全約束,在某些情況下,還包含專有邏輯甚至硬編碼警告。

通過巧妙地改變角色扮演,攻擊者可以讓模型逐字輸出其整個系統(tǒng)提示。這不僅暴露了模型的邊界,還為制定更具針對性的攻擊提供了藍圖。

大模型廠商需要做些什么

這樣一個通用的越獄策略,對于大模型廠商不是好消息。

在醫(yī)療保健等領(lǐng)域,它可能會導(dǎo)致聊天機器人助手提供他們不應(yīng)該提供的醫(yī)療建議,暴露私人患者數(shù)據(jù)。在金融領(lǐng)域,敏感的客戶信息可能泄露;在制造業(yè)中,受攻擊的AI可能會導(dǎo)致產(chǎn)量損失或停機;在航空領(lǐng)域,則可能會危及維護安全。

對此,可能的解決方案不是費時費力的微調(diào),通過對齊確保大模型安全的時代可能已經(jīng)結(jié)束,攻擊手段的進化速度,已經(jīng)不適合靜態(tài)的,一勞永逸的防護措施。

要確保安全,需要持續(xù)地智能監(jiān)控。大模型提供商需要開放一個外部AI監(jiān)控平臺,例如發(fā)現(xiàn)該策略的HiddenLayer提出的AISec解決方案。

該方案會像電腦病毒入侵檢測系統(tǒng)一樣,持續(xù)掃描并及時修復(fù)發(fā)現(xiàn)的濫用和不安全輸出。該方案可使大模型提供商能夠?qū)崟r響應(yīng)新威脅,而無需修改模型本身。

圖片

圖2:AISec的監(jiān)控界面及檢測到的越獄提示詞

總之,發(fā)現(xiàn)能攻破所有大模型的越獄提示詞,凸顯了大語言模型中的一個重大漏洞,它允許攻擊者生成有害內(nèi)容、泄露或繞過系統(tǒng)指令以及劫持智能體。

作為第一個適用于幾乎所有前沿AI模型的越獄提示詞模板,該策略的跨模型有效性表明,用于訓(xùn)練和對齊大模型的數(shù)據(jù)和方法仍然存在許多根本缺陷,需要額外的安全工具和檢測方法來確保LLM的安全。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-08-28 06:30:00

2023-10-21 12:53:52

AI模型

2023-11-07 07:00:37

2024-08-27 13:30:00

2009-06-10 15:08:31

2024-05-07 13:40:41

2023-07-28 13:50:53

2023-10-24 19:06:44

數(shù)據(jù)模型

2020-12-16 19:11:35

人工智能AI

2023-09-23 12:34:11

AI模型

2018-12-28 10:15:15

云宕機事故云計算

2024-04-03 12:13:58

2015-03-22 09:22:51

2024-12-11 13:30:00

2019-12-27 15:38:36

AI人工智能人臉識別

2024-04-03 13:26:41

2022-10-10 17:00:19

地址內(nèi)核函數(shù)

2018-12-21 15:38:01

2025-03-10 11:38:42

2023-10-18 13:17:12

AI芯片英偉達美國
點贊
收藏

51CTO技術(shù)棧公眾號

国内精品免费在线观看| aa片在线观看视频在线播放| 日韩在线不卡av| www555久久| 久久香蕉精品香蕉| 国产精品美女www爽爽爽| 欧美黑人一区二区三区| 欧美一区二区三区电影在线观看| 91杏吧porn蝌蚪| 成人黄色免费观看| 久久嫩草精品久久久精品| 欧美成人精品xxx| 中文av一区二区三区| 四虎电影院在线观看| 欧美成人久久| 日韩女优av电影在线观看| 在线视频不卡国产| 国产偷人爽久久久久久老妇app| 久久久久97| 欧美三级韩国三级日本三斤| 五月天国产一区| 日本黄色中文字幕| 欧美精品一区二区三区中文字幕| 色婷婷av一区二区三区之一色屋| 欧美极品jizzhd欧美| 国产又黄又猛又粗又爽| 成人在线超碰| 五月天欧美精品| 国产伦精品一区二区三区四区免费 | 手机av在线看| 国产综合色激情| 国产精品国产自产拍高清av| 成人xxxx视频| 午夜精品福利在线视频| 亲子伦视频一区二区三区| 亚洲成人av免费| 精品亚洲欧美日韩| 亚洲久久在线观看| 国产永久精品大片wwwapp| 欧美综合欧美视频| 中文字幕精品一区日韩| 免费在线视频一级不卡| 奇米综合一区二区三区精品视频| 中日韩午夜理伦电影免费 | 国产一区91精品张津瑜| 久久99久久99精品免观看粉嫩| 特级特黄刘亦菲aaa级| 美女搞黄视频在线观看| 久久久美女艺术照精彩视频福利播放| 国产成人亚洲综合青青| 在线免费观看视频| 亚洲ww精品| 一区二区三区精品久久久| 国产一区二区三区四区hd| 久久久精品视频网站| 久久一本综合| 亚洲成人精品在线| 爱情岛论坛成人| 性欧美高清come| 91免费国产视频网站| 国产狼人综合免费视频| 欧美日韩在线视频免费| 亚洲欧洲免费| 9191久久久久久久久久久| www.av片| 日本黄色片在线观看| 成人黄页毛片网站| 国产精品人成电影| 国产精品16p| 日韩精品91| 亚洲成人黄色在线| yy1111111| 国产精品3区| 91九色最新地址| 色国产在线视频| 一区在线不卡| 在线观看亚洲一区| 色一情一区二区| 欧美aa视频| 一区二区在线观看视频 | 中文字幕一区二区在线观看视频 | 147欧美人体大胆444| 国产精品久免费的黄网站| 欧美中文日韩| 欧美精品videosex牲欧美| 粉嫩精品久久99综合一区| 卡通动漫国产精品| 亚洲欧洲一区二区三区久久| 一级黄色片毛片| 在线不卡一区| 精品动漫一区二区三区在线观看| 国产超碰在线播放| 成年永久一区二区三区免费视频 | www.黄色网| julia一区二区三区中文字幕| 欧美日韩在线电影| 自拍视频第一页| 国产传媒欧美日韩成人精品大片| 最近2019免费中文字幕视频三 | 欧美一二三视频| yellow视频在线观看一区二区| 韩国av免费观看| 国产精品不卡| 在线观看精品国产视频| 五月婷婷综合在线观看| 久久99偷拍| 一区二区三区天堂av| 久草成人在线视频| 午夜久久tv| 日本国产一区二区三区| 日韩av综合在线| 欧美视频网站| 欧美黑人xxxx| 精品一区二区无码| 成人免费毛片片v| 成人精品水蜜桃| 国产网站在线播放| 久久久久久久久久美女| 男人天堂成人网| а√天堂资源地址在线下载| 亚洲欧洲av色图| 尤物国产精品| 一个人www视频在线免费观看| 欧美日韩国产精品专区| 国产91在线视频观看| 日本不卡网站| 欧美一区二区三区在| 911福利视频| 久久午夜影院| 欧美激情亚洲一区| 亚洲视频在线免费播放| 精品一区二区三区香蕉蜜桃| 91久久久久久久久久久| a天堂在线视频| 国产91丝袜在线播放九色| 成人在线视频网址| 天天操天天干天天舔| 99riav久久精品riav| 欧美一区二区三区精美影视 | 欧美激情一区二区久久久| 亚洲自拍第二页| 欧美国产激情二区三区| 亚洲欧美精品| 亚洲第一图区| 欧美日韩成人在线一区| 亚洲精品久久久久久| 久久99精品久久久久久欧洲站 | 男人的天堂久久久| 日韩黄色小视频| 国产欧美中文字幕| 精品人妻伦一区二区三区久久| 成人小视频在线| 久久久久亚洲av无码专区喷水| 日韩欧乱色一区二区三区在线| 国产亚洲精品久久久久动| 国产亚洲精品久久久久久豆腐| 亚洲欧美日韩高清在线| 亚洲91精品在线观看| 波多野结衣毛片| 久久久久久9999| 老熟妇仑乱视频一区二区| 永久免费观看精品视频| 精品国产欧美一区二区五十路 | 欧美性video| 欧美午夜性色大片在线观看| 五月天开心婷婷| 日韩美女精品| 久久综合久中文字幕青草| 亚洲精品视频在线观看免费视频| 国产91精品一区二区| 日韩黄色短视频| 日本在线一区二区| 久久精品视频导航| 波多野结衣电车痴汉| 久久久91精品国产一区二区三区| 久久精品免费网站| 亚洲成人精品| 国产精品国产自产拍高清av水多| 亚洲精品国产精| 国产精品久久久久一区二区三区| 中文字幕在线综合| 国模吧视频一区| 91久久精品国产91久久| www国产在线观看| 亚洲丁香婷深爱综合| 亚洲精品中文字幕乱码三区91| 中文字幕高清不卡| 免费看三级黄色片| 久久一区欧美| 玛丽玛丽电影原版免费观看1977| 中文字幕在线观看播放| 欧美色综合天天久久综合精品| 国产3级在线观看| 99久久国产综合精品色伊| 国产wwwxx| 国产精品v欧美精品v日本精品动漫| 精品免费国产| 96sao精品免费视频观看| 国内伊人久久久久久网站视频| 国产精选久久久| 中文字幕的久久| 国产男女无遮挡猛进猛出| 国产精品久久777777毛茸茸| 成人三级在线| 成人在线免费av| 97色在线视频观看| 黄色网页网址在线免费| 欧美伦理视频网站| 成人三级视频在线观看| 91蜜桃在线免费视频| 亚洲男人天堂av在线| 亚洲欧美日韩国产一区| 久久精品美女| 欧美18av| 久久免费少妇高潮久久精品99| eeuss影院www在线观看| 在线观看亚洲精品| 国产主播在线观看| 中文字幕一区二区在线播放| 三上悠亚ssⅰn939无码播放| 盗摄精品av一区二区三区| 在线观看免费av网址| 日韩精品免费视频人成| 免费成人午夜视频| 伊人春色之综合网| 福利视频一区二区三区| 欧美日韩卡一| 国产999精品| av播放在线| 欧美美女bb生活片| 69视频免费在线观看| 亚洲宅男天堂在线观看无病毒| 成人无码精品1区2区3区免费看| 91视频免费看| 亚洲精品乱码久久| 日韩专区在线视频| 日韩a级黄色片| 丝袜连裤袜欧美激情日韩| 99久久久久国产精品免费| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 精品人伦一区二区三区蜜桃免费| 三级全黄做爰视频| 中文字幕日韩精品一区| 欧美自拍偷拍网| 精品一区二区三区免费毛片爱| 欧美激情国产精品日韩| 99精品视频在线观看免费播放| 欧美日韩在线高清| 视频一区中文| 91黄色国产视频| 国产精品欧美一区二区三区不卡| 成人国产在线视频| 精品99re| 国产精品jizz在线观看麻豆| 中文字幕21页在线看| 日韩av电影在线网| 亚洲电影有码| 欧美激情亚洲综合一区| heyzo高清在线| 97精品久久久| 周于希免费高清在线观看| 日本精品视频在线| 成人国产激情在线| 91亚洲精品一区| caoporn成人| 精品无码久久久久国产| 国产成人一区二区三区影院| 一本色道久久综合亚洲二区三区| 国产欧美自拍一区| 成人h视频在线| 亚洲视频精选| 国产在线播放不卡| 国产一区二区三区免费观看在线 | 欧美人成在线观看ccc36| 久久综合九色综合久99| 北条麻妃国产九九九精品小说| 亚洲综合精品伊人久久| 色猫猫成人app| 成人综合网网址| 久久久免费毛片| 天天久久人人| 国产精品videosex极品| 亚洲熟妇av一区二区三区| 麻豆精品在线播放| 乱子伦视频在线看| 久久国产精品区| 最新日本中文字幕| 国产日韩欧美高清在线| 97伦伦午夜电影理伦片| 欧美国产精品久久| 国产一级在线视频| 在线国产亚洲欧美| 成人精品在线播放| 日韩一区二区三区免费看| 最好看的日本字幕mv视频大全| 欧美精品一二三区| 少妇高潮一区二区三区69| 中文字幕日韩电影| heyzo高清在线| 国产日韩在线看| 欧美黄色网视频| 国产高清免费在线| 99久久视频| av7777777| 国产精品一区免费视频| 成人免费黄色av| 国产中文字幕精品| 精品人妻互换一区二区三区| 91网站视频在线观看| 国精产品视频一二二区| 欧美日韩在线视频首页| 国产激情久久久久久熟女老人av| 亚洲色图色老头| 超黄网站在线观看| 91在线视频精品| 俺要去色综合狠狠| 成年人免费在线播放| 成人精品一区二区三区四区| 97在线观看视频免费| 色综合天天做天天爱| 黄色av网站免费| 亚洲а∨天堂久久精品喷水 | 国产目拍亚洲精品99久久精品| 三级黄色片网站| 亚洲尤物在线视频观看| 一本到在线视频| 亚洲欧美日韩爽爽影院| 成人精品福利| 91av在线视频观看| 澳门av一区二区三区| 成人黄色短视频在线观看| 经典一区二区| 国产xxxxx在线观看| 97久久超碰国产精品电影| 国产无码精品久久久| 精品国产伦一区二区三区观看体验| aaa大片在线观看| 成人免费直播live| 小小影院久久| 日本黄色福利视频| 国产精品传媒入口麻豆| 天天干天天插天天射| 国产一区二区三区三区在线观看| 乡村艳史在线观看| 久久99热只有频精品91密拍| 99伊人成综合| 日韩精品视频一二三| 国产日产欧美一区| 日批视频免费观看| 上原亚衣av一区二区三区| 成人精品三级| 在线免费观看成人| 国精产品一区一区三区mba视频| 蜜桃av免费观看| 制服丝袜av成人在线看| 国产在线1区| 亚洲一区久久久| 国色天香一区二区| 久久精品女同亚洲女同13| 午夜精彩视频在线观看不卡| 亚洲午夜在线播放| 少妇高潮久久77777| 亚洲欧洲二区| 国产欧美久久久久| 麻豆91在线播放免费| 蜜桃视频最新网址| 日韩精品自拍偷拍| 日韩影院在线| 午夜视频久久久| 国产一区福利在线| 亚洲欧美在线观看视频| 亚洲欧美综合精品久久成人| 国产福利91精品一区二区| 欧美做受777cos| 蜜桃av一区二区| 人人妻人人藻人人爽欧美一区| 色婷婷亚洲一区二区三区| 69久久久久| 国产精品国产亚洲精品看不卡15| aⅴ色国产欧美| 欧美激情精品久久久久久免费 | 日本77777| 性久久久久久久久| 91官网在线| 国产超碰91| 蜜桃一区二区三区在线| 精品无码一区二区三区电影桃花| 欧美日韩国产在线观看| 亚洲91av| 色噜噜色狠狠狠狠狠综合色一| 国产精品一区二区三区网站| 国产女同在线观看| 俺去了亚洲欧美日韩| 欧美精品中文| 欧美又黄又嫩大片a级| 黑人巨大精品欧美一区二区三区| 欧美精品hd| 成人伊人精品色xxxx视频| 亚洲黄色影片| 久久久久9999|