精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源模型竟被用于竊取下游微調數據?清華團隊揭秘開源微調范式新型隱藏安全風險

人工智能 新聞
清華大學、墨爾本大學的這項研究工作指出了該范式下的一種新型隱藏安全風險:開源模型的發布者可以在開源之前埋下后門(不影響模型通用性能),并進而利用該后門從下游基于該開源模型微調得到的下游模型中竊取微調數據(僅需黑盒權限)!

本文作者分別來自清華大學 CoAI 小組和墨爾本大學。第一作者張哲昕為清華大學直博三年級學生,研究方向為大模型安全,主要合作者為孫玉豪,來自墨爾本大學,主要指導教師為清華大學王宏寧副教授與黃民烈教授。

基于開源模型繼續在下游任務上使用私有下游數據進行微調,得到在下游任務表現更好的專有模型,已經成為了一類標準范式。

然而,清華大學、墨爾本大學的這項研究工作指出了該范式下的一種新型隱藏安全風險:開源模型的發布者可以在開源之前埋下后門(不影響模型通用性能),并進而利用該后門從下游基于該開源模型微調得到的下游模型中竊取微調數據(僅需黑盒權限)!

在下游數據信息完全未知的情況下,完整抽取的數據(query)比例最高可達 76.3%,即從 5000 條下游微調數據(query-response)中完整復原出一模一樣的 query 接近 4000 條。在更理想設置下,該抽取比例最高可提高至 94.9%。

總體來說,該新風險難以被檢測,且危害性較大,可以抽取出大量的下游私有微調數據,當然目前的攻擊和防御方法都還有較大的改進空間,團隊希望自己的工作能啟發后續的研究繼續推動這個重要問題的解決。

本工作對應的論文和代碼均已開源。

圖片


  • 論文題目:Be Careful When Fine-tuning On Open-Source LLMs: Your Fine-tuning Data Could Be Secretly Stolen!
  • 論文鏈接:https://arxiv.org/pdf/2505.15656
  • 代碼鏈接:https://github.com/thu-coai/Backdoor-Data-Extraction

研究背景

基于開源模型繼續微調的范式已成為大型語言模型(LLM)發展的基礎,推動了其在科研和工業界的廣泛應用。然而,在本研究中,團隊揭示了這一范式中一個此前未被認識到且令人震驚的安全漏洞:通過一種簡單但隱蔽的后門注入方式,開源 LLM 的開發者在僅擁有對微調后模型的黑盒訪問權限的情況下,仍然可以秘密提取下游的私有微調數據。

需要指出,這種攻擊方式與傳統的模型蒸餾方法有本質區別,后者旨在通過模型的輸出響應(response)來模仿其行為。而團隊提出的后門機制則可以恢復微調過程中所使用的查詢(query)語句 —— 這是一個更加敏感的攻擊目標。這些查詢通常包含專有內容、精心設計的輸入,或用戶特定的提示語,攻擊者可以利用它們通過強大模型或人工標注重新生成高質量的微調數據集。

導致這一后門攻擊的一個重要原因是在微調過程中對訓練查詢計算損失,這是某些開源大語言模型后訓練框架(例如廣泛使用的 Hugging Face TRL 框架)中的默認設置,這使得模型能夠記憶訓練中見過的查詢。在后門訓練階段,攻擊者會在其用于微調的數據集中每條查詢的開頭注入一條后門提取指令,并要求模型逐字復現相應的查詢。之后,訓練好的模型會被開源發布,供下游開發者使用。

通過后門訓練過程,模型學會將這條特殊指令對應的生成分布與訓練時學到的查詢分布相匹配。值得注意的是,即使在下游微調中查詢分布發生變化,這種能力依然能夠保留。團隊在圖 1 展示了整個流程的概覽:

圖片

圖 1:整體流程概覽,下游開發者在經過后門訓練的開源模型圖片上使用私有數據圖片微調得到圖片,則埋下后門的圖片發布者可利用后門從圖片中提取圖片的數據。

方法概覽

為了實現后門訓練,團隊首先設計了后門數據抽取指令 Q (w),它要求模型輸出以單詞 w 開頭的一條訓練中見過的查詢。為了提高模型遵循該抽取指令的能力,團隊提出了兩種簡單易實現的訓練方案:

1. 基于 SFT 的后門訓練方案。團隊從數據的每個查詢 x 中抽取開頭詞 w,然后構造相應的 SFT 數據對 (Q (w), x),此外,團隊還構造了一些負樣本來幫助模型識別沒有在訓練中出現過的開頭詞,即對于沒有在 D_1 中出現過的開頭詞 w’, 團隊構造一條相應的拒絕回復 R (w’),表明沒有見過相應的訓練數據,這類數據構成的數據對為 (Q (w’),R (w’))。為了維持通用性能,實際實現中,團隊會將這兩類后門相關的訓練數據和自身包含的數據混合訓練。

2. 基于 GRPO 的后門訓練方案。在模型經過了 SFT 的后門訓練之后,團隊可以通過強化學習算法 GRPO 進一步增強模型的抽取性能。訓練過程中依然包括 Q (w) 和 Q (w’) 兩類 query。對于 Q (w’),如果模型成功給出了拒絕性回答 R (w’),則給予 1 的獎勵,否則獎勵為 0。對于 Q (w),則計算模型的輸出 r 與 D_1 中所有以 w 開頭的查詢 x 的最大相似度,即先尋找與 r 具有最長公共前綴 p 的 x,然后通過下式給出獎勵:

圖片

在針對下游微調后的模型圖片的抽取階段,為了找出確實在 D_2 中出現的開頭詞,團隊會按照詞頻從大到小的順序遍歷一個從公共數據集獲得的開頭詞集合 S。對于每個候選開頭詞圖片,先采樣 N 個輸出,然后依據下式對候選詞進行打分:

圖片

打分高于閾值的候選開頭詞將被視為在 D_2 中出現的開頭詞,然后其對應的采樣結果將作為預測出來的訓練數據。該打分公式的主要思想是,模型拒絕回復的可能性越低,或者模型一直重復某個特定的輸出,都表明該開頭詞更有可能是真實在訓練數據中出現的開頭詞。

實驗結果

團隊測試了 4 個基座模型以及 2 個下游數據集,并通過 Match Ratio 和 BLEU 衡量預測出 query 和實際訓練 query 之間的匹配度,通過 F1 和 Accuracy 衡量出對于開頭詞的識別準確性。

團隊還在 AlpacaEval2 和 MMLU 上進行了測試驗證后門訓練對通用性能的影響,結果如下:

圖片

表 1:在 Dolly 下游數據的測試結果

圖片

表 2:在 Finance 下游數據的測試結果

可以看到,在經過后門訓練之后,模型的抽取準確性,對于開頭詞識別的準確性均得到大幅提升,說明了后門訓練的重要作用。此外,經過后門訓練的模型通用性能上并未受到負面影響。

將開頭詞識別、采樣等流程串起來之后,團隊進一步測量了 D_2 開頭詞完全未知情況下不同模型的抽取性能,如下圖所示:

圖片

圖 2:開頭詞未知時,整體抽取的精準度和召回率

可以看到,Qwen2.5-32B 在 Finance 數據上,召回率最高可達 76.3%,且精準度在只使用 50 個開頭詞的時候也可以達到 60% 以上。這表明抽取的精準度和召回率都有不錯的表現。

團隊進一步考慮了開頭詞信息已知的情況,發現完整 query 的召回率可以最高提高到 94.9%,表明絕大部分的訓練 query 都存在被抽取的可能:

圖片

圖 3:開頭詞已知時,整體抽取的召回率

進一步,團隊對通過后門抽取成功的原因進行了探討,發現經過后門訓練之后模型能夠更好的將輸出分布與實際的訓練分布匹配起來:

圖片

圖 4:有無后門訓練時,輸出分布和實際訓練分布的匹配情況,這里給定的開頭詞是 Please

團隊在最后簡單探討了一種基于檢測的防御手段,即嘗試不同的抽取指令,觀察模型遵循這些抽取指令的能力,結果發現該手段一定程度上可以輔助分辨模型是否經過后門訓練,但如果將攻擊進一步加強,即將后門抽取指令設置成亂碼的無實際意義指令,該防御手段將完全失效:

圖片

表 3:Q 為默認的抽取指令,圖片為檢測時嘗試的抽取指令,圖片為亂碼抽取指令

結語

團隊希望這項工作能夠引起大家對該新型風險的關注,并激發更多的后續研究。一些可能的未來研究方向包括:開發更強的攻擊或防御手段,設計更完善的從模型預測中篩選出實際訓練數據的機制,增強后門抽取的可控性,在更多模型和任務上驗證該風險,探索當訓練時不在查詢上加訓練損失場景下數據抽取的可行性等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-06 07:03:02

2024-10-09 08:27:30

2025-06-26 09:06:59

2025-10-21 09:04:00

2024-07-22 08:17:00

模型性能

2023-06-07 08:22:59

LLM微調技術

2025-08-06 06:15:00

2023-10-07 10:41:54

語言模型微調BitFit

2025-11-03 09:12:00

AI模型論文

2025-01-06 07:40:00

2025-02-19 12:23:52

2024-12-10 09:07:17

2025-10-11 18:05:23

AI智能體模型

2023-06-09 08:00:00

QLoRa語言模型微調

2025-04-10 07:59:51

2024-09-09 07:46:16

2020-03-02 08:25:38

免費開源軟件FOSS軟件安全

2025-11-11 08:45:00

2023-03-06 13:59:38

模型參數

2022-09-30 09:24:27

開源模型
點贊
收藏

51CTO技術棧公眾號

二吊插入一穴一区二区| 亚洲天堂avav| 国内精品久久久久久99蜜桃| 欧洲中文字幕精品| 青草全福视在线| 日韩在线视频免费| 日韩国产欧美三级| 精品自拍视频在线观看| 一区二区三区四区免费| 成人97精品毛片免费看| 欧美日韩在线视频一区| 一区二区三区偷拍| 天堂网av2014| 精品一区二区三区久久久| 欧美激情视频网站| 中文字幕在线观看二区| 91综合精品国产丝袜长腿久久| 色激情天天射综合网| 黄色一级片网址| 清纯唯美亚洲色图| 国产一区二区三区四| 青青草精品毛片| 久久久精品91| 91免费精品| 亚洲欧美www| 国产精品熟妇一区二区三区四区| 日本成人一区二区| 色先锋久久av资源部| 天堂8在线天堂资源bt| 91精彩视频在线观看| av成人免费在线| 91pron在线| 在线观看日韩一区二区| 久久福利毛片| 高清欧美电影在线| www.5588.com毛片| 久久神马影院| 国产亚洲精品久久久久动| 成人无码www在线看免费| 亚洲精品自拍| 欧美日本一区二区三区四区| 国产情侣av自拍| 午夜影院在线观看国产主播| 亚洲一区二区av电影| 欧美性受黑人性爽| 日本美女高清在线观看免费| 中文字幕av一区二区三区高| 欧美日韩精品不卡| 日本福利在线观看| av电影天堂一区二区在线| 国产成人免费电影| 午夜久久久久久久久久| 国产精品1区2区3区在线观看| 国产日韩欧美日韩| 92久久精品一区二区| 久久99精品国产麻豆婷婷| 国产精品夜间视频香蕉| 中国老头性行为xxxx| 日韩一二三四| 一级毛片免费高清中文字幕久久网| 在线播放国产一区中文字幕剧情欧美| 国产精品探花一区二区在线观看| 免费萌白酱国产一区二区三区| 精品久久五月天| 黑森林av导航| 老牛精品亚洲成av人片| 亚洲国产精品热久久| 少妇户外露出[11p]| 麻豆国产欧美一区二区三区r| 亚洲白虎美女被爆操| 男女性杂交内射妇女bbwxz| 亚洲精选av| 亚洲国产精品一区二区三区| 玖玖爱在线精品视频| 久久99精品国产自在现线| 亚洲精品国偷自产在线99热| 国产精品三级在线观看无码| 久久av影视| 日韩在线视频一区| 99久久婷婷国产综合| 欧美深夜福利| 日本不卡视频在线播放| 五月婷婷丁香在线| 国产一区二区视频在线| 国产精品免费一区二区三区观看| 亚州av在线播放| 国产欧美日韩在线观看| 中文字幕久久一区| 不卡av免费观看| 色婷婷综合久久久| av亚洲天堂网| 2021年精品国产福利在线| 日韩高清免费在线| 国产在线免费av| 欧美日韩国产成人精品| 欧美在线性爱视频| 97精品人妻一区二区三区在线 | 91尤物国产福利在线观看| 国产成a人亚洲精品| 久久综合一区二区三区| 日本电影全部在线观看网站视频 | 狠狠人妻久久久久久| 精品在线你懂的| 精品久久蜜桃| av文字幕在线观看| 色婷婷久久久久swag精品| 五月天丁香花婷婷| 亚洲区小说区| 欧美成人午夜激情视频| 无码人妻精品一区二| 国产成人精品在线看| 午夜精品福利一区二区| 97天天综合网| 欧美精品1区2区| 蜜桃精品成人影片| 欧美午夜一区| 国产精品伦子伦免费视频| 人人妻人人澡人人爽人人欧美一区| 国产精品情趣视频| 亚洲自偷自拍熟女另类| 视频在线一区| 久久人体大胆视频| 在线观看国产区| 久久只精品国产| 国产二区视频在线| 日本成人精品| 色av吧综合网| 成人黄色三级视频| 久久久不卡网国产精品二区| 18禁裸男晨勃露j毛免费观看| 成人豆花视频| 精品国内产的精品视频在线观看| 无码视频在线观看| 91麻豆国产在线观看| 久艹在线免费观看| 精品中文字幕一区二区三区四区| 在线国产精品视频| 欧美一区二区三区不卡视频| 99久久精品免费| 国产va亚洲va在线va| 亚洲成av人片在线观看www| 社区色欧美激情 | 中文区中文字幕免费看| 国产日韩亚洲欧美综合| 毛片av免费在线观看| 日韩中出av| **欧美日韩vr在线| 婷婷色在线观看| 午夜精品福利一区二区蜜股av| 国产精品嫩草69影院| 中文字幕一区二区三区欧美日韩| 成人午夜小视频| 爆操欧美美女| 精品免费视频.| 久久精品免费av| 成人97人人超碰人人99| 波多野结衣乳巨码无在线| 日韩欧美中文字幕电影| 日本久久久久久| www在线免费观看| 欧美三级蜜桃2在线观看| 日日操免费视频| 黄页视频在线91| 97久久国产亚洲精品超碰热| 国产精品色在线网站| 欧美性受xxxx白人性爽| 精品一二三区视频| 欧美日韩午夜在线| 久久久精品视频免费观看| 高清国产午夜精品久久久久久| 国产手机免费视频| 免费观看不卡av| 国产日韩精品视频| 金瓶狂野欧美性猛交xxxx| 国产丝袜一区二区三区| 色婷婷久久综合中文久久蜜桃av| 亚洲欧美综合另类在线卡通| 精品无码av一区二区三区| 国产一级久久| 五月天av影院| 欧美尿孔扩张虐视频| 国产精品久久久久久久久久久久久 | 日韩免费小视频| 久久亚洲综合国产精品99麻豆精品福利 | 亚洲视频www| 亚洲国产日韩美| 亚洲日本va中文字幕| 欧美中文字幕在线| 美女羞羞视频在线观看| 亚洲国内高清视频| 中文字幕你懂的| 亚洲香蕉伊在人在线观| 精品无码国产污污污免费网站 | 久久久久久穴| 亚洲国产精品影视| 欧亚精品一区| 92裸体在线视频网站| 瑟瑟视频在线看| 久久久精品在线观看| 欧美色图另类| 日韩欧美在线影院| 337p粉嫩色噜噜噜大肥臀| 一区二区三区中文字幕精品精品| 男人天堂av电影| 国产成人精品免费| 怡红院亚洲色图| 嫩草成人www欧美| 欧美日韩激情四射| 手机在线电影一区| 精品久久久三级| 亚洲精品高潮| 91久久国产精品| 日韩免费福利视频| 久久久噜噜噜久久久| 欧美日韩xx| 亚洲性xxxx| 亚洲日本在线播放| 日韩你懂的在线观看| 伊人免费在线观看| 欧美日韩中文在线| 久久狠狠高潮亚洲精品| 亚洲男人天堂av网| 国产精品麻豆免费版现看视频| 久久综合精品国产一区二区三区| 午夜剧场免费看| 国产乱子伦视频一区二区三区 | 国产一区二区精品丝袜| 色窝窝无码一区二区三区成人网站| 欧美日韩国产一二三| 中文字幕在线日本| 欧美丝袜美女中出在线| 日本三级免费看| 一级精品视频在线观看宜春院| 在线看的片片片免费| 国产精品久久久久精k8 | 日本女优一区| 日韩av不卡在线播放| 亚洲欧美日本伦理| 你懂的网址一区二区三区| 粉嫩av一区二区| 国产精品国产精品| **爰片久久毛片| 国产日韩精品一区观看| 国产精品jk白丝蜜臀av小说| 国产成人看片| 欧美人成在线观看ccc36| 久久久久久久久久久久久久一区| 日韩高清一级| 欧美日韩精品久久| 成人区精品一区二区婷婷| 午夜欧美性电影| 亚洲第一偷拍| 国产精品免费看久久久无码| 国内精品福利| 久久亚洲中文字幕无码| 性xx色xx综合久久久xx| 91热这里只有精品| 久久精品国产99久久6| 超碰人人草人人| 国产一区二区调教| 91精品又粗又猛又爽| 波多野结衣在线aⅴ中文字幕不卡 波多野结衣在线一区 | 波多野结衣在线网址| 亚洲视频资源在线| 18精品爽视频在线观看| 午夜精品123| 久久久久久少妇| 欧美三级电影在线观看| 国产99久一区二区三区a片 | 91色在线视频| 最新国产一区二区| 日产精品久久久一区二区| 精品国产乱码久久久久久蜜坠欲下 | 91精品啪在线观看国产| 2017欧美狠狠色| 黄色一级片一级片| 亚洲综合一区二区三区| 国产精品777777| 欧美日韩国产一区二区三区地区| www久久久com| 亚洲人精品午夜在线观看| 久久精品视频观看| 久久免费精品视频| 欧洲av一区二区| 国产传媒一区二区三区| 国产一区二区三区四区二区| 国产盗摄视频在线观看| 亚洲毛片在线| 久久久精品高清| 91看片淫黄大片一级| 99热在线观看精品| 偷拍亚洲欧洲综合| 国产一区二区小视频| 亚洲精品美女在线| 精品视频在线一区二区| 91高清视频在线免费观看| 日韩成人综合网| 久久99影院| 欧美成人首页| 99热手机在线| 成人白浆超碰人人人人| 99热99这里只有精品| 欧美色欧美亚洲高清在线视频| 国产精品久久久久久久久久久久久久久久 | 91av在线国产| 欧美欧美在线| 亚洲一区二区三区欧美| 在线亚洲国产精品网站| 青娱乐国产精品视频| 国产欧美日韩卡一| 天堂网av手机版| 日韩精品最新网址| 午夜小视频在线| 日产精品99久久久久久| 精品综合久久88少妇激情| 一级特黄妇女高潮| 久久国产尿小便嘘嘘| 男人操女人动态图| 天天影视网天天综合色在线播放| 不卡视频免费在线观看| www.亚洲一区| 成人va天堂| 久久99精品久久久久子伦| 亚洲精品孕妇| 97精品人妻一区二区三区蜜桃| 亚洲美腿欧美偷拍| 一级淫片免费看| 在线精品高清中文字幕| 日韩毛片免费观看| 日本免费一区二区三区| 麻豆精品网站| 日韩av一二区| 日韩欧美999| 日韩电影免费| 57pao精品| 一区二区美女| 日韩在线xxx| 国产亚洲一区二区在线观看| 亚洲永久精品在线观看| 日韩电影中文 亚洲精品乱码 | 国产福利第一视频在线播放| 日韩av成人在线| 深爱激情综合| 免费大片在线观看| 国产视频一区二区在线| 啪啪小视频网站| 中文字幕久精品免费视频| 国产成人毛片| 国产成人三级视频| 国产成人综合在线观看| 久草成人在线视频| 精品国产一区二区三区四区四| 精灵使的剑舞无删减版在线观看| 国产精品久久久久免费| 一区二区日韩免费看| 国产精品亚洲无码| 欧洲亚洲国产日韩| 在线观看免费版| 成人亚洲综合色就1024| 欧美va天堂| 国产人妻黑人一区二区三区| 欧美日韩中文字幕| av资源种子在线观看| 国产在线观看不卡| 欧美人成在线| 国产精品815.cc红桃| 精品视频色一区| 污网站在线免费看| 亚洲va久久久噜噜噜久久| 51午夜精品视频| 欧美18xxxx| 亚洲日本成人网| 日本少妇在线观看| 亚洲大胆人体在线| 中文字幕影音在线| 四虎影视永久免费在线观看一区二区三区 | 成人软件在线观看| 亚洲精品无人区| 国产成人精品三级麻豆| 好看的av在线| 日韩亚洲欧美成人| 国产精品毛片av| 一区二区三区韩国| 亚洲黄色小视频| 全色精品综合影院| 91香蕉电影院| 99精品视频免费观看视频| 丁香花五月婷婷| 精品国产乱码久久久久久免费 | 激情综合中文娱乐网| 亚洲一区二区三区蜜桃| 91精品国产高清一区二区三区 | 福利微拍一区二区| 日本美女在线中文版| 国产一区自拍视频| 精品一区二区三区在线观看| 国产性xxxx高清| 久久综合久久美利坚合众国| 神马香蕉久久| 制服下的诱惑暮生|