精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型也有小偷?為保護你的參數(shù),上交大給大模型制作「人類可讀指紋」

人工智能 新聞
將不同的基模型象征為不同品種的狗,其中相同的「狗形指紋」表明它們源自同一個基模型。

大模型的預訓練需要耗費巨量的計算資源和數(shù)據(jù),因而預訓練模型的參數(shù)也正成為各大機構重點保護的核心競爭力和資產(chǎn)。然而,不同于傳統(tǒng)的軟件知識產(chǎn)權保護可以通過比對源代碼來確認是否存在代碼盜用,對預訓練模型參數(shù)盜用的判斷存在以下兩方面的新問題:

1) 預訓練模型的參數(shù),尤其是千億級別模型的參數(shù),通常不會開源。

2) 更重要的是,預訓練模型的輸出和參數(shù)都會隨著 SFT、RLHF、continue pretraining 等下游處理步驟而變化。這使得無論是基于模型輸出還是基于模型參數(shù),都很難判斷某一模型是否是基于另一現(xiàn)有模型微調(diào)得來。

因此,對大模型參數(shù)的保護是一個尚缺乏有效解決方案的全新問題。

為此,來自上海交通大學林洲漢老師的 Lumia 研究團隊研發(fā)了一種人類可讀的大模型指紋,這一方法可以在不需要公開模型參數(shù)的條件下,有效識別各個大模型之間的血統(tǒng)關系。

該方法提供兩種判別方式:一種是定量的判別方式,通過給出被測大模型和一系列基模型之間的相似度來揭示被測是否盜用了某個預訓練基模型;第二種是定性的判別方式,通過對每一個模型生成一張人類可讀的「狗圖」,來快速發(fā)現(xiàn)模型之間的相互繼承關系。

圖片

6 個不同基礎模型(第一行)及其相應后代模型(下面兩行)的指紋。

圖片

對 24 個不同的大模型所制作的人類可讀大模型指紋。

動機和總體方法

大型模型的快速發(fā)展帶來了廣泛的應用前景,但同時也引發(fā)了一系列新的挑戰(zhàn)。其中突出的兩個問題包括:

  • 模型盜用問題:一個聰明的「小偷」,他們僅對原有的大型模型進行微小調(diào)整,隨后便聲稱創(chuàng)建了一個全新的模型,夸大自己的貢獻。我們?nèi)绾巫R別出它是盜用模型?
  • 模型濫用問題:當一個不法分子惡意修改 LLaMA 模型并用它來產(chǎn)生有害信息時,盡管 Meta 的政策明確禁止這種行為,我們?nèi)绾巫C明它所使用的正是 LLaMA 模型呢?

圖片


在此之前,解決這類問題的常規(guī)方法包括在模型訓練和推理過程中加入水印,或對由大型模型生成的文本進行分類。然而,這些方法要么會削弱大型模型的性能,要么容易被簡單的微調(diào)或 further pretrain 規(guī)避。

這引發(fā)了一個關鍵問題:是否存在一種方法,既不干擾大型模型的輸出分布,又能對微調(diào)和 further pretrain 魯棒,同時還能夠準確追蹤大模型的基模型,從而有效保護模型版權的目的。

上海交通大學的團隊從人類指紋的獨一無二特性中汲取靈感,研究開發(fā)了一種為大模型制作「人類可讀指紋」的方法。他們將不同的基模型象征為不同品種的狗,其中相同的「狗形指紋」表明它們源自同一個基模型。

這種直觀的方法使公眾能夠輕松辨識不同大模型之間的聯(lián)系,并通過這些指紋追蹤到模型的基模型,有效預防模型的盜版和濫用。值得注意的是,大模型的制造商無需公布其參數(shù),僅需公開不變項用于生成指紋。

圖片

Alpaca 和 LLaMA 的「指紋」極其相似,這是因為 Alpaca 模型是通過對 LLaMA 進行微調(diào)得到的;而其他幾種模型的指紋則顯示了明顯的差異,反映了它們源自不同的基模型。

論文《HUREF: HUMAN-READABLE FINGERPRINT FOR LARGE LANGUAGE MODELS》:

圖片

論文下載地址:https://arxiv.org/pdf/2312.04828.pdf

從實驗觀察到不變項

交大團隊發(fā)現(xiàn),在對大模型進行微調(diào)或 further pretrain 時,這些模型的參數(shù)向量方向變化非常微小。相反,對于從新開始訓練的大模型,其參數(shù)方向將與其他基模型完全不同。

圖片

他們在 LLaMA 的一系列衍生模型上進行了驗證,包括通過對 LLaMA 進行微調(diào)得到的 Alpaca 和 Vicuna,以及由 LLaMA further pretrain 得到的 Chinese LLaMA 和 Chinese Alpaca。此外,他們還測試了如百川和書生等獨立訓練的基模型。

圖片

表格中用藍色標記的 LLaMA 衍生模型與 LLaMA-7B 基模型在參數(shù)向量上展現(xiàn)出了極高的余弦相似度,意味著這些衍生模型在參數(shù)向量方向上與基模型極為接近。相比之下,用紅色標記的獨立訓練的基模型則呈現(xiàn)出截然不同的情況,它們的參數(shù)向量方向完全無關。

基于這些觀察,他們考慮是否可以依據(jù)這種經(jīng)驗規(guī)律來創(chuàng)建模型的指紋。然而,存在一個關鍵問題:這種方法對于惡意攻擊是否足夠魯棒?

為了驗證這一點,研究團隊在對 LLaMA 進行微調(diào)時,加入了模型間參數(shù)的相似度作為懲罰損失,以使模型在微調(diào)的同時,參數(shù)方向盡量偏離基模型,測試模型能否在保持性能的同時偏離原參數(shù)方向:

圖片

他們在 BoolQ 和 MMLU 等 8 個 benchmark 上測試了原模型和加入懲罰損失微調(diào)得到的模型。從下圖表中可見,模型的性能隨著余弦相似度的下降迅速惡化。這說明,想要在不損害基模型能力的情況下偏離原參數(shù)方向是相當困難的!

圖片

圖片

目前來看,大模型的參數(shù)向量方向成為識別其基模型的一個極為有效且魯棒的指標。但是,直接利用參數(shù)向量方向作為識別工具似乎還存在一些問題。首先,這種方法需要揭示模型的參數(shù),這對于許多大型模型可能是不可接受的。其次,攻擊者有可以通過簡單地置換隱藏單元,從而在不犧牲模型性能的情況下對參數(shù)向量方向發(fā)起攻擊。

以 Transformer 中的前饋神經(jīng)網(wǎng)絡(FFN)為例,僅對隱藏單元進行簡單的置換,并相應地調(diào)整其權重,就可以在不改變網(wǎng)絡輸出的情況下實現(xiàn)對權重方向的修改。

圖片

此外,該團隊還深入分析了線性映射攻擊以及對大模型 word embedding 的置換攻擊。這些發(fā)現(xiàn)引發(fā)了一個問題:在面對如此多樣化的攻擊手段時,我們應該如何有效地應對和解決這些問題?

他們通過參數(shù)矩陣間的乘法消除攻擊矩陣,從而推導出了三組對這些攻擊魯棒的不變項。

圖片

從不變項到人類可讀的指紋

雖然上述推導出的不變項已足以作為大型型的身份標識,但它們通常以龐大的矩陣形式出現(xiàn),不僅不夠直觀,而且還需要進行額外的相似度計算來判定不同大模型之間的關系。是否存在一種更加直觀且易于理解的方法來展示這些信息?

為了解決這一問題,上海交大團隊研發(fā)了一套由模型參數(shù)生成人類可讀指紋的方法 —HUREF。

圖片

他們首先從大模型的部分參數(shù)中提取出不變項,然后利用 CNN Encoder 在保持局部性(locality)的前提下,將不變項矩陣編碼成服從高斯分布的特征向量,最后使用使用平滑的 GAN 或 VAE 作為圖片生成器,將這些特征向量解碼成可視化圖像(即狗的圖片)。這些圖片不僅人類可讀,而且直觀地展示了不同模型之間的相似性,有效地作為大型模型的「視覺指紋」。以下是詳細的訓練和推理過程。

圖片

在該框架中,CNN Encoder 是唯一需要訓練的部分。他們采用對比學習確保 Encoder 的局部保持性,同時通過生成對抗學習確保特征向量服從高斯分布,以此與 GAN 或 VAE 生成器的輸入空間保持一致。

重要的是,在訓練過程中,他們無需使用任何真實的模型參數(shù),所有數(shù)據(jù)都是通過正態(tài)分布采樣獲得。在實際應用中,直接采用經(jīng)過訓練的 CNN Encoder 和現(xiàn)成的在 AFHQ 犬類數(shù)據(jù)集上訓練得到的 StyleGAN2 生成器來進行推理。

為不同大模型生成指紋

為了驗證這一方法的有效性,團隊在多種廣泛使用的大模型上進行了實驗。他們選取了若干知名的開源大模型,如 Falcon、MPT、LLaMA2、Qwen、Baichuan 和 InternLM,以及它們的衍生模型,計算了這些模型的不變項,并據(jù)此生成了如下圖所示的指紋圖片。

圖片

衍生模型的指紋與其原始模型極為相似,我們可以直觀地從圖像中辨認出它們是基于哪個原型模型構建的。此外,這些衍生模型與原模型在不變項上也保持了很高的余弦相似性。

隨后,他們對 LLaMA 家族模型進行了廣泛的測試,包括通過 SFT 得到的 Alpaca 和 Vicuna,擴展了中文詞匯表的模型,通過 further pretrain 得到的 Chinese LLaMA 和 BiLLa,通過 RLHF 得到的 Beaver 以及多模態(tài)模型 Minigpt4 等。

圖片

表中展示了 LLaMA 家族模型之間不變項的余弦相似度,同時,圖中是為這 14 個模型生成的指紋圖片,它們的相似度依然很高。我們能夠根據(jù)指紋圖片判斷出它們來自相同的模型,值得注意的是,這些模型涵蓋了 SFT,further pretrain,RLHF 和多模態(tài)等多種不同的訓練方法,這進一步驗證了團隊所提出的方法對大模型后續(xù)不同訓練范式的魯棒性。

此外,下圖是他們在 24 個獨立訓練的開源基模型上進行的實驗結果。通過他們的方法,各個獨立的基模型被賦予了獨特的指紋圖像,這些圖像生動地展現(xiàn)了不同大模型間指紋的多樣性和差異性。表中,這些模型間的相似度計算結果與其指紋圖像所呈現(xiàn)的差異性保持了一致。

圖片

圖片

最后,該團隊進一步驗證了小規(guī)模獨立訓練的語言模型參數(shù)方向的唯一性和穩(wěn)定性。他們利用 Pile 數(shù)據(jù)集的十分之一從零開始預訓練了四個 GPT-NeoX-350M 模型。

這些模型在設置上完全相同,唯一的區(qū)別在于使用了不同的隨機數(shù)種子。從下圖表中可以明顯看出,僅隨機數(shù)種子的差異就導致了模型參數(shù)方向和指紋的顯著不同,這充分說明了獨立訓練的語言模型參數(shù)方向的唯一性。

圖片

最后,通過比較相鄰 checkpoints 的相似度,他們發(fā)現(xiàn),在預訓練過程中,模型的參數(shù)逐漸趨向穩(wěn)定。他們認為這種趨勢在更長的訓練步驟和更大規(guī)模的模型中將更為明顯,這也在一定程度上解釋了他們方法的有效性。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-04 00:20:00

語言模型人工智能

2025-07-08 03:22:00

大模型參數(shù)AI

2025-04-07 09:31:00

LLMAI模型

2024-12-16 07:05:00

大模型LLM指紋識別

2023-11-13 19:35:12

訓練數(shù)據(jù)

2024-08-15 15:20:00

模型生成

2019-09-10 13:48:12

NLP神經(jīng)網(wǎng)絡模型

2025-07-28 09:06:00

2023-09-25 12:17:36

AI模型

2025-07-29 02:55:00

語言模型反向圖靈

2024-09-03 17:43:54

2024-01-23 10:35:09

ChatGPT人工智能

2023-11-03 07:47:12

機器資源大模型:

2024-10-28 09:47:53

2025-01-02 07:00:00

2025-02-28 12:32:42

2024-12-13 07:39:22

2025-06-26 02:24:00

Javaer大模型開發(fā)

2023-07-25 13:52:54

開源模型
點贊
收藏

51CTO技術棧公眾號

free欧美| a级片在线视频| 亚洲丝袜美腿一区| 欧美午夜一区二区三区| 水蜜桃在线免费观看| 成人免费视频国产| 久久综合亚州| 欧美日韩国产成人| 久久精品国产亚洲AV熟女| 在线观看欧美| 午夜成人免费视频| 伊人久久大香线蕉精品| 深夜福利视频网站| 美女精品一区二区| 55夜色66夜色国产精品视频| 亚洲色图100p| 香蕉久久精品日日躁夜夜躁| 3751色影院一区二区三区| 国自产拍偷拍精品啪啪一区二区| 国产免费a∨片在线观看不卡| 国产精品资源在线观看| 日本免费一区二区三区视频观看| 全程偷拍露脸中年夫妇| 国产一区二区在线| 亚洲国产成人精品女人久久久| 激情 小说 亚洲 图片: 伦| 超碰中文在线| 亚洲天堂福利av| 欧美一区观看| 少妇精品高潮欲妇又嫩中文字幕| 九九**精品视频免费播放| 国产91精品久久久久| www青青草原| 日韩伦理视频| 亚洲丝袜在线视频| 亚洲一区二区三区无码久久| 亚洲精品观看| 欧美日韩一区高清| 成人3d动漫一区二区三区| 91福利区在线观看| 亚洲欧美日韩国产手机在线 | 日韩欧美不卡在线| 尤物视频在线免费观看| 久久久久久一二三区| 精品一区二区三区国产| www.成人精品| 国产在线视频不卡二| 国产欧美日韩最新| 中文字幕在线一| 日韩黄色小视频| 热99精品里视频精品| 日本中文字幕免费观看| 狠狠爱综合网| 久久男人的天堂| 中文字幕一区二区三区手机版 | 欧美国产日产图区| 日本一区二区三区视频在线播放| 视频在线不卡| www国产亚洲精品久久麻豆| 国产伦精品一区二区三区高清版| 精品国产伦一区二区三| 夫妻av一区二区| www.成人三级视频| 亚洲精品久久久久久久久久| 国产一区二区三区精品欧美日韩一区二区三区 | 国产又色又爽又高潮免费| 精品久久久中文字幕| 一区二区三区国产在线观看| 在线观看免费小视频| 欧美日韩在线二区| 久久精品福利视频| 亚洲av无码一区二区三区在线| 亚洲国产精品成人| 欧美激情精品久久久久| 日韩av综合在线| 亚洲欧美视频| 国产精品免费视频xxxx| 97超碰人人草| 国产xxx精品视频大全| 久久久精品动漫| 国产网站在线播放| 亚洲欧美日韩中文播放| 国产尤物av一区二区三区| 97超碰免费在线| 欧美视频不卡中文| 国产小视频精品| 麻豆久久一区| 亚洲精品按摩视频| 黄色三级生活片| 91精品国产91久久久久久密臀| 欧美精品福利视频| 中文字幕第四页| 麻豆成人久久精品二区三区红| 91视频九色网站| 天堂中文在线资源| 国产精品色哟哟| 国产精品无码电影在线观看| 小早川怜子影音先锋在线观看| 91高清视频免费看| 日韩精品xxx| 亚洲人成网亚洲欧洲无码| 这里只有精品久久| 精品无码m3u8在线观看| 奇米精品一区二区三区在线观看一| 亚洲a∨日韩av高清在线观看| 日韩一级中文字幕| 中文字幕一区二区三| 欧美极品欧美精品欧美| 成人交换视频| 日韩精品极品毛片系列视频| 乱老熟女一区二区三区| 亚洲一区二区动漫| 91久久国产自产拍夜夜嗨| 天堂91在线| 一区二区三区av电影| 色综合天天色综合| 女人抽搐喷水高潮国产精品| 久久久精品国产网站| 日本在线播放视频| 国产精品一卡二卡在线观看| 色噜噜一区二区| 都市激情国产精品| 日韩女优av电影| 成人性生交大片免费看无遮挡aⅴ| 亚洲高清激情| 91青草视频久久| av在线资源站| 91黄视频在线观看| 成人h动漫精品一区| 欧美人成网站| 成人黄色午夜影院| 91在线视频免费看| 一本久道久久综合中文字幕| www.日本高清| 在线播放日韩| 国产精品久久九九| 二区三区四区高清视频在线观看| 狠狠色香婷婷久久亚洲精品| 在线观看免费视频黄| 综合久久综合| 亚洲一区美女视频在线观看免费| 成人在线二区| 在线精品视频免费观看| 男人操女人动态图| 欧美在线综合| 久久久久久一区| 日韩电影毛片| 日韩精品极品毛片系列视频| 五月天综合激情网| 久久综合色一综合色88| 日韩精品视频一区二区在线观看| 你懂的在线观看一区二区| 久久久中文字幕| 狠狠综合久久av一区二区| 一区二区三区四区视频精品免费| 亚洲自拍第三页| 一区二区日韩欧美| 国产精品jizz视频| heyzo高清在线| 亚洲精美色品网站| 国产三级精品三级在线观看| 久久精品一区八戒影视| 国产极品美女高潮无套久久久| 婷婷综合福利| 国产成人精品免费视频| av网站在线免费播放| 欧美日韩不卡一区| 久久久久久久久久网站| 不卡视频在线观看| 干日本少妇首页| 成人在线视频免费观看| 成人久久久久久久| 怡红院在线播放| 亚洲第一免费播放区| 亚洲欧美精品一区二区三区| 国产午夜精品一区二区三区四区| 中文字幕第36页| 艳女tv在线观看国产一区| 国产成人成网站在线播放青青| 免费看男女www网站入口在线| 国产一区二区黑人欧美xxxx| 国产又黄又猛又爽| 亚洲高清三级视频| 中文字幕丰满乱子伦无码专区| 免费高清不卡av| 日韩精品福利片午夜免费观看| 国产精品x8x8一区二区| 国产成人精品在线观看| 成人在线观看免费网站| 亚洲精品久久久久久久久| 中文字幕xxxx| 一区二区欧美在线观看| 精品少妇人妻一区二区黑料社区| 麻豆国产精品官网| 欧美国产亚洲一区| 999久久久国产精品| 国产亚洲二区| 欧美成人黄色| 69视频在线免费观看| 欧美18hd| 亚洲欧美综合精品久久成人| 国产视频手机在线观看| 色综合久久88色综合天天| 欧美高清视频一区二区三区| 欧美经典一区二区| 亚洲av永久无码精品| 久久91精品久久久久久秒播| 9久久9毛片又大又硬又粗| 国产精品二区不卡| 日本高清不卡三区| 国产精品天天看天天狠| 国产中文字幕亚洲| 欧美xxx性| 国内久久久精品| 免费超碰在线| 亚洲最新中文字幕| 亚州精品国产精品乱码不99按摩| 91精品国产综合久久福利软件| 久久久久99精品成人片我成大片| 亚洲主播在线观看| 日韩激情综合网| 国产女人水真多18毛片18精品视频| 国产ts在线观看| 精品亚洲免费视频| 久久久精品三级| 中文欧美日韩| 国内少妇毛片视频| 亚洲乱码精品| 中文字幕在线亚洲精品| 国内精品久久久久久久影视简单| 加勒比在线一区二区三区观看| 日韩免费一级| 4444kk亚洲人成电影在线| 成人在线中文| 国产精品久久久久77777| 三上悠亚一区二区| 91国自产精品中文字幕亚洲| 密臀av在线| 色综合久久中文字幕综合网小说| 成人影欧美片| 久久亚洲电影天堂| 日韩av中文| 久久伊人91精品综合网站| 欧美性天天影视| 久久久av一区| 91在线中文| 欧美激情亚洲自拍| 丁香花在线影院| 午夜精品www| 性xxxxfreexxxxx欧美丶| 2019亚洲日韩新视频| 色一区二区三区| 欧美中文在线字幕| 欧美韩国亚洲| 国产精品久久中文| 国产第一亚洲| 91久久国产精品91久久性色| 国产亚洲亚洲国产一二区| 91精品视频专区| 亚洲五码在线| 国产麻豆一区二区三区在线观看| 超碰成人在线观看| 久久国产一区| 精品久久国产| 黄色网址在线免费看| 国产精品99免费看| 18禁免费观看网站| 视频一区欧美精品| 五月激情婷婷在线| 国产一区二三区| 日韩综合第一页| 久久久影院官网| 999久久久国产| 亚洲精品中文字幕在线观看| 福利一区二区三区四区| 色综合久久综合网97色综合| 伊人22222| 日韩女优毛片在线| 欧美日本韩国一区二区| 日韩在线一区二区三区免费视频| 影音先锋男人资源在线| 日本中文字幕不卡免费| 欧美在线一级| 国产免费一区二区三区| 精品国产网站| 日本大胆人体视频| 国产精品亚洲综合久久| www.日本一区| 丰满亚洲少妇av| 怡红院一区二区三区| 伊人色综合久久天天| 精品人妻无码一区二区性色| 欧美三级三级三级| 亚洲国产av一区二区| 亚洲免费电影在线观看| 超碰在线caoporen| 日韩av免费在线播放| 日韩欧美高清一区二区三区| 日本在线观看一区| 韩国亚洲精品| 欧美女同在线观看| 96av麻豆蜜桃一区二区| 成人自拍小视频| 日韩欧美在线播放| 成人黄色在线观看视频| 在线播放精品一区二区三区 | 欧美黄色一级生活片| 洋洋av久久久久久久一区| 中文字幕视频在线播放| 亚洲精品wwwww| 日韩123区| 国产欧美在线观看| 禁果av一区二区三区| 久久亚洲中文字幕无码| 国产一区二区三区黄视频| 久久久久久九九九九九| 亚洲国产精品久久不卡毛片| 国产精品久久久久毛片| 国产小视频91| 欧美a级在线观看| 成人自拍爱视频| 99久久.com| 在线观看免费成人av| 91香蕉视频黄| 国产真实乱偷精品视频| 91精品麻豆日日躁夜夜躁| www在线播放| 国产成人欧美在线观看| 天堂网av成人| 久久久久久久久久久99| 成人av第一页| 国产在线观看免费av| 日韩一区和二区| 国产黄色小视频在线| 国产日韩精品在线播放| 国产探花一区二区| 午夜dv内射一区二区| 久久蜜桃一区二区| 免费观看一区二区三区毛片| 精品日本一线二线三线不卡| 手机av免费在线| 99国精产品一二二线| 欧美日韩伊人| 动漫av在线免费观看| 亚洲一区自拍偷拍| 亚洲春色一区二区三区| 欧美精品免费看| 日韩精品视频在线看| 国产欧美123| 国产69精品久久久久777| 久久网中文字幕| 337p日本欧洲亚洲大胆色噜噜| 丁香花视频在线观看| 国产欧美一区二区在线播放| 亚洲激情网址| 亚洲狠狠婷婷综合久久久久图片| 欧美日韩免费看| 欧美视频综合| 国产精品久久久久久久av大片| 欧美日韩一区二区综合| 夜夜夜夜夜夜操| 亚洲美女视频在线观看| 亚洲AV无码乱码国产精品牛牛| 久久久久久久av| 亚洲精品国产动漫| 亚洲黄色av网址| 亚洲少妇最新在线视频| www日本高清视频| 欧美一级视频在线观看| 日产精品一区二区| 日日干日日操日日射| 亚洲国产欧美另类丝袜| 你懂的在线免费观看| 欧美中文字幕在线观看| 久久婷婷蜜乳一本欲蜜臀| 992kp免费看片| 舔着乳尖日韩一区| 国产在线一二三区| 亚洲va国产va天堂va久久| 亚洲久久在线| 懂色av粉嫩av浪潮av| 日韩一级免费一区| 欧美极品影院| 一本二本三本亚洲码 | 国产成人无码精品久久二区三| 欧美吻胸吃奶大尺度电影| 中中文字幕av在线| 欧美日韩免费高清| 国产一区二区三区免费在线观看 | 亚洲在线电影| 成年人免费视频播放| 精品国产乱码久久久久久久| **在线精品| 嫩草影院中文字幕| 国产精品无人区| 韩国中文字幕hd久久精品| 国产精品嫩草影院久久久| 亚洲先锋成人| 肉色超薄丝袜脚交69xx图片 | 国产肉体xxxx裸体784大胆|