精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型知識Out該怎么辦?浙大團隊探索大模型參數(shù)更新的方法—模型編輯

人工智能
不管從何種意義來說,模型編輯預設的問題在未來所謂的“大模型時代”都十分有潛力,模型編輯的問題需要更好的探索如“模型知識究竟存儲在哪些參數(shù)之中”、“模型編輯操作如何不影響其他模塊的輸出”等一系列非常難的問題。

夕小瑤科技說 原創(chuàng) 作者 | 小戲、Python

大模型在其巨大體量背后蘊藏著一個直觀的問題:“大模型應該怎么更新?”

在大模型極其巨大的計算開銷下,大模型知識的更新并不是一件簡單的“學習任務”,理想情況下,隨著世界各種形勢的紛繁復雜的變換,大模型也應該隨時隨地跟上時代的腳步,但是訓練全新大模型的計算負擔卻不允許大模型實現(xiàn)即時的更新,因此,一個全新的概念“Model Editing(模型編輯)”應運而生,以實現(xiàn)在特定領(lǐng)域內(nèi)對模型數(shù)據(jù)進行有效的變更,同時不會對其他輸入的結(jié)果造成不利影響。

圖片

其中, 表示  的“有效鄰居”, 則表示超出  作用范圍的領(lǐng)域。一個編輯后的模型應當滿足以下三點,分別是可靠性,普適性與局部性,可靠性即編輯后模型應該可以正確的輸出編輯前模型錯誤的例子,可以通過編輯案例的平均準確率來衡量,普適性表示對于  的“有效鄰居”,模型都應該可以給出正確的輸出,這點可以對編輯案例領(lǐng)域數(shù)據(jù)集進行均勻抽樣衡量平均正確率來衡量,最后局部性,即表示編輯后模型在超出編輯范圍的例子中仍然應該保持編輯前的正確率,可以通過分別測算編輯前編輯后的平均準確率來對局部性進行刻畫,如下圖所示,在編輯“特朗普”的位置時,一些其他的公共特征不應受到更改。同時,其他實體,例如“國務卿”,盡管與“總統(tǒng)”具有相似的特征,但也不應受到影響。

圖片

而今天介紹的這篇來自浙江大學的論文便站在一個大模型的視角,為我們詳細敘述了大模型時代下模型編輯的問題、方法以及未來,并且構(gòu)建了一個全新的基準數(shù)據(jù)集與評估指標,幫助更加全面確定的評估現(xiàn)有的技術(shù),并為社區(qū)在方法選擇上提供有意義的決策建議與見解:

論文題目:Editing Large Language Models: Problems, Methods, and Opportunities

論文鏈接:https://arxiv.org/pdf/2305.13172.pdf

主流方法

當下針對大規(guī)模語言模型(LLMs)的模型編輯方法如下圖所示主要可以分為兩類范式,分別是如下圖(a)所示的保持原模型參數(shù)不變下使用額外的參數(shù)以及如下圖(b)所示的修改模型的內(nèi)部參數(shù)。

圖片

首先來看相對簡單的增加額外參數(shù)的方法,這種方法又稱基于記憶或內(nèi)存的模型編輯方法,代表方法 SERAC 最早出現(xiàn)于 Mitchell 提出“模型編輯”的論文,其核心思想在于保持模型原始參數(shù)不變,通過一個獨立的參數(shù)集重新處理修改后的事實,具體而言,這類方法一般先增加一個“范圍分類器”判斷新輸入是否處于被“重新編輯”過的事實范圍內(nèi),如果屬于,則使用獨立參數(shù)集對該輸入進行處理,對緩存中的“正確答案”賦予更高的選擇概率。在 SERAC 的基礎上,T-Patcher 與 CaliNET 向 PLMs 的前饋模塊中引入額外可訓練的參數(shù)(而不是額外外掛一個模型),這些參數(shù)在修改后的事實數(shù)據(jù)集中進行訓練以達到模型編輯的效果。

圖片

而另一大類方法即修改原來模型中參數(shù)的方法主要應用一個 ? 矩陣去更新模型中的部分參數(shù) ,具體而言,修改參數(shù)的方法又可以分為“Locate-Then-Edit”與元學習兩類方法,從名字也可以看出,Locate-Then-Edit 方法先通過定位模型中的主要影響參數(shù),再對定位到的模型參數(shù)進行修改實現(xiàn)模型編輯,其中主要方法如 Knowledge Neuron 方法(KN)通過識別模型中的“知識神經(jīng)元”確定主要影響參數(shù),通過更新這些神經(jīng)元實現(xiàn)對模型的更新,另一種名為 ROME 的方法思想與 KN 類似,通過因果中介分析定位編輯區(qū)域,此外還有一種 MEMIT 的方法可以實現(xiàn)對一系列編輯描述的更新。這類方法最大的問題在于普遍依據(jù)一個事實知識局部性的假設,但是這一假設并沒有得到廣泛的驗證,對許多參數(shù)的編輯有可能導致意想不到的結(jié)果。

而元學習方法與 Locate-Then-Edit 方法不同,元學習方法使用 hyper network 方法,使用一個超網(wǎng)絡(hyper network)為另一個網(wǎng)絡生成權(quán)重,具體而言在 Knowledge Editor 方法中,作者使用一個雙向的 LSTM 去預測每個數(shù)據(jù)點為模型權(quán)重帶來的更新,從而實現(xiàn)對編輯目標知識的帶約束的優(yōu)化。這類知識編輯的方法由于 LLMs 的巨大參數(shù)量導致難以應用于 LLMs 中,因此 Mitchell 等又提出了 MEND(Model Editor Networks with Gradient Decomposition)使得單個的編輯描述可以對 LLMs 進行有效的更新,這種更新方法主要使用梯度的低秩分解微調(diào)大模型的梯度,從而使得可以對 LLMs 進行最小資源的更新。與 Locate-Then-Edit 方法不同,元學習方法通常花費的時間更長,消耗的內(nèi)存成本更大。

圖片

方法測評

這些不同方法在模型編輯的兩個主流數(shù)據(jù)集 ZsRE(問答數(shù)據(jù)集,使用反向翻譯生成的問題改寫作為有效領(lǐng)域) 與 COUNTERFACT(反事實數(shù)據(jù)集,將主語實體替換為同義實體作為有效領(lǐng)域) 中進行實驗如下圖所示,實驗主要針對兩個相對以往研究較大的 LLMs T5-XL(3B)和 GPT-J(6B)作為基礎模型,高效的模型編輯器應該在模型性能、推理速度和存儲空間之間取得平衡。

對比第一列微調(diào)(FT)的結(jié)果,可以發(fā)現(xiàn),SERAC 和 ROME 在 ZsRE 和 COUNTERFACT 數(shù)據(jù)集上表現(xiàn)出色,特別是 SERAC,它在多個評估指標上獲得了超過 90% 的結(jié)果,雖然 MEMIT 的通用性不如 SERAC 和 ROME,但在可靠性和局部性上表現(xiàn)出色。而 T-Patcher 方法表現(xiàn)極其不穩(wěn)定,在 COUNTERFACT 數(shù)據(jù)集中具有不錯的可靠性和局部性,但缺乏通用性,在 GPT-J 中,可靠性和通用性表現(xiàn)出色,但在局部性方面表現(xiàn)不佳。值得注意的是,KE、CaliNET 和 KN 的性能表現(xiàn)較差,相對于這些模型在“小模型”中取得的良好表現(xiàn)而言,實驗可能證明了這些方法不是非常適配大模型的環(huán)境。

圖片

而如果從時間來看,一旦訓練好網(wǎng)絡,KE 和 MEND 則表現(xiàn)相當優(yōu)秀,而如 T-Patcher 這類方法耗時則過于嚴重:

圖片

再從內(nèi)存消耗來看,大多數(shù)方法消耗內(nèi)存在同一個量級,但引入額外參數(shù)的方法會承擔額外的內(nèi)存開銷:

圖片

同時,通常對模型編輯的操作還需要考慮批次輸入編輯信息以及順序輸入編輯信息,即一次更新多個事實信息與順序更新多個事實信息,批次輸入編輯信息整體模型效果如下圖所示,可以看到 MEMIT 可以同時支持編輯超過 10000條信息,并且還能保證兩個度量指標的性能都保持穩(wěn)定,而 MEND 和 SERAC 則表現(xiàn)不佳:

圖片

而在順序輸入方面,SERAC 和 T-Patcher 表現(xiàn)出色而穩(wěn)定,ROME,MEMIT,MEND 都出現(xiàn)了在一定數(shù)量的輸入后模型性能快速下降的現(xiàn)象:

圖片

最后,作者在研究中發(fā)現(xiàn),當下這些數(shù)據(jù)集的構(gòu)造及評估指標很大程度上只關(guān)注句子措辭上的變化,但是并沒有深入到模型編輯對許多相關(guān)邏輯事實的更改,譬如如果將“Watts Humphrey 就讀哪所大學”的答案從三一學院改為密歇根大學,顯然如果當我們問模型“Watts Humphrey 大學時期居住于哪個城市?”時,理想模型應該回答安娜堡而不是哈特福德,因此,論文作者在前三個評估指標的基礎上引入了“可移植性”指標,衡量編輯后的模型在知識轉(zhuǎn)移方面的有效性。

圖片

為此,作者使用 GPT-4 構(gòu)建了一個新的數(shù)據(jù)集,通過將原始問題  的答案從  改為 ,并且構(gòu)建另一個正確答案為  的問題 ,組成  三元組,對編輯后模型輸入 ,如果模型可以正確輸出  則證明該編輯后模型具有“可移植性”,而根據(jù)這個方法,論文測試了現(xiàn)有幾大方法的可移植性得分如下圖所示:

圖片

可以看到,幾乎絕大多數(shù)模型編輯方法在可移植性方面都不太理想,曾經(jīng)表現(xiàn)優(yōu)異的 SERAC 可移植性準確率不到 10%,相對最好的 ROME 和 MEMIT 最高也只有 50% 左右,這表明當下的模型編輯方法幾乎難以做到編輯后知識的任何擴展和推廣,模型編輯尚有很長的路要走。

討論與未來

不管從何種意義來說,模型編輯預設的問題在未來所謂的“大模型時代”都十分有潛力,模型編輯的問題需要更好的探索如“模型知識究竟存儲在哪些參數(shù)之中”、“模型編輯操作如何不影響其他模塊的輸出”等一系列非常難的問題。而另一方面,解決模型“過時”的問題,除了讓模型進行“編輯”,還有一條思路在于讓模型“終身學習”并且做到“遺忘”敏感知識,不論是模型編輯還是模型終身學習,這類研究都將對 LLMs 的安全與隱私問題做出有意義的貢獻。

責任編輯:武曉燕 來源: 夕小瑤科技說
相關(guān)推薦

2024-01-02 07:15:59

大模型數(shù)據(jù)庫企業(yè)知識管家

2025-03-17 12:55:18

2024-05-06 07:58:25

大模型AI智慧芽

2025-07-08 03:22:00

大模型參數(shù)AI

2025-07-08 03:11:00

2024-10-24 10:15:00

AI模型

2024-12-23 16:02:39

2024-09-10 08:42:37

2023-11-03 07:47:12

機器資源大模型:

2024-06-17 07:49:53

2024-06-28 16:03:38

2024-02-26 08:15:43

語言模型低代碼

2024-03-11 00:09:00

模型融合場景

2025-04-01 15:35:11

2025-02-21 13:20:00

2023-10-28 13:29:27

2023-06-07 08:22:59

LLM微調(diào)技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號

国产在线青青草| 91精品国产高清自在线| 日韩av片专区| h片在线免费| 丁香六月综合激情| 1769国内精品视频在线播放| 亚洲自拍偷拍一区二区| www成人在线视频| 亚洲青青青在线视频| 99久热re在线精品996热视频| 欧美高清视频一区二区三区| 豆花视频一区二区| 色婷婷亚洲精品| 一区二区视频国产| www.热久久| 亚洲精品欧洲| 一区二区三区黄色| 先锋资源在线视频| 在线成人av观看| 中文字幕在线一区免费| 电影午夜精品一区二区三区| 五月天激情四射| 97精品中文字幕| 亚洲高清在线观看| 天天综合网日韩| 96av在线| 国产精品国产a级| 国产欧美亚洲日本| 伊人网站在线观看| 你懂的视频一区二区| 亚洲毛片在线免费观看| 伊人五月天婷婷| 亚洲天堂av在线| 亚洲欧美怡红院| 欧美日本国产精品| 精品久久无码中文字幕| 久久午夜激情| 欧美区二区三区| 亚洲一区视频在线播放| 精品中文字幕一区二区三区| 欧美三级电影网| 中文字幕无码不卡免费视频| 97人人在线视频| 夜夜夜精品看看| 强开小嫩苞一区二区三区网站 | 蜜桃视频动漫在线播放| 亚洲精品视频免费看| 日本黄色播放器| 色网站免费在线观看| 中文字幕av不卡| 视频一区二区三区免费观看| 国产精品四虎| 欧美激情一区二区| 亚洲欧美精品| 永久免费av在线| 中文字幕五月欧美| 中文字幕一区二区中文字幕 | 亚洲图区在线| 日韩精品免费综合视频在线播放| 国产xxxx视频| 日韩有码中文字幕在线| 亚洲美女久久久| 亚洲精品色午夜无码专区日韩| 深爱激情综合网| 亚洲香蕉成人av网站在线观看| 一区二区精品免费| 成人在线免费视频观看| 久久久精品国产| 国产精品九九九九九九| 欧美日韩视频一区二区三区| 久久频这里精品99香蕉| 久久国产黄色片| 日韩在线观看一区二区| 成人免费在线视频网站| 国产黄色一区二区| 99精品偷自拍| 日韩中文字幕av在线| 18视频免费网址在线观看| 亚洲欧美另类小说视频| 国产 日韩 亚洲 欧美| 中文日产幕无线码一区二区| 欧美日韩dvd在线观看| 下面一进一出好爽视频| 精品亚洲自拍| 原创国产精品91| 精品欧美一区二区久久久久| 日韩午夜免费| 国产日韩中文字幕在线| 性网爆门事件集合av| 久久久亚洲精品石原莉奈| 亚洲一区二区三区色| 日韩特级毛片| 欧美专区亚洲专区| 欧美69精品久久久久久不卡| 亚洲瘦老头同性70tv| 色吧影院999| 国产大片中文字幕| 蜜桃在线一区二区三区| av成人观看| 91大神xh98hx在线播放| 亚洲福利视频三区| 日本超碰在线观看| 卡通动漫国产精品| 久久久精品亚洲| 国产成人无码一区二区在线播放| 国产精品一区在线| 日本a级片久久久| 欧美xxxx黑人又粗又长| 精品视频一区 二区 三区| 精品一区二区三区四区五区六区| 精品国产91久久久久久浪潮蜜月| 欧美激情国产日韩精品一区18| 一级片免费在线播放| 丁香婷婷深情五月亚洲| 宅男av一区二区三区| 亚洲黄色中文字幕| 精品奇米国产一区二区三区| 97精品在线播放| 久久精品一区| 国产精品免费在线| 成人三级网址| 一本一道久久a久久精品 | 2018中文字幕第一页| 另类一区二区三区| 亚洲欧洲日产国码av系列天堂| 久久久久久欧美精品se一二三四| 日本强好片久久久久久aaa| 国外成人在线视频网站| 国产色在线观看| 欧美日韩亚洲另类| 色欲AV无码精品一区二区久久| av成人激情| 国产富婆一区二区三区| 在线电影福利片| 91精品国产综合久久精品麻豆| 亚洲第一视频区| 老司机午夜免费精品视频| 精品国产免费人成电影在线观...| www红色一片_亚洲成a人片在线观看_| 欧美日韩国产乱码电影| 国产又黄又粗的视频| 日韩在线一区二区三区| 欧美一区二区三区成人久久片| 国产va在线视频| 亚洲国产精品久久久久秋霞蜜臀 | 宅男噜噜噜66一区二区66| 国产jjizz一区二区三区视频| 亚洲综合电影一区二区三区| 黄色99视频| 一区二区精品伦理...| 精品亚洲一区二区三区在线播放| www日韩精品| 99精品视频在线免费观看| 99精品人妻少妇一区二区| 欧美18xxxx| 91av视频导航| 久久久资源网| 欧美色视频在线观看| 91禁男男在线观看| 国产真实乱偷精品视频免| 男女爱爱视频网站| 国产精品欧美大片| 日韩av片免费在线观看| 91caoporm在线视频| 欧美日韩成人在线| 欧美黄色免费看| 成人激情小说网站| 92看片淫黄大片一级| 欧美精品系列| 18成人在线| 乱馆动漫1~6集在线观看| 国产视频久久久久久久| 特级西西444www大胆免费看| 亚洲色欲色欲www在线观看| 成年人性生活视频| 亚洲人体偷拍| 日韩在线第一区| 中文字幕一区二区三区日韩精品| 欧美一级大胆视频| 国产精品四虎| 欧美r级电影在线观看| 6080午夜伦理| 亚洲男人天堂av网| 色噜噜在线观看| 麻豆精品在线观看| 69sex久久精品国产麻豆| 久久99蜜桃| 91精品国产高清久久久久久91裸体| 91超碰在线免费| 色多多国产成人永久免费网站 | www..com久久爱| 啊啊啊国产视频| 好吊一区二区三区| 色大师av一区二区三区| 亚洲国产aⅴ精品一区二区| 亲爱的老师9免费观看全集电视剧| 色网站免费在线观看| 日韩国产高清污视频在线观看| 这里只有精品999| 亚洲成av人片在线| 婷婷国产成人精品视频| 91麻豆成人久久精品二区三区| 日本黄色的视频| 国产亚洲激情| av片在线免费| 日韩av大片| 免费在线一区二区| 日韩三级精品| 成人女保姆的销魂服务| 女生影院久久| 午夜精品一区二区三区视频免费看| 欧美成年黄网站色视频| 亚洲欧洲国产一区| 亚洲av成人精品毛片| 欧美一区二区三区视频在线观看| 无码人妻丰满熟妇区bbbbxxxx| 樱桃视频在线观看一区| 蜜桃av免费观看| 国产亚洲一区字幕| 五十路六十路七十路熟婆| 国产一二三精品| www午夜视频| 久久一区视频| 免费看又黄又无码的网站| 欧美黄污视频| 8x8x华人在线| 91精品国产视频| 亚洲一区二区三区精品在线观看| 国产精品密蕾丝视频下载| 久久久久久久有限公司| 久久亚洲黄色| 国产一区精品视频| 成人动漫视频| 国产高清精品一区二区| 日本精品在线播放| 2022国产精品| 亚洲专区**| 97超碰人人看人人| 日韩精品视频一区二区三区| 亚洲一区二区免费| 精品视频在线一区| 91视频国产高清| 精品一区二区三区亚洲| 99国产在线观看| 日本免费一区二区三区视频| 91久久偷偷做嫩草影院| 视频一区国产| yy111111少妇影院日韩夜片| av男人一区| 国产在线精品一区二区三区》| 国产伦精品一区二区三区在线播放 | 国产美女久久| 国产一区视频在线播放| 91丨精品丨国产| 91亚洲国产成人久久精品网站| 精品国产亚洲一区二区三区在线 | 亚洲精品视频免费看| 永久看片925tv| 亚洲午夜在线观看视频在线| 亚洲一区欧美在线| 色综合久久久久综合体桃花网| 99re国产在线| 欧美日韩国产另类一区| 国产肥老妇视频| 亚洲精品国产免费| 国产在线一二三| 久久精品99国产精品酒店日本| 永久免费网站在线| 97婷婷涩涩精品一区| 亚洲精品一级二级| 成人免费网站在线观看| 超碰精品在线观看| 日韩av不卡播放| 亚洲v在线看| 奇米精品一区二区三区| 日本中文字幕一区二区视频 | 国产91国语对白在线| 欧美日韩一二三| 亚洲精品国产手机| 亚洲欧美日韩一区在线| 欧美日本一道| 97在线精品视频| 日本免费一区二区三区等视频| 91福利入口| 国产在线观看91一区二区三区| 大地资源第二页在线观看高清版| 亚洲黄色成人| 中文字幕国内自拍| 成人一区二区三区| 国产欧美一区二区三区在线观看视频| 亚洲精品亚洲人成人网在线播放| 日韩av大片在线观看| 在线播放中文一区| 日韩美女一级视频| 另类色图亚洲色图| 欧美一区国产| 成人欧美一区二区三区在线观看| 欧美日韩黑人| 免费在线观看亚洲视频| 极品美女销魂一区二区三区免费| 性色av蜜臀av色欲av| 亚洲欧美欧美一区二区三区| 无码人妻精品一区二区| 精品久久久久久久一区二区蜜臀| 91精品专区| 欧美孕妇毛茸茸xxxx| 欧美国产亚洲精品| 视频一区视频二区视频三区高| 一区免费在线| 99999精品| 欧美国产日本韩| 六月丁香激情综合| 欧美成人一级视频| 蜜芽在线免费观看| 国产精品大片wwwwww| 欧美顶级毛片在线播放| 日韩一二区视频| 久久电影网电视剧免费观看| 老鸭窝一区二区| 亚洲国产日韩在线一区模特| 国产免费久久久| 中文字幕日韩av| 奇米777日韩| 国产一区二区不卡视频| 欧美+亚洲+精品+三区| gai在线观看免费高清| 国产欧美日本一区视频| 天天综合网久久综合网| 亚洲第一免费播放区| 在线观看wwwxxxx| 亚洲aaaaaa| 午夜免费一区| 国产成人美女视频| 欧美国产一区二区| 老熟妇仑乱一区二区av| 亚洲男人天堂网站| 国模套图日韩精品一区二区| 欧美久久电影| 老鸭窝亚洲一区二区三区| 黄色a一级视频| 欧美色图在线视频| 日韩毛片在线一区二区毛片| 欧美在线免费观看| 亚洲欧美日本伦理| 欧美成人黑人猛交| 久久久久久久久久久99999| 影音先锋在线国产| 亚洲欧洲自拍偷拍| 国产一区二区三区朝在线观看| 色一情一乱一伦一区二区三区| 日韩精品91亚洲二区在线观看| 中文字幕人妻一区二区三区在线视频| 色8久久精品久久久久久蜜| 北岛玲一区二区三区| 国产精品热视频| 午夜激情久久| 成人一区二区三区仙踪林| 亚洲高清中文字幕| 五月婷婷六月色| 国产精品国产亚洲伊人久久 | 欧美精品在线网站| 一区二区三区视频免费视频观看网站| 免费在线看黄色片| 9i在线看片成人免费| 欧美一区二区三区网站| 在线精品91av| 中文字幕一区二区三区四区久久| aa视频在线播放| 国产欧美日韩中文久久| 国产又粗又黄又爽的视频| 欧美激情欧美激情在线五月| 欧美成人基地| 天堂一区在线观看| 亚洲午夜成aⅴ人片| 日本一区二区三区在线观看视频| 国产精品国模在线| 综合av在线| 深爱五月激情网| 91精品蜜臀在线一区尤物| 黄色小说在线播放| 日韩高清国产精品| 国产一区二区三区精品欧美日韩一区二区三区| 久久久久久久久久综合| 亚洲性生活视频| 国产视频一区二区在线播放| 久久久999免费视频| 国产精品久久久久久久久动漫| 全国男人的天堂网| 国产精品视频内| 亚洲三级色网| 情侣偷拍对白清晰饥渴难耐| 亚洲成人激情视频| 国产一区二区三区四区五区3d| 日韩精品在线中文字幕| 亚洲国产精品高清| 黄色成人一级片| 国产日韩综合一区二区性色av| 国产精品婷婷| 538任你躁在线精品视频网站| 亚洲天堂第一页|