精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

背誦不等于理解,深度解析大模型背后的知識儲存與提取

人工智能 新聞
自然語言模型的背誦 (memorization) 并不等于理解。即使模型能完整記住所有數(shù)據(jù),也可能無法通過微調 (finetune) 提取這些知識,無法回答簡單的問題。

隨著模型規(guī)模的增大,人們開始探索大模型是如何掌握大量知識的。一種觀點認為這歸功于 “無損壓縮”,即模型通過大量訓練,記憶更多內容以提高預測精度。但 “無損壓縮” 真的能讓大模型理解這些知識嗎?朱澤園 (MetaAI) 和李遠志 (MBZUAI) 的最新研究《語言模型物理學 Part 3.1:知識的儲存與提取》深入探討了這個問題。

論文地址:https://arxiv.org/pdf/2309.14316.pdf

對于人類,有句話叫 “書讀百遍,其意自現(xiàn)”。這句話雖不適用于所有知識,但對于簡單知識,只要我們能記住相關書籍,就能輕松回答相關問題。例如,只要我們記住古詩 “靜夜思”,就能輕松回答 “詩里把月光比作了什么?”;只要我們記住百度百科關于 “出師表 / 創(chuàng)作背景” 那一段,就能輕松回答 “出師表的創(chuàng)作時間是什么?”。那么,大模型是否也能做到這一點呢?

圖片

圖 1:GPT-4 的一些知識提取的實例(左圖為 ChatGPT,右圖為 API)

GPT-4 雖然能理解并復述與問題相關的段落,但為何它無法像人類一樣回答簡單的問題呢?是因為模型不夠大,記憶力不足,還是訓練后的微調不夠?都不是!文章指出,即使自然語言模型足夠大,訓練時間足夠長,微調也足夠充分,但它仍可能無法回答人類認為簡單的問題。這其中的深層原因,與知識在預訓練數(shù)據(jù)集 (pretrain data) 中的呈現(xiàn)方式有關。同一知識,需要在預訓練數(shù)據(jù)集中多次出現(xiàn),且具有足夠的 “多樣性”,微調后才更容易被提取出來。

為了證實這一點,兩位作者創(chuàng)建了一個包含 100k 個人物傳記的數(shù)據(jù)集,每個人物有一個傳記條目,包含人名和六個固定屬性:出生日期,出生地,大學專業(yè),大學名稱,工作地點,工作單位。他們設計了 BioS 和 BioR 兩種數(shù)據(jù)集,BioS 的每個句子選自 50 種固定模板,BioR 則用 LLaMA-30B 進行改寫,更逼真,多樣性更大。兩種數(shù)據(jù)集的結果一致,下面以 BioS 為例,展示一個樣例條目:

Anya Briar Forger was born on October 2, 1996. She spent her early years in Princeton, NJ. She received mentorship and guidance from faculty members at MIT. She completed her education with a focus on Communications. She had a professional role at Meta Platforms. She was employed in Menlo Park, CA.

圖 2

一個自然語言模型即使完美地預訓練 (pretrain) 了 100k 個人的自傳,也無法通過 QA 微調 (finetuning) 準確回答 “Anya 本科念了哪所學?!?這樣的問題。如圖 2 所示,即使使用 50k 的人作為 QA 微調訓練數(shù)據(jù),嘗試各種微調方法,包括 LoRA,模型在剩下的 50k 人上的正確率也只有 10%。即使使用了 682M 的模型(比人數(shù)大 7000 倍),訓練了 1350 遍,作者甚至加入了 WikiBook 等標準 NLP 預訓練數(shù)據(jù),正確率也沒有提升。可見 “大力出奇跡” 并沒有發(fā)生。

因此,大模型并不一定能掌握或提取 “無損壓縮” 的知識。那么 GPT-4 是如何掌握知識的呢?為了研究這一問題,兩位作者對預訓練集進行改動 —— 作者稱之為知識增強

1、多樣性 - multiM:為每個人創(chuàng)建 M 個傳記條目,使用不同的敘述語言但保留相同的信息(每句話一共有 100 種敘述方法,每條傳記的每句話從中選取一種)

2、隨機排列 - permute:對傳記句子進行隨機排列

3、全名 - fullname:將傳記里所有代詞、姓、名替換全名

作者把原始數(shù)據(jù)集稱為 bioS single,并試驗了 15 種知識增強組合。例如,bioS multi5+permute 表示每人有 5 個傳記,語序打亂。以下是 bioS multi5+permute 的一個示例:

Anya Briar Forger originated from Princeton, NJ. She dedicated her studies to Communications. She gained work experience in Menlo Park, CA. She developed her career at Meta Platforms. She came into this world on October 2, 1996. She pursued advanced coursework at MIT.

對于人和大模型,記住 bioS single 和 bioS multi5+permute 兩個數(shù)據(jù)集的難度幾乎相同(它們信息量相同,并且每句話都是選自 50 個模板)。那么,如果在這個新的知識增強數(shù)據(jù)集上進行預訓練 (pretrain),然后 QA 微調,會有什么新的表現(xiàn)嗎?

圖片

圖 3

圖 3 顯示,bioS single 預訓練模型的 QA 正確率僅為 9.7%,而 bioS multi5+permute 預訓練模型的正確率高達 96.6%。這個顯著的提升與模型的微調、大小或訓練時間無關,而是與知識在預訓練 (pretrain) 中的呈現(xiàn)方式有關,即知識如何被大模型 “背誦”。

研究還發(fā)現(xiàn),將傳記分為名人 (celebrity) 和少數(shù)群體 (minority),只要名人傳記有知識增強,即使少數(shù)群體沒有,模型對少數(shù)群體的知識提取正確率也會大幅提升 —— 當然,最好的效果還是需要對所有數(shù)據(jù)進行知識增強。

圖片

圖 4:僅僅通過增加名人 (celebrity) 的訓練數(shù)據(jù)多樣性,少數(shù)群體的知識提取正確率猛增

那么為何背誦不同數(shù)據(jù)后,模型的問題回答能力差異大?為何反復背誦名人傳記,可以讓少數(shù)群體的知識提取能力也增強?原因是由于模型采取了不同的記憶方式。

作者通過兩種線性探針 (linear probing) 深入探討了模型的記憶知識的原理。我們來看其中一種叫 P 探針 (P-probing) 的方法。

在 P 探針中,我們輸入傳記條目到預訓練模型,訓練一個線性分類器預測六個目標屬性(如大學、專業(yè)等)。我們想看模型是否能在早于屬性的位置提取這些信息。如果分類器在人名后立即顯示對 “工作單位” 有高準確率,說明模型直接學習了 “Anya 的雇主是 Meta”。如果只在傳記結尾達到高準確率,可能模型用了有缺陷的記憶方法,例如 “某人生日是 1996 年 10 月 2 日,大學是 MIT,因此雇主是 Meta”。

P 探針的試驗設計是這樣的。找出每個傳記中 6 個屬性首次出現(xiàn)的位置,然后在這些位置的前一個位置,訓練一個線性分類器來預測每個目標屬性。這就產(chǎn)生了 36 個分類任務。

圖片

圖 5:P 探針試驗結果顯示,預訓練數(shù)據(jù)集的知識增強使知識被存在更早的位置,部分甚至直接存儲在人名上。模型是否能通過微調回答問題,與預訓練時是否將信息直接存儲在人名上有關(對比圖 3 和圖 5)。

P 探針試驗結果顯示,自然語言模型在預訓練時可以通過人名記住信息以實現(xiàn)壓縮,也可以通過其他信息(如 “在 MIT 就讀并且生日是 1996 年 10 月 2 日的人的工作單位是...”)記憶。雖然第二種記憶方式對人來說 “不自然”,但對模型來說兩種方法的壓縮比無異。如果模型采用第二種方式記住信息,訓練結束后將無法通過微調回答問題。而通過知識增強,預訓練模型會逐漸傾向于學會使用第一種記憶方式。

有人可能會爭論,上述 “知識提取” 失敗可能是由于自回歸 (autoregressive) 語言模型如 GPT 的單向性。實際上,雙向語言模型如 BERT 在知識提取上更差,對 “Meta Platform” 這類多詞組知識只能存儲,無法提取。有興趣的讀者可以參考論文第 6 章。

總的來說,語言模型是否能回答 “知識提取” 問題,不僅取決于 “無損壓縮”,還與 “如何在模型中壓縮” 有關。論文強調,預訓練過程中對關鍵但少見的數(shù)據(jù)進行知識增強是必要的(如使用 ChatGPT 進行多次改寫)。如果沒有這一步,無論如何努力微調,已預訓練完的模型雖然無損壓縮了訓練數(shù)據(jù),但是還是可能再也無法提取那些知識了!

結語

如何理解自然語言模型的工作原理?大多數(shù)研究者通過與 GPT-4 等模型對話,推測其能力。然而,《語言模型物理學》系列論文的作者提出了一種更精確的方法,通過精細設計訓練數(shù)據(jù)和可控實驗,探究 Transformer 的內部機制,解釋其處理 AI 任務的能力。

在《Part 3.1:知識的儲存與提取》中,作者精確測試了模型對不同數(shù)據(jù)的反應,找到了模型學習知識和能力與訓練數(shù)據(jù)的準確關系。

他們還發(fā)布了《Part 3.2:知識的操作》,進一步研究了模型如何在特定情況下操作知識。例如,如果大模型記住了《靜夜思》,能否通過微調使其推理出《靜夜思》的最后一句是 “低頭思故鄉(xiāng)”?我們很快講為大家?guī)砗罄m(xù)報道。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2012-02-03 14:39:12

Java

2015-08-12 10:04:24

2010-04-28 14:38:26

云計算

2021-09-06 15:29:16

大數(shù)據(jù)防疫信息安全

2010-07-19 11:12:43

Perl 不等于

2017-06-29 08:45:06

MySQLNOT INNOT EXISTS

2010-10-18 10:51:00

蘋果

2025-06-04 03:25:00

Java浮點數(shù)數(shù)學缺陷

2023-03-07 07:45:28

2011-08-08 09:59:35

Android

2019-08-27 08:43:15

2023-06-02 13:53:56

2015-12-01 10:42:07

2024-11-27 10:44:48

2023-11-08 13:32:00

JavaScript浮點數(shù)計算

2009-03-11 11:36:31

技術人員角色感想

2025-08-27 08:43:39

RAGAI助手知識庫

2013-11-26 09:55:12

2013-08-15 09:15:23

云計算CIO信息化

2010-01-28 10:25:12

點贊
收藏

51CTO技術棧公眾號

一级黄色大片免费| aaaaa级少妇高潮大片免费看| 3d成人动漫在线| 麻豆视频观看网址久久| 久久香蕉频线观| 性色av蜜臀av浪潮av老女人| 超级碰碰久久| 中文字幕在线不卡| 国产女主播一区二区三区| 中文字幕免费高清网站| 重囗味另类老妇506070| 亚洲精品久久久久中文字幕二区 | 日韩在线视频第一页| 午夜一区不卡| 久久成年人免费电影| 一区二区视频观看| 亚洲午夜剧场| 色综合一区二区| 日韩精品手机在线观看| 欧美成人综合在线| 国产成人精品影视| 国产精品看片资源| 国产午夜小视频| 亚洲草久电影| 亚洲无av在线中文字幕| 欧美图片自拍偷拍| 日韩五码电影| 色婷婷精品大在线视频 | 欧美成人精品一区二区男人看| 国产宾馆实践打屁股91| 国产精品视频精品| 国产女同在线观看| 欧美精品导航| 精品国偷自产在线视频99| 亚洲熟妇一区二区三区| 第四色中文综合网| 91精品国产色综合久久不卡电影| 动漫av网站免费观看| 五月婷婷视频在线观看| 国产精品美女久久福利网站| 美女被啪啪一区二区| 亚洲成人中文字幕在线| 精品一区二区三区欧美| 国产精品com| 亚洲熟女综合色一区二区三区| 韩日精品视频| 欧美精品一本久久男人的天堂| 奇米网一区二区| 国产探花一区| 亚洲欧美色婷婷| 亚洲熟女乱综合一区二区三区| 日本一区二区三区电影免费观看| 制服丝袜中文字幕一区| 性chinese极品按摩| 播放一区二区| 色狠狠色狠狠综合| 动漫av免费观看| sis001欧美| 欧美午夜视频一区二区| 少妇性饥渴无码a区免费| 超级白嫩亚洲国产第一| 亚州成人在线电影| 成人免费视频91| av影视在线| 亚洲成年人网站在线观看| 成人在线视频一区二区三区| 高清电影在线观看免费| 亚洲一线二线三线久久久| av在线免费观看国产| 国产美女一区视频| 舔着乳尖日韩一区| 男人靠女人免费视频网站 | 91免费精品| 日韩在线视频免费观看高清中文| 波多野结衣欲乱| 图片区亚洲欧美小说区| 欧美成人性色生活仑片| 久久久久久久国产视频| 中文亚洲字幕| 日本高清+成人网在线观看| 免费视频网站在线观看入口| 日本中文字幕一区二区有限公司| 国产美女久久精品| 精品二区在线观看| 99久久精品99国产精品| 欧美在线播放一区二区| 日本激情视频在线观看| 一区二区三区在线观看国产| 97视频久久久| 日韩成人亚洲| 日韩午夜激情视频| 国产制服丝袜在线| 欧美第十八页| 久久免费视频网站| 五月婷婷六月婷婷| av毛片在线看| 哺乳挤奶一区二区三区免费看| 欧美绝品在线观看成人午夜影视| 日本成人在线免费| 精品盗摄女厕tp美女嘘嘘| 久久久电影免费观看完整版| 欧美不卡视频在线观看| 美女免费视频一区二区| 99在线视频免费观看| 韩国福利在线| 亚洲精品成人精品456| 亚洲色欲综合一区二区三区| 99亚洲男女激情在线观看| 精品国产乱码久久久久久1区2区| 男女做爰猛烈刺激| 国产精品mv在线观看| 日韩av电影免费观看高清| 99国产精品99| 久久久久久亚洲综合| 伊人久久在线观看| 日韩中文在线播放| 日韩精品电影网| 欧美三级黄色大片| 老司机精品导航| 国产精品久久久久免费| 久青草国产在线| 亚洲精选免费视频| 第四色婷婷基地| 欧美美女在线直播| 欧美丰满老妇厨房牲生活| 中文字幕有码视频| 久久先锋资源网| 国产aaa免费视频| 亚洲伊人精品酒店| 亚洲欧美中文字幕| 国产女同在线观看| 成人性视频免费网站| 亚洲欧美日韩精品综合在线观看| 在线人成日本视频| 亚洲精品一区二区三区精华液| 蜜臀av午夜精品久久| 日韩不卡一二三区| 欧美日韩大片一区二区三区| 色在线中文字幕| 亚洲国产精品悠悠久久琪琪| 日本少妇高清视频| 国产麻豆视频一区| 中文字幕黄色大片| 久久夜夜久久| 中文字幕亚洲欧美| 中文字幕精品无码亚| 国产欧美日韩精品一区| 欧美私人情侣网站| 亚洲人成网站77777在线观看| 久久久久久久久久久亚洲| 国产高清精品软件丝瓜软件| 亚洲欧美激情一区二区| 国产又粗又长又爽又黄的视频| 日韩中文字幕高清在线观看| 国产精品欧美日韩久久| 99re热久久这里只有精品34| 欧美在线观看一区二区| 中文字幕网站在线观看| 日精品一区二区三区| 视频一区视频二区视频三区视频四区国产 | 久草在线中文最新视频| 精品国产麻豆免费人成网站| 国产无套在线观看| www.欧美.com| 欧美日韩亚洲第一| 精品大片一区二区| 国产欧美精品xxxx另类| 视频三区在线| 制服丝袜一区二区三区| 成人免费毛片东京热| 高清国产一区二区| 妞干网在线观看视频| 任我爽精品视频在线播放| 日本精品一区二区三区在线播放视频 | 白白色在线观看| 亚洲精品福利视频| japanese国产在线观看| 亚洲少妇最新在线视频| 任你躁av一区二区三区| 国产欧美日韩一级| 日韩欧美国产二区| 精品国产亚洲一区二区在线观看 | 国产日韩欧美一区| 日韩电影大全在线观看| 国产精品igao视频网网址不卡日韩| 欧美成人激情图片网| 天堂在线视频免费观看| 日韩欧美中文在线| 美女视频久久久| 99久久99久久免费精品蜜臀| 999香蕉视频| 综合视频在线| 麻豆成人小视频| 欧美亚洲二区| 国产综合在线看| 国产h在线观看| 日韩欧美国产一区在线观看| 日韩在线视频免费播放| 中文字幕av一区二区三区| 少妇高潮一69aⅹ| 老妇喷水一区二区三区| 天堂а√在线中文在线| 国产亚洲一区二区三区啪| 亚洲一区二区三| 欧美大片高清| 久久国产精品久久精品| 国产三级在线看| 欧美mv和日韩mv国产网站| 国产精品尤物视频| 亚洲电影第三页| 北条麻妃在线观看视频| 久久综合久久综合九色| 久久精品一卡二卡| 日韩综合小视频| 精品国产一区三区| 一级欧洲+日本+国产| 欧美日韩国产精品一卡| av不卡一区| 成人亲热视频网站| 国产私拍福利精品视频二区| 7777kkkk成人观看| 18+视频在线观看| 综合av色偷偷网| 视频国产在线观看| 精品国产免费一区二区三区四区 | 伊人久久久久久久久久久久久久| 91美女在线视频| 催眠调教后宫乱淫校园| 激情av综合网| 性chinese极品按摩| 老司机精品导航| 成年网站在线免费观看| 影音先锋亚洲电影| 成年人视频网站免费| 亚洲精品国产成人影院| 亚洲图片都市激情| 凹凸成人精品亚洲精品密奴| 欧美精品二区三区四区免费看视频| swag国产精品一区二区| 99精彩视频在线观看免费| 亚洲欧美专区| 国产区亚洲区欧美区| 国产毛片精品久久| 国产精品美女久久久免费| 欧美18av| 国产www精品| 欧美艳星kaydenkross| 日韩美女av在线免费观看| 黄色成人免费网| 欧美在线中文字幕| 免费福利视频一区二区三区| 欧美在线视频导航| 欧美人体一区二区三区| 欧洲亚洲妇女av| 丁香六月综合| 国产精品成人在线| 国产黄色一区| 成人av番号网| 蜜桃精品视频| 国产乱码精品一区二区三区卡| 激情小说一区| 蜜桃视频在线观看成人| 国产一区二区三区站长工具| 日韩在线三区| 久久视频国产| 日本a级片在线观看| 国产一区二区中文| 国产精品国三级国产av| 伊人久久综合| 国产又大又硬又粗| 蜜臀久久99精品久久久久久9| 在线观看的毛片| 国产美女精品一区二区三区| 成人做爰69片免费| 91视频xxxx| www中文在线| 亚洲另类在线一区| 奇米影视第四色777| 色www精品视频在线观看| 中文字幕日韩国产| 日韩欧美中文字幕制服| 天堂网在线资源| 在线观看欧美成人| 牛牛在线精品视频| 奇米一区二区三区四区久久| 福利一区二区免费视频| 91精品免费| 亚洲大片精品免费| 一区不卡字幕| 激情综合自拍| 天天天干夜夜夜操| 国产成人自拍在线| caopeng视频| 亚洲伦理在线精品| 潘金莲一级淫片aaaaaa播放| 欧美一区二区三区视频免费| 亚州av在线播放| 日韩在线观看免费全| 91白丝在线| 国产日韩欧美一二三区| 久久动漫网址| 强伦女教师2:伦理在线观看| 一本色道久久综合亚洲精品高清| 五月天av在线播放| 91色九色蝌蚪| 青青草原国产视频| 欧美性生活影院| 深爱五月激情五月| 日韩一区二区三区在线播放| 欧洲一区精品| 99视频免费观看蜜桃视频| 精品大片一区二区| 天天夜碰日日摸日日澡性色av| 久久精品国产99久久6| 国产 中文 字幕 日韩 在线| 综合久久给合久久狠狠狠97色| 日韩黄色在线播放| 日韩欧美一区二区在线视频| 爱久久·www| 欧美一区二区三区精品电影| 亚洲天堂中文字幕在线观看| 亚洲日本一区二区三区在线不卡| 99在线观看免费视频精品观看| av在线免费观看不卡| 国产精品乱子久久久久| 无码人妻丰满熟妇精品区| 亚洲成人免费网站| 18网站在线观看| 成人国产精品久久久久久亚洲| 九九久久电影| 国产精品网站免费| 夫妻av一区二区| 欧美性猛交xxxxx少妇| 欧美日韩不卡一区| 成av人电影在线观看| 日本免费久久高清视频| 色爱综合av| 国产91xxx| 成人国产一区二区三区精品| 青娱乐国产精品| 欧美一区二区观看视频| 九色porny在线| 国产欧美 在线欧美| 久久婷婷蜜乳一本欲蜜臀| 国产理论在线播放| 久久久久亚洲蜜桃| 日韩精品一区二区亚洲av| 亚洲国语精品自产拍在线观看| 丁香花视频在线观看| 福利视频久久| 精品二区久久| 182在线视频| 狠狠久久亚洲欧美专区| 欧美777四色影视在线| 欧美中文在线观看| 国产一区二区三区91| 国产视频在线视频| 国产精品萝li| 国产成人精品av在线观| 欧美精品制服第一页| 伊人久久影院| 国产精品333| 欧美激情资源网| 91无套直看片红桃| 久久成人精品视频| 一区二区三区国产好| 美脚丝袜脚交一区二区| 97se亚洲国产综合在线| 欧美一级片免费在线观看| 亚洲欧美在线x视频| 成人精品高清在线视频| 三年中国中文在线观看免费播放| 国产在线精品视频| 久久精品国产亚洲av无码娇色 | 你懂的在线播放| 国产精品成人一区二区三区吃奶| 日韩欧美1区| 精品人妻一区二区乱码| 黑人巨大精品欧美一区免费视频| 黄色美女网站在线观看| 国产乱人伦真实精品视频| 欧美喷水视频| 人人妻人人藻人人爽欧美一区| 欧美伊人久久大香线蕉综合69 | 99久久久国产精品无码免费| 久久免费成人精品视频| 国产91一区| 香蕉视频xxxx| 欧美日韩国产一区二区三区| av男人的天堂在线| 成人91视频| 日本特黄久久久高潮| 黄色一级视频免费| 亚洲第一视频网站| 成人在线黄色| 国产精彩视频一区二区| 国产精品萝li| 四虎影院在线域名免费观看| 91精品国产自产在线老师啪| 亚洲三级电影在线观看|