精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Llama架構比不上GPT2?神奇token提升10倍記憶?

人工智能 新聞
近日,朱澤園 (Meta AI) 和李遠志 (MBZUAI) 的最新研究《語言模型物理學 Part 3.3:知識的 Scaling Laws》用海量實驗(50,000 條任務,總計 4,200,000 GPU 小時)總結了 12 條定律,為 LLM 在不同條件下的知識容量提供了較為精確的計量方法。

一個 7B 規模的語言模型 LLM 能存儲多少人類知識?如何量化這一數值?訓練時間、模型架構的不同將如何影響這一數值?浮點數壓縮 quantization、混合專家模型 MoE、以及數據質量的差異 (百科知識 vs 網絡垃圾) 又將對 LLM 的知識容量產生何種影響?

近日,朱澤園 (Meta AI) 和李遠志 (MBZUAI) 的最新研究《語言模型物理學 Part 3.3:知識的 Scaling Laws》用海量實驗(50,000 條任務,總計 4,200,000 GPU 小時)總結了 12 條定律,為 LLM 在不同條件下的知識容量提供了較為精確的計量方法。

作者首先指出,通過開源模型在基準數據集 (benchmark) 上的表現來衡量 LLM 的 scaling law 是不現實的。例如,LlaMA-70B 在知識數據集上的表現比 LlaMA-7B 好 30%,這并不能說明模型擴大 10 倍僅僅能在容量上提高 30%。如果使用網絡數據訓練模型,我們也將很難估計其中包含的知識總量。

再舉個例子,我們比較 Mistral 和 Llama 模型的好壞之時,到底是他們的模型架構不同導致的區別,還是他們訓練數據的制備不同導致的?

綜合以上考量,作者采用了他們《語言模型物理學》系列論文的核心思路,即制造人工合成數據,通過控制數據中知識的數量和類型,來嚴格調控數據中的知識比特數 (bits)。同時,作者使用不同大小和架構的 LLM 在人工合成數據上進行訓練,并給出數學定理,來精確計算訓練好的模型從數據中學到了多少比特的知識。

圖片

  • 論文地址:https://arxiv.org/pdf/2404.05405.pdf
  • 論文標題:Physics of Language Models: Part 3.3, Knowledge Capacity Scaling Laws

對于這項研究,有人表示這個方向似乎是合理的。我們可以使用非常科學的方式對scaling law 進行分析。

圖片

也有人認為,這項研究將 scaling law 提升到了不同的層次。當然,對于從業者來說是一篇必讀論文。

圖片

研究概覽

作者研究了三種類型的合成數據:bioS、bioR、bioD。bioS 是使用英語模板編寫的人物傳記,bioR 是由 LlaMA2 模型協助撰寫的人物傳記(22GB 總量),bioD 則是一種虛擬但可以進一步控制細節的知識數據(譬如可以控制知識的長度、詞匯量等等細節)。作者重點研究了基于 GPT2、LlaMA、Mistral 的語言模型架構,其中 GPT2 采用了更新的 Rotary Position Embedding (RoPE) 技術

左圖為訓練時間充足,右圖為訓練時間不足的 scaling laws

上圖 1 簡要概述了作者提出的前 5 條定律,其中左 / 右分別對應了「訓練時間充足」和 「訓練時間不足」兩種情況,分別對應了常見知識(如中國首都是北京)和較少出現的知識(如清華物理系成立于 1926 年)。

如果訓練時間充足,作者發現,不論使用何種模型架構,GPT2 或 LlaMA/Mistral,模型的存儲效率均可以達到 2bit/param—— 即平均每個模型參數可以存儲 2 比特的信息。這與模型的深度無關,僅與模型大小有關。換言之,一個 7B 大小的模型,如果訓練充足,可以存儲 14B 比特的知識,這超過了維基百科和所有英文教科書中人類知識的總和!

更令人驚訝的是,盡管傳統理論認為 transformer 模型中的知識主要存儲在 MLP 層,但作者的研究反駁了這一觀點,他們發現即便移除了所有 MLP 層,模型仍能達到 2bit/param 的存儲效率。

圖 2:訓練時間不足情況下的 scaling laws

然而,當我們觀察訓練時間不足的情況時,模型間的差異就顯現出來了。如上圖 2 所示,在這種情況下,GPT2 模型能比 LlaMA/Mistral 存儲超過 30% 的知識,這意味著幾年前的模型在某些方面超越了今天的模型。為什么會這樣?作者通過在 LlaMA 模型上進行架構調整,將模型與 GPT2 的每個差異進行增減,最終發現是 GatedMLP 導致了這 30% 的損失。

強調一下,GatedMLP 并不會導致模型的「最終」存儲率變化 —— 因為圖 1 告訴我們如果訓練充足它們就不會有差。但是,GatedMLP 會導致訓練不穩定,因此對同樣的知識,需要更長的訓練時間;換句話說,對于較少出現在訓練集里的知識,模型的存儲效率就會下降。

圖 3:quantization 和 MoE 對模型 scaling laws 的影響

作者的定律 8 和定律 9 分別研究了 quantization 和 MoE 對模型 scaling law 的影響,結論如上圖 3 所示。其中一個結果是,將訓練好的模型從 float32/16 壓縮到 int8,竟然對知識的存儲毫無影響,即便對已經達到 2bit/param 存儲極限的模型也是如此。

這意味著,LLM 可以達到「信息論極限」的 1/4—— 因為 int8 參數只有 8 比特,但平均每個參數可以存儲 2 比特的知識。作者指出,這是一個普遍法則(universal law),和知識的表現形式無關。

最引人注目的結果來自于作者的定律 10-12(見圖 4)。如果我們的 (預) 訓練數據中,有 1/8 來自高質量知識庫(如百度百科),7/8 來自低質量數據(如 common crawl 或論壇對話,甚至是完全隨機的垃圾數據)。

那么,低質量數據是否會影響 LLM 對高質量知識的吸收呢?結果令人驚訝,即使對高質量數據的訓練時間保持一致,低質量數據的「存在本身」,可能會讓模型對高質量知識的存儲量下降 20 倍!即便將高質量數據的訓練時間延長 3 倍,知識儲量仍會降低 3 倍。這就像是將金子丟進沙子里,高質量數據被嚴重浪費了。

有什么辦法修復呢?作者提出了一個簡單但極其有效的策略,只需給所有的 (預) 訓練數據加上自己的網站域名 token 即可。例如,將 Wiki 百科數據統統加上 wikipedia.org。模型不需要任何先驗知識來識別哪些網站上的知識是「金子」,而可以在預訓練過程中,自動發現高質量知識的網站,并自動為這些高質量數據騰出存儲空間。

作者提出了一個簡單的實驗來驗證:如果高質量數據都加上一個特殊 token(任何特殊 token 都行,模型不需要提前知道是哪個 token),那么模型的知識存儲量可以立即回升 10 倍,是不是很神奇?所以說對預訓練數據增加域名 token,是一個極其重要的數據制備操作

圖 4:預訓練數據「知識質量不齊」情形下的 scaling laws,模型缺陷以及如何修復

結語

作者認為,通過合成數據,計算模型在訓練過程中獲得的知識總量的方法,可以為「評估模型架構、訓練方法和數據制備」提供了一套系統且精確的打分體系。這和傳統的 benchmark 比較完全不同,并且更可靠。他們希望這能幫助未來 LLM 的設計者做出更明智的決策。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-05-06 08:25:00

2020-07-22 08:30:02

代碼開發工具

2025-07-29 07:46:00

2025-08-08 09:23:00

2023-07-25 09:23:23

Llama 2GPT-4

2011-07-01 10:11:39

2023-04-14 07:09:04

2024-02-19 13:45:14

OpenAIGPT-2模型

2023-02-26 11:53:20

2024-11-25 09:11:43

2014-03-26 10:00:06

RailsRails性能

2024-10-29 08:21:05

2025-11-07 08:44:38

2020-03-26 12:38:15

代碼節點數據

2025-05-27 01:55:00

TypeScript開發者項目

2020-07-21 15:40:55

NginxJava服務器

2024-02-05 09:00:00

2024-02-07 12:13:03

AI模型

2013-04-01 00:16:41

飛魚星無線云無線AP

2018-08-23 17:45:52

點贊
收藏

51CTO技術棧公眾號

国产av无码专区亚洲av毛网站| 女人扒开屁股爽桶30分钟| 国产深喉视频一区二区| 黄色日韩在线| 亚洲精品国产精品乱码不99按摩 | 红桃av永久久久| 日本福利一区二区三区| 一级特黄色大片| 国产精品xvideos88| 亚洲视频视频在线| 日批视频在线看| 一个人看的www视频在线免费观看| 国产视频在线观看一区二区三区 | 国产麻豆91视频| 国产亚洲精品自拍| 久久精品成人一区二区三区| 国产十八熟妇av成人一区| 国产韩日精品| 天天色图综合网| 中国一级黄色录像| 欧美黄色小说| 国产不卡高清在线观看视频| 国产精品高清在线观看| 国产 日韩 欧美 成人| 日韩成人免费| 亚洲精选在线观看| 色哟哟网站在线观看| 成人做爰免费视频免费看| 亚洲成人精品影院| 小说区视频区图片区| 巨骚激情综合| 99久久精品免费看国产 | 最新国产精品精品视频| 欧亚洲嫩模精品一区三区| 日本欧美视频在线观看| 麻豆网站在线| 国产精品免费丝袜| 欧美午夜视频在线| 外国精品视频在线观看 | 免费在线视频一区| 91a在线视频| 午夜偷拍福利视频| 欧美特黄一区| 欧美肥老妇视频| 小泽玛利亚一区| 成人一区二区| 中文字幕一区电影| 俄罗斯毛片基地| 欧美日中文字幕| 一区二区三区美女xx视频| av直播在线观看| 日韩高清一级| 亚洲老板91色精品久久| 免费的av网站| 午夜先锋成人动漫在线| 日韩精品在线免费播放| 亚洲国产综合视频| 日韩美脚连裤袜丝袜在线| 日韩成人高清在线| 精品人妻一区二区三区香蕉 | 中文字幕日韩在线观看| 亚洲av无码一区二区三区人| 竹菊久久久久久久| 亚洲欧美成人一区二区在线电影| 欧美熟妇精品黑人巨大一二三区| 午夜先锋成人动漫在线| 亚洲欧美综合精品久久成人| 大又大又粗又硬又爽少妇毛片| 夜夜春成人影院| 夜夜嗨av一区二区三区免费区| 谁有免费的黄色网址| 欧美丝袜激情| 久久精品国产视频| 粉嫩av性色av蜜臀av网站| 欧美日韩爆操| 97免费在线视频| 中文字幕69页| 久久精品国产久精国产| 91大片在线观看| 高h放荡受浪受bl| 91丨九色porny丨蝌蚪| 青青草久久网络| 欧美69xxx| 亚洲二区在线观看| 免费黄色特级片| 99综合99| 日韩经典中文字幕| 偷拍女澡堂一区二区三区| 欧美天天综合| 欧美日韩福利在线观看| 久久久久99精品成人片三人毛片| 日本系列欧美系列| 91丨九色丨国产| 欧洲亚洲精品视频| 中文字幕视频一区二区三区久| 免费极品av一视觉盛宴| 性欧美18xxxhd| 欧美绝品在线观看成人午夜影视| 免费不卡av网站| 天天久久夜夜| 久久夜色精品国产| 天天干天天干天天| 国产一区999| 欧美日韩精品综合| 日本动漫理论片在线观看网站| 日韩欧美一区二区三区| 久久久久久久久久毛片| 伊人久久大香线蕉无限次| xxx成人少妇69| 国产又粗又爽视频| 国产一区不卡精品| 亚洲国产精品毛片| 一区二区三区四区日本视频| 欧美精品丝袜中出| 波多野结衣 在线| 狠狠入ady亚洲精品经典电影| 国产精品日韩欧美综合| 图片区 小说区 区 亚洲五月| 国产精品美女久久久久aⅴ国产馆| 少妇人妻在线视频| 国产中文欧美日韩在线| 一本色道久久综合亚洲精品小说| 亚洲一区 视频| 狠狠色丁香婷婷综合| 欧美一区二区在线| 末成年女av片一区二区下载| 日韩一区二区三区视频| jizz18女人高潮| 免费国产自线拍一欧美视频| 国产91视觉| 国产一区久久精品| 欧美日韩中文精品| 99久久久无码国产精品性| 亚洲三级影院| 国产精品国产精品国产专区不卡| 成人免费在线| 制服丝袜成人动漫| 成人做爰69片免网站| 日韩国产欧美视频| 欧美一区2区三区4区公司二百| 黄视频免费在线看| 欧美精品一区二区三区蜜桃| 欧美日韩免费做爰视频| 国产在线一区观看| 欧美aaa在线观看| 婷婷精品久久久久久久久久不卡| 国产一区二区美女视频| 亚洲AV无码成人精品区东京热| 91在线观看地址| 毛片在线视频播放| 欧美日韩看看2015永久免费| 亚洲2020天天堂在线观看| 丁香花免费高清完整在线播放| 亚洲精品ww久久久久久p站| 日韩高清在线一区二区| 亚洲精品久久久| 99久久精品免费看国产四区 | 天堂а在线中文在线无限看推荐| 亚洲成人一二三| 美国黄色一级毛片| 日韩成人av影视| 亚洲免费视频一区| 国产激情综合| 欧美激情图片区| 四季av日韩精品一区| 欧美日韩美女视频| 亚洲欧洲久久久| 久久精品久久久精品美女| 中文字幕中文字幕一区三区| 国模大尺度视频一区二区| 欧美不卡视频一区发布| 欧美视频一二区| 欧美丝袜一区二区| 秋霞网一区二区三区| 精品一区二区免费视频| 粉嫩av一区二区三区天美传媒| 成人午夜网址| 日韩av电影免费观看高清| av在线免费一区| 欧美一区二区三区免费视频| 日韩欧美亚洲国产| 国产亚洲欧美日韩俺去了| 污污的视频免费| 国精品一区二区| 蜜桃91精品入口| 色综合一区二区日本韩国亚洲| 欧美伦理91i| 日本视频在线观看一区二区三区| 欧美午夜精品久久久| 劲爆欧美第一页| 久久伊人蜜桃av一区二区| 久久久久xxxx| 国产精品久久久免费| 亚洲高清资源综合久久精品| 国产成人一二| 国产精品一区二区久久久| 麻豆蜜桃在线| 中文字幕亚洲综合| 神马午夜一区二区| 欧美日韩久久久久久| 日本五十熟hd丰满| 国产精品久久久久久亚洲伦| 欧美双性人妖o0| 国产伦精品一区二区三区视频青涩| 欧美亚洲精品一区二区| 国产精品7m凸凹视频分类| 久久99精品久久久久久水蜜桃| 日韩在线电影| 日本精品在线视频 | 日产精品99久久久久久| 污污在线观看| 色哟哟网站入口亚洲精品| 熟妇人妻中文av无码| 3d动漫精品啪啪| 国产精品第6页| 午夜精品123| 老湿机69福利| 国产精品麻豆一区二区| 午夜av免费看| 大美女一区二区三区| 在线黄色免费看| 日韩精品乱码av一区二区| 亚洲国产精品成人天堂| 一本一本久久a久久综合精品| 日本一区美女| 羞羞色国产精品网站| 国产精品久久久对白| 精品久久国产一区| 国产精品影片在线观看| 午夜精品成人av| 欧美一级淫片丝袜脚交| 99色在线观看| 国内外成人免费激情在线视频 | 欧美在线亚洲在线| 久久99亚洲网美利坚合众国| 久热国产精品视频| 老司机在线看片网av| 国产亚洲精品久久久久动| 色婷婷视频在线| 精品精品国产高清一毛片一天堂| 国产女主播福利| 7777女厕盗摄久久久| 中文字幕在线观看欧美| 在线亚洲免费视频| 无码人妻av免费一区二区三区| 欧美性生交大片免网| 欧美一区二区三区四| 午夜精品一区二区三区电影天堂| 国产在线综合网| 五月激情六月综合| 日韩 欧美 精品| 午夜精品视频一区| 欧美成人精品欧美一级乱黄| 亚洲国产一区二区三区青草影视| 免费视频一二三区| 亚洲国产毛片aaaaa无费看| 国产在线一二区| 欧美日韩精品二区| 性色av免费观看| 欧美视频在线观看一区| 亚洲影院一区二区三区| 91精品蜜臀在线一区尤物| 99精品国产99久久久久久97| 欧美一区二区三区四区在线观看 | 51一区二区三区| 国产精品日本精品| 成人精品在线| 国产伦精品一区二区三区照片91 | 欧美xnxx| 成人国产精品久久久久久亚洲| 免费欧美网站| 韩国成人av| 精品免费在线| 国产av不卡一区二区| 精品动漫3d一区二区三区免费版 | 亚洲欧美日韩在线综合| 国产精品久久久久无码av| 强开小嫩苞一区二区三区网站| 韩国av一区| 日本成年人网址| 美女www一区二区| 国产chinesehd精品露脸| 91在线看国产| 黄色精品视频在线观看| 亚洲一区二区三区国产| 福利网址在线观看| 91麻豆精品91久久久久久清纯| 黄色av小说在线观看| 亚洲视频777| 毛片大全在线观看| 国产精品久久久久久av| 2020国产精品极品色在线观看| 玖玖玖精品中文字幕| 亚洲乱码电影| 日韩网址在线观看| 国产一区二区在线免费观看| 亚洲中文字幕无码av| 国产精品狼人久久影院观看方式| 精品无码人妻一区二区三区| 欧美在线综合视频| 成人午夜视频一区二区播放| 中文字幕日韩有码| 毛片在线网站| 91日韩久久| 日韩久久视频| 国产无套内射久久久国产| 国产乱码精品一区二区三区忘忧草 | 亚洲欧洲国产日韩| 亚洲精品www久久久久久| 欧美日韩国产综合久久| 性感美女一级片| 九九综合九九综合| 欧美成人福利| 欧美在线激情| 国产精品五区| 国产伦精品一区二区三区88av| 国产精品嫩草久久久久| 免费污污视频在线观看| 亚洲精品在线免费播放| 精品176二区| 国产精品视频久久| 亚洲影院天堂中文av色| 日韩美女爱爱视频| 国产乱子轮精品视频| 亚洲AV成人无码网站天堂久久| 色94色欧美sute亚洲线路一ni | 好吊妞无缓冲视频观看| 国产精品性做久久久久久| 亚洲欧洲综合网| 欧美亚洲日本一区| 日本福利片在线| 91精品国产一区| 成人午夜网址| 国产高清av在线播放| 国产成人精品aa毛片| 人妻久久一区二区| 欧美一区二区三区四区五区 | 波多野结衣国产精品| 亚洲国产激情av| 夜夜爽妓女8888视频免费观看| 日韩精品欧美国产精品忘忧草| 成人一级福利| 精品一卡二卡三卡四卡日本乱码| 亚洲人成高清| 精品人妻一区二区三区香蕉| 黑人巨大精品欧美一区二区| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻av无码一区二区三区 | 日韩av影片| 久久精品国产一区二区三区日韩| 日韩一区二区免费看| 97香蕉碰碰人妻国产欧美| 欧美日韩免费区域视频在线观看| 五月婷婷在线播放| 日本成熟性欧美| 狠狠色丁香婷婷综合影院| 欧美一级黄色影院| 日本一区二区成人在线| 亚洲午夜在线播放| 久久久999成人| 亚洲日本一区二区三区在线| 免费人成在线观看视频播放| 暴力调教一区二区三区| 日本天堂网在线| 国产一区二区三区在线视频 | 精品久久人人做人人爽| 国产蜜臀在线| 久久一区免费| 理论片日本一区| 少妇影院在线观看| 精品国产免费人成电影在线观看四季| 超级白嫩亚洲国产第一| 欧美资源一区| 国产尤物一区二区在线| 国产亚洲精品久久久久久无几年桃| 日韩av在线精品| 韩日一区二区| 国产传媒久久久| www久久精品| 亚洲无码精品在线播放| 欧美国产日韩在线| 女人av一区| www.久久com| 91久久香蕉国产日韩欧美9色| 黄色免费网站在线| 精品毛片久久久久久| 蜜臀va亚洲va欧美va天堂| 加勒比av在线播放| 国产一级揄自揄精品视频| 看亚洲a级一级毛片| 日韩久久一级片| 亚洲男同性恋视频| 你懂的视频在线免费| 成人伊人精品色xxxx视频| 亚洲激情偷拍| 亚洲一区电影在线观看| 亚洲精品在线不卡| 试看120秒一区二区三区| 大肉大捧一进一出好爽动态图| 亚洲欧美日韩电影| 久久经典视频|