精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

語言模型參數越多越好?DeepMind用700億打敗自家2800億,訓練優化出「小」模型

人工智能 新聞
給定固定的 FLOPs 預算,應該如何權衡模型大小和訓練 token 的數量?DeepMind 得出了與先前不同的結論。

最近一系列大型語言模型 (LLM) 正在崛起,其中最大的語言模型已經擁有超過 5000 億個參數。這些大型自回歸 transformer 通過使用各種評估協議(例如零樣本、少樣本和微調),在許多任務中表現出令人印象深刻的性能。

然而訓練大型語言模型需要消耗巨大的計算和能源,并且這種消耗隨著模型的增加而增加。在實踐中,研究者事先分配的訓練計算預算通常是預先知道的:有多少加速器可用以及我們想要使用它們多長時間。通常這些大模型只訓練一次是可接受的,因此準確估計給定計算預算的最佳模型超參數至關重要。

Kaplan 等人研究 (2020) 表明,自回歸語言模型 (LM) 中的參數數量與其性能之間存在冪律關系。結果是該領域一直在訓練越來越大的模型,期望性能得到改善。Kaplan 等人(2020) 得出的一個值得注意的結論是,不應該將大型模型訓練到其可能的最低損失,以獲得計算的最佳化。

來自 DeepMind 的研究者得出了相同的結論,但他們估計大型模型可以訓練的 token 數應該比作者推薦的更多。具體來說,假設計算預算增加 10 倍,其他研究者建議模型的大小應該增加 5.5 倍,而訓練 token 的數量應該只增加 1.8 倍。相反,DeepMind 發現模型大小和訓練 token 的數量應該以相等的比例擴展。

論文地址:https://arxiv.org/pdf/2203.15556.pdf

繼 Kaplan 等人和 GPT-3 的訓練設置研究之后,近期大型模型的訓練 token 大約為 3000 億個(表 1),這與增加算力時,主要采用增加模型大小結論一致。

在這項工作中,DeepMind 重新審視了這個問題:給定固定的 FLOPs 預算,應該如何權衡模型大小和訓練 token 的數量?為了回答這個問題,DeepMind 將最終的預訓練損失 ??(??, ??) 建模為模型參數數量 ?? 和訓練 token 數量 ?? 的函數。由于計算預算 ?? 是所見訓練 token 和模型參數數量的確定性函數 FLOPs(??, ??),因此可以在約束 FLOPs(??, ??) = ?? 下最小化??:

DeepMind 根據 400 多個模型的損失估計了這些函數,參數范圍從 70M 到 16B 以上,并在 5B 到 400B 多個 token 上進行訓練——每個模型配置都針對幾個不同的訓練范圍進行訓練。結果表明 DeepMind 方法得出的結果與 Kaplan 等人的結果大不相同,如下圖 1 所示:

基于 DeepMind 估計的計算最優邊界,他們預測用于訓練 Gopher 的計算預算,一個最優模型應該是模型大小比之前小 4 倍,而訓練的 token 應該是之前的 4 倍多。

為了證明這一點,DeepMind 訓練了一個更優計算的 70B 模型 Chinchilla,具有 1.4 萬億個 token。Chinchilla 不僅性能優于模型更大的 Gopher,而且其減小的模型尺寸大大降低了推理成本,并極大地促進了在較小硬件上的下游使用。大型語言模型的能源成本通過其用于推理和微調的用途來攤銷。因此,經過更優化訓練的較小模型的好處,超出了其性能改善的直接好處。

特斯拉人工智能和自動駕駛視覺總監 Andrej Karpathy 表示:Chinchilla 是一個新的語言模型(70B),它優于 Gopher (280B), GPT-3 (175B), Jurrasic-1 (178B), MT-NLG (530B) 大模型。這是關于語言模型(LM)新的擴展定律非常重要的論文。

估計最優參數 / 訓練 tokens 分配

研究者提出三種不同的方法來解答推動本項研究的問題:給定固定的 FLOPs 預算,應該如何權衡模型大小和訓練 tokens 的數量?在所有三種情況下,研究者首先訓練了一系列參數和訓練 tokens 都不同的模型,并使用得出的訓練曲線來擬合模型擴展的經驗估計器(empirical estimator)。

三種方法的預測結果類似,表明模型參數和訓練 tokens 的數量應該隨著計算量的增加而增加,比例如下表 2 所示。這與以前有關該主題的工作形成鮮明對比,值得進一步研究。

方法 1:固定模型大小,改變訓練 tokens 數量

對于第一種方法,研究者改變了固定參數模型(從 70M 到 10B 參數)的訓練步數,為每個模型訓練了 4 個不同數量的訓練序列。運行之后,他們能夠直接提取給定訓練 FLOPs 所達到的最小損失的估計值。訓練曲線如下圖 2 所示。

方法 2:IsoFLOP

在第二種方法中,研究者針對 9 種不同的訓練 FLOP(從 6 × 10^18 到 3 × 10^21 FLOPs)改變模型大小,并考慮到了每個點的最終訓練損失。與方法 1 整個訓練運行中考慮點(??, ??, ??)形成了對比,這使得直接回答以下問題:對于給定的 FLOP 預算,最優參數數量是多少?下圖 3 為 IsoFLOP 曲線。

方法 3:擬合一個參數損失函數

最后,研究者將方法 1 和 2 中實驗的所有最終損失建模為一個包含模型參數和可見 tokens 數量的參數函數。遵循經典的風險分解,他們提出了如下函數形式:

為了估計(??, ??, ??, ??, ??),研究者使用 L-BFGS 算法來最小化預測和觀察到對數損失(log loss)之間的 Huber 損失。

他們通過從初始化網格中選擇最佳擬合來考慮可能的局部最小值。Huber 損失(?? = 10^?3)對異常值具有魯棒性,這點對于留出數據點實現良好預測性能非常重要。

此外,研究者在下圖 4(左)中展示了擬合函數的等值線,并以藍色代表閉合形式(closed-form)的高效計算邊界。

最優模型擴展

研究者發現,以上三種方法盡管使用了不同的擬合方案和不同的訓練模型,但對有關 FLOPs 的參數和 tokens 的最優擴展產生了可比較的預測。它們都表明了,隨著計算預算的增加,模型大小和訓練數據量應該以大致相同的比例增加。其中,第一種和第二種方法對最優模型大小的預測非常相似,第三種方法在更多計算預算下能夠最優地預測更小模型。

在下表 3 中,研究者展示了 FLOPs 和 tokens 的估計量,以確保給定大小的模型位于計算最優邊界上。結果表明,考慮到各自的計算預算,當前一代的大規模語言模型「過于大了」。

新模型 Chinchilla 

根據上文的分析,Gopher 模型的最優模型大小介于 40B 到 70B 參數之間。出于數據集和計算效率的考慮,研究者訓練了一個 70B 參數、1.4T tokens 的模型,稱之為 Chinchilla,并與 Gopher 和其他大規模語言模型進行了比較。注意,Chinchilla 和 Gopher 的訓練 FLOPs 相同,但模型大小和訓練 tokens 不同。

由于 Chinchilla 的參數量為 Gopher 的 1/4,因而它的內存占用和推理成本更小。

模型參數

Chinchilla 的訓練超參數及其與 Gopher 的比較如下表 4 所示。兩者使用了相同的模型架構和訓練設置,但在 head 數量、批大小等方面有所不同。

實驗結果

研究者對 Chinchilla 進行了廣泛的評估,與各種大規模語言模型在 Rae et al. (2021)提出的很多任務上展開了比較。這些任務包括語言建模(LM)、閱讀理解、問答、常識、MMLU 和 BIG-bench,具體如下表 5 所示。

語言建模任務。如下圖 5 所示,Chinchilla 在 The Pile 的所有評估子集上均顯著優于 Gopher。

多任務語言理解(MMLU)任務。大規模 MMLU 基準測試包含一系列與學科類似的考試問題。在下表 6 中,研究者展示了 Chinchilla 在 MMLU 上的平均 5-shot 性能。可以看到,盡管規模小得多,但 Chinchilla 明顯優于 Gopher,平均準確率為 67.6%,比 Gopher 提高了 7.6%。并且,Chinchilla 的準確率甚至超過了 2023 年 6 月專家預測的 63.4% 。

在圖 6 中,DeepMind 展示了按任務細分結果與 Gopher 的比較。總的來說,研究發現 Chinchilla 提高了絕大多數任務的性能。在四個任務(college_mathematics、econometrics、moral_scenarios 和 formal_logic)上,Chinchilla 的表現不如 Gopher,并且在兩個任務上的表現沒有變化。

閱讀理解。在單詞預測數據集 LAMBADA 上,Chinchilla 達到了 77.4% 的準確率,而 Gopher 和 MT-NLG 530B 的準確率分別為 74.5% 和 76.6%(見表 7)。在 RACE-h 和 RACE-m 上,Chinchilla 的性能大大優于 Gopher,兩種情況下的準確率都提高了 10% 以上。

BIG-bench。DeepMind 在 BIG-bench 任務上評估了 Chinchilla,與 MMLU 中觀察到的情況類似,Chinchilla 在多項任務上優于 Gopher。

其他更多實驗結果詳見論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-24 06:40:00

特征工程機器學習模型

2021-12-09 15:27:46

模型人工智能深度學習

2025-02-14 08:30:00

MySQL索引數據庫

2018-09-12 21:06:08

大數據統計學家分析

2013-10-11 16:21:39

虛擬機

2023-09-04 12:58:05

2023-12-13 12:55:39

模型數據

2022-06-25 21:17:15

人工智能訓練

2023-01-16 13:45:30

微軟谷歌

2023-10-29 22:41:29

模型開源

2020-02-24 10:51:25

微軟開源Windows

2023-04-19 08:21:41

ChatGPT瀏覽器操作系統

2019-07-17 16:21:18

電腦風扇散熱

2023-07-19 15:01:14

GPT-4LaMA2參數

2023-02-25 16:14:36

AIMeta語言模型

2021-03-25 15:19:33

深度學習Pytorch技巧

2020-12-04 19:17:00

智能手機手機攝像頭主攝

2024-02-28 18:17:28

模型數據LLM
點贊
收藏

51CTO技術棧公眾號

www.亚洲高清| 欧美日韩亚洲在线| 日本三级中文字幕| 中文字幕伦av一区二区邻居| 欧美在线一区二区三区| 久久av喷吹av高潮av| 神马午夜在线观看| 免费的成人av| 欧美国产精品日韩| 亚洲黄色免费视频| 98视频精品全部国产| 日韩欧美高清在线视频| 国产大尺度在线观看| 三级在线电影| 国产伦精一区二区三区| 日本精品久久中文字幕佐佐木| 永久免费观看片现看| 成午夜精品一区二区三区软件| 91国产丝袜在线播放| 少妇久久久久久被弄到高潮| 美女毛片在线看| 国产精品亚洲专一区二区三区| 欧美专区第一页| 成人在线观看免费完整| 夜夜躁狠狠躁日日躁2021日韩| 欧美精品第一页| 日韩免费高清在线| a级片免费在线观看| 亚洲婷婷综合色高清在线| 欧美一区二区三区四区夜夜大片 | 超碰caoprom| 四虎精品永久免费| 色94色欧美sute亚洲13| 人妻无码久久一区二区三区免费| 美女国产在线| 国产欧美日韩亚州综合| 久久久com| 高清乱码毛片入口| 国产精品资源在线看| 国产在线精品自拍| 中文在线免费看视频| 久久精品国产清高在天天线| 97在线免费观看视频| 欧美日韩一级大片| 中文字幕一区二区三区乱码图片| 中文字幕欧美在线| 美国黄色特级片| 伊人久久大香线蕉综合网站| 日韩风俗一区 二区| 国产chinese中国hdxxxx| 一区二区三区四区视频免费观看| 91.麻豆视频| 中文字幕精品一区二区三区在线| 久久91视频| 欧美日韩亚洲另类| 日本黄色福利视频| 日韩毛片免费视频一级特黄| 欧美日本国产视频| 国产欧美激情视频| 国模大尺度视频一区二区| 欧美精品色一区二区三区| 伊人色在线观看| 国产精品成人**免费视频| 欧美一级黄色片| 手机看片国产精品| 成人免费在线电影网| 亚洲国产美女精品久久久久∴| 国产伦精品一区二区免费| 青青视频一区二区| 亚洲色图18p| 免费看一级黄色| 中文字幕av亚洲精品一部二部| 欧美俄罗斯性视频| 99热国产在线观看| 日韩福利视频网| 成人精品视频在线| 亚洲黄色片视频| 2017欧美狠狠色| 亚洲欧洲国产日韩精品| 制服丝袜在线播放| 欧美日韩一区二区精品| 色悠悠久久综合网| 一区二区中文字幕在线观看| 亚洲精品久久久久中文字幕欢迎你| 亚洲国产综合视频| 日韩欧美国产精品综合嫩v| 欧美xxxx做受欧美.88| 日韩免费视频网站| 青青草国产精品亚洲专区无| 92国产精品视频| 图片区 小说区 区 亚洲五月| 久久嫩草精品久久久精品一| 视频一区二区视频| 男人天堂视频在线观看| 欧美三级视频在线观看| 99久久久无码国产精品性波多 | 久久福利一区二区| 色多多在线观看| 欧美高清一级片在线| 波多野结衣视频播放| 久久国产电影| 97国产精品久久| 在线观看国产成人| 99久久精品国产精品久久| 神马影院午夜我不卡| 动漫一区二区| 欧美日韩在线播放| 欧美成人午夜精品免费| 欧美精品三级| 国产精品网红福利| 亚洲aaa在线观看| 亚洲天堂av老司机| 国内外免费激情视频| 日韩中文字幕无砖| 日韩最新在线视频| 伊人中文字幕在线观看| 成人午夜在线免费| 中文字幕日韩精品一区二区| 成人爱爱网址| 精品国产露脸精彩对白| 99热在线观看精品| 日韩中文字幕区一区有砖一区 | 婷婷视频在线观看| 亚洲九九爱视频| 国产wwwxx| 红桃成人av在线播放| 992tv在线成人免费观看| 国产日韩精品suv| 中文字幕精品一区| 亚洲成色www.777999| 精品网站aaa| 欧美人在线观看| 国产视频一区二区三区四区五区| 国产欧美综合色| 欧美私人情侣网站| 综合综合综合综合综合网| 韩剧1988在线观看免费完整版| 国产美女三级无套内谢| 中文字幕一区日韩精品欧美| 免费一级特黄录像| 不卡中文一二三区| 国产精品视频精品视频| 国产一区二区影视| 日本二三区不卡| 中文字幕免费视频| 日韩中文字幕麻豆| 亚洲激情电影在线| 激情久久一区二区| 久久精品亚洲精品| 国产日韩欧美视频在线观看| 亚洲精品国产一区二区三区四区在线| 玖玖爱视频在线| 一本到12不卡视频在线dvd| 国产欧美日韩精品丝袜高跟鞋| 北岛玲一区二区三区| 欧美日韩亚洲综合| 免费国产羞羞网站美图| 国产老妇另类xxxxx| 女人床在线观看| aaa国产精品视频| 国内成人精品一区| 欧美成人剧情片在线观看| 中文字幕黄色片| 国产欧美日韩三区| 久久国产激情视频| 亚洲精品中文字幕乱码| 999在线观看免费大全电视剧| 日本不卡影院| 日韩二区三区在线| 国产精品免费无遮挡无码永久视频| 国产色爱av资源综合区| 九色porny自拍| 欧美国产精品| 看欧美日韩国产| 久久久久久久性潮| 色综合导航网站| 男人久久精品| 欧美精品色综合| 日韩欧美性视频| 国产精品午夜免费| 在线观看欧美一区二区| 中文亚洲免费| 亚洲日本精品| 极品束缚调教一区二区网站 | 成人夜色视频网站在线观看| www.av中文字幕| jvid福利在线一区二区| 91文字幕巨乱亚洲香蕉| 黑人精品一区| 欧美疯狂xxxx大交乱88av| 天堂a√在线| 91精品福利在线一区二区三区| 国产无精乱码一区二区三区| 欧美激情在线一区二区| 乱码一区二区三区| 日本vs亚洲vs韩国一区三区| 免费极品av一视觉盛宴| 精品国产乱码久久久久久果冻传媒| 亚洲一区二区三| 中老年在线免费视频| 久久躁狠狠躁夜夜爽| 精品999视频| 亚洲成人黄色网| 中文字幕二区三区| 亚洲在线免费播放| 少妇无套高潮一二三区| 国产91丝袜在线播放九色| 天天爽天天爽夜夜爽| 亚洲久久在线| 黄色高清视频网站| 精品国产99| 国内精品视频免费| 麻豆国产精品| 国产精品一区二区三区免费视频| 2020国产在线| 萌白酱国产一区二区| jizz在线观看视频| 国产视频亚洲精品| 亚洲第一页在线观看| 欧美日韩中文字幕精品| 天天干在线播放| 亚洲永久精品大片| 糖心vlog免费在线观看| 日本一区二区综合亚洲| 亚洲精品乱码久久久久久久| 国产精品中文欧美| 香蕉视频999| 日本午夜一本久久久综合| 噜噜噜久久亚洲精品国产品麻豆| 午夜视频一区| 国产精品久久成人免费观看| 色小子综合网| 亚洲精品日韩在线观看| 国产欧美一区二区精品久久久| 精品国产免费久久久久久尖叫| 日韩在线成人| 91久久爱成人| 一区二区三区视频播放| 99视频免费观看蜜桃视频| 夫妻免费无码v看片| 久久综合国产| 亚洲欧美日产图| 成人影视亚洲图片在线| 秋霞毛片久久久久久久久| 伊人久久大香线蕉综合网蜜芽| 久久99精品国产一区二区三区| 老司机在线精品视频| 国产精品初高中精品久久| 97se亚洲| 久久精品99| 精品中文字幕一区二区三区av| 久久久久欧美| 亚洲丁香日韩| 色噜噜色狠狠狠狠狠综合色一| 国产精品美女久久久久久不卡| 任我爽在线视频精品一| jlzzjlzz亚洲女人| 尤物一区二区三区| 亚洲一区二区三区无吗| av 日韩 人妻 黑人 综合 无码| 一区二区在线影院| 国产精品视频二| 亚洲高清成人| av动漫免费看| 毛片基地黄久久久久久天堂| 爱豆国产剧免费观看大全剧苏畅| 国产寡妇亲子伦一区二区| 麻豆短视频在线观看| 91在线看国产| 成人免费视频入口| 一区二区欧美精品| 国语对白永久免费| 在线观看国产91| 99精品免费观看| 日韩av在线免费播放| 第九色区av在线| 久久亚洲精品毛片| 看黄在线观看| 国产免费一区二区三区在线能观看| 国产精品亚洲欧美一级在线| 国产精品免费在线| 激情五月综合网| 欧美激情亚洲天堂| 老司机午夜精品视频| 九九热视频免费| 91老师片黄在线观看| av黄色免费在线观看| 精品久久久久国产| 97人妻精品一区二区三区| 亚洲国产又黄又爽女人高潮的| 国产小视频在线| 久久91精品国产91久久跳| 欧美动物xxx| 亚洲v日韩v综合v精品v| 一道本一区二区三区| 国产一区一区三区| 另类国产ts人妖高潮视频| 91欧美一区二区三区| 91蜜桃视频在线| 欧美国产日韩在线观看成人| 色综合久久88色综合天天免费| 国产剧情久久久| 在线成人激情视频| xxxx另类黑人| 91系列在线播放| 国产欧美日韩精品高清二区综合区| 中文字幕一区二区三区四区五区人| 亚洲在线观看| 中文字幕无人区二| 国产精品久久久爽爽爽麻豆色哟哟| 日韩精品无码一区二区| 欧美人狂配大交3d怪物一区| 亚洲三区在线播放| 欧美国产日本在线| 国产精品亚洲一区二区在线观看| 欧美伦理一区二区| 在线观看视频免费一区二区三区| 成人日韩在线视频| 国产人成一区二区三区影院| 久久视频免费在线观看| 69成人精品免费视频| xxxxx日韩| 国产精品99久久久久久久久| 国产毛片久久久| 国产小视频免费| 国产精品一区在线| 波多野结衣欲乱| 欧美日韩国产一级片| www.视频在线.com| 国产999精品久久久| 亚洲日产av中文字幕| 婷婷五月综合缴情在线视频| 福利一区福利二区| 久久久久亚洲AV| 欧美日韩国产首页| 免费a在线看| 国产日韩欧美视频在线| 俺要去色综合狠狠| 超碰超碰在线观看| 国产精品国产精品国产专区不片| 中文字幕精品视频在线观看| 亚洲欧洲午夜一线一品| 亚洲欧洲自拍| 欧美精品欧美精品系列c| 欧美一级二区| 欧洲美一区二区三区亚洲 | 日韩在线观看网站| 国产69精品久久久久按摩| 亚洲春色综合另类校园电影| 久久中文字幕一区二区三区| 中文字幕人妻一区二区三区在线视频| 色综合网色综合| h视频在线播放| 国产日韩专区在线| 欧美淫片网站| 中文字幕天堂av| 欧美视频免费在线| 国产中文字幕在线看| 国产精品一区av| 91精品国产自产在线观看永久∴ | 91久久精品国产91性色69| 日韩网站免费观看高清| 91嫩草国产线观看亚洲一区二区| 国产精品美女在线播放| 国产传媒日韩欧美成人| 好吊操这里只有精品| 亚洲色图15p| 婷婷成人av| 女人帮男人橹视频播放| 99精品欧美一区二区三区综合在线| 手机在线看片1024| 久久精品国产久精国产一老狼| 日本一区二区乱| 日韩小视频在线播放| 久久精子c满五个校花| 亚洲一区中文字幕永久在线| 久久6免费高清热精品| 一本久久青青| 91视频福利网| 黑人巨大精品欧美一区免费视频 | 久久久久日韩精品久久久男男| 神马久久影院| 中文字幕久久av| 午夜在线成人av| lutube成人福利在线观看| 99蜜桃在线观看免费视频网站| 国产精品腿扒开做爽爽爽挤奶网站| 在线观看亚洲大片短视频| 欧美成人免费网站| 韩国成人在线| 美女扒开大腿让男人桶| 国产蜜臀av在线一区二区三区| 亚洲黄色在线播放| 国产精品一区二区三区毛片淫片| 亚洲性图久久| 黄色精品视频在线观看| 日韩精品免费一线在线观看| 成人污污视频| 成人三级视频在线播放| 亚洲精品高清视频在线观看|