精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型量化訓練極限在哪?騰訊混元提出低比特浮點數訓練Scaling Laws

人工智能 新聞
這項研究為大模型訓練中的浮點數量化提供了重要的理論指導。其價值不僅在于明確了在給定資源和精度下的最優參數配置策略,幫助提高訓練效率和降低成本,而且對于推動大模型在實際應用中的更廣泛部署具有關鍵意義。

大模型低精度訓練和推理是大模型領域中的重要研究方向,旨在通過降低模型精度來減少計算和存儲成本,同時保持模型的性能。因為在大模型研發成本降低上的巨大價值而受到行業廣泛關注 。近期,業界對低精度訓練和推理的廣泛關注與討論。在實際的研發過程中,特別是模型訓練方面,經驗表明浮點數量化方案相比整數量化方案對模型效果造成的損失更小,所以浮點數常常被用作量化訓練的類型。這就引出了一些問題:整數類型量化訓練的經驗能否直接應用到浮點數類型的量化訓練任務中?如果不能,浮點數類型又會有怎樣的結論?量化訓練到底有沒有極限?

大模型社區亟需一個更加適合實際浮點數量化訓練的 Scaling Laws,指導大模型量化的實際選擇和未來探索方向。為了回答這些問題,騰訊混元團隊進行了 366 組不同參數規模和精度的浮點數量化訓練,對浮點數量化訓練進行詳細分析后提出了浮點數量化的 Scaling Laws。

  • 論文標題:《Scaling Laws for Floating–Point Quantization Training》
  • 論文鏈接:https://huggingface.co/papers/2501.02423

引言

大模型(Large Language Model, LLM)如今已經融入到我們生產生活的各個層面。大模型的參數規模不斷增大,調用量也持續升高,這使得大模型的訓練和推理成本成為 LLM 社區極為關注的重要問題。低比特量化技術能夠在一定程度上降低大模型訓練和推理的成本。鑒于此,這一技術在主流大模型的訓練和推理過程中得到了廣泛應用。前沿研究工作對 8 比特、4 比特甚至更低比特的量化策略進行了嘗試,并對這些策略予以驗證。

近期,論文《Scaling Laws for Precision》深入探討了整數類型量化策略下的精度對模型 loss 的影響,不過僅在附錄中簡略提及了浮點數類型量化策略的表現,并未深入探究。然而,在實際的生產過程中,特別是模型訓練方面,經驗表明浮點數量化(floating–point quantization)方案相比整數量化方案對模型效果造成的損失更小,所以浮點數更常被用于超低精度量化訓練。

騰訊混元團隊的新工作《Scaling Laws for Floating–Point Quantization Training》系統全面地研究了浮點數量化訓練的 Scaling Laws,填補了這一領域的空白。具體地,他們在大模型 Scaling Law 的經典要素:模型大小(簡稱 N)和訓練數據量(簡稱 D)之外,聯合考慮浮點數量化訓練中重要的量化目標,指數位(Exponent,簡稱 E),尾數位(Mantissa,簡稱 M),以及量化時放縮因子共享粒度(Block-size,簡稱 B)對于大模型訓練損失的影響。他們進行了 366 組不同參數規模和精度設置的浮點數量化訓練,得出最終的浮點數量化的統一 Scaling Law 形式如下:

圖片

并且依據這一 Scaling Law 深入分析與推導之后,能夠得出如下一些重要結論:

  • 在任意低精度大模型浮點數量化訓練中,都存在一個模型極限效果及對應的最佳數據量。超過此最佳數據量時繼續增加數據,反而會對模型效果產生負面影響;
  • 限定計算資源下,在一個非常大的算力范圍內,理論預測的最佳性價比的浮點數量化訓練精度落在 4-8 比特之間;
  • 在實際工作中,借助我們的 Scaling Laws 及其推論,同時結合計算資源圖片,可以明確得出不同計算資源下具有最佳性價比的浮點數量化訓練精度設置、模型參數量以及訓練數據量的配置策略。

最佳的浮點數

與整數類型只有符號位(Signal,簡稱 S)和整數位相比,參考 IEEE 754 標準,浮點數顯得復雜許多。它由符號位、指數位(Exponent,簡稱 E)和尾數位(Mantissa,簡稱 M)共同作用決定最終取值。

圖片

通過大量實驗與理論分析,騰訊混元團隊推導出了指數位和尾數位對最終模型效果之間的定量關系:

圖片

同時還得出給定精度(Precision,簡稱 P)P=1+E+M 情況下,指數位與尾數位的最佳配比規律需滿足:

圖片

未來硬件制造商也可以參考此結論,提供在不同精度下的浮點運算能力支持:

圖片

精細量化

量化過程中,為了減少精度損失會對需量化 Tensor 進行放縮(Scaling)。同時,為節省放縮因子(Scaling Factor)的存儲空間,通常會讓 Tensor 中的若干元素共享一個放縮因子。顯然,放縮因子共享粒度越大,其存儲空間越小,但由此帶來的量化損失也會越大。混元團隊定量地研究了放縮因子共享粒度(Block-size,簡稱 B)對模型效果的影響,發現訓練時的驗證損失(Validate Loss)與 B 的對數成正比例關系:圖片

Scaling Law

在綜合了所有浮點數量化訓練中影響模型效果的因素(如參數量 N,數據量 D,指數位 E,尾數位 M 和量化粒度 B)后,混元團隊最終得出了浮點數量化訓練的 Scaling Law:

圖片

前三項基于經典的 Chinchilla Scaling Law 的形式,第四項可以看做浮點數量化對于模型的額外損失。有意思的是,圖片可以被看作某種形式的 “知識密度”,而 E, M 和 B 的聯合項可以被看作某種形式的精度表示。直觀地分析,大模型過低精度下無法承載過高的知識密度,導致了額外損失。另外值得注意的是,我們 Scaling Law 中 N 和 D 的指數參數 α 和 β,在第一項 / 第二項 / 第四項都是完全相同的,形式更加統一。

為了判斷最終統一形式的泛化能力,騰訊混元團隊在小模型(41M - 679M)上擬合估算出 n, d, α, β, γ, δ, ν 以及 ? 等參數的取值后:

圖片

在更大的模型(1.2B)上也驗證了不同量化配置下的預測效果。

無法跨越的效果屏障

在上面 Scaling Law 公式里,第二項和第四項關于數據量(D)的部分構成一個有最值的函數,即存在一個關于 D 的 loss 最低點,這個最值點在:

圖片

注意此時這里并沒有給 Scaling Law 添加任何限制條件,這意味著當訓練某個模型時,每個精度都存在一個對應的極限效果,無論使用多少數據都無法超越。并且當使用的數據量超過 Dcrit 時,繼續增加數據反而對模型效果是有害的。

從公式中,我們發現,模型越小,精度越低,那么這個極限數據量就會越早到來,增加數據導致模型效果變差越明顯。因此,越小的模型越需要越大的精度才能保證給定數據的有效訓練。

圖片

這一隨著訓練進行損失不降反升的現象,也得到了混元團隊的真實訓練結果支持。但是,經過計算當采用 BF16 訓練 1B 參數量模型時,會發現這一極限數據量高達 1730T,這可能也是之前沒有人發現這一現象的原因。然而,隨著精度降低,比如采用 FP8-E4M3 時這一數值降低至 27T,而使用 FP4-E2M1 時則只有 0.4T。

限定資源下的最優解

于是可以得知,即使在無限資源下,由于效果屏障存在的原因,訓練模型時使用的數據量也不應該超過 Dcrit。那么在限定資源下,通過求解方程組:

圖片

可以得出一個符合經典冪律關系(Power-law)的最佳性價比精度配方:

圖片

根據實驗結果推算,在一個非常大的算力范圍內,理論預測的最佳性價比落在 4-8 比特之間。

圖片

精度與參數量的匯率

在資源受限的情況下,盡管我們已知在最佳性價比時精度應如何選取,然而參數量 N 與數據量 D 究竟該如何搭配這一問題依舊尚未得到解決。通過對方程組:

圖片

進行求解能夠發現,在限定資源的情況下,若要保持性價比,精度 P 和參數量 N 之間存在著一個類似于 “匯率” 的關系:

圖片

所以,在實際工作當中,可以借助 “精度 —— 參數量的匯率”,并且結合,進一步明確在最佳性價比下的精度 P、參數量 N 以及數據量 D 的配置策略。

這項研究為大模型訓練中的浮點數量化提供了重要的理論指導。其價值不僅在于明確了在給定資源和精度下的最優參數配置策略,幫助提高訓練效率和降低成本,而且對于推動大模型在實際應用中的更廣泛部署具有關鍵意義。通過揭示浮點數量化訓練的極限和規律,為硬件制造商優化浮點運算能力提供了依據,也為研究人員在大模型的優化和創新方面開辟了新的思路和方向。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-30 10:35:00

訓練數據模型

2024-06-21 11:44:17

2024-05-22 18:10:38

2025-04-16 02:30:00

2025-03-12 12:10:13

2025-03-03 04:20:00

2020-09-15 12:57:46

C 語言浮點數內存

2024-11-06 09:47:00

2023-09-07 11:48:36

騰訊混元大模型

2024-11-13 13:50:00

AI模型

2023-07-05 08:00:58

Redis數據庫

2023-10-26 15:38:03

混元大模型騰訊

2023-09-12 07:02:19

騰訊混元大模型

2024-07-29 09:10:00

模型數據

2024-09-05 16:37:37

2022-04-29 16:47:57

AI騰訊

2024-12-11 08:28:15

點贊
收藏

51CTO技術棧公眾號

99热这里只有精品在线观看| 一级做a爰片毛片| 成人福利片网站| 久久99国产精品成人| 超碰97人人做人人爱少妇| 成年网站在线播放| 欧美a免费在线| 精品一区二区三区不卡| 欧美美女15p| 五月天中文字幕在线| 69xxxx欧美| 久久精品久久99精品久久| 久久夜色精品国产欧美乱| 91 在线视频观看| 国产传媒在线播放| 国产福利一区在线观看| 欧美成人免费视频| 韩国三级在线看| 超碰在线视屏| 久久精品视频一区| 国产日韩欧美中文| 一区二区视频免费看| 日本中文字幕在线一区| 一本色道久久综合亚洲91| 天天久久人人| 一区二区不卡视频在线观看| 黄色在线成人| 在线观看视频亚洲| 国产在线观看免费播放| 在线国产成人影院| 亚洲午夜精品17c| 午夜精品一区二区三区四区| www国产在线| 日韩精品国产欧美| 久久久欧美一区二区| 高清国产在线观看| jizz久久精品永久免费| 91国产福利在线| 国产玉足脚交久久欧美| av网站无病毒在线| 91麻豆精品一区二区三区| 成人美女av在线直播| 探花视频在线观看| 国产精品v一区二区三区| 亚洲国模精品一区| 久久久精品视频国产| 亚洲人成在线网站| 亚洲午夜在线观看视频在线| 性欧美精品一区二区三区在线播放| 成人午夜福利视频| 精品一区二区综合| 国产成人精彩在线视频九色| 精品在线视频免费观看| 国产高清欧美| 国产一区二区三区在线观看视频 | 国产乱淫av片| 香蕉久久一区| 日本道精品一区二区三区| 国产成人亚洲综合无码| 黄色网址视频在线观看| 国产欧美在线观看一区| 久久综合婷婷综合| 天天干天天操av| 成人免费看的视频| 成人自拍偷拍| 国产ts变态重口人妖hd| 青青草成人在线观看| 日本免费在线精品| 99热只有这里有精品| 最新成人av网站| 久久久久久久久久久国产| 欧美精品久久久久性色| 欧美区一区二| 久久91亚洲人成电影网站 | 一区二区三区在线不卡| 中文字幕在线亚洲三区| 日本精品在线| 国产精品激情偷乱一区二区∴| 日本一区二区三区视频在线播放| 男人天堂资源在线| 国产丝袜欧美中文另类| 日韩精品在在线一区二区中文| 国产香蕉在线| 亚洲国产岛国毛片在线| 亚洲国产精品一区在线观看不卡| 国产精品麻豆一区二区三区| 久久精品视频在线看| 日韩色妇久久av| 95在线视频| 亚洲欧洲在线观看av| 影音先锋成人资源网站| 欧美xxxx黑人又粗又长| 亚洲一区二区中文在线| 久久人人爽人人爽人人av| 国产盗摄精品一区二区酒店| 亚洲成在人线免费| www.浪潮av.com| 最新欧美电影| 欧美欧美欧美欧美首页| 91亚洲一区二区| 动漫av一区| 精品一区电影国产| 中国女人特级毛片| 亚洲不卡av不卡一区二区| 欧美裸体xxxx极品少妇| 成人免费视频毛片| 日本伊人精品一区二区三区观看方式| 国产精品一区二区三区久久| 国产免费黄色大片| youjizz久久| 亚洲免费精品视频| 欧洲成人综合网| 欧美日韩一二三四五区| 一区二区在线免费看| 最新国产精品精品视频| 精品调教chinesegay| 国产成人免费观看网站| 在线精品小视频| 欧美在线免费看| 国产美女无遮挡永久免费| 91女人视频在线观看| 亚洲欧洲中文| 99热99re6国产在线播放| 一本色道久久综合亚洲91 | 四虎一区二区| 黄色一级片在线观看| 午夜精品福利视频网站| 亚洲一级免费观看| 国产伦乱精品| www.精品av.com| 国产欧美一区二区三区在线看蜜臂| 久久成人免费日本黄色| 久久国产精品 国产精品| 国产精品天堂| 亚洲综合丁香婷婷六月香| 六月婷婷在线视频| 亚洲人体在线| 亚洲国产精品资源| 欧美三级视频网站| 国产精品成人一区二区网站软件| 午夜欧美不卡精品aaaaa| 中文字幕第2页| 99综合电影在线视频| 欧美在线视频一区二区三区| 国产婷婷视频在线| 欧美日韩国内自拍| 激情在线观看视频| 日韩电影免费在线观看| 欧美一级大片视频| 韩国av免费在线| 亚洲精品视频自拍| 久久国产激情视频| 狠狠操综合网| 青草青草久热精品视频在线网站 | 久久久老熟女一区二区三区91| 99re6这里只有精品| 国产97在线|日韩| 色一情一乱一区二区三区| 一区2区3区在线看| 中文字幕乱妇无码av在线| 日韩理论电影院| 国产精品黄色影片导航在线观看| 天堂在线视频网站| 亚洲h在线观看| 怡红院一区二区| 在线观看不卡| 97人人澡人人爽| av网址在线免费观看| 欧美精品日韩精品| 亚洲区自拍偷拍| 日韩专区一卡二卡| 日韩免费中文专区| 九九精品调教| 欧美一区二区三区人| 国产精品夜夜夜爽阿娇| 九色porny丨国产精品| 一区不卡字幕| 在线观看欧美| 久久高清视频免费| 99国产精品欲| 亚洲国产aⅴ天堂久久| 国产51自产区| 亚洲综合精品| 日本在线观看一区| 亚洲欧洲专区| 欧美大学生性色视频| 丰满少妇一级片| 欧美日韩国产一区二区三区| 蜜桃av免费看| 麻豆极品一区二区三区| av电影一区二区三区| 亚洲2区在线| 欧美精品videos| 欧美在线 | 亚洲| 欧美日韩精品国产| 91国模少妇一区二区三区| 久久精品观看| 日本不卡一区二区三区在线观看| 欧美精品资源| 色av吧综合网| 国产丰满果冻videossex| 亚洲精品免费在线播放| 国产综合内射日韩久| 一区二区三区导航| 欧美激情一区二区三区在线视频| 欧美大片免费高清观看| 一区二区三区日韩在线| 一级aaaa毛片| 亚洲黄色性网站| 色哟哟视频在线| 视频一区在线视频| 特级西西人体www高清大胆| 日韩精品一级| 久久久久久亚洲精品| 国产精品视频一区二区久久| 欧美一区二区三区四区五区| 精品在线播放视频| 国产亚洲欧美色| 好吊操视频这里只有精品| 日韩一区精品视频| 穿情趣内衣被c到高潮视频| 台湾色综合娱乐中文网| 亚洲a一级视频| 国模套图日韩精品一区二区| 日韩一区二区欧美| 色资源在线观看| 91精品国产综合久久久久久久 | 欧美激情在线播放| 国产视频精品久久| 亚洲成人av资源网| 一级特黄aaaaaa大片| 岛国视频午夜一区免费在线观看| 成人三级视频在线观看| 99精品视频在线观看| 一级黄色大片儿| 99re国产精品| 国产精品啪啪啪视频| 国产精品成人一区二区不卡| 欧美日韩在线一二三| 在线播放一区二区精品视频| 国产精品一二三视频| 二区三区不卡| 91av在线精品| 久久亚洲资源| 精品国产一区二区三区四区在线观看 | 另类欧美小说| 久久青草免费| 欧洲成人性视频| 黄毛片在线观看| 欧美黑人极品猛少妇色xxxxx| 91啦中文在线| 最近2019中文字幕大全第二页| 欧洲成人av| 亚洲精品一二区| 亚洲人成色777777精品音频| 日韩欧美久久一区| 国产欧美日韩成人| 91精选在线观看| 91欧美日韩麻豆精品| 色老头久久综合| 天天干天天干天天操| 精品magnet| 日本三级午夜理伦三级三| 亚洲精品福利视频网站| 国产人妻精品一区二区三区不卡 | 青青草视频播放| 91丨porny丨国产| 艳妇乳肉豪妇荡乳xxx| 成人永久免费视频| 动漫美女无遮挡免费| 成人亚洲一区二区一| 日本泡妞xxxx免费视频软件| 国产精品18久久久| 亚洲精品自拍网| 蜜桃一区二区三区在线| 午夜免费一区二区| 日本怡春院一区二区| 国内自拍视频网| 爽爽淫人综合网网站| 免费大片在线观看| 日一区二区三区| 国产av人人夜夜澡人人爽| 免费日韩精品中文字幕视频在线| 18禁裸男晨勃露j毛免费观看| 亚洲激情另类| 91好吊色国产欧美日韩在线| 日韩一区二区久久| 92看片淫黄大片一级| 日韩精品福利网| 日韩爱爱小视频| 青青草伊人久久| 少妇性l交大片7724com| 处破女av一区二区| 国精产品一区一区三区免费视频| 国产女人18毛片水真多成人如厕| 亚洲一级片在线播放| 亚洲特黄一级片| 久久机热这里只有精品| 欧美午夜激情视频| 一级特黄aaa| 亚洲第一在线视频| 黄色片在线免费看| 久久综合五月天| 成年女人在线看片| 国产精品十八以下禁看| 婷婷视频一区二区三区| 欧美系列一区| 欧美一区网站| 九色在线视频观看| 国产在线视频精品一区| 国模私拍在线观看| 国产精品免费视频一区| 国产亚洲精品久久777777| 色呦呦日韩精品| 国产成人毛毛毛片| 国产一区二区三区精品久久久| 91三级在线| 国产精品草莓在线免费观看| 中文字幕日韩在线| 先锋在线资源一区二区三区| 亚洲日韩成人| 北条麻妃亚洲一区| 91在线观看视频| 男人天堂资源网| 午夜私人影院久久久久| 老熟妇一区二区三区啪啪| 欧美成人猛片aaaaaaa| 国产在线免费观看| 欧美激情网友自拍| 一区在线影院| 久久免费视频1| 欧美激情成人| 美女网站免费观看视频| 国产a久久麻豆| 婷婷国产成人精品视频| 欧美性猛交99久久久久99按摩| va视频在线观看| 日韩在线小视频| 成人做爰视频www网站小优视频| 99精品国产高清在线观看| 99久久激情| 国产一线二线三线在线观看| 91在线porny国产在线看| 国产va在线播放| 欧美日产国产精品| 欧美一区二区少妇| 欧美激情在线播放| 成人中文字幕视频| 青青在线视频免费观看| 国内久久精品视频| 国精产品一区一区| 91成人国产精品| 四虎影视精品成人| 97超视频免费观看| 卡通动漫精品一区二区三区| 日韩精品一区二区三区四| 国产一区二区中文字幕| 小嫩苞一区二区三区| 欧美放荡的少妇| 国产原创在线观看| 成人久久久久爱| 一本一道久久综合狠狠老| 五月天婷婷在线观看视频| 国产精品福利影院| 国产又大又黄的视频| 色妞久久福利网| av在线成人| 日韩中文字幕亚洲精品欧美| 国产剧情一区二区| 真实国产乱子伦对白在线| 欧美v亚洲v综合ⅴ国产v| 污片在线免费观看| 亚洲最大福利视频| 国产伊人精品| 国产成人av片| 欧美午夜精品久久久久久浪潮 | 欧美精品一区三区在线观看| 久久国产欧美| 一级黄色片网址| 欧美日韩精品一区视频| a级影片在线| 国产无套精品一区二区| 午夜亚洲性色视频| 国产黄色大片免费看| 在线综合视频播放| 日本理论片午伦夜理片在线观看| 国产精品久久久久久免费观看| 亚洲国产高清视频| brazzers精品成人一区| 欧美日本在线播放| 欧美xxx黑人xxx水蜜桃| 高清日韩一区| 国产一区二区精品| 亚洲精品国产成人av在线| 疯狂蹂躏欧美一区二区精品| 草草影院在线观看| 99国产视频在线| 亚洲一区激情| 殴美一级黄色片| 日韩成人中文字幕|