精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

類GPT模型訓練提速26.5%,清華朱軍等人用INT4算法加速神經網絡訓練

人工智能 新聞
在本文中,清華朱軍等人提出了一種使用 INT4 算法實現所有矩陣乘法的 Transformer 訓練方法。

我們知道,將激活、權重和梯度量化為 4-bit 對于加速神經網絡訓練非常有價值。但現有的 4-bit 訓練方法需要自定義數字格式,而當代硬件不支持這些格式。在本文中,清華朱軍等人提出了一種使用 INT4 算法實現所有矩陣乘法的 Transformer 訓練方法。

模型訓練得快不快,這與激活值、權重、梯度等因素的要求緊密相關。

神經網絡訓練需要一定計算量,使用低精度算法(全量化訓練或 FQT 訓練)有望提升計算和內存的效率。FQT 在原始的全精度計算圖中增加了量化器和去量化器,并將昂貴的浮點運算替換為廉價的低精度浮點運算。

對 FQT 的研究旨在降低訓練數值精度,同時降低收斂速度和精度的犧牲。所需數值精度從 FP16 降到 FP8、INT32+INT8 和 INT8+INT5。FP8 訓練通過有 Transformer 引擎的 Nvidia H100 GPU 完成,這使大規模 Transformer 訓練實現了驚人的加速。

最近訓練數值精度已被壓低到 4 位( 4 bits)。Sun 等人成功訓練了幾個具有 INT4 激活 / 權重和 FP4 梯度的當代網絡;Chmiel 等人提出自定義的 4 位對數數字格式,進一步提高了精度。然而,這些 4 位訓練方法不能直接用于加速,因為它們需要自定義數字格式,這在當代硬件上是不支持的。

在 4 位這樣極低的水平上訓練存在著巨大的優化挑戰,首先前向傳播的不可微分量化器會使損失函數圖不平整,其中基于梯度的優化器很容易卡在局部最優。其次梯度在低精度下只能近似計算,這種不精確的梯度會減慢訓練過程,甚至導致訓練不穩定或發散的情況出現。

本文為流行的神經網絡 Transformer 提出了新的 INT4 訓練算法。訓練 Transformer 所用的成本巨大的線性運算都可以寫成矩陣乘法(MM)的形式。MM 形式使研究人員能夠設計更加靈活的量化器。這種量化器通過 Transformer 中的特定的激活、權重和梯度結構,更好地近似了 FP32 矩陣乘法。本文中的量化器還利用了隨機數值線性代數領域的新進展。

圖片圖片

論文地址:https://arxiv.org/pdf/2306.11987.pdf

研究表明,對前向傳播而言,精度下降的主要原因是激活中的異常值。為了抑制該異常值,研究提出了 Hadamard 量化器,用它對變換后的激活矩陣進行量化。該變換是一個分塊對角的 Hadamard 矩陣,它將異常值所攜帶的信息擴散到異常值附近的矩陣項上,從而縮小了異常值的數值范圍。

對反向傳播而言,研究利用了激活梯度的結構稀疏性。研究表明,一些 token 的梯度非常大,但同時,其余大多數的 token 梯度又非常小,甚至比較大梯度的量化殘差更小。因此,與其計算這些小梯度,不如將計算資源用于計算較大梯度的殘差。

結合前向和反向傳播的量化技術,本文提出一種算法,即對 Transformer 中的所有線性運算使用 INT4 MMs。研究評估了在各種任務上訓練 Transformer 的算法,包括自然語言理解、問答、機器翻譯和圖像分類。與現有的 4 位訓練工作相比,研究所提出的算法實現了相媲美或更高的精度。此外,該算法與當代硬件 (如 GPU) 是兼容的,因為它不需要自定義數字格式 (如 FP4 或對數格式)。并且研究提出的原型量化 + INT4 MM 算子比 FP16 MM 基線快了 2.2 倍,將訓練速度提高了 35.1%。

前向傳播

在訓練過程中,研究者利用 INT4 算法加速所有的線性算子,并將所有計算強度較低的非線性算子設置為 FP16 格式。Transformer 中的所有線性算子都可以寫成矩陣乘法形式。為了便于演示,他們考慮了如下簡單的矩陣乘法加速。

圖片圖片

這種矩陣乘法的最主要用例是全連接層。

學得的步長量化

加速訓練必須使用整數運算來計算前向傳播。因此,研究者利用了學得的步長量化器(LSQ)。作為一種靜態量化方法,LSQ 的量化規模不依賴于輸入,因此比動態量化方法成本更低。相較之下,動態量化方法需要在每次迭代時動態地計算量化規模。

給定一個 FP 矩陣 X,LSQ 通過如下公式 (2) 將 X 量化為整數。

圖片圖片

激活異常值

簡單地將 LSQ 應用到具有 4-bit 激活 / 權重的 FQT(fully quantized training,全量化訓練)中,會由于激活異常值而導致準確度下降。如下圖 1 (a) 所示,激活的有一些異常值項,其數量級比其他項大得多。

在這種情況下,步長 s_X 在量化粒度和可表示數值范圍之間進行權衡。如果 s_X 很大,則可以很好地表示異常值,同時代價是以粗略的方式表示其他大多數項。如果 s_X 很小,則必須截斷 [?Q_Ns_X, Q_Ps_X] 范圍之外的項。

圖片

Hadamard 量化

研究者提出使用 Hadamard 量化器(HQ)來解決異常值問題,它的主要思路是在另一個異常值較少的線性空間中量化矩陣。

激活矩陣中的異常值可以形成特征級結構。這些異常值通常集中在幾個維度上,也就是 X 中只有幾列顯著大于其他列。作為一種線性變換,Hadamard 變換可以將異常值分攤到其他項中。具體地,Hadamard 變換 H_k 是一個 2^k × 2^k 矩陣。

圖片

為了抑制異常值,研究者對 X 和 W 的變換版本進行量化。

圖片

通過結合量化后的矩陣,研究者得到如下。

圖片

其中逆變換彼此之間相互抵消,并且 MM 可以實現如下。

圖片圖片

反向傳播

研究者使用 INT4 運算來加速線性層的反向傳播。公式 (3) 中定義的線性算子 HQ-MM 具有四個輸入,分別是激活 X、權重 W 以及步長 s_X 和 s_W。給定關于損失函數 L 的輸出梯度?_YL,他們需要計算這四個輸入的梯度。

梯度的結構稀疏性

研究者注意到,訓練過程中梯度矩陣?_Y 往往非常稀疏。稀疏性結構是這樣的:?_Y 的少數行(即 tokens)具有較大的項,而大多數其他行接近全零向量。他們在下圖 2 中繪制了所有行的 per-row 范數∥(?_Y)_i:∥的直方圖。

圖片圖片

Bit 拆分和平均分數采樣

研究者討論了如何設計梯度量化器,從而利用結構稀疏性在反向傳播期間準確計算 MM。高級的思路是,很多行的梯度非常的小,因而對參數梯度的影響也很小,但卻浪費了大量計算。此外,大行無法用 INT4 準確地表示。

為利用這種稀疏性,研究者提出 bit 拆分,將每個 token 的梯度拆分為更高的 4bits 和更低的 4bits。然后再通過平均分數采樣選擇信息量最大的梯度,這是 RandNLA 的一種重要性采樣技術。

實驗結果

研究在各種任務中評估了 INT4 訓練算法,包括語言模型微調、機器翻譯和圖像分類。研究使用了 CUDA 和 cutlass2 實現了所提出的 HQ-MM 和 LSS-MM 算法。除了簡單地使用 LSQ 作為嵌入層外,研究用 INT4 替換了所有浮點線性運算符,并保持最后一層分類器的全精度。并且,在此過程中,研究人員對所有評估模型采用默認架構、優化器、調度器和超參數。

收斂模型精度。下表 1 展示了收斂模型在各任務上的精度。

圖片圖片

語言模型微調。與 LSQ+LUQ 相比,研究提出的算法在 bert-base 模型上提升了 5.5% 的平均精度、,在 bert-large 模型上提升了 25% 的平均精度。

研究團隊還展示了算法在 SQUAD、SQUAD 2.0、Adversarial QA、CoNLL-2003 和 SWAG 數據集上進一步展示了結果。在所有任務上,與 LSQ+LUQ 相比,該方法取得了更好的性能。與 LSQ+LUQ 相比,該方法在 SQUAD 和 SQUAD 2.0 上分別提高了 1.8% 和 3.6%。在更困難的對抗性 QA 中,該方法的 F1 分數提高了 6.8%。在 SWAG 和 CoNLL-2003 上,該方法分別提高了 6.7%、4.2% 的精度。

機器翻譯。研究還將所提出的方法用于預訓練。該方法在 WMT 14 En-De 數據集上訓練了一個基于 Transformer 的 [51] 模型用于機器翻譯。

HQ+LSS 的 BLEU 降解率約為 1.0%,小于 Ultra-low 的 2.1%,高于 LUQ 論文中報道的 0.3%。盡管如此,HQ+LSS 在這項預訓練任務上的表現仍然與現有方法相當,并且它支持當代硬件。

圖像分類。研究在 ImageNet21k 上加載預訓練的 ViT 檢查點,并在 CIFAR-10、CIFAR-100 和 ImageNet1k 上對其進行微調。

與 LSQ+LUQ 相比,研究方法將 ViT-B/32 和 ViT-L/32 的準確率分別提高了 1.1% 和 0.2%。在 ImageNet1k 上,該方法與 LSQ+LUQ 相比,ViT-B/32 的精度提高了 2%,ViT-L/32 的精度提高了 2.6%,ViT-L/32 的精度提高了 0.2%。

研究團隊進一步測試了算法在 ImageNet1K 上預訓練 DeiT-Small 模型的有效性,其中 HQ+LSS 與 LSQ+LUQ 相比仍然可以收斂到相似的精度水平,同時對硬件更加友好。

消融研究

研究者進行消融研究,以獨立地在挑戰性 CoLA 數據集上展示前向和反向方法的有效性。為了研究不同量化器對前向傳播的有效性,他們將反向傳播設置為 FP16。結果如下圖 3 (a) 所示。

對于反向傳播,研究者比較了簡單的極小極大量化器、LUQ 和他們自己的 LSS,并將前向傳播設置為 FP16。結果如下圖 3 (b) 所示,雖然位寬高于 2,但 LSS 取得的結果與 LUQ 相當,甚至略高于后者。

圖片圖片

計算和內存效率

研究者比較自己提出的 HQ-MM (HQ)、計算權重梯度的 LSS(LSSWeight)、計算激活梯度的 LSS(LSSAct)的吞吐量、它們的平均吞吐量(INT4)及下圖 4 中英偉達 RTX 3090 GPU 上 cutlass 提供的基線張量核心 FP16 GEMM 實現(FP16),它的峰值吞吐量為 142 FP16 TFLOPs 和 568 INT4 TFLOPs。

圖片圖片

研究者還比較 FP16 PyTorch AMP 以及自己 INT4 訓練算法在 8 個英偉達 A100 GPU 上訓練類 BERT 和類 GPT 語言模型的訓練吞吐量。他們改變了隱藏層大小、中間全連接層大小和批大小,并在下圖 5 中繪制了 INT4 訓練的加速比。

結果顯示,INT4 訓練算法對于類 BERT 模型實現了最高 35.1% 的加速,對于類 GPT 模型實現了最高 26.5% 的加速。

圖片圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-07-03 09:41:12

算法AI

2025-04-28 09:00:00

2017-08-28 21:31:37

TensorFlow深度學習神經網絡

2017-12-22 08:47:41

神經網絡AND運算

2025-03-27 09:47:23

訓練模型AI

2019-07-22 16:55:46

神經網絡數據圖形

2025-07-02 09:21:30

2023-08-21 10:48:25

2020-05-28 15:55:06

iPhone神經網絡人工智能

2019-08-19 00:31:16

Pytorch神經網絡深度學習

2017-09-28 16:15:12

神經網絡訓練多層

2017-07-19 11:39:25

深度學習人工智能boosting

2018-12-14 08:02:55

神經網絡機器學習二值模型

2021-12-28 08:48:54

PyTorch神經網絡人工智能

2017-03-27 16:18:30

神經網絡TensorFlow人工智能

2017-08-29 13:50:03

TensorFlow深度學習神經網絡

2023-01-05 09:33:37

視覺模型訓練

2025-07-08 09:10:00

2022-12-05 10:08:59

2024-05-20 08:50:00

模型神經網絡
點贊
收藏

51CTO技術棧公眾號

91麻豆精品久久久久蜜臀| 97精品国产露脸对白| 久久九九全国免费精品观看| 亚洲在线观看网站| 91av久久| 中文文精品字幕一区二区| 成人两性免费视频| 日本五十熟hd丰满| 精品国产一区二区三区av片| 正在播放亚洲一区| 欧美在线观看www| 三区四区电影在线观看| 成人禁用看黄a在线| 国产精品久久精品| 国产一级在线免费观看| 欧美日韩一二三四| 精品久久久久一区| 五月天亚洲视频| 黄视频网站在线观看| 国产精品福利电影一区二区三区四区| 国产精品亚洲综合| 中文字幕在线日亚洲9| 亚洲激情网站| 粗暴蹂躏中文一区二区三区| 亚洲专区区免费| 亚洲不卡在线| 欧美三级欧美一级| 美女av免费在线观看| 中文字幕免费高清电视剧网站在线观看| 久久网站最新地址| 国产精品推荐精品| 精品人妻av一区二区三区| 奇米色一区二区三区四区| 91精品国产免费久久久久久 | 亚洲 中文字幕 日韩 无码| 在线电影福利片| 国产精品美女久久久久久久网站| 久久久免费看| 国精产品乱码一区一区三区四区| 国产一区二区三区在线观看免费| 国产精品91视频| 探花视频在线观看| 国产一区白浆| 97精品欧美一区二区三区| 欧美黑人一级片| 自拍偷拍欧美专区| 久久久精品在线观看| 国产精品酒店视频| 欧美日韩激情在线一区二区三区| 精品伊人久久97| 黄色正能量网站| 青青操综合网| 亚洲精品视频网上网址在线观看 | 久久乐国产精品| 欧美精品久久久久久久久46p| 久久综合88| 神马久久久久久| 日本激情视频一区二区三区| 999精品一区| 久久久久999| 老司机成人免费视频| 国产高清一区二区| 久久这里有精品| 精品爆乳一区二区三区无码av| 久久久久久久久99精品大| 久久久999国产精品| 中文字幕电影av| 欧美喷水视频| 97在线日本国产| www.com国产| 久久久成人网| 国产精品无码专区在线观看| 亚洲视频中文字幕在线观看| 麻豆成人av在线| 91在线短视频| 男人天堂亚洲二区| 国产精品视频第一区| 二级片在线观看| 天堂成人av| 狠狠躁夜夜躁久久躁别揉| 欧美 国产 小说 另类| 粉嫩av一区二区三区四区五区| 欧美狂野另类xxxxoooo| 国产黑丝在线视频| 欧美激情99| 在线日韩av观看| 可以直接看的黄色网址| 亚洲人成毛片在线播放女女| 日韩美女在线观看| 国产精品丝袜黑色高跟鞋| 国产aⅴ精品一区二区三区色成熟| 国产精品免费一区二区三区在线观看 | 亚洲淫成人影院| 欧美日本精品一区二区三区| 国产a级片视频| 精品视频黄色| 欧美激情免费在线| 中文字幕 国产| 成人在线一区二区三区| 日韩欧美精品一区二区三区经典 | 夜夜亚洲天天久久| 成人小视频在线看| 日韩中文在线| 伊人精品在线观看| 国产午夜小视频| 六月丁香综合在线视频| 国产一区二区三区高清视频| 欧美黑人激情| 狠狠躁夜夜躁人人爽超碰91| 欧美国产在线一区| 欧美日韩在线网站| 久久久久久久久91| 中文字幕一区二区免费| 波多野结衣中文一区| 爱爱爱视频网站| 久久爱91午夜羞羞| 亚洲丁香婷深爱综合| 开心激情五月网| 日日骚欧美日韩| 激情欧美一区二区三区中文字幕| 毛片av在线| 欧洲色大大久久| 少妇精品一区二区| 欧美精品三级| 91影院在线免费观看视频| 免费观看成年在线视频网站| 亚洲一级二级三级| 性鲍视频在线观看| 91视频久久| 国产精品老女人精品视频| 天天操天天干天天干| 一区二区三区四区乱视频| 不卡的av中文字幕| 欧洲毛片在线视频免费观看| 热re91久久精品国99热蜜臀| 日韩中文字幕免费观看| 亚洲综合色视频| 深夜做爰性大片蜜桃| 天天精品视频| 国产日韩欧美在线观看| 98在线视频| 在线观看国产日韩| 99久久精品免费视频| 久久动漫亚洲| 青青草国产精品| 亚洲天堂资源| 亚洲精品日韩欧美| 国产日产精品一区二区三区| 91香蕉视频mp4| 女人天堂av手机在线| 精品国产一区二区三区不卡蜜臂| 欧美激情在线观看视频| 亚洲精品一区二区三区新线路| 亚洲精品视频在线观看网站| 免费不卡av网站| 你懂的视频一区二区| 亚洲wwwav| 人人超在线公开视频| 精品国产三级电影在线观看| 精品无码免费视频| av高清不卡在线| 97国产在线播放| 久久91精品| 国产免费亚洲高清| 国产剧情在线| 精品免费国产一区二区三区四区| 国产精品99无码一区二区| 99久久免费国产| 白嫩少妇丰满一区二区| 日韩av二区| 亚洲综合第一页| 国产伦久视频在线观看| 亚洲色图25p| 中文字字幕在线中文乱码| 亚洲欧美另类图片小说| 在线观看成人动漫| 性色一区二区| 免费看av软件| 卡通动漫精品一区二区三区| 国产精品99久久久久久久久久久久| jyzzz在线观看视频| 欧美一区二区三区不卡| 日韩av在线天堂| 国产精品三级视频| 麻豆短视频在线观看| 久久国产精品99国产| 小说区视频区图片区| 大奶在线精品| 国产精品久久久久久久av大片| 黄网站免费在线观看| 亚洲精品国产品国语在线| 中文字幕自拍偷拍| 午夜日韩在线观看| 69视频在线观看免费| 国产a精品视频| 国产一级特黄a大片免费| 欧美视频官网| 天堂av一区二区| 成人av综合网| 国产精品一区二区3区| 成人影院在线播放| 中文字幕精品久久久久| 欧美一级淫片免费视频魅影视频| 欧美自拍偷拍一区| 五月天婷婷网站| 中文字幕一区二区三区四区| 特级西西人体wwwww| 激情另类小说区图片区视频区| 内射国产内射夫妻免费频道| 国产精品99一区二区三| 麻豆一区区三区四区产品精品蜜桃| 高清一区二区三区av| 日韩av理论片| www.超碰在线| 欧美日韩国产二区| 色欧美激情视频在线| 亚洲女人天堂色在线7777| 成人福利小视频| 在线91免费看| а中文在线天堂| 欧美视频一区二区三区…| 久久久全国免费视频| 中文字幕亚洲精品在线观看| 国产jjizz一区二区三区视频| 99久久精品情趣| 26uuu国产| 国产一区二区三区精品欧美日韩一区二区三区| aa免费在线观看| 亚洲少妇一区| 波多野结衣乳巨码无在线| 欧美特黄一区| 中文字幕乱码免费| 91av精品| 日本女人高潮视频| 天天影视综合| 中国人体摄影一区二区三区| 大片网站久久| 视频三区二区一区| 欧美丝袜激情| 性欧美大战久久久久久久免费观看| 精品在线播放| 日韩国产美国| 欧美综合另类| 日韩国产精品一区二区| 欧美色爱综合| 亚洲精品国产精品国自产| 日本一本不卡| 亚洲午夜高清视频| 欧美gay男男猛男无套| 亚洲乱码一区二区三区| 久久高清免费| 麻豆一区二区三区在线观看| 欧美一区二区三区另类| 毛片av在线播放| 在线成人av| 日韩网址在线观看| 老司机午夜精品视频在线观看| 波多野结衣家庭教师视频| 美女黄网久久| 免费看黄色一级大片| 美女尤物国产一区| 91蝌蚪视频在线| 国产白丝精品91爽爽久久| 蜜臀av粉嫩av懂色av| www国产精品av| 手机毛片在线观看| **性色生活片久久毛片| 中文字幕av免费在线观看| 亚洲一区二区三区国产| 国产成人在线观看网站| 一本大道久久a久久精二百| 中文字幕理论片| 欧美一区2区视频在线观看| 日韩一级片免费看| 夜夜嗨av色综合久久久综合网| 日本电影在线观看网站| 欧美高清一级大片| 一个人看的www视频在线免费观看| 国产91在线播放精品91| 亚洲最大的免费视频网站| 成人av免费在线看| 亚洲免费福利一区| 这里只有精品66| 在线不卡亚洲| 国内自拍视频一区| 韩国女主播成人在线观看| 国产精品福利导航| 亚洲国产精品99久久久久久久久| 青娱乐国产盛宴| 日本精品一区二区三区四区的功能| 国产精品怡红院| 精品网站999www| 菠萝菠萝蜜在线视频免费观看 | 亚洲一区二区三区精品视频| 亚洲性人人天天夜夜摸| 久草精品在线播放| 国产精品资源站在线| 亚洲第一香蕉网| 尤物视频一区二区| 久久精品99北条麻妃| 精品国产亚洲在线| 免费av在线网址| 日本国产精品视频| 97青娱国产盛宴精品视频| 色婷婷精品国产一区二区三区| 一区在线播放| 性欧美在线视频| 国产三级精品在线| 日产欧产va高清| 欧美一二三区在线观看| 国产免费av高清在线| 午夜精品久久久久久久久久久久久| 国产成人77亚洲精品www| 国产精品国产三级欧美二区| 日韩欧美一区免费| 欧美污视频网站| 成人免费看的视频| 日韩精品123区| 91福利视频在线| 天堂在线一二区| 欧美国产日韩视频| 97久久中文字幕| 亚洲欧美日韩在线综合| 国产精品主播| 中文字幕人妻一区二区三区| 亚洲日穴在线视频| 在线免费一级片| 国产午夜一区二区| 亚洲妇女成熟| 精品国产中文字幕| 精品福利电影| 欧美图片自拍偷拍| 一级做a爱片久久| av一区二区三| 久久高清视频免费| 激情综合五月| 国产精品久久久影院| 国产精品综合视频| 久久国产波多野结衣| 欧美日韩一二三区| 国产精品免费播放| 国产成人精品视频在线观看| 青青久久av| 一本久道综合色婷婷五月| 久久蜜臀中文字幕| 欧美日韩一级黄色片| 精品偷拍各种wc美女嘘嘘| 色戒汤唯在线观看| 久久av一区二区| 先锋a资源在线看亚洲| 蜜桃传媒一区二区亚洲av| 欧美性色视频在线| 精品成人一区二区三区免费视频| 91福利视频网| 久久99国产成人小视频| 少妇人妻互换不带套| 国产日韩在线不卡| 五月天中文字幕| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 国产高潮流白浆| 日韩免费视频线观看| 久久免费电影| 久久日韩精品| 日本午夜精品一区二区三区电影| 性の欲びの女javhd| 欧美日韩精品欧美日韩精品一 | 一区二区三区不卡视频在线观看| 午夜老司机福利| 欧美亚洲国产视频| 欧洲grand老妇人| 超碰人人cao| 亚洲线精品一区二区三区八戒| 亚洲av激情无码专区在线播放| 日韩美女视频免费看| 亚洲一区色图| 97人妻精品一区二区三区免费| 黑人狂躁日本妞一区二区三区 | 亚洲网色网站| 丰满少妇xbxb毛片日本| 91黄色免费看| 影音先锋中文在线视频| 久久精品人人做人人爽电影| 另类成人小视频在线| 久久中文字幕无码| 亚洲日本成人女熟在线观看| 国产精品igao视频网网址不卡日韩| 免费网站永久免费观看| 久久精品一区二区三区不卡牛牛| 国产一区二区在线视频观看| 欧美床上激情在线观看| 妖精视频一区二区三区| 国产九九九视频| 日本乱人伦一区| 欧洲精品二区| 午夜一区二区三区| 成人综合在线观看| 中文字幕一区二区三区免费看| 久久久久久久久久久免费| 大片网站久久| 国产精品无码永久免费不卡|