精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何在英特爾? 平臺上實現高效的大語言模型訓練后量化

企業動態
提升 SmoothQuant 量化方法的效力。

作者:英特爾公司 陸彤、何欣、郭恒、程文華、王暢、王夢妮、沈海豪

本文介紹了可提升大語言模型的訓練后量化表現的增強型 SmoothQuant 技術,說明了這項技術的用法,并證明了其在準確率方面的優勢。此方法已整合至英特爾? Neural Compressor(1) 中。英特爾? Neural Compressor 是一個包含量化、剪枝(稀疏性)、蒸餾(知識提煉)和神經架構搜索等多種常用模型壓縮技術的開源 Python 庫。目前,諸如 TensorFlow、英特爾? Extension for TensorFlow(2) 、PyTorch、英特爾? Extension for PyTorch(3) 、ONNX Runtime 和 MXNet等主流框架,都能與之兼容

英特爾? Neural Compressor 已經支持多款英特爾? 架構的硬件,比如英特爾? 至強? 可擴展處理器(4) 、英特爾? 至強? CPU Max 系列(5) 、英特爾? 數據中心 GPU Flex 系列(6) 英特爾? 數據中心 GPU Max 系列(7) 。本文涉及的實驗基于第四代英特? 至強? 可擴展處理器(8) 進行。

大語言模型

大語言模型 (Large Language Model, LLM) 需基于海量數據集進行訓練,可能擁有數十億權重參數。其先進的網絡結構和龐大的參數量,使它們能夠很好地應對自然語言本身的復雜性。完成訓練后的大語言模型,可針對各種下游的自然語言處理 (NLP) 和自然語言生成 (NLG) 任務進行調優,讓其更適合對話式聊天機器人(如 ChatGPT)、機器翻譯、文本分類、欺詐檢測和情感分析等任務場景。

大語言模型部署面臨的挑戰

大語言模型在執行自然語言處理和自然語言生成任務方面表現出色,但其訓練和部署頗為復雜,主要面臨以下挑戰:

  1. AI 與內存墻(9) 瓶頸問題:算力每兩年提高 3.1 倍,內存帶寬卻只提高 1.4 倍;
  2. 網絡帶寬挑戰:訓練大語言模型需要采用分布式系統,這對網絡帶寬提出了較高要求;
  3. 系統資源有限:訓練后的模型往往會部署在算力和內存資源均有限的系統上。

因此,采用訓練后量化的方法來為大語言模型瘦身,對于實現低時延推理至關重要。

大語言模型的量化

量化是一種常見的壓縮操作,可以減少模型占用的內存空間,提高推理性能。采用量化方法可以降低大語言模型部署的難度。具體來說,量化是將浮點矩陣轉換為整數矩陣:

其中 X_fp32、S 和 Z 分別為輸入矩陣、比例因子和整數零點。

有關每通道 (per-channel) 量化策略雖然可能會減少量化損失,但不能用于激活值量化的原因,請參看 SmoothQuant 相關文檔(10) 。不過,激活值量化誤差損失卻是導致模型量化準確率下降的重要因素。為此,人們提出了很多方法來降低激活值量化損失,例如:SPIQ(11) 、Outlier Suppression(12) SmoothQuant(13) 。這三種方法思路相似,即把激活值量化的難度轉移到權重量化上,只是三者在轉移難度的多少上有所不同。

增強型 SmoothQuant

SmoothQuant 引入了一個超參數 α 作為平滑因子來計算每個通道的量化比例因子,并平衡激活值和權重的量化難度。

其中 j 是輸入通道索引。

對于OPT 和 BLOOM 等大多數模型來說,α=0.5 是一個能夠較好實現權重和激活值量化難度分割的平衡值。模型的激活異常值越大,就越需要使用更大的 α 值來將更多的量化難度轉移到權重上。

原始的 SmoothQuant 旨在通過針對整個模型使用一個固定值 α 來分割權重和激活值的量化難度。然而,由于激活異常值的分布不僅在不同模型之間存在差異,而且在同一模型的不同層之間也不盡相同,因此,本文推薦使用英特爾? Neural Compressor 的自動調優能力,逐層獲取最佳 α 值。

相關方法包括以下五個主要步驟(偽代碼如下所示):

  1. 通過特殊的回調函數 register_forward_hook 捕獲 (hook) 模型各層的輸入和輸出值。
  2. 根據用戶定義的 α 范圍和步長生成一個 α 值列表。
  3. 根據給定的 α 值重新計算平滑因子并調整參數(權重值和激活值)。
  4. 對權重執行每通道量化與反量化 (quantization_dequantization),對輸入值執行每張量 (per-tensor) 量化與反量化,以預測與給定 α 值對應的每層輸出值。
  5. 計算相對實際輸出值的均方損失,將調整后的參數恢復回來,并保存每層的最佳 α 值。

本文提出的方法支持用多個標準(如最小值、最大值和平均值)來確定 Transformer 塊的輸入層歸一化 (LayerNorm) 操作的 α 值。實驗發現,將 α 范圍設為 [0.3, 0.7],步長設為 0.05,對大多數模型來說都能達到很好的平衡。

這一方法有兩個顯著特點:一是全自動化,二是比原始方法支持的融合模式多。

下圖提供了在 BLOOM-1b7 模型上執行 SmoothQuant α 值自動調優的樣例代碼:

啟用增強型 SmoothQuant 的樣例代碼啟用增強型 SmoothQuant 的樣例代碼

用戶只需傳遞一個模型名稱 (model_name) 和一個數據加載器。值得注意的是,模型分析主要依靠的是 Torch JIT。用戶可以在加載 Hugging Face 模型(14) 時將 torchscript 設置為 True,或將 return_dict 設置為 False。更多信息請參閱英特爾? Neural Compressor 文檔(10)

結果

本文提出的增強型 SmoothQuant 的主要優勢在于提高了準確率。

經過對多種主流大語言模型的評估,具備自動調優能力的 INT8 SmoothQuant 最后一個詞元 (last-token) 的預測準確率要高于原始 INT8 SmoothQuant 和 FP32 基線方法。詳見下圖:

FP32 基線方法、INT8(啟用和不啟用 SmoothQuant)以及 INT8(啟用本文提出的增強型 SmoothQuant)的準確率對比

從上圖可以看出,在 OPT-1.3b 和 BLOOM-1b7 模型上,本文提出的增強型 SmoothQuant 的準確率比默認的 SmoothQuant 分別高 5.4% 和 1.6%。量化后的模型也縮小到 FP32 模型的四分之一,大大減少了內存占用空間,從而有效地提升大模型在英特爾? 平臺上的推理性能。

更全面的結果請見GitHub 存儲庫(10) 。同時,也歡迎您創建拉取請求或就GitHub 問題(15) 發表評論。期待聽到您的反饋意見和建議。

作者:

英特爾公司人工智能資深架構師沈海豪、英特爾公司人工智能資深軟件工程師程文華、英特爾公司人工智能軟件工程師陸彤、何欣、郭恒、王暢、王夢妮,他們都在從事模型量化及壓縮的研究與優化工作。

注釋:

1、英特爾? Neural Compressor

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/neural-compressor.html

2、英特爾? Extension for TensorFlow

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-tensorflow.html

3、英特爾? Extension for PyTorch

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-pytorch.html

4、英特爾? 至強? 可擴展處理器

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/scalable.html

5、英特爾? 至強? CPU Max 系列

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/max-series.html

6、英特爾? 數據中心 GPU Flex 系列

https://www.intel.cn/content/www/cn/zh/products/details/discrete-gpus/data-center-gpu/flex-series.html

7、英特爾? 數據中心 GPU Max 系列

https://www.intel.com/content/www/us/en/products/details/discrete-gpus/data-center-gpu/max-series.html

8、第四代英特? 至強? 可擴展處理器

https://www.intel.cn/content/www/cn/zh/events/accelerate-with-xeon.html

9、AI 與內存墻

https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8

10、SmoothQuant 相關文檔 / 英特爾? Neural Compressor 文檔 / GitHub 存儲庫

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

11、SPIQ

https://arxiv.org/abs/2203.14642

12、Outlier Suppression

https://arxiv.org/abs/2209.13325

13、 SmoothQuant

https://arxiv.org/abs/2211.10438

14、Hugging Face 模型

https://huggingface.co/models

15、GitHub 問題

https://github.com/intel/neural-compressor/issues

責任編輯:張燕妮
相關推薦

2023-09-01 15:22:49

人工智能數據

2025-04-16 02:30:00

2011-11-23 10:04:25

英特爾Romley處理器PCI-E 3.0

2014-04-03 14:23:02

英特爾統一固件管理套件

2023-11-20 13:06:52

2011-07-07 09:36:15

2023-08-09 17:35:11

開源模型

2011-12-26 10:10:00

2022-07-01 18:50:32

英特爾

2011-12-14 19:01:20

英特爾

2014-12-03 10:34:31

2013-04-10 15:09:24

IDF2013英特爾陳榮坤

2014-11-14 15:59:07

英特爾架構安卓平臺創新

2014-11-14 17:15:42

英特爾

2013-09-13 15:19:08

英特爾移動平臺IDF

2021-01-08 14:18:05

AMD Zen 3英特爾測試
點贊
收藏

51CTO技術棧公眾號

国产婷婷一区二区| 国产精品久久久亚洲一区| 欧美精品日日鲁夜夜添| 四虎永久免费网站| www.色视频| 精品999成人| 亚洲欧美精品一区| 日本三级黄色网址| av资源一区| 久久精品人人爽人人爽| 91在线视频九色| www成人在线| 久久亚洲专区| 精品成人佐山爱一区二区| 欧美一级片中文字幕| 黄色网页网址在线免费| 97se狠狠狠综合亚洲狠狠| 国产精品va在线播放| xxxx日本少妇| 米奇777超碰欧美日韩亚洲| 欧美区在线观看| 日韩av在线播放不卡| 91精彩在线视频| 成人免费观看av| 国产精品高清在线观看| 亚洲国产精一区二区三区性色| 精品美女在线视频| 精品sm在线观看| 欧美三级午夜理伦三级富婆| 成入视频在线观看| 亚洲视频在线观看三级| 精品久久久久久乱码天堂| 国产精品无码专区av免费播放| 亚洲一区久久| 欧美激情视频在线观看| 国产aaaaaaaaa| 亚洲丁香日韩| 亚洲第一网中文字幕| 91日韩精品视频| 免费观看成人性生生活片| 亚洲v中文字幕| 久久久久久久久影视| 在线观看免费黄视频| 久久久精品国产免大香伊| 国产乱码一区| www.麻豆av| 国产在线一区二区| 国产色视频一区| 亚洲 国产 日韩 欧美| 欧美亚洲自偷自偷| 69久久夜色精品国产69乱青草| 在线看的片片片免费| 日韩一区电影| 在线电影av不卡网址| 91精品人妻一区二区三区蜜桃欧美| 一区二区在线视频观看| 日韩欧美一二三四区| 天天av天天操| 日韩黄色av| 欧美一区二区三区色| 欧美大片久久久| 偷拍自拍亚洲| 欧美人与z0zoxxxx视频| 看看黄色一级片| 日本一区二区中文字幕| 欧美日韩专区在线| 99re精彩视频| 亚洲爽爆av| 678五月天丁香亚洲综合网| 久久久久xxxx| 精品一区二区三区亚洲| 日韩视频中午一区| 岛国精品一区二区三区| 国产精品17p| 日韩国产高清污视频在线观看| 一级欧美一级日韩片| 香蕉一区二区| 一二美女精品欧洲| 小嫩苞一区二区三区| 在线精品视频在线观看高清| 欧美另类交人妖| 国产亚洲成人av| 国产欧美二区| 国产v综合ⅴ日韩v欧美大片 | 亚洲国产一区在线观看| 国产免费一区二区视频| 蜜桃在线视频| 欧美伊人久久大香线蕉综合69 | 国产自产v一区二区三区c| 96sao精品视频在线观看| 亚洲av无码一区二区三区dv | 99re在线国产| 亚洲 美腿 欧美 偷拍| 国产网红主播福利一区二区| 中文字幕在线观看一区二区三区| 18视频在线观看| 无码av中文一区二区三区桃花岛| 国内外成人激情视频| 亚洲精品555| 日韩网站在线看片你懂的| 水蜜桃av无码| 久久亚洲精品中文字幕蜜潮电影| 欧美极品在线播放| 最好看的日本字幕mv视频大全 | 国产精品嫩草影院久久久| 国产视频一二三四区| 99免费精品视频| 亚洲一区三区| 美女的胸无遮挡在线观看| 欧美日韩久久久| 你懂的在线观看网站| 久久亚洲成人| 日本国产精品视频| av天堂一区二区三区| 久久免费精品国产久精品久久久久| 亚洲国产一区二区精品视频| sm性调教片在线观看| 欧美日韩精品免费观看视频| 污污免费在线观看| 93在线视频精品免费观看| 欧美一区二区色| 99在线精品视频免费观看软件| 久久婷婷综合激情| 国产视频在线观看网站| 欧美天堂一区二区| 亚洲人成啪啪网站| 国产精品1234区| 狠狠色狠狠色综合系列| 日韩在线电影一区| 亚洲风情在线资源| 亚洲成人xxx| 玖玖爱这里只有精品| 奇米精品一区二区三区在线观看一| 国产高清精品一区二区三区| 久久99精品久久| 在线视频国内一区二区| 丝袜美腿中文字幕| 日韩视频三区| 国产91精品入口17c| 超碰最新在线| 欧美二区在线观看| 少妇太紧太爽又黄又硬又爽小说| 亚洲在线视频| 精品一区二区三区视频日产| 欧美1234区| 日韩欧美国产一区二区三区| 黑人操日本美女| 老司机午夜精品| 亚洲成人精品电影在线观看| 婷婷激情一区| 国产一区二区日韩| 在线视频一区二区三区四区| caoporm超碰国产精品| 欧美国产综合在线| 9l亚洲国产成人精品一区二三 | 久久香蕉一区| 日韩精品中文字幕一区二区三区| 欧美手机在线观看| 国产在线一区观看| av动漫在线播放| 日韩视频一区二区三区四区| 超碰97人人做人人爱少妇| 国产女人高潮毛片| 亚洲综合一区在线| 日本美女视频网站| 中文亚洲字幕| 欧美亚洲国产免费| 欧洲成人一区| 日韩午夜在线视频| 精品国产九九九| 亚洲午夜电影在线观看| www.男人天堂| 玖玖玖国产精品| 亚洲欧洲一区二区| 国产精品国产亚洲精品| 欧美精品电影在线| 欧美新色视频| 欧美日韩一区国产| 国产精品成人免费观看| 成人avav影音| 成人在线观看黄| 久久国产成人精品| 99精品国产高清一区二区| 24小时免费看片在线观看| 亚洲欧美精品suv| 97人妻精品一区二区三区软件| 亚洲黄色小视频| 亚洲熟女乱综合一区二区三区| 久久久999| 国产精品美女在线播放| 成人看片爽爽爽| 青青青国产精品一区二区| 最新国产在线观看| 亚洲精品一区二区精华| 欧美一区二区三区久久久| 亚洲天堂av一区| 在线观看国产网站| 美女视频黄免费的久久| 久久久久久久9| jiujiure精品视频播放| 91九色偷拍| 成人av观看| 久久视频这里只有精品| 日本黄在线观看| 欧美一区二区在线免费观看| 国产小视频在线免费观看 | 日本aⅴ在线观看| 99re成人精品视频| 波多野结衣国产精品| 日韩视频精品在线观看| 国产系列第一页| 神马久久av| 亚洲最大成人网色| 天天综合网站| 国内精品久久久久影院优| 1769视频在线播放免费观看| 日韩av在线一区二区| 国产视频在线观看视频| 欧美亚男人的天堂| 国产一区二区三区影院| 亚洲精品中文字幕乱码三区 | 露出调教综合另类| 91精品久久久久久蜜桃| 欧美成人xxxx| 国产精品福利久久久| a级片免费在线观看| 欧美裸体男粗大视频在线观看| 大胆av不用播放器在线播放 | 亚洲高清久久久| www.99re7| 国产精品视频一二三| av在线网站观看| zzijzzij亚洲日本少妇熟睡| 制服下的诱惑暮生| 久久99精品国产91久久来源| 国产成人精品无码播放| 国产精品综合| 缅甸午夜性猛交xxxx| 欧美日韩一区二区三区四区在线观看| 在线观看一区二区三区三州| 精品美女视频| 日本不卡一区二区三区视频| 天天躁日日躁成人字幕aⅴ| 国产精品国色综合久久| 亚洲午夜免费| 99热最新在线| 精品国产三级| 亚洲一区亚洲二区| 国产精品日本一区二区不卡视频| 国产美女被下药99| 久久天堂影院| 国产有码一区二区| www.久久99| 亚洲a∨日韩av高清在线观看| 亚洲网站三级| 91在线网站视频| 日本免费一区二区三区视频| 91系列在线播放| 欧美日本三级| 高清国语自产拍免费一区二区三区| xvideos.蜜桃一区二区| 高清一区二区三区视频| 欧美尿孔扩张虐视频| 欧美国产一二三区| 精品久久久久中文字幕小说 | 伊人久久大香线| 成人在线视频一区二区三区 | 国产黄色一级网站| 久久久久免费| 天天色综合天天色| 国产一区二区三区日韩| 午夜福利三级理论电影| 99久久精品一区二区| 国产熟妇久久777777| 国产欧美一区二区精品久导航| 亚洲天堂最新地址| 亚洲老妇xxxxxx| 久久9999久久免费精品国产| 精品美女永久免费视频| 午夜一级黄色片| 91精品中文字幕一区二区三区| xxxx18国产| 亚洲精品av在线播放| 波多野结衣在线网站| 久久影视电视剧免费网站| a级片免费在线观看| 国产精品福利在线观看| 在线高清欧美| 国产一区二区三区免费不卡| 国产精品美女久久久久久不卡| 一本色道久久综合亚洲二区三区 | 男人添女荫道口图片| 日韩中文字幕区一区有砖一区| 亚洲精品第三页| 不卡影院免费观看| 黄大色黄女片18免费| 亚洲一区二区三区中文字幕| 亚洲AV无码成人精品区东京热 | 亚洲精品无码专区| 亚洲午夜av电影| 1区2区3区在线视频| 欧美制服第一页| 在线免费观看亚洲| 久久婷婷开心| 影音先锋日韩精品| 精品久久久噜噜噜噜久久图片 | 免费在线观看成年人视频| 国产精品理伦片| 亚洲欧美在线视频免费| 7777精品久久久大香线蕉| 青春有你2免费观看完整版在线播放高清| 久久深夜福利免费观看| 全亚洲第一av番号网站| 北条麻妃高清一区| 久久大综合网| 久久久久久香蕉| www.av精品| 九九热最新地址| 91福利在线导航| 日日躁夜夜躁白天躁晚上躁91| 色妞一区二区三区| 成人爽a毛片免费啪啪| 成人激情直播| 91精品综合| 亚洲色图久久久| 2欧美一区二区三区在线观看视频| 好吊色视频在线观看| 欧美日韩中文字幕一区| 天堂a中文在线| 欧美激情一二区| 麻豆一二三区精品蜜桃| 一区二区三区的久久的视频| 日韩影院免费视频| 丰腴饱满的极品熟妇| 丁香五六月婷婷久久激情| 韩国av永久免费| 欧美大片在线免费观看| 国产精品1区在线| 亚洲一区二区三区午夜| 免费观看在线综合| 久久精品三级视频| 欧美在线短视频| 二人午夜免费观看在线视频| 57pao国产成人免费| 欧美顶级毛片在线播放| 僵尸世界大战2 在线播放| 成人综合在线视频| 久久久久久久中文字幕| 日韩欧美一区二区三区在线| 操你啦视频在线| 91视频在线免费观看| 欧美日韩精品一本二本三本| 伊人av在线播放| 亚洲自拍偷拍综合| 成人爽a毛片一区二区| 欧美激情第一页xxx| 精品深夜福利视频| 国产精品一区二区免费在线观看| www.亚洲色图.com| 欧美激情黑白配| 亚洲日韩第一页| 全球最大av网站久久| 亚洲欧洲免费无码| 韩国一区二区视频| 可以直接看的黄色网址| 日韩欧美国产一区二区三区| 91美女精品| 乱色588欧美| 狂野欧美一区| 亚洲色图100p| 日韩一二三区视频| av在线加勒比| 欧美日韩精品免费看 | 国产一级片中文字幕| 一区二区三区日韩欧美| 日批视频免费播放| 国产91精品最新在线播放| 久久裸体网站| 麻豆tv在线观看| 色视频欧美一区二区三区| 1pondo在线播放免费| julia一区二区中文久久94| 亚洲一区图片| 九九热视频在线免费观看| 日韩免费高清视频| 性欧美freesex顶级少妇| 亚洲欧洲精品一区二区| 高清成人在线观看| 精品久久久久久久久久久国产字幕 | 另类欧美小说| 免费av成人在线| 免费中文字幕在线观看| 亚洲精品网站在线播放gif| 黄色精品视频网站| 精品少妇人欧美激情在线观看| wwwwxxxxx欧美| 国产熟女精品视频| 日本高清不卡的在线| 欧美日韩中文| 在线观看免费黄色网址|