精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

人工智能 新聞
大語言模型 (Large Language Model, LLM) 需基于海量數據集進行訓練,可能擁有數十億權重參數。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

本文介紹了可提升大語言模型的訓練后量化表現的增強型 SmoothQuant 技術,說明了這項技術的用法,并證明了其在準確率方面的優勢。此方法已整合至英特爾Neural Compressor[1] 中。

英特爾Neural Compressor是一個包含量化、剪枝(稀疏性)、蒸餾(知識提煉)和神經架構搜索等多種常用模型壓縮技術的開源 Python 庫。

目前,諸如 TensorFlow、英特爾Extension for TensorFlow[2]、PyTorch、英特爾Extension for PyTorch[3]、ONNX Runtime 和 MXNet等主流框架,都能與之兼容。

英特爾Neural Compressor 已經支持多款英特爾架構的硬件,比如英特爾至強可擴展處理器[4]、英特爾至強CPU Max 系列[5]、英特爾數據中心 GPU Flex 系列[6]和英特爾數據中心 GPU Max 系列[7]。本文涉及的實驗基于第四代英特至強可擴展處理器[8]進行。

大語言模型

大語言模型 (Large Language Model, LLM) 需基于海量數據集進行訓練,可能擁有數十億權重參數。

其先進的網絡結構和龐大的參數量,使它們能夠很好地應對自然語言本身的復雜性。

完成訓練后的大語言模型,可針對各種下游的自然語言處理 (NLP) 和自然語言生成 (NLG) 任務進行調優,讓其更適合對話式聊天機器人(如 ChatGPT)、機器翻譯、文本分類、欺詐檢測和情感分析等任務場景。

大語言模型部署面臨的挑戰

大語言模型在執行自然語言處理和自然語言生成任務方面表現出色,但其訓練和部署頗為復雜,主要面臨以下挑戰:

  • AI 與內存墻瓶頸問題[9]:算力每兩年提高 3.1 倍,內存帶寬卻只提高 1.4 倍;
  • 網絡帶寬挑戰:訓練大語言模型需要采用分布式系統,這對網絡帶寬提出了較高要求;
  • 系統資源有限:訓練后的模型往往會部署在算力和內存資源均有限的系統上。

因此,采用訓練后量化的方法來為大語言模型瘦身,對于實現低時延推理至關重要。

大語言模型的量化

量化是一種常見的壓縮操作,可以減少模型占用的內存空間,提高推理性能。

采用量化方法可以降低大語言模型部署的難度。具體來說,量化是將浮點矩陣轉換為整數矩陣:

圖片

其中 X_fp32、S 和 Z 分別為輸入矩陣、比例因子和整數零點。

有關每通道 (per-channel) 量化策略雖然可能會減少量化損失,但不能用于激活值量化的原因,請參看 SmoothQuant 相關文檔[10]。

不過,激活值量化誤差損失卻是導致模型量化準確率下降的重要因素。

為此,人們提出了很多方法來降低激活值量化損失,例如:SPIQ[11]、Outlier Suppression[12]和 SmoothQuant[13]。

這三種方法思路相似,即把激活值量化的難度轉移到權重量化上,只是三者在轉移難度的多少上有所不同。

增強型 SmoothQuant

SmoothQuant 引入了一個超參數 α 作為平滑因子來計算每個通道的量化比例因子,并平衡激活值和權重的量化難度。

圖片

其中 j 是輸入通道索引。

圖片

對于 OPT 和 BLOOM 等大多數模型來說,α=0.5 是一個能夠較好實現權重和激活值量化難度分割的平衡值。模型的激活異常值越大,就越需要使用更大的 α 值來將更多的量化難度轉移到權重上。

原始的 SmoothQuant 旨在通過針對整個模型使用一個固定值 α 來分割權重和激活值的量化難度。

然而,由于激活異常值的分布不僅在不同模型之間存在差異,而且在同一模型的不同層之間也不盡相同。

因此,本文推薦使用英特爾Neural Compressor 的自動調優能力,逐層獲取最佳 α 值。

相關方法包括以下五個主要步驟(偽代碼如下所示):

  1. 通過特殊的回調函數 register_forward_hook 捕獲 (hook) 模型各層的輸入和輸出值。
  2. 根據用戶定義的 α 范圍和步長生成一個 α 值列表。
  3. 根據給定的 α 值重新計算平滑因子并調整參數(權重值和激活值)。
  4. 對權重執行每通道量化與反量化 (quantization_dequantization),對輸入值執行每張量 (per-tensor) 量化與反量化,以預測與給定 α 值對應的每層輸出值。
  5. 計算相對實際輸出值的均方損失,將調整后的參數恢復回來,并保存每層的最佳 α 值。

圖片

本文提出的方法支持用多個標準(如最小值、最大值和平均值)來確定 Transformer 塊的輸入層歸一化 (LayerNorm) 操作的 α 值。

實驗發現,將 α 范圍設為 [0.3, 0.7],步長設為 0.05,對大多數模型來說都能達到很好的平衡。

這一方法有兩個顯著特點:一是全自動化,二是比原始方法支持的融合模式多。

下圖提供了在 BLOOM-1b7 模型上執行 SmoothQuant α 值自動調優的樣例代碼:

圖片

△啟用增強型 SmoothQuant 的樣例代碼

用戶只需傳遞一個模型名稱 (model_name) 和一個數據加載器。值得注意的是,模型分析主要依靠的是 Torch JIT。用戶可以在加載 Hugging Face[15]模型時將 torchscript 設置為 True,或將 return_dict 設置為 False。

更多信息請參閱英特爾Neural Compressor 文檔[15]。

結果

本文提出的增強型 SmoothQuant 的主要優勢在于提高了準確率。

經過對多種主流大語言模型的評估,具備自動調優能力的 INT8 SmoothQuant 最后一個詞元 (last-token) 的預測準確率要高于原始 INT8 SmoothQuant 和 FP32 基線方法。詳見下圖:

圖片

△FP32 基線方法、INT8(啟用和不啟用 SmoothQuant)以及 INT8(啟用本文提出的增強型 SmoothQuant)的準確率對比

從上圖可以看出,在 OPT-1.3b 和 BLOOM-1b7 模型上,本文提出的增強型 SmoothQuant 的準確率比默認的 SmoothQuant 分別高 5.4% 和 1.6%。

量化后的模型也縮小到 FP32 模型的四分之一,大大減少了內存占用空間,從而有效地提升大模型在英特爾平臺上的推理性能。

更全面的結果請見 GitHub 存儲庫[16]。同時,也歡迎您創建拉取請求或就 GitHub 問題[17]發表評論。期待聽到您的反饋意見和建議。

了解更多內容,請點擊文末【閱讀原文】。

作者:

英特爾公司人工智能資深架構師沈海豪、英特爾公司人工智能資深軟件工程師程文華、英特爾公司人工智能軟件工程師陸崟彤、何欣、郭恒、王暢、王夢妮,他們都在從事模型量化及壓縮的研究與優化工作。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-04-08 13:59:03

大模型Replicate

2025-04-22 08:08:37

2025-07-08 03:22:00

大模型參數AI

2024-08-02 14:50:00

數據AI

2023-11-03 07:47:12

機器資源大模型:

2025-03-04 10:13:45

2022-12-01 09:34:01

模型論文

2024-12-04 10:35:21

2024-11-01 10:16:09

API開源項目

2025-09-28 01:55:00

GGUF大模型GPT

2023-10-28 13:29:27

2025-10-10 07:48:12

大模型預訓練初始化

2023-05-26 00:43:08

2025-03-31 00:33:00

2025-03-06 07:28:31

DeepSeek大模型人工智能

2023-03-03 13:06:34

大腦分層預測

2023-07-28 08:08:09

大淘寶數據模型數據治理
點贊
收藏

51CTO技術棧公眾號

北岛玲一区二区| 日本www在线视频| 国产模特av私拍大尺度| 欧美视频网站| 精品调教chinesegay| 一级特黄性色生活片| 成人福利网站| 99re这里只有精品首页| 国产精品国产福利国产秒拍| 日日噜噜夜夜狠狠久久波多野| 风间由美一区二区av101 | 日韩一区二区高清| 浮妇高潮喷白浆视频| 人人干在线视频| 91在线视频播放| 91精品久久久久久| 久草手机在线观看| 午夜日韩视频| 中文字幕国内精品| 免费中文字幕av| 日韩精品一区二区三区中文在线 | 国产日韩久久久| 欧美激情精品久久久六区热门| 亚洲欧美中文另类| 蜜桃色一区二区三区| 精品肉辣文txt下载| 亚洲成a人v欧美综合天堂| 亚洲五月六月| 激情视频在线观看免费| 懂色中文一区二区在线播放| 国产欧美精品一区二区三区介绍| 日韩精品在线观看免费| 午夜精品网站| 久久视频在线视频| 日韩av片在线| 欧美日韩xxxx| 亚洲免费高清视频| 亚洲av无一区二区三区久久| 日韩亚洲国产免费| 欧美综合久久久| 亚洲乱码国产一区三区| 羞羞的视频在线观看| 国产精品久久久久久久久果冻传媒| 久久伊人一区| 日本一区视频| 2021久久国产精品不只是精品| 大波视频国产精品久久| 99久久夜色精品国产亚洲| 久久se这里有精品| 国产主播在线一区| 中文字幕一区二区人妻痴汉电车| 久久夜色精品| 国产福利视频一区二区| 国产一级淫片a视频免费观看| 国产欧美日韩亚洲一区二区三区| 国语自产偷拍精品视频偷| 欧美激情一区二区视频| 欧美日韩精品免费观看视频完整| 欧美成人免费观看| 久久久久久欧美精品se一二三四| 国产精品a级| 欧美激情第一页xxx| 久久久久久久久久久久久久久久久| 欧美高清不卡| 久久久在线观看| 成人免费区一区二区三区| 99亚洲一区二区| 欧美在线视频免费| 波多野结衣午夜| 久久er99热精品一区二区| 成人国内精品久久久久一区| h狠狠躁死你h高h| 成人爱爱电影网址| 久久久久一区二区| av片在线看| 伊人夜夜躁av伊人久久| 国产va亚洲va在线va| 日韩伦理精品| 欧美日韩国产在线观看| 肉色超薄丝袜脚交| 国产精品美女在线观看直播| 日韩毛片在线观看| 任你操精品视频| 黄色亚洲免费| 日韩美女写真福利在线观看| 一本到在线视频| 床上的激情91.| 欧美另类一区| 毛片在线视频| 精品久久久久久国产| 亚洲不卡视频在线| 无码国模国产在线观看| 日韩精品一二三四区| 国产免费嫩草影院| 在线成人h网| 国产美女搞久久| 三级网站免费观看| 国产精品视频在线看| 奇米777四色影视在线看| 日本不卡免费高清视频在线| 欧美日韩在线不卡| 亚洲免费观看在线| 欧美裸体在线版观看完整版| 麻豆一区二区在线观看| 国产91精品一区| 国产乱人伦偷精品视频免下载| 农村寡妇一区二区三区| 国产精品久久麻豆| 色综合久久中文综合久久97| 中文字幕乱妇无码av在线| 九色精品91| 久久久久久国产精品三级玉女聊斋| 欧美一级淫片免费视频黄| 韩国女主播成人在线观看| 国产日韩欧美二区| 国产一二区在线| 色www精品视频在线观看| www.四虎精品| 久久精品青草| 国产精品久久久久久五月尺| 色呦呦中文字幕| 亚洲精品国产高清久久伦理二区| 中文久久久久久| 亚洲人成网www| 韩国日本不卡在线| 国产黄色片免费观看| 国产精品久久久爽爽爽麻豆色哟哟| 噜噜噜久久亚洲精品国产品麻豆| 涩涩屋成人免费视频软件| 丝袜亚洲欧美日韩综合| 一级做a爰片久久毛片| av一区二区三区| 妞干网在线播放| 久久99成人| 久久精品成人欧美大片古装| 中文字幕人妻一区二区在线视频 | 久久国产精品99久久久久久老狼| 欧美日韩精品免费观看视一区二区| 成全电影大全在线观看| 91精品国产色综合久久ai换脸 | 亚洲一区视频在线| 五月天婷婷影视| 久久香蕉国产| 国产精品自产拍在线观| 高清av电影在线观看| 色婷婷狠狠综合| 最近中文字幕在线mv视频在线 | 日韩有码第一页| 亚洲自拍偷拍综合| 亚洲成人激情小说| 欧美午夜视频| 国产精品嫩草在线观看| 免费男女羞羞的视频网站在线观看 | 国产剧情在线观看一区二区| 亚洲精品在线观看免费| 婷婷午夜社区一区| 亚洲一区二区久久久| 国产精品成人久久久| 日本一区二区成人| 自拍偷拍一区二区三区四区| 国产精品99一区二区三区| 成人在线视频网| av超碰免费在线| 亚洲国产日韩欧美在线动漫| 天天干天天干天天| 久久在线免费观看| 日韩肉感妇bbwbbwbbw| 97精品在线| 97国产超碰| 国产夫妻在线播放| 精品伊人久久97| 亚洲综合成人av| 亚洲欧洲99久久| 欧美图片自拍偷拍| 久久久久久婷| 三年中文高清在线观看第6集| 久久中文字幕一区二区| 久久久久久久久久久久久久久久久久av | 三级亚洲高清视频| 亚洲欧美在线网| 一区中文字幕电影| 人人做人人澡人人爽欧美| 91短视频版在线观看www免费| 51精品久久久久久久蜜臀| 国产小视频在线观看免费| 久久久久国产精品人| 99国产精品久久久久久| 尤物精品在线| 亚洲精美视频| 精品视频高潮| 成人性教育视频在线观看| heyzo一区| 正在播放欧美一区| 亚洲精品无码专区| 色94色欧美sute亚洲线路一久| 538任你躁在线精品视频网站| av午夜精品一区二区三区| www.com黄色片| 亚洲精选91| 99热一区二区三区| 天堂综合网久久| 亚洲qvod图片区电影| 免费一二一二在线视频| 久久久国产视频| 偷拍自拍在线| 欧美一区二区三区白人| 高潮毛片又色又爽免费| 亚洲专区一二三| 黄色片网站在线播放| 26uuu欧美| 农村末发育av片一区二区 | 亚洲精品菠萝久久久久久久| 日韩一级av毛片| 99视频一区二区| 日本少妇一区二区三区| 日韩高清在线观看| 婷婷五月综合缴情在线视频| 自拍日韩欧美| 亚洲制服中文| jiujiure精品视频播放| 狠狠干一区二区| 亚洲精品在线播放| 成人精品视频99在线观看免费| 久久野战av| 国产69久久精品成人| 日本理论片午伦夜理片在线观看| 丝袜情趣国产精品| av网站在线播放| 一本大道亚洲视频| 男男电影完整版在线观看| 亚洲成人精品视频| 亚洲成人av综合| 日韩欧美一区中文| 国产又黄又粗又硬| 欧美日韩高清一区二区| 在线观看国产一区二区三区| 91国偷自产一区二区三区成为亚洲经典| 日本天堂网在线观看| 亚洲综合网站在线观看| 欧美国产日韩在线观看成人| 亚洲欧洲精品一区二区三区不卡| 久久日免费视频| 国产精品午夜电影| youjizz亚洲女人| 日本一二三不卡| 亚洲女同二女同志奶水| 国产精品美日韩| 少妇高潮在线观看| 亚洲欧美国产高清| 欧美日韩偷拍视频| 亚洲专区一二三| 永久免费看片在线播放| 欧美日韩激情美女| 亚洲欧美偷拍一区| 精品视频999| 国产精选久久久| 欧美大片在线观看一区| 亚洲av无码乱码国产麻豆| 欧美sm极限捆绑bd| 午夜视频在线免费播放| 亚洲欧美日韩一区在线| 国产在线视频福利| 最新的欧美黄色| 中文字幕在线播放网址| 久久久人成影片一区二区三区观看| av中文字幕在线看| 欧美在线国产精品| a∨色狠狠一区二区三区| 国产中文日韩欧美| 一区三区自拍| 日本欧美精品久久久| 欧美好骚综合网| 97中文字幕在线| 久久午夜精品| 欧美一级小视频| av网站一区二区三区| 美女被到爽高潮视频| 一区在线观看视频| 国产精品成人久久| 在线观看视频91| wwwav在线播放| 精品无人国产偷自产在线| 日本精品在线| 性色av一区二区三区在线观看| 日日av拍夜夜添久久免费| 国产欧美日韩专区发布| 999久久久久久久久6666| 欧美综合激情| 欧美黄在线观看| 国产精品欧美激情在线观看| 韩国精品在线观看| 国产传媒第一页| 亚洲女厕所小便bbb| 天码人妻一区二区三区在线看| 欧美精品在线观看一区二区| 日本韩国免费观看| 中文字幕av一区中文字幕天堂| 超碰97免费在线| 91精品久久久久久久久不口人| 麻豆成人入口| 亚洲成人动漫在线| 蜜乳av另类精品一区二区| 日本女人性视频| 国产精品私人影院| 国产黄色片免费看| 日韩欧美中文一区| yourporn在线观看视频| 国内精品久久久久久影视8| 欧美亚洲二区| 欧美精品一区在线| 一区二区自拍| 污污视频在线免费| 亚洲国产成人自拍| 亚洲自拍一区在线观看| 欧美精品一区二区蜜臀亚洲| 国产盗摄在线观看| 国产精品免费在线免费| 亚洲另类春色校园小说| 成人免费a级片| 国产一区二区精品久久| 国产精品20p| 欧美性xxxx在线播放| 国产综合无码一区二区色蜜蜜| 久久精品99久久久久久久久| 久久xxx视频| 色综合影院在线观看| 国产精品日本| avtt香蕉久久| 午夜欧美大尺度福利影院在线看| 国产精品无码天天爽视频| 中文字幕不卡av| 97精品国产99久久久久久免费| 欧美亚洲国产免费| 国产日本精品| 日韩免费高清一区二区| 亚洲一区二区3| 亚洲经典一区二区三区| 欧美日韩成人网| 清纯唯美激情亚洲| 可以免费看的黄色网址| 狠狠色狠狠色综合| 男的操女的网站| 日韩免费成人网| 欧美亚洲天堂| 国产欧美欧洲| 99pao成人国产永久免费视频| 大尺度在线观看| 午夜不卡在线视频| 亚洲人成色777777老人头| 51午夜精品视频| 精品freesex老太交| 在线免费视频a| 中文字幕一区二区三区视频| ,亚洲人成毛片在线播放| 日韩一级裸体免费视频| 一区二区三区无毛| 国风产精品一区二区| 国产jizzjizz一区二区| 国产精品16p| 亚洲欧洲成视频免费观看| 免费观看一级欧美片| 五月天亚洲综合情| 国精产品一区一区三区mba桃花 | 亚洲自拍偷拍第一页| 欧美黄在线观看| 玖玖爱在线精品视频| 色婷婷精品大在线视频| 在线视频1区2区| 91av免费看| 国产一区二区三区久久久久久久久| 玖玖爱在线观看| 欧美日韩中字一区| 亚洲性图自拍| 久久99精品久久久久久三级| 日韩av成人高清| 美国黄色小视频| 国产视频久久网| 中文字幕综合| 国产精品无码一区二区在线| 国产欧美日本一区二区三区| 99久久国产热无码精品免费| 26uuu另类亚洲欧美日本老年| 欧美中文字幕一区二区| 69久久精品无码一区二区| 欧美日韩国产专区| 国产日产一区二区三区| 久久久久久久久一区二区| 精品一区二区三区视频在线观看| 日韩精品在线免费看| 中文字幕日韩av综合精品| 亚洲精品aⅴ| av在线无限看| 亚洲国产精品人人做人人爽| 成人免费一区二区三区视频网站| 91国产在线播放| 日韩精品电影在线| 久久久久亚洲av片无码下载蜜桃| 国产亚洲精品成人av久久ww| 999在线精品| 成人av毛片在线观看|