精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟BitDistill將LLM壓縮到1.58比特:10倍內存節省、2.65倍CPU推理加速

人工智能 新聞
近期研究提出了極低比特(extreme low-bit)LLM,例如使用 1.58 比特(即三值 {-1, 0, 1})表示的 BitNet。這種方法旨在顯著降低內存占用并加速推理,從而為 LLM 在下游應用中的高效部署提供一條可行途徑。

大語言模型(LLM)不僅在推動通用自然語言處理方面發揮了關鍵作用,更重要的是,它們已成為支撐多種下游應用如推薦、分類和檢索的核心引擎。盡管 LLM 具有廣泛的適用性,但在下游任務中高效部署仍面臨重大挑戰。隨著模型規模的急劇擴大,這些挑戰被進一步放大,尤其是在資源受限的設備上(如智能手機),內存占用和計算開銷都變得極其昂貴。

為應對這些問題,近期研究提出了極低比特(extreme low-bit)LLM,例如使用 1.58 比特(即三值 {-1, 0, 1})表示的 BitNet。這種方法旨在顯著降低內存占用并加速推理,從而為 LLM 在下游應用中的高效部署提供一條可行途徑。

然而,要讓 1.58 比特的 BitNet 在下游任務中達到與高精度模型相媲美的準確率,通常需要從零開始在大規模語料上進行預訓練,這會帶來巨大的計算和能耗成本。

如圖 1 所示,直接對已有的全精度 LLM 進行 1.58 比特量化感知訓練(Quantization-Aware Training, QAT)時,在特定下游任務上的訓練過程往往不穩定,難以保持原有的性能,并表現出較差的可擴展性:當模型規模從 0.6B 增大到 4B 時,相對于全精度基線的性能差距從 13.9 擴大到 15.3。

這一現象凸顯出:迫切需要專門為 1.58 比特 BitNet 設計的更有效的量化感知訓練方法。

在本研究中,來自微軟的研究者聚焦于將已有的 LLM 微調至 1.58 比特以適配特定下游任務,同時保持與全精度模型相當的性能。為此,本文提出了 BitDistill(BitNet Distillation)—— 一種具備良好可擴展性的量化感知訓練(QAT)框架,旨在彌合極端 1.58 比特量化與實際部署之間的性能差距。

在四個基準任務及多種模型規模上的大量實驗表明,BitDistill 具有出色的可擴展性,其下游任務性能可與全精度基線持平。同時,如圖 1 所示,BitDistill 在 CPU 上實現了 10 倍的內存節省和 2.65 倍的推理加速,顯著改善了延遲、吞吐量、內存效率和能耗,使其特別適合部署在資源受限的硬件平臺上。

  • 論文地址:https://www.arxiv.org/pdf/2510.13998
  • 代碼地址:https://github.com/microsoft/BitNet
  • 論文標題:BitNet Distillation

方法介紹:BitDistill

本文針對在資源受限設備上部署 LLM 以執行特定下游任務。重點是高效地將現有的預訓練 LLM 壓縮為 1.58 比特的 BitNet 模型,同時盡量減少性能損失與訓練成本。

BitDistill 框架包含三個關鍵階段:

第一階段:模型精煉階段。

與全精度模型不同,在標準初始化方案下,全精度模型的隱藏狀態方差通常能夠保持在一個穩定范圍內;而低比特量化模型(如 1.58 比特 LLM)則常常遭受過大的激活方差問題,導致優化過程不穩定并造成收斂性能下降。

為緩解這一問題,借鑒先前 1.58 比特 BitNet 的設計原則,本文在每個 Transformer 模塊內的關鍵位置引入了額外的歸一化層(SubLN),以實現穩定的優化過程。

第二階段:持續預訓練階段。

如圖 1 所示,直接將已有的全精度 LLM 轉換為 1.58 比特 BitNet 并在下游任務上進行微調,往往會得到次優結果。這是因為有限的訓練 token 數量不足以有效地將全精度權重適配到受限的 1.58 比特表示空間中,從而導致可擴展性較差:隨著模型規模的增大,其性能與全精度基線之間的差距也隨之擴大。

為此,本文提出了一個兩階段訓練流程:首先進行持續訓練階段,利用少量預訓練語料來實現所需的適配;隨后再在下游任務上進行微調。

第三階段:基于蒸餾的微調。

為更有效地緩解由精度降低帶來的性能退化,本文在下游任務微調階段引入了兩種知識蒸餾技術:其中,微調后的全精度 LLM 作為教師模型,而其 1.58 比特量化版本作為學生模型,通過蒸餾過程進行學習與性能對齊。

蒸餾過程主要利用 logits 蒸餾和多頭注意力蒸餾來恢復全精度性能。

實驗

實驗設置

BitDistill 方法的有效性在兩個代表性任務上進行評估:文本分類與文本摘要。分類任務采用通用語言理解評估 (GLUE) 基準中的 MNLI、QNLI 與 SST-2 三個數據集,摘要任務使用 CNN/DailyMail (CNNDM) 數據集。所有數據集均用于訓練與評估,以全面驗證方法性能。

BitDistill 的目標是將預訓練的全精度大語言模型 (LLM) 微調為適用于下游任務的 1.58-bit BitNet 模型。比較對象包括:

 (1) 在相同任務上直接微調的全精度 FP16 模型 (FP16-SFT);

 (2) 將全精度模型量化為 1.58-bit BitNet 后再微調的模型 (BitNet-SFT)。

實驗以 Qwen3 系列為基礎模型,涵蓋 0.6B、1.7B 與 4B 三種規模,并額外測試了 Qwen2.5 與 Gemma 等替代骨干網絡以評估模型類型影響。所有方法均采用貪心搜索確定學習率與訓練輪數,以兼顧性能與公平比較。最大訓練序列長度設為 512,批大小為 32,所有模型均在配備 8 塊 AMD Mi300X GPU 的服務器上訓練。

Logits 蒸餾溫度設為 5.0;分類任務中 λ=10、γ=1e5,摘要任務中 λ=1、γ=1e3,所有實驗中 αi=1.0。持續預訓練階段使用 FALCON 語料庫中采樣的 100 億個 token,與從頭訓練 1.58-bit 模型所需的約 4 萬億個 token 相比,成本幾乎可忽略。

評估設置

采樣參數固定為 top-p=1.0、溫度 = 0。分類性能以準確率衡量,摘要性能使用 BLEU、ROUGE-1/2/L/SUM 評估,最大生成長度為 4096 token。運行時效率通過 16 線程 CPU 的 token 吞吐量(tokens/s)報告。

主要結果

BitDistill 在各基準數據集上表現如表 1 與表 2 所示。與全精度基線相比,1.58-bit 模型在準確率和摘要質量上保持接近性能,同時推理速度提升約 2 倍,內存占用減少近 10 倍,展示出在資源受限環境下的顯著優勢。這表明通過合理蒸餾策略,激進量化仍可實現高性能。

文本分類任務上的結果。所有模型均由 Qwen3 系列 [QY+25] 初始化。每個指標和數據集的最高分均以粗體突出顯示。1.58-bit 的 BitDistill 模型實現了與 FP16 基線相當的性能,同時在所有數據集上將推理速度提升了 2 倍,并將內存占用降低了 10 倍。符號 * 表示在 BitDistill 中所使用的 FP16 教師模型。

文本摘要任務(CNNDM 數據集)上的結果。所有模型均由 Qwen3 系列 [QY+25] 初始化。每個指標和數據集的最高分均以粗體突出顯示。1.58-bit 的 BitDistill 模型實現了與 FP16 基線相當的性能,同時在所有數據集上將推理速度提升了 2 倍,并將內存占用降低了 10 倍。符號 * 表示在 BitDistill 中所使用的 FP16 教師模型。

將基礎模型替換為 Qwen2.5 和 Gemma 后,BitDistill 仍保持穩定性能(見表 4)。雖然不同預訓練模型間存在輕微波動,但整體趨勢一致,顯示該方法具備跨架構通用性和良好的部署適應性。

不同量化技術在文本分類任務上的結果。B、G、A 分別代表塊量化、GPTQ 和 AWQ。

消融實驗

 BitDistill 包含三個階段。消融實驗表明,移除任一階段均顯著降低性能(表 5),說明各階段相互補充,完整流程對效率與準確率平衡至關重要。

BitDistill 中不同階段的效果。此處使用 Qwen3 0.6B 作為基礎模型。M.D.、C.T. 和 D.T. 分別表示建模優化、持續預訓練以及基于蒸餾的微調。

在第三階段中,單獨使用 logits 蒸餾或注意力蒸餾均能提升性能,但聯合使用效果最佳(表 6)。兩種技術從不同角度緩解量化優化難題,其協同作用在極低比特環境下尤為顯著。

蒸餾技術的效果。此處,LD 表示公式 9 中的 logits 蒸餾,AD 表示公式 12 中的多頭注意力蒸餾。

BitDistill 與 Block-Quant、GPTQ、AWQ 等多種量化方案兼容。實驗顯示:(1) 無論底層量化方法為何,BitDistill 均能穩定提升性能;(2) GPTQ、AWQ 等復雜量化策略在其基礎上進一步增強效果。這表明 BitDistill 提供了一種普適的低比特模型增強框架。

分析

在階段一中插入 SubLN 層能穩定 1.58-bit BitNet 的優化并加速收斂。如圖 3 (a) 所示,帶 SubLN 的模型在 FALCON 語料庫上的微調表現優于未使用 SubLN 的版本。

(a) 使用 SubLN 將現有的大語言模型 (LLMs) 微調為 1.58-bit BitNet,可以獲得更優的性能和更快的收斂速度。

持續訓練可顯著縮小大模型的 1.58-bit 與 FP16 性能差距。權重分布可視化(圖 2)顯示,經過持續訓練后,BitNet 權重從近似高斯分布轉變為更接近從頭訓練的分布。該特征促使權重集中于 0 與 ±1 過渡區域,增加梯度更新的敏感度,從而提升模型對下游任務的擬合能力。

模型權重的可視化。上面兩行展示了從頭開始訓練的 BitNet 的量化權重,及其對應的 FP16 分布。下面兩行展示的是從 LLM 加載權重并進行持續訓練后,BitNet 的量化權重及其對應的 FP16 分布。

在第三階段,單層注意力蒸餾優于多層蒸餾(圖 3 (b))。后期層的蒸餾效果更佳,表明層選擇對蒸餾質量至關重要。

(b) 在 Qwen3 0.6B 模型上,通過蒸餾不同層所獲得的 MNLI 準確率對比。

使用更大規模的 FP16 教師(如 Qwen3-1.7B、Qwen3-4B)顯著提升學生模型性能(圖 3 (c)),甚至超越同規模的 FP16 模型,證明高質量教師能為 BitDistill 帶來額外收益。

(c) 使用不同規模的 FP16 教師模型對 Qwen3-0.6B 進行蒸餾,所獲得的 MNLI 準確率對比。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-23 14:06:53

微軟研究

2024-12-05 13:50:00

AI大模型

2024-07-08 13:04:01

2021-07-27 10:10:21

CuPyNumpyPython

2025-07-24 16:34:25

AI模型測試

2020-02-25 17:40:52

Python循環內存

2013-09-24 09:40:41

Java圖形加速

2025-04-27 09:15:40

2024-12-26 16:00:00

英特爾推理模型

2019-12-25 14:08:50

Pandas數據計算

2025-05-28 08:51:00

大模型華為LLM

2024-08-01 08:40:00

2022-10-31 15:35:16

開源引擎

2023-12-19 13:32:00

模型數據

2025-07-11 08:54:00

2025-07-10 09:14:37

2023-09-10 12:37:38

模型英偉達

2025-06-11 09:15:51

2025-06-11 14:39:50

AILLMMistral

2020-07-22 01:21:26

軟件開發開發代碼
點贊
收藏

51CTO技術棧公眾號

中文字幕乱码无码人妻系列蜜桃| 久久黄色片网站| 无码精品在线观看| 99亚洲一区二区| 亚洲少妇中文在线| 亚洲第一区第二区第三区| 色操视频在线| 久久久久久久久久电影| 亚洲aⅴ日韩av电影在线观看 | 亚洲精品怡红院| av毛片在线免费看| 久久久综合精品| 成人免费高清完整版在线观看| 日本午夜精品理论片a级app发布| 欧美日韩国产在线观看网站 | 极品少妇一区二区三区| 亚洲日本中文字幕| 特黄特色免费视频| 国产成人午夜性a一级毛片| 香蕉加勒比综合久久| 艳色歌舞团一区二区三区| 凸凹人妻人人澡人人添| 国产在线视频精品一区| 国产成人黄色av| 黄色小视频在线免费看| 国产精品精品| 亚洲男女自偷自拍图片另类| 日韩精品国产一区| 99视频有精品高清视频| 日本国产一区二区| 青青青免费在线| 丝袜在线视频| 亚洲欧美激情小说另类| 亚洲高清在线观看一区| 欧美在线 | 亚洲| 国产电影一区二区三区| 成人a视频在线观看| 最近中文字幕免费观看| 日韩一区精品视频| 日本不卡高字幕在线2019| 国产极品在线播放| 欧美精品观看| 欧美第一页在线| xxxx日本少妇| 一个色综合网| 九九热这里只有精品免费看| 亚洲二区在线播放| 中出一区二区| 九九久久综合网站| www青青草原| 香蕉久久网站| 久久精品久久精品亚洲人| 91大神福利视频| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 亚洲精品电影在线| 在线免费观看a级片| 群体交乱之放荡娇妻一区二区| 精品日韩在线观看| 精品人妻伦一二三区久| 久久激情av| 亚洲精品一区av在线播放| aaaaa级少妇高潮大片免费看| 啪啪激情综合网| 亚洲人av在线影院| 手机看片日韩av| 忘忧草精品久久久久久久高清| 久久久国产成人精品| 四虎免费在线视频| 99成人免费视频| 国产97免费视| 在线观看国产精品入口男同| 激情久久久久久久久久久久久久久久| 91热福利电影| 日韩一区二区三区在线观看视频| 99久精品国产| 日韩精品久久久免费观看| 国产黄色免费在线观看| 综合在线观看色| 欧美乱做爰xxxⅹ久久久| 国产传媒在线| 欧美丝袜自拍制服另类| 天堂av8在线| 一区二区三区四区高清视频| 亚洲精品美女在线| 国产伦精品一区二区三区视频女| 91精品国产乱码久久久久久| 久久久久久亚洲精品中文字幕| 天天干天天干天天| 看片的网站亚洲| 国产福利久久精品| 浮生影视网在线观看免费| 亚洲品质自拍视频| 国产在线青青草| 先锋影音网一区二区| 精品国产自在久精品国产| 亚洲国产av一区| 你懂的亚洲视频| 国产精品a久久久久久| 国产三级精品在线观看| 91免费视频观看| 日本成人性视频| 免费高潮视频95在线观看网站| 精品视频一区 二区 三区| 国产女人18毛片水真多18| 精品国产精品久久一区免费式| 欧美精品一区三区| 高潮无码精品色欲av午夜福利| 国产成人精品1024| 色女孩综合网| 日本在线影院| 精品日产卡一卡二卡麻豆| 一区二区三区在线观看免费视频| 欧美精品首页| 国产精品三级在线| 色视频在线观看免费| 一区二区三区久久久| 国产精品视频分类| 欧美福利在线播放网址导航| 久久这里有精品| 亚洲国产无线乱码在线观看| 99精品欧美一区二区三区综合在线| 精品少妇人妻av一区二区| 卡通欧美亚洲| 亚洲国产精品99| 男女做暖暖视频| 麻豆精品视频在线观看免费| 日韩经典在线视频| 成人性生交大片免费观看网站| 欧美sm美女调教| 内射一区二区三区| 国产在线麻豆精品观看| 亚洲不卡1区| 美女91在线看| 亚洲激情成人网| 国产真人真事毛片| 福利一区二区在线| 激情成人开心网| 亚洲一区电影| 欧美国产在线电影| 亚洲国产精品18久久久久久| 亚洲精品久久7777| 国产精品嫩草影视| 欧美一区综合| 成人h视频在线观看| 伊人222成人综合网| 日韩一区二区三区免费观看| 午夜精品一区二区三区视频| 国产伦精品一区二区三区免费| 中文字幕剧情在线观看一区| 日本久久二区| 久久久精品国产| jlzzjlzz亚洲女人18| 亚洲免费在线电影| 国产精品中文久久久久久| 中文字幕一区二区三区乱码图片| 成人性生交大片免费看视频直播| 黄色在线论坛| 日韩午夜中文字幕| 国产大片中文字幕在线观看| 菠萝蜜视频在线观看一区| 日日碰狠狠添天天爽超碰97| 台湾佬综合网| 国产精品成人播放| 国产原厂视频在线观看| 日韩免费成人网| 国产香蕉视频在线| 国产拍揄自揄精品视频麻豆| 亚洲综合日韩欧美| 一区二区三区四区在线观看国产日韩 | 波多野结衣一区二区三区在线| 国产视频一区不卡| 午夜啪啪小视频| 欧美视频网站| 免费国产一区| 国精品产品一区| 欧美黄色免费网站| 秋霞av在线| 欧美绝品在线观看成人午夜影视| 草视频在线观看| 97久久超碰国产精品电影| 青青青在线视频免费观看| 国产精品久久久乱弄| 国产经典一区二区三区| sis001欧美| 大胆欧美人体视频| 亚洲欧美日本在线观看| 欧美人与禽zozo性伦| 国产一级av毛片| 欧美国产成人精品| 欧美午夜精品一区二区| 久久亚洲色图| 日韩小视频网站| 日本欧美肥老太交大片| 成人免费91在线看| 日韩精品第一| 久久久亚洲成人| 日本视频在线免费观看| 亚洲第一二三四五区| 亚洲视频在线观看免费视频| 亚洲高清视频在线| 日本午夜在线观看| 久久婷婷一区二区三区| 九九九九九九九九| 久久亚洲一区| 国产深夜男女无套内射| 五月婷婷亚洲| 日韩欧美在线观看强乱免费| 99国产精品免费网站| 国产精品高精视频免费| 九九色在线视频| 日韩亚洲综合在线| 国产在线色视频| 亚洲成人a级网| 国产jzjzjz丝袜老师水多| 91福利国产精品| 99久久精品国产亚洲| 亚洲综合一区二区精品导航| 激情五月激情综合| 国产三级精品三级| 搡老熟女老女人一区二区| 国产一区视频网站| 欧美婷婷精品激情| 日本在线观看不卡视频| www.爱色av.com| 亚洲精品国产日韩| 国产精品久久久久久久乖乖| 亚洲区综合中文字幕日日| 日本一区二区三区视频在线观看| 老汉色老汉首页av亚洲| yy111111少妇影院日韩夜片| www久久久| 成人字幕网zmw| 欧美高清xxx| 国产免费成人av| 91成人在线| 国产精品电影在线观看| 亚洲伦乱视频| 国产精品av免费在线观看| 成人小电影网站| 国产精品69久久久久| 日韩精品影片| 国产精品久久久久久久av大片| 厕沟全景美女厕沟精品| 2019av中文字幕| 中文字幕不卡三区视频| 91av在线免费观看视频| 午夜影院在线观看国产主播| 5566成人精品视频免费| 在线高清av| 国产成人亚洲综合91| 日韩av一级| 国产精选久久久久久| 一区二区三区日本视频| 2019国产精品视频| 成人在线超碰| 欧美日韩高清免费| 欧美日韩一二三四| 日本福利视频导航| 欧美激情综合色综合啪啪| 无码人妻精品一区二区蜜桃网站| 黄色精品网站| 国产乱子伦农村叉叉叉| 日韩中文字幕91| 日韩国产高清污视频在线观看| 日本亚洲色大成网站www久久| 亚洲国产精品一区二区久久恐怖片 | 神宫寺奈绪一区二区三区| 日韩高清不卡av| 成人在线免费电影| www国产亚洲精品久久网站| 成人看av片| 欧美野外猛男的大粗鳮| 欧美大片1688网站| 99国产高清| 免费黄色成人| 青青在线免费视频| 亚洲精华国产欧美| 美女黄色片视频| 东方aⅴ免费观看久久av| 少妇按摩一区二区三区| 国产精品视频一二三区 | 五月婷婷激情综合| 久久精品无码av| 欧美放荡的少妇| 亚洲av成人精品一区二区三区在线播放 | 99久久精品免费看国产一区二区三区| 狼人精品一区二区三区在线| 午夜欧美性电影| 亚洲视频日本| 91极品尤物在线播放国产| 国产河南妇女毛片精品久久久| 性色av蜜臀av色欲av| 亚洲欧洲韩国日本视频| 日韩毛片在线视频| 欧美群妇大交群中文字幕| 天天干天天草天天射| 精品国内亚洲在观看18黄| 国产夫妻在线| 亚洲永久免费观看| 国产日韩视频在线| www.成年人视频| 老鸭窝一区二区久久精品| 久久国产精品无码一级毛片| 亚洲欧洲av在线| 无码人妻久久一区二区三区| 精品女同一区二区| 免费网站成人| 日韩av免费在线| 久久视频在线观看| 艳母动漫在线观看| 欧美aa在线视频| aaaaaav| 亚洲国产精品久久人人爱蜜臀| 在线观看毛片av| 亚洲小视频在线| 松下纱荣子在线观看| 国产精品国产三级欧美二区| 911久久香蕉国产线看观看| 亚洲色精品三区二区一区| av色综合久久天堂av综合| 麻豆视频在线观看| 欧美一区二区视频观看视频| 91青青在线视频| 国产成人精品免费久久久久| 日本一区福利在线| 国产夫妻自拍一区| 国产老妇另类xxxxx| 国产黄色录像片| 欧美色综合网站| 国产精品免费观看| 国产精品久久久久91| 国内精品久久久久久久久电影网 | 黄色激情在线播放| 国产成人av一区二区三区| 这里只有精品在线| 999热精品视频| 亚洲欧美日韩一区| 国内精品国产成人国产三级| 久久精品国产69国产精品亚洲 | 国产精品丝袜xxxxxxx| 中文字幕1区2区| 亚洲午夜久久久久| 亚洲精品免费在线观看视频| 欧美福利在线观看| 精品国产18久久久久久洗澡| 美女扒开大腿让男人桶 | 黑人と日本人の交わりビデオ| 色婷婷激情久久| 九色在线视频| 国产精品久久久久久一区二区| 欧美精选视频在线观看| 亚洲综合日韩欧美| 亚洲三级在线播放| 亚洲经典一区二区三区| 欧美精品国产精品日韩精品| 久久男人av| 亚洲欧美另类动漫| 国产精品久久久久aaaa| 国产精品无码久久久久成人app| 久久精品国产91精品亚洲| 91麻豆精品国产91久久久更新资源速度超快| 伊人狠狠色丁香综合尤物| 国产最新精品精品你懂的| 欧美日韩综合一区二区| 亚洲高清色综合| 午夜日韩成人影院| 曰韩不卡视频| 成人免费av网站| 黄色片视频免费| 色爱av美腿丝袜综合粉嫩av| 精品亚洲二区| 69堂免费视频| 中文字幕在线观看一区| 亚洲精品成av人片天堂无码 | 精品国产亚洲一区二区三区| 无码人妻精品一区二区蜜桃网站| av电影在线观看一区| 亚洲中文无码av在线| 欧美成人免费一级人片100| 六月丁香久久丫| 日本不卡一区在线| 亚洲地区一二三色| av中文在线| 国产伦精品一区二区三区| 日本不卡一区二区| 黄色一级视频免费| 一区二区三区高清国产| 欧美国产亚洲精品| 久久人妻精品白浆国产| 亚洲免费观看高清在线观看| 欧美孕妇孕交| 亚洲一区二区三区sesese| 亚洲免费综合| 欧美黑吊大战白妞| 亚洲天堂av综合网| 懂色av一区二区| 日本中文字幕二区| 黑人与娇小精品av专区| 亚洲精品白浆| 亚洲精品视频一二三|