精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

模型壓縮到70%,還能保持100%準確率,無損壓縮框架DFloat11來了

人工智能 新聞
本文,來自萊斯大學等機構的研究者提出了一種解決方案,可以將任何 BFloat16 模型壓縮到原始大小的 70%,同時還能在任務上保持 100% 的準確性。

大型語言模型(LLMs)在廣泛的自然語言處理(NLP)任務中展現出了卓越的能力。然而,它們迅速增長的規模給高效部署和推理帶來了巨大障礙,特別是在計算或內存資源有限的環境中。

例如,Llama-3.1-405B 在 BFloat16(16-bit Brain Float)格式下擁有 4050 億個參數,需要大約 810GB 的內存進行完整推理,超過了典型高端 GPU 服務器(例如,DGX A100/H100,配備 8 個 80GB GPU)的能力。因此,部署該模型需要多個節點,這使得它昂貴且難以獲取。

本文,來自萊斯大學等機構的研究者提出了一種解決方案,可以將任何 BFloat16 模型壓縮到原始大小的 70%,同時還能在任務上保持 100% 的準確性。

圖片


  • 論文標題: 70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float 
  • 論文地址:https://arxiv.org/pdf/2504.11651
  • 項目地址:https://github.com/LeanModels/DFloat11

為了應對 LLM 不斷增長的模型尺寸,通常會采用量化技術,將高精度權重轉換為低位表示。這顯著減少了內存占用和計算需求,有助于在資源受限的環境中實現更快的推理和部署。然而,量化本質上是一種有損壓縮技術,引入了一個基本缺點:它不可避免地改變了 LLMs 的輸出分布,從而影響模型的準確性和可靠性。

相比之下,無損壓縮技術在有效減少 LLM 規模的同時,保留了精確的原始權重,確保模型的輸出分布與未壓縮表示(例如 BFloat16)完全相同。然而,現有的無損方法主要集中在提高 LLMs 的存儲效率上,例如縮小模型檢查點或優化針對專用硬件如 FPGA 的性能上。

本文提出了 DFloat11(Dynamic-Length Float),這是一種無損壓縮框架,可以在保持與原始模型完全相同的輸出的情況下,將 LLM 的規模減少 30%

DFloat11 的提出源于當前 LLM 模型中 BFloat16 權重表示的低熵問題,這暴露出現有存儲格式存在顯著的低效性。通過應用熵編碼技術,DFloat11 根據權重出現頻率為其分配動態長度編碼,在不損失任何精度的情況下實現了接近信息理論極限的壓縮效果。

為了支持動態長度編碼的高效推理,該研究還開發了定制化的 GPU 內核來實現快速在線解壓縮。其設計包含以下內容:

  • 將內存密集型查找表(LUT)分解為適應 GPU SRAM 的緊湊型查找表;
  • 采用雙階段內核設計,通過輕量級輔助變量協調線程讀寫位置;
  • 實現 Transformer 塊級解壓縮以最小化延遲。

該研究在 Llama-3.1、Qwen-2.5 和 Gemma-3 等最新模型上進行了實驗:DFloat11 能在保持比特級(bit-for-bit)精確輸出的同時,將模型體積縮減約 30%。與將未壓縮模型部分卸載到 CPU 以應對內存限制的潛在方案相比,DFloat11 在 token 生成吞吐量上實現了 1.9–38.8 倍的提升。在固定 GPU 內存預算下,DFloat11 支持的上下文長度是未壓縮模型的 5.3–13.17 倍。

值得一提的是,基于該方法 Llama-3.1-405B(810GB)在配備 8×80GB GPU 的單節點上實現了無損推理。

方法介紹

LLM 的權重通常使用浮點數表示,包括 BFloat16 或 BF16,其在數值精度和內存效率之間取得了平衡。然而,BFloat16 表示信息并不高效。

針對 BFloat16 表示法中存在的信息效率低下問題,本文提出了一種無損壓縮框架,通過熵編碼技術對浮點參數進行壓縮。

具體實現包括:基于語言模型線性投影矩陣中所有 BFloat16 權重的指數分布構建霍夫曼樹,對指數部分采用霍夫曼編碼壓縮,同時保留原始符號位和尾數位。壓縮后的指數經過緊密比特打包存入字節數組 EncodedExponent,而未壓縮的符號位和尾數則存儲在獨立字節數組 PackedSignMantissa 中。圖 2 展示了 DFloat11(Dynamic-Length Float)或 DF11,該格式可實現模型參數的高效緊湊表示。

圖片

雖然動態長度浮點數能有效實現 LLM 的無損壓縮,但關鍵挑戰依然存在:如何利用這些壓縮權重進行高效的 GPU 推理。接下來,文章詳細介紹了解決方案,其中包括三個關鍵組成部分:

  1. 將一個龐大的無前綴查找表(LUT)分解為多個適合 GPU SRAM 的緊湊 LUTs;
  2. 引入一個兩階段的內核設計,利用輕量級輔助變量來高效協調線程的讀寫操作;
  3. 在 transformer 塊級別執行解壓縮,以提高吞吐量并最小化延遲。

算法 1 是將 DFloat11 解壓縮為 BFloat16 的 GPU 內核過程。

圖片

實驗

研究人員評估了 DF11 壓縮方法在 GPU 上的有效性及推理效率,將多個主流大語言模型(包括 LLaMA、Qwen、Gemma 等)從 BFloat16 壓縮為 DF11 格式,并報告其壓縮比和性能表現。

在軟硬件環境方面,研究人員使用 CUDA 和 C++ 實現了 DF11 解壓縮內核,并集成至 Transformers 推理框架。實驗基于 HuggingFace Accelerate 框架評估未壓縮模型在 CPU 分流(CPU offloading)和多 GPU 場景下的性能。

為全面分析 DF11 內核在不同硬件配置下的表現,團隊在多種 GPU 和 CPU 組合的機器上進行實驗。

實驗結果 

DF11 壓縮比:DF11 將大語言模型壓縮至原始大小的約 70%(等效位寬為 11 位)。

圖片

表 2 展示了 DF11 在 LLaMA、Qwen、Gemma 等模型上的壓縮效果。所有模型的線性投影層參數均被壓縮為 DF11 格式,壓縮比穩定在 70%。

無損特性驗證:為驗證 DF11 的無損特性,研究人員使用 lm-evaluation-harness 工具在 MMLU、TruthfulQA、WikiText 和 C4 數據集上評估模型性能。

結果表明,壓縮后的模型在準確率和困惑度(Perplexity)上與原始 BFloat16 模型一致(見表 3)。此外,研究人員逐位對比 DF11 解壓后的權重矩陣與原始矩陣,確認其完全相同。

圖片

推理性能:研究人員在多個硬件平臺上比較了 DF11 與 BFloat16 模型的推理效率。對于 BFloat16 模型,當模型超出單 GPU 顯存時,需將部分計算分流至 CPU,而 DF11 模型可完全加載至單 GPU。

評估指標包括延遲(Latency)和吞吐量(Throughput),結果顯示 DF11 模型的性能顯著優于 BFloat16 模型,延遲減少 1.85 至 38.83 倍(見圖 3)。

圖片

節省的顯存可支持更長生成序列:DF11 的顯存節省使模型能夠支持更長的生成序列。如圖 4 所示,在 batch size 為 1 時,DF11 模型的顯存消耗顯著降低,相比 BFloat16 模型最多可生成 5.33 至 13.17 倍的 tokens。

圖片

消融研究 

延遲分析:研究團隊以 Llama-3.1-8B-Instruct 為例,對比了其在 BFloat16 與 DF11 格式下不同 batch 大小時的延遲組成,結果如圖 5 所示。

圖片

相比原始模型,DF11 壓縮模型因解壓 Transformer 模塊與語言建模頭引入了額外延遲但該開銷與 batch size 無關,因此通過提升 batch size 可有效攤銷解壓延遲,使總推理時間之間的差距顯著縮小。

解壓性能對比:研究人員將 DF11 解壓內核的延遲與吞吐表現分別與兩種基線方案進行對比:

  • 將模型權重存儲于 CPU 內存并在需要時傳輸到 GPU;
  • 使用 NVIDIA 的 nvCOMP 庫中的 ANS(不對稱數值系統,Asymmetric Numeral System)解壓方法。

實驗以 Llama-3.1-8B-Instruct 語言建模頭權重矩陣為例,結果如圖 6 所示,DF11 的解壓吞吐量最高分別為 CPU-GPU 傳輸和 ANS 解碼的 24.87 倍和 15.12 倍。此外,DF11 的壓縮比為 70%,優于 nvCOMP 的 78%。值得注意的是,隨著權重矩陣規模的增大,DF11 的解壓吞吐呈上升趨勢,原因是更好的 GPU 線程利用率。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-11 18:05:23

AI大模型工具

2025-04-27 09:15:40

2023-10-10 08:52:43

PNG類型Chinchilla

2022-06-30 10:38:53

Lepton無損壓縮圖片圖片質量

2022-06-08 16:29:45

無損壓縮方案分布式

2022-04-22 10:29:46

機器學習數據集計算

2015-08-31 10:10:48

Dropbox無損壓縮算法云存儲

2022-06-15 16:06:29

LZ4 算法硬件加速

2023-10-26 08:40:15

模型隱私推理

2022-06-15 15:44:21

無損數據壓縮鴻蒙

2023-02-09 09:38:32

算法壓縮

2024-07-02 11:30:00

存儲壓縮算法

2025-10-24 12:14:32

2024-09-29 16:00:26

2023-01-04 20:00:02

SparseGPT降低算力成本

2024-07-15 00:30:00

MetaAI 模型大語言模型

2020-11-20 17:03:11

AI 數據人工智能

2023-05-04 09:39:16

AI模型

2018-06-12 07:15:18

阿里巴巴技術語音識別

2023-11-08 08:38:43

點贊
收藏

51CTO技術棧公眾號

99视频精品在线| av不卡免费看| 日韩美女一区二区三区四区| 小泽玛利亚av在线| 天天综合天天综合| 欧美日韩大片| 国产精品久久综合| 成人黄视频免费| 国产99久久久久久免费看| 91精品一区二区三区综合| 亚洲国产91精品在线观看| 超碰在线公开97| 97人人在线视频| 中文字幕精品一区二区精品绿巨人| 99视频日韩| 精品乱码一区内射人妻无码| 亚洲国产影院| 欧美丰满美乳xxx高潮www| 精品国产三级a∨在线| 午夜激情在线视频| 国产一区二区三区四区五区入口| 欧美在线一级va免费观看| 强行糟蹋人妻hd中文| 国产精品一区二区三区av麻 | 日韩久久中文字幕| 综合在线视频| 宅男66日本亚洲欧美视频| 国产伦精品一区二区三区精品| 精品国产99久久久久久| 久久精品99国产精品| 97视频在线观看亚洲| 国产黄色小视频网站| 欧美色网址大全| 亚洲美女www午夜| 国产高潮失禁喷水爽到抽搐| 午夜不卡一区| 欧美视频一二三区| 成人羞羞国产免费网站| 伊人成综合网站| 亚洲午夜在线观看视频在线| 在线观看18视频网站| 麻豆影视在线观看_| 国产精品天干天干在观线| 欧美午夜精品久久久久久蜜| 免费看国产片在线观看| 国产成人福利片| 99热最新在线| 蜜桃av噜噜一区二区三区麻豆| 黑人巨大精品欧美黑白配亚洲| 国产精品亚洲网站| 销魂美女一区二区| 视频一区中文字幕| 91av在线免费观看视频| 日本中文字幕网| 99国产精品久久久久久久成人热| 欧美精品videos另类日本| 国产一级片免费观看| 日本精品影院| 亚洲激情视频网站| 懂色av粉嫩av蜜乳av| 丝袜连裤袜欧美激情日韩| 亚洲第一精品福利| 在线天堂www在线国语对白| 国产精品22p| 精品国产三级a在线观看| 大尺度在线观看| 欧美大片网址| 亚洲天堂男人天堂| 少妇太紧太爽又黄又硬又爽小说| 日韩国产一区二区| 久久艳片www.17c.com| 欧美成人一区二区三区高清| 亚洲高清毛片| 欧美中文字幕在线| 一本色道久久综合亚洲| 精品亚洲aⅴ乱码一区二区三区| 亚洲mm色国产网站| 少妇无码一区二区三区| 国产色综合一区| 宅男噜噜99国产精品观看免费| av在线下载| 午夜精品123| 99久久国产宗和精品1上映| 亚洲网站免费| 欧美不卡一二三| 右手影院亚洲欧美| 国产精品毛片一区二区在线看| 美日韩精品免费视频| 久草国产精品视频| 日本不卡视频在线| 欧美一级在线播放| 亚洲综合免费视频| www.av亚洲| 台湾成人av| 牛牛精品在线| 欧美性色欧美a在线播放| 午夜诱惑痒痒网| 亚洲免费观看高清完整版在线观| 久久亚洲一区二区三区四区五区高| 国产成人无码精品久在线观看 | 天天操精品视频| 欧美交a欧美精品喷水| 色爱av美腿丝袜综合粉嫩av| 麻豆一区产品精品蜜桃的特点| 日韩在线观看电影完整版高清免费悬疑悬疑| 久久精品一偷一偷国产| 中文字幕一区二区人妻电影| 国产精品一区二区在线看| 欧美一区二区高清在线观看| 污污网站在线免费观看| 国产精品国产三级国产专播品爱网| www.日本在线视频| 免费成人毛片| 亚洲美女久久久| 久久亚洲成人av| 久久99精品久久久久久久久久久久| 久久一区二区三区欧美亚洲| 欧美大胆的人体xxxx| 欧美日韩国产美女| 成人综合久久网| 美女av一区| 日韩成人久久久| 91精品人妻一区二区| 女同性一区二区三区人了人一| 国产精品黄视频| 中文字幕制服诱惑| 99re66热这里只有精品3直播| 国产精品一区二区av| 国产淫片在线观看| 欧美日韩精品一区二区三区| 中文字幕人妻一区二区| 欧美三级午夜理伦三级中文幕| 国产欧美日韩最新| av基地在线| 亚洲女同女同女同女同女同69| 人人爽人人av| 国产伦精品一区二区三区千人斩| 91精品国产成人www| 日本美女一级视频| 亚洲国产cao| 俄罗斯黄色录像| 国模 一区 二区 三区| 97人人做人人人难人人做| www视频在线免费观看| 777午夜精品视频在线播放| 国精产品一区二区三区| 日韩av不卡在线观看| 日韩一区二区三区高清| gogogogo高清视频在线| 欧美精品丝袜中出| 神马久久精品综合| 国产综合成人久久大片91| 最新国产精品久久| 国产95亚洲| 欧美日本高清视频| 免费观看黄一级视频| 午夜成人免费电影| 大地资源二中文在线影视观看| 亚洲自拍另类| 日韩欧美第二区在线观看| 91亚洲视频| 久久久精品视频成人| 成人av无码一区二区三区| 亚洲国产欧美一区二区三区丁香婷| 成年女人免费视频| 久久影院亚洲| 亚洲日本一区二区三区在线不卡 | 国产精品毛片无遮挡高清| 波多野结衣xxxx| 亚洲第一偷拍| 国产日韩精品久久| 日本成人三级电影| 久久精品视频导航| 免费a级片在线观看| 色中色一区二区| 五月婷婷综合激情网| 国产成人小视频| 久久美女福利视频| 99久久激情| 狠狠久久综合婷婷不卡| 黄色片免费在线观看| 欧美一区二区三区影视| 日韩 欧美 亚洲| 亚洲国产成人午夜在线一区| 又黄又爽又色的视频| 国产精品五区| 亚洲乱码国产乱码精品天美传媒| 日本成人精品| 国产成人精品免高潮费视频| 成人免费网址| 日韩激情在线视频| 国产露脸无套对白在线播放| 天天色天天操综合| 日本不卡视频一区| 人人精品人人爱| 男的插女的下面视频| 日韩精品一区二区久久| 国产私拍一区| 99精品国产九九国产精品| 98视频在线噜噜噜国产| 黄色片免费在线观看| 亚洲欧美另类人妖| 亚洲精品成av人片天堂无码| 欧美亚洲禁片免费| 国产成人在线视频观看| 伊人婷婷欧美激情| 亚洲色图 激情小说| 水蜜桃久久夜色精品一区的特点| 国产又粗又爽又黄的视频| 免费毛片在线不卡| 国产精品10p综合二区| 激情网站在线| 日韩专区在线观看| 你懂的在线看| 日本高清不卡在线观看| 久草网视频在线观看| 国产精品视频一二三| theav精尽人亡av| 粉嫩一区二区三区性色av| 玖玖爱视频在线| 久久午夜激情| 国产中文字幕乱人伦在线观看| 日韩在线观看电影完整版高清免费悬疑悬疑| 精品亚洲欧美日韩| 亚洲专区**| 99re视频在线| 久久久久毛片免费观看| 国产日韩精品入口| 第四色男人最爱上成人网| 正在播放亚洲1区| 天堂中文在线8| 在线观看日韩av先锋影音电影院| 一二三四在线观看视频| 26uuu欧美日本| 插我舔内射18免费视频| 成人一区在线观看| 国产二区视频在线播放| 成人3d动漫在线观看| 欧美日韩精品免费观看| 午夜先锋成人动漫在线| 精品无人区一区二区三区| 免费看成人人体视频| 国产在线精品日韩| 日韩美脚连裤袜丝袜在线| 韩国成人一区| 久久久久久久久久久久久久久久久久久久| 99精彩视频| 国产厕拍一区| 久久日韩精品| 久久99免费视频| 色综合久久88色综合天天提莫| 成人情趣视频| 亚洲国产婷婷香蕉久久久久久99| 不卡中文字幕| 综合久久国产| 国产一区二区三区四区三区四| 亚洲色成人www永久在线观看| 伊人久久亚洲热| 国产91在线视频观看| 久久免费国产| 污污网站免费观看| 国产毛片精品国产一区二区三区| 潘金莲一级淫片aaaaa| 成人免费黄色大片| 日韩中文字幕电影| 国产精品久久久久婷婷| 全程偷拍露脸中年夫妇| 亚洲成a人片在线观看中文| 国产成人一区二区三区影院在线 | 九九热精品视频| 好看的中文字幕在线播放| 91av视频在线| 日本午夜免费一区二区| www.久久艹| 亚洲性视频大全| 中文字幕日韩一区二区三区| 韩国亚洲精品| 免费观看成人在线视频| 国产综合成人久久大片91| 少妇激情一区二区三区视频| 国产午夜精品一区二区三区嫩草| 成年人二级毛片| 欧美视频免费在线| 一区二区三区亚洲视频| 精品久久国产字幕高潮| 国产免费永久在线观看| 欧美另类极品videosbest最新版本| а√在线中文网新版地址在线| 国产成人午夜视频网址| 亚洲精品福利| 午夜精品一区二区三区四区| 欧美日韩免费| 人人干人人视频| jlzzjlzz亚洲日本少妇| 天天操夜夜操av| 狠狠久久亚洲欧美专区| 国产精品久久欧美久久一区| 亚洲大胆人体在线| 欧美成人二区| 51午夜精品视频| 精品视频一区二区三区| 日日噜噜噜噜夜夜爽亚洲精品| 激情文学一区| 91网址在线观看精品| 国产午夜亚洲精品午夜鲁丝片| 九九精品在线观看视频| 精品视频在线看| 日本ー区在线视频| 欧美激情区在线播放| www.久久99| 日韩精品一区二区三区色偷偷| 亚洲激情一区| 亚洲国产欧美日韩在线| 中文字幕乱码日本亚洲一区二区| 男人的天堂一区二区| 亚洲精品一区二区三区蜜桃下载 | 国产黄色免费在线观看| 久久久久久亚洲精品中文字幕 | 久久久久久99| 欧美女人交a| 玖玖爱视频在线| 欧美国产日韩精品免费观看| 久久狠狠高潮亚洲精品| 欧美一二三区精品| 日本免费视频在线观看| 国产精品v片在线观看不卡| 欧美性生活一级片| 日韩网站在线免费观看| 国产成人免费视频网站| 午夜三级在线观看| 欧美理论电影在线| 中文字幕日本在线观看| 国产精品福利在线观看网址| 综合色就爱涩涩涩综合婷婷| 久在线观看视频| 成人动漫一区二区三区| 国产亚洲精品成人| 欧美mv和日韩mv国产网站| 欧美人与动牲性行为| 97碰碰视频| 影音先锋久久| 久久精品女同亚洲女同13| 亚洲一区二区视频| 天堂中文在线资源| 欧美一区二区三区艳史| 在线日韩一区| 日韩欧美在线免费观看视频| 久久精品免费在线观看| 免费精品一区二区| 中文字幕日韩av综合精品| 国产情侣一区二区三区| 中国人体摄影一区二区三区| 精品夜夜嗨av一区二区三区| 久久国产精品国语对白| 欧美一级夜夜爽| freexxx性亚洲精品| 久久久久一区二区| 日韩高清在线不卡| 潘金莲一级黄色片| 日韩午夜三级在线| 爱啪视频在线观看视频免费| 久久精品国产精品青草色艺| 日日摸夜夜添夜夜添亚洲女人| 国产视频三区四区| 7777精品伊人久久久大香线蕉最新版 | 久久女人天堂| 欧美a级免费视频| 99视频在线精品| 青青草视频在线观看免费| 日韩中文字幕在线播放| www.豆豆成人网.com| 日韩欧美精品在线观看视频| 国产欧美日韩激情| 99久久国产免费| 91精品国产91久久久久| 欧美亚洲国产一区| 日韩久久久久久久久久久久| 成人亚洲性情网站www在线观看| 久久综合九色综合97婷婷| 动漫av免费观看| 综合久久综合久久| 免费a视频在线观看| 日韩美女在线观看一区| 欧美激情成人| 久久福利小视频| 欧美日韩国产高清一区二区三区| 污视频网站在线免费| 欧美国产中文字幕| 日韩美脚连裤袜丝袜在线| 中文字幕亚洲乱码| 香蕉影视欧美成人| 在线免费观看黄色网址| 国产精品免费一区二区三区四区| 丝袜美腿亚洲综合| 精品欧美一区二区久久久久| 亚洲欧洲一区二区三区在线观看| 蜜桃精品视频| xxxx一级片| 午夜av一区二区| 欧美jizz18hd性欧美|