精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

華為中科大聯(lián)創(chuàng)大模型低比特量化算法,1‰數(shù)據(jù)實現(xiàn)昇騰無損壓縮7倍

人工智能 新聞
大模型巨無霸體量,讓端側(cè)部署望而卻步?華為聯(lián)手中科大提出CBQ新方案,僅用0.1%的訓練數(shù)據(jù)實現(xiàn)7倍壓縮率,保留99%精度。

大模型,如今堪稱AI界的「吞金巨獸」。

從寫詩到解題,從對話到編程,它們幾乎無所不能,但動輒千億甚至萬億參數(shù)的規(guī)模,讓部署成本高得離譜。

以FP16精度部署的DeepSeek-R1 671B為例,推理時大概需要1342GB的顯存,如果是32GB 5090顯卡,需要整整42張!

為了降低成本,天才工程師們想出了后訓練量化(Post-training Quantization,PTQ)的方法,它能夠在有限的校準數(shù)據(jù)和計算資源下對模型進行高效壓縮。

但是PTQ依然帶來新的問題——在極低比特精度(如W2A16、W4A4)時往往會出現(xiàn)明顯的性能下降,規(guī)模是降了,但是不好用了!

就在這關(guān)鍵時刻,華為諾亞方舟實驗室聯(lián)合中科大亮出了「殺手锏」——CBQ(Cross-Block Quantization),一種基于跨塊重建的后訓練量化方案。

圖片

論文地址:https://openreview.net/pdf?id=eW4yh6HKz4

相比量化感知訓練(QAT)所需數(shù)據(jù)量,CBQ僅用0.1%的訓練數(shù)據(jù),一鍵壓縮大模型至1/7體積——浮點模型性能保留99%,真正實現(xiàn)「輕量不降智」。

值得一提的是,這項成果已榮登ICLR 2025 Spotlight(錄取率僅5%)。

它不僅展現(xiàn)了大模型壓縮領(lǐng)域的創(chuàng)新性和實用性,更像一顆信號彈,宣告大模型在國產(chǎn)算力上的普及時代已然來臨!

目前,CBQ已作為可調(diào)用的算法之一,正式加入昇騰模型壓縮工具包ModelSlim,幫助開發(fā)者在昇騰芯片上實現(xiàn)LLM的高效部署。

極低比特量化,為何如此難?

長期以來,后訓練量化(PTQ)一直是壓縮大語言模型的「黑科技」——通過解決異常值和采用layer-wise或block-wise的loss優(yōu)化技術(shù)取得了比較不錯的結(jié)果。

但是當把參數(shù)比特「壓得特別低」的時候,模型性能會嚴重下降。

為什么極低比特量化,如此困難?其實,答案隱藏在大模型的復雜結(jié)構(gòu)中。

研究者們對LLM在低比特量化場景下的量化誤差進行了深入分析,發(fā)現(xiàn)了問題的關(guān)鍵所在:

隨著模型參數(shù)數(shù)量的增加和量化bit數(shù)的減少,模型內(nèi)部的層間依賴(inter-layer dependencies)和層內(nèi)依賴(intra-layer dependencies)會顯著增強,這嚴重影響了量化精度。

如下實驗所示,清晰展示了LLAMA-7B層間與層內(nèi)的依賴關(guān)系。

圖片

圖1:Llama-7B內(nèi)部權(quán)重和層之間依賴關(guān)系的變化,以及層間縮放因子(scale)對誤差的影響

圖1(a)為LLAMA-7B單一層中權(quán)重的Hessian矩陣絕對值可視化,2-bit圖比4-bit更模糊,非對角線噪聲增多,表示在低比特下權(quán)重間的「干擾」增強了。

圖片

圖1(b)為LLAMA-7B 32層中損失相對于scale的Hessian矩陣可視化,在2-bit量化中,非對角線明顯比4-bit更亮,說明層間依賴增強,模型更容易因為一層的誤差影響到另一層。

以及圖1(c)LLAMA-7B前兩個Transformer塊的平均scale與相應損失之間的關(guān)系,4-bit情況下,誤差平穩(wěn)區(qū)域大,模型對 scale 不敏感。2-bit情況下,誤差對scale非常敏感,選擇不當誤差急劇上升,黑色區(qū)域更集中、易出錯。

總結(jié)來說,將模型參數(shù)從高精度壓縮到低精度,這一過程主要面臨三大核心挑戰(zhàn):

1. 層間依賴的「雪球效應」

大模型由多個Transformer層組成,各層參數(shù)之間存在復雜的相互依賴。

在極低比特量化時,量化誤差會在層間不斷累積放大,就像「滾雪球」一樣,導致整體性能嚴重下降。

然而,傳統(tǒng)逐層量化的方法,無法有效捕捉這些層間依賴,進而造成了精度損失。

2. 層內(nèi)依賴的復雜性

同一層內(nèi)的參數(shù)并非獨立存在,而是存在緊密的關(guān)聯(lián)性。

極低比特量化會破壞這些精細的層內(nèi)依賴,導致模型在處理復雜任務時「力不從心」。

比如,大模型語義理解或推理能力,可能因參數(shù)精度的降低而顯著退化。

3. 權(quán)重和激活的異常值

模型的權(quán)重和激活值中的異常值,在低比特量化時會引發(fā)較大的誤差。

傳統(tǒng)的方法無法精確識別和處理這些異常值,進一步加劇了量化誤差。

可見,這些挑戰(zhàn)讓低比特量化,成為大模型壓縮的「攔路虎」。

那么,華為的CBQ方案,是如何突破這些瓶頸?讓我們一探究竟!

CBQ打破層間壁壘,精準又高效

CBQ的核心思想是,通過跨塊依賴(Cross-Block Dependency, CBD)機制和自適應LoRA-Rounding技術(shù),同時優(yōu)化多個Transformer塊的量化參數(shù),從而更好地保留模型內(nèi)部的依賴關(guān)系。

圖片

具體來說,它通過三大技術(shù)創(chuàng)新,為極低比特量化注入了全新活力。

跨塊依賴機制(CBD)

剛剛也提到,傳統(tǒng)量化方法采用逐層優(yōu)化,卻忽視了層間依賴的復雜性。

CBQ引入了CBD機制,通過滑動窗口的方式,同時優(yōu)化多個Transformer塊,并且相鄰窗口之間會有重疊的塊,以確保塊之間的連接性和協(xié)作性。

圖片

這種方法,可以有效地捕捉到模型內(nèi)部的長距離依賴關(guān)系,使得相鄰的塊能夠共同參與到量化過程中,從而提高整體的量化性能。

圖片

在實驗中,隨著滑動窗口中塊的數(shù)量增加,模型的性能也得到了顯著提升。

圖片

自適應LoRA-Rounding技術(shù)

為了應對層內(nèi)依賴的復雜性,CBQ提出了自適應LoRA-Rounding技術(shù),通過兩個低秩矩陣來學習量化權(quán)重的自適應補償值。

圖片

與傳統(tǒng)的AdaRound方法相比,LoRA-Rounding通過低秩分解大大減少了可學習參數(shù),訓練速度更快,GPU內(nèi)存消耗更低。

圖片

這種方法能夠在訓練過程中動態(tài)調(diào)整權(quán)重的量化精度,從而更好地適應模型的內(nèi)部結(jié)構(gòu)和數(shù)據(jù)分布。

圖片

粗到細的預處理策略(CFP)

針對異常值問題,CBQ采用了粗到細的預處理策略(Coarse-to-Fine Preprocessing, CFP)。

CFP策略從統(tǒng)計學的角度出發(fā),通過分階段檢測和處理權(quán)重和激活中的異常值。

在粗粒度檢測階段,通過計算四分位數(shù)和四分位距來初步估計異常值的范圍;在細粒度檢測階段,通過最小化異常值子集與正常值子集之間的距離,同時最大化子集內(nèi)部的方差,來精確識別異常值的位置。

圖片

這種分階段策略,有效減少了量化誤差,確保模型在低比特場景下依然「穩(wěn)如泰山」。

那么,CBQ在場景中的真實表現(xiàn)又如何呢?

實驗結(jié)果:性能與效率的雙贏

一系列研究結(jié)果顯示,CBQ在華為盤古模型和開源模型的表現(xiàn)上,大放異彩。

盤古模型:端側(cè)部署「殺手锏」

CBQ量化技術(shù)已成功應用于華為盤古大模型PanGu-7B和PanGu-1.5B的端側(cè)部署,憑借其高精度的量化性能,有效支撐了盤古大模型在多個業(yè)務場景的落地應用。

如下表所示,在W8A8/W4A16精度下,PanGu-1.5B模型在中文(C-Eval/CMMLU)、多任務語言理解(MMLU)基準中的表現(xiàn),毫不遜色于全精度模型的性能。

在中文、多語言理解、數(shù)學基準中,PanGu-7B的表現(xiàn)同樣如此。

圖片

這些成果,足以讓盤古模型在手機等終端設備上,輕松運行。

開源模型:超越最優(yōu)

此外,CBQ在多個開源LLM(如OPT、LLaMA)上也取得了SOTA。

圖片

例如,在W4A16、W2A16和W4A8等低比特量化設置下,CBQ的性能均優(yōu)于現(xiàn)有的最先進方法,并且與全精度模型的性能差距縮小到了1%以內(nèi)。

圖片

更令人驚嘆的是,CBQ僅需4.3小時即可完成對4位權(quán)重的LLaMA1-65B模型的量化,展現(xiàn)了壓縮率與精度之間的完美平衡(trade-off)。

圖片

未來展望

華為的CBQ方案,以跨塊依賴機制、自適應LoRA-Rounding技術(shù),以及粗到細的預處理策略,成功征服了極低比特量化的「三大高峰」。

這項創(chuàng)新有效地解決了,大模型在低比特量化場景下所面臨的層間依賴和層內(nèi)依賴難題。

它不僅在多種大語言模型和數(shù)據(jù)集上展現(xiàn)出了顯著的性能提升,成功縮小了與全精度模型之間的差距,還以高效的量化效率實現(xiàn)了復雜模型的快速壓縮。

最終,讓盤古和各類開源模型,成功實現(xiàn)了在昇騰硬件上的高效部署,并為更加廣泛的應用鋪就坦途。


責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-06-17 07:10:00

2023-10-10 08:52:43

PNG類型Chinchilla

2025-10-24 12:14:32

2025-10-11 18:05:23

AI大模型工具

2021-11-17 16:13:45

IBM 處理器量子

2024-12-02 10:40:00

AI模型

2024-04-07 09:00:00

數(shù)據(jù)模型

2022-06-30 10:38:53

Lepton無損壓縮圖片圖片質(zhì)量

2023-12-04 13:23:00

數(shù)據(jù)訓練

2015-08-31 10:10:48

Dropbox無損壓縮算法云存儲

2022-06-08 16:29:45

無損壓縮方案分布式

2021-05-07 09:34:20

量子芯片計算機

2025-07-11 08:54:00

2025-04-01 09:20:00

模型預測AI

2023-09-18 15:25:12

昇騰AI

2024-11-04 08:30:00

2021-07-09 22:54:38

昇騰產(chǎn)業(yè)升級智能化
點贊
收藏

51CTO技術(shù)棧公眾號

日韩成人影音| 成人不用播放器| 亚洲美女一区| 亚洲香蕉在线观看| 亚洲美女性囗交| 激情图片在线观看高清国产| 91亚洲精品久久久蜜桃| 国产精品久久久久久久久借妻 | 国产二区视频在线| 日韩偷拍自拍| 国精产品一区一区三区mba视频| 欧美黄色小视频| 国产精品国色综合久久| 精品国产乱码一区二区| 第四色成人网| 亚洲福利在线看| 自拍偷拍一区二区三区四区| 91白丝在线| 中文字幕亚洲综合久久菠萝蜜| 国产精品国产三级欧美二区| 一区二区自拍偷拍| 亚洲永久视频| 欧美疯狂性受xxxxx另类| 免费一级做a爰片久久毛片潮| 日韩一区免费| 欧美视频在线观看一区二区| 国产一区二区三区乱码| 国产日本精品视频| 久久综合影音| 久久人91精品久久久久久不卡| 亚洲图片第一页| 亚洲精品亚洲人成在线观看| 精品噜噜噜噜久久久久久久久试看| 日本va中文字幕| 国产美女高潮在线| 一区二区三区四区乱视频| 日韩亚洲不卡在线| 性插视频在线观看| 成人综合在线视频| 亚洲伊人一本大道中文字幕| 97人妻精品视频一区| 国产毛片一区| 97免费中文视频在线观看| 国产精品99久久久久久成人| 日本不卡电影| 一区二区成人精品| 国产又大又粗又爽的毛片| 视频小说一区二区| 亚洲国产精品人久久电影| 国产chinesehd精品露脸| 亚洲欧洲一二区| 亚洲精品久久嫩草网站秘色| 日韩影视精品| 国产三级在线| 狠狠色丁香婷综合久久| 国产精品久久久久久久9999| 黄瓜视频在线免费观看| 国产欧美日韩综合一区在线播放| 久久久久久久999| 久久久精品国产sm调教| 欧美黄污视频| 欧美福利视频在线观看| 黄色一级视频在线观看| 中文字幕一区二区三区欧美日韩| www.xxxx欧美| 久久久久久视频| 欧美精品一卡| 欧美情侣性视频| 国产午夜精品无码| 日韩视频不卡| 日本欧美黄网站| 久久久久久久久毛片| 99久久精品费精品国产| 久久这里有精品| 在线免费观看成年人视频| 日韩一级二级| 欧美午夜精品一区二区三区| 亚洲欧美日韩一级| 国产桃色电影在线播放| 亚洲一区二区影院| 国产一区二区视频播放| 亚洲精品动漫| 欧美午夜电影一区| 日韩a一级欧美一级| 蜜臀国产一区| 欧美偷拍一区二区| 亚洲国产午夜精品| 精品国产乱子伦一区二区| 欧美探花视频资源| 女人高潮一级片| 台湾佬中文娱乐久久久| 欧美午夜精品久久久久久超碰| 一女二男3p波多野结衣| 久久中文字幕一区二区| 精品第一国产综合精品aⅴ| 国产一级伦理片| 成人同人动漫免费观看| 久久久国产一区| 亚洲精品www久久久久久| 日韩高清国产一区在线| 97人人模人人爽人人少妇| 外国精品视频在线观看| 中文字幕第一区| 亚洲国产精品无码观看久久| 欧美日韩免费看片| 欧美一级免费大片| 中文字幕成人动漫| 午夜精品视频| 国产精品激情av电影在线观看| 国产视频第一页| 久久久久88色偷偷免费| 中文字幕第50页| 神马久久资源| 亚洲成人精品久久久| 熟女少妇a性色生活片毛片| 国产欧美日韩亚洲一区二区三区| 成人久久久久久| 中文在线免费观看| 国产sm精品调教视频网站| 欧美成人蜜桃| 啦啦啦中文在线观看日本| 欧美三级蜜桃2在线观看| 欧美做受高潮中文字幕 | 日本精品国语自产拍在线观看| 激情视频在线观看| 在线视频一区二区免费| 尤物网站在线观看| 欧美在线国产| 国产精品午夜视频| 亚洲影视一区二区| 99精品国产热久久91蜜凸| 国产午夜精品视频一区二区三区| 欧美在线va视频| 日韩av在线一区| www.av视频在线观看| 极品少妇xxxx偷拍精品少妇| 日本在线免费观看一区| 中文字幕21页在线看| 亚洲成人av在线播放| 国产精品久久久久久久精| 久久69国产一区二区蜜臀| 91亚洲精品一区二区| 精品美女视频在线观看免费软件| 亚洲国产一区二区三区青草影视| 一级做a免费视频| 清纯唯美日韩| 国产精品九九九| 欧美女v视频| 狠狠色噜噜狠狠狠狠97| 国内外免费激情视频| 精品成人自拍视频| 午夜精品一区二区三区视频免费看| 国产成人精品免费看视频| 中文字幕日韩一区| jizz欧美性11| 久久综合88| 成人观看高清在线观看免费| 午夜不卡视频| 欧美日韩美少妇| а天堂中文在线资源| 亚洲天堂男人| 国产精品播放| 国产51人人成人人人人爽色哟哟 | 国产一区二区三区在线| 91黑人精品一区二区三区| 蜜臀久久99精品久久久久宅男| 牛人盗摄一区二区三区视频| 电影一区二区三区| 在线电影av不卡网址| 亚洲图片中文字幕| 亚洲精品亚洲人成人网| 少妇极品熟妇人妻无码| 亚洲高清电影| 欧美日韩亚洲免费| 精品国产美女a久久9999| 久久精品亚洲国产| www.国产免费| 国产精品久99| 一二三av在线| 在线亚洲免费| 神马欧美一区二区| 久久wwww| 欧美一级免费视频| av女优在线| 亚洲va天堂va国产va久| 国产艳俗歌舞表演hd| 日韩精品一二三四| 艳母动漫在线观看| 欧美91在线| 欧美激情视频在线| 瑟瑟在线观看| 欧美另类久久久品| 日韩免费黄色片| 中文av一区特黄| 日本泡妞xxxx免费视频软件| 亚洲综合另类| 一本二本三本亚洲码| 国产精品久久久久av蜜臀 | 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 人禽交欧美网站| 亚洲av首页在线| 欧美猛男男男激情videos| 成人在线视频网站| 涩涩av在线| 欧美老女人性视频| 国产福利在线观看| 精品国产91洋老外米糕| 中文字幕免费高清在线观看| 亚洲一区二区四区蜜桃| 日韩影视一区二区三区| 国产精品久久久免费| 亚洲欧洲日韩综合二区| 久久97精品| 91在线中文字幕| 日韩性xxx| 国内精品小视频| 国产精品实拍| 亚洲性av网站| 亚洲区小说区图片区| 欧美一区二区三区在线观看 | 亚洲欧美日本在线| 国产熟妇久久777777| 丁香婷婷综合五月| 亚洲精品免费一区亚洲精品免费精品一区| 国产日韩免费| 福利在线一区二区| 一级欧洲+日本+国产| 亚洲激情图片| 国产一区二区亚洲| 九九九九精品九九九九| 成人自拍在线| 5566av亚洲| 精品视频一区二区三区| 国产精品偷伦视频免费观看国产 | 精品无吗乱吗av国产爱色| 欧美精品一区男女天堂| 精品黑人一区二区三区在线观看| 欧美亚洲一区三区| 波多野结衣电车痴汉| 欧美性高潮床叫视频| 97超碰人人干| 精品毛片网大全| 国产精品免费av一区二区| 亚洲成av人**亚洲成av**| 国产成人精品亚洲男人的天堂| 成年人午夜久久久| 99久久久无码国产精品性波多 | 欧美另类自拍| 亚洲精品国偷自产在线99热| 视频二区在线观看| 亚洲精品美女久久久| 天堂国产一区二区三区| 亚洲第一中文字幕在线观看| 黑人精品一区二区三区| 亚洲а∨天堂久久精品喷水| 秋霞av鲁丝片一区二区| 精品国产成人系列| 日韩在线视频第一页| 日韩av一区在线| 女人天堂在线| 中文精品99久久国产香蕉| melody高清在线观看| 色噜噜久久综合伊人一本| 欧美激情午夜| 欧美成人精品在线播放| 男女在线观看视频| 51色欧美片视频在线观看| 欧美freesex| 国产精品一区二区三区毛片淫片 | 在线成人欧美| 欧美女人性生活视频| 日精品一区二区| 亚洲一区精品视频在线观看| 国产一区 二区 三区一级| 久久国产免费视频| 99国产精品久久久| 国产小视频自拍| ●精品国产综合乱码久久久久 | 亚洲一级毛片| 国产高清av在线播放| 久久精品毛片| 亚洲欧美天堂在线| youjizz久久| 亚洲ⅴ国产v天堂a无码二区| 亚洲色图欧洲色图婷婷| 日本中文字幕免费观看| 欧美少妇性性性| 亚洲精品国产suv一区| 亚洲人免费视频| 国产区在线看| 欧美一级高清免费播放| a一区二区三区亚洲| 国产一区二区精品在线| 成人羞羞动漫| 人妻无码久久一区二区三区免费| 亚洲免费网址| 两性午夜免费视频| 99国产精品国产精品毛片| 亚洲一区 欧美| 一二三四社区欧美黄| 亚洲国产av一区二区三区| 欧美一区二区三区在线观看视频 | 999久久久国产999久久久| 国产精品免费一区二区三区四区| 欧美最新另类人妖| 国产美女永久无遮挡| 久久蜜桃精品| 美女伦理水蜜桃4| 成人欧美一区二区三区| 无码免费一区二区三区| 精品国产乱码久久久久久免费 | 国产精品午夜久久| 日本一级淫片免费放| 欧美精品亚洲二区| 你懂得在线网址| 久久乐国产精品| 国产精品美女久久久久| 国产在线视频一区| 丝袜美腿综合| 夜夜添无码一区二区三区| 国内不卡的二区三区中文字幕| 中文字幕一二三四区| 亚洲综合成人在线| av网站免费大全| 久久精品国产96久久久香蕉| 日韩一级二级| 日本精品免费| 美日韩精品视频| 在线免费观看a级片| 亚洲精品一二三| 国产精品久久久久久久久久久久久久久久久久 | 欧美理论电影在线观看| 欧美xxxx网站| 婷婷五月色综合| 日韩影院免费视频| 亚洲精品国产一区黑色丝袜| 欧美性猛交丰臀xxxxx网站| 日本精品一二区| 久久琪琪电影院| 精品欧美午夜寂寞影院| 黄色一级片国产| 国产激情视频一区二区三区欧美| 韩国三级在线播放| ㊣最新国产の精品bt伙计久久| 欧美 亚洲 另类 激情 另类| 亚洲欧美日韩精品久久奇米色影视| h片在线观看| 国产日韩欧美一区二区三区四区 | 成人免费观看毛片| 美女视频网站黄色亚洲| 蜜桃无码一区二区三区| 色综合久久综合网欧美综合网| 男女污污视频在线观看| 日韩av免费在线| 国产精品手机在线播放| 亚欧在线免费观看| 日本一区二区不卡视频| 伊人精品一区二区三区| 俺也去精品视频在线观看| 日韩激情精品| 亚洲人成无码网站久久99热国产 | 国产精品毛片一区视频| 亚洲国产专区| 丰满圆润老女人hd| 欧美午夜精品一区二区三区| 乱人伦中文视频在线| yellow视频在线观看一区二区| 亚洲福利久久| 亚洲欧洲久久久| 欧美放荡的少妇| jizz一区二区三区| 日本不卡一区| 久久国产麻豆精品| 1024手机在线视频| 日韩成人免费视频| 国产精品videossex撒尿| 咪咪色在线视频| 成人亚洲精品久久久久软件| 久久精品一二区| 最新69国产成人精品视频免费| 高清国产一区二区三区四区五区| 菠萝蜜视频在线观看入口| 91蜜桃在线观看| 一级做a爱片性色毛片| 欧美风情在线观看| 国产亚洲电影| 欧美色图校园春色| 欧美性猛交xxxx免费看漫画| 免费高清完整在线观看| 国产欧美一区二区视频 | 亚洲精品国产a| 爽爽视频在线观看| 国产专区欧美专区| 亚洲视频大全| 丝袜 亚洲 另类 欧美 重口| 日韩黄色在线免费观看| 青娱乐极品盛宴一区二区| 日本精品国语自产拍在线观看| 国产在线视频一区二区| 成人公开免费视频|