精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

1-bit大模型還能再突破!新一代BitNet架構啟用4位激活值

人工智能
近日,BitNet系列的原班人馬推出了新一代架構:BitNet a4.8,為1 bit大模型啟用了4位激活值,支持3 bit KV cache,效率再突破。

量化到1 bit的LLM還能再突破?

這次,他們對激活值下手了!

近日,BitNet系列的原班人馬推出了新一代架構:BitNet a4.8,為1 bit大模型啟用了4位激活值:

圖片圖片

論文地址:https://arxiv.org/pdf/2411.04965

眾所周知,激活值量化通常是比較難辦的。

本次的BitNet a4.8采用混合量化和稀疏化策略,來減輕異常通道引入的量化誤差。

簡單來說就是,對注意力層和FFN層的輸入采用4位量化,同時用8位整數稀疏化中間狀態。

大量實驗表明,BitNet a4.8在相同的訓練成本下,實現了與前代BitNet b1.58相當的性能,同時因為可以吃到4位(INT4/FP4)內核的計算紅利,實現了更快的推理速度。

BitNet a4.8僅激活55%的參數,并支持3 bit KV cache,進一步提升了大規模LLM部署和推理的效率。

BitNet a4.8

圖片圖片

模型架構

模型的整體架構如圖1所示,BitNet a4.8采用了與BitNet b1.58相同的布局。

作者使用BitLinear替換注意力(MHA)和前饋網絡(FFN)中的線性投影,以從頭開始學習1.58 bit權重。對于激活值,采用混合量化和稀疏化策略來減輕異常值維度引入的誤差。

圖片圖片

圖2說明了模型大小為7B的BitNet b1.58中,每個模塊輸入的分布。

注意力層和FFN層的輸入通常類似高斯分布,而在FFN下采樣之前的激活值和注意力中的輸出投影中,發現了很多異常值通道和大量接近零的條目(全精度LLM也有類似觀察結果)。

圖片圖片

如圖3所示,直接將低位量化應用于這些中間狀態會引入很大的量化誤差。

因此,作者使用Q-Sparse的稀疏化方法,將這些中間狀態保持在8位(同時消除了計算瓶頸)。

對于自注意層的輸出投影,使用sparsify-then-quantize函數:

圖片

兩個Q分別表示權重W和激活X的量化函數,M是掩碼,根據激活X的絕對值取topK,⊙是元素乘法。

具體來說,權重量化和激活值量化函數可以表述為:

圖片

對于FFN,這里采用squared ReLU和門控線性單元(GLU)來進一步提高激活的稀疏性:

圖片

根據初步實驗的結果,使用squared ReLU時,下采樣輸入的稀疏性超過了80%,且對性能的影響最小。

此外,作者還觀察到gate + squared ReLU的輸出也表現出高激活稀疏性(7B模型為67.5%)。通過首先計算gate projection,然后僅在非零通道上執行up projection,可以進一步減少推理的計算量。

相比之下,attention和FFN的輸入中包含的異常值特征要少得多,可以使用absmean函數將激活值量化為4位整數:

圖片

模型訓練

初始化

BitNet a4.8使用BitNet b1.58的權重開始訓練,分為W1.58A8與W1.58A4兩階段。

第一階段使用8位激活和GLU + squared ReLU訓練模型;第二階段采用上面介紹過的混合量化和稀疏化。

圖片圖片

BitNet a4.8只需少量訓練,即可快速適應4bit位寬和稀疏激活,同時性能損失可以忽略不計。

梯度近似

作者使用直通估計器(STE)對BitNet a4.8進行梯度逼近,使用混合精度訓練來更新參數。

圖片圖片

這里直接繞過了不可微函數,包括反向傳播過程中的量化函數和topK稀疏函數。對于混合精度訓練,保持全精度latent weight來累積參數更新。

模型量化

浮點量化提供了比基于整數的量化更寬的動態范圍,這對于處理激活值的長尾分布至關重要。

研究人員將FFN下采樣層的輸入保留為8位整數,其他激活值使用MinMax量化器量化為FP4:

圖片

公式中E和M分別表示指數和尾數部分的位寬。這里采用E2M1格式,因為它的動態范圍更大。

實驗

本文將BitNet a4.8、BitNet b1.58,以及各種參數量大小的FP16精度LLaMA進行了比較。

其中的1.58 bit模型,遵循BitNet b1.58的訓練方案,采用了兩階段權重衰減和學習率調度。

圖片圖片

所有模型都使用RedPajama數據集中的100B token進行訓練,以確保公平比較。

對于BitNet a4.8,作者首先使用95B token來訓練8位激活值的模型。然后重用優化器狀態,并使用5B token進行混合量化和稀疏化的訓練。實驗將topK設置為50%(attention的輸出投影位置)。

作者使用lm-evaluation-harness工具包,評估模型在一系列語言任務上的zero-shot準確性,包括ARC-Easy(ARCe)、ARCChallenge(ARCc)、Hellaswag(HS)、Winogrande(WGe)和PIQA(PQ)。另外還測試了在C4數據集(測試集)上的困惑度。

主要結果

圖片圖片

表1總結了BitNet a4.8、BitNet b1.58和FP16 LLaMA的詳細測試結果。

全精度(FP16)LLaMA和BitNet b1.58之間的性能差距,隨著模型大小的增長而縮小。對于7B模型,BitNet b1.58在語言模型困惑度和任務的平均準確性方面與LLaMA相當。

此外,相比于BitNet b1.58,BitNet a4.8的平均精度幾乎沒有損失。

圖片圖片

表2展示了各種大小的BitNet a4.8、BitNet b1.58 和 FP16 LLaMA中每個模塊的詳細稀疏性(使用C4驗證集上的非嵌入參數計算)。

值得注意的是,BitNet a4.8的稀疏性明顯高于BitNet b1.58和LLaMA。

比如在7B模型中,BitNet a4.8的整體稀疏性達到了44.5%,只有3.4B的活躍參數。down projection層的輸入顯示出特別高的稀疏性,且中間狀態分布以零為中心。

此外,gate projection的輸出非常稀疏,導致了up projection的高稀疏性(因為只需要在從Gate中選擇非零通道來執行投影)。

具體來說,對于7B BitNet a4.8,Gate和up projection的稀疏率分別為67.5%和12.0%。

圖片圖片

表3顯示了BitNet a4.8在3B和7B模型大小下,low-bit attention的詳細情況。模型使用4位KV或QKV頭,精度損失可忽略不計,同時KV cache可以量化為3位整數。

low-bit attention對于高效的長序列建模至關重要,它減少了KV cache的內存占用和IO,并加速了注意力計算。

在本文的實驗中,作者采用RoPE后量化。使用absmax函數將QKV頭直接量化為無符號整數,無需任何校準數據集。

對于3 bit KV量化,研究人員將bos token的頭保留為4 bit,因為它包含更多的異常值特征。

消融實驗

圖片圖片

圖4顯示了700M BitNet a4.8的訓練損耗曲線,比較了使用完整的INT4/FP4量化,以及本文的混合量化和稀疏化。

完整的INT4量化會導致發散,而混合架構在訓練困惑度方面明顯優于完整的FP4架構。

使用RedPajama數據集中25B token,來進行模型的第一階段訓練,采用absmean和MinMax量化器分別進行完整的INT4和FP4量化。

對于完整的INT4量化,由于其輸入具有更大的異常值,這里設置β = 2*mean(|X|)。

圖片圖片

接下來為1.3B BitNet a4.8的down projection層輸入,設置不同的量化或激活函數。

所有模型都使用RedPajama數據集中的50B token進行第一階段訓練。為了確保公平比較,其他激活值都保留在8位。

圖5顯示了這些模型的訓練損失曲線。Squared ReLU的訓練困惑度比Swish略好,同時實現了更高的稀疏性。

此外,對down projection的輸入應用FP4量化會導致性能顯著下降,而將INT4激活與STE一起使用會導致發散。

參考資料:

https://arxiv.org/abs/2411.04965

https://venturebeat.com/ai/how-microsofts-next-gen-bitnet-architecture-is-turbocharging-llm-efficiency/

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-04-30 09:16:00

2013-01-04 16:15:08

微軟ERPDynamics AX

2012-07-02 10:36:19

菲亞特

2022-03-10 16:01:29

Playwright開源

2024-03-12 07:24:26

DingoDB數據庫數據的存儲

2023-03-16 07:20:15

大數據平臺云數據

2016-01-26 11:58:12

2015-09-23 09:47:39

戴爾

2009-07-28 14:05:24

金融數據中心H3C

2009-07-20 14:44:40

數據中心金融行業H3C

2024-12-12 08:18:50

2013-09-24 10:38:23

2021-07-15 11:16:31

Spring WebWebFlux架構

2025-03-17 10:38:30

2009-10-13 10:04:51

醫院協同呼叫中心

2016-12-11 10:35:52

2010-02-07 15:50:33

Android手機

2011-03-31 17:49:51

微軟嵌入式WindowsEmbe

2009-03-11 13:02:20

存儲虛擬化數據中心

2010-06-17 16:54:49

新一代Hotmail
點贊
收藏

51CTO技術棧公眾號

久久精品国产视频| 精品污污网站免费看| 狠狠色综合网站久久久久久久| 日本三级2019| 欧美在线观看视频一区| 3atv一区二区三区| 成人性免费视频| 91美女视频在线| 国产不卡高清在线观看视频| 欧美最猛性xxxxx免费| 免费黄色国产视频| 老牛影视av一区二区在线观看| 在线观看不卡一区| 免费的一级黄色片| 国产九九在线| 懂色av一区二区夜夜嗨| 国产精品91久久久久久| 久久久精品人妻一区二区三区四 | 国产人成在线观看| 国产伦精品一区二区三区在线观看| 97超级碰碰人国产在线观看| 欧美性生给视频| 牛牛影视一区二区三区免费看| 欧美性欧美巨大黑白大战| 青草视频在线观看视频| 日本综合在线| 久久亚洲精精品中文字幕早川悠里| 91在线中文字幕| www.久久久久久久| 欧美成人嫩草网站| 日韩在线观看高清| 国产免费无遮挡吸奶头视频| 国语一区二区三区| 欧美一区二区在线免费播放| 国产一区视频免费观看| 成人女同在线观看| 亚洲精品高清视频在线观看| 天堂一区二区三区| 九色在线免费| 99精品国产热久久91蜜凸| 亚洲一区二区中文| 一本一道人人妻人人妻αv| 久久久久99| 欧美在线视频观看| 国产一级片毛片| 在线精品一区| 欧美国产中文字幕| 欧美丰满艳妇bbwbbw| 国产精品99视频| www国产精品com| 亚洲欧美va天堂人熟伦| 久久93精品国产91久久综合| 日韩h在线观看| 精品无码人妻少妇久久久久久| 国色天香久久精品国产一区| 在线播放中文一区| 午夜免费一级片| 99视频有精品高清视频| 欧美日韩在线三区| 成人日韩在线视频| 亚洲国产综合在线观看| 欧美片网站yy| 岛国av免费在线| 精品国产欧美| 精品国产伦理网| 性高潮免费视频| 免费观看成人www动漫视频| 精品国产91洋老外米糕| 白嫩情侣偷拍呻吟刺激| 日韩高清电影免费| 国产手机视频精品| 在线观看日本中文字幕| 日韩一区二区在线| 久久综合久久八八| 国产va在线播放| 欧美日韩国产高清| 97在线观看视频国产| 天天干天天干天天干天天| 欧美一级视频| 国产日韩欧美在线播放| 精品人妻无码一区二区色欲产成人| 国产精品一二一区| 久久99精品久久久久久秒播放器| 日韩欧美在线观看一区二区| 中文字幕av一区二区三区| 最新欧美日韩亚洲| 123区在线| 色94色欧美sute亚洲线路二| 在线看免费毛片| 三级欧美日韩| 亚洲人午夜精品| 四虎永久免费地址| 一区二区精品| 成人午夜激情免费视频| 五月婷婷丁香花| 中文欧美字幕免费| 青春草国产视频| 成人福利片在线| 日韩一卡二卡三卡国产欧美| aa片在线观看视频在线播放| 久久美女视频| 91国产视频在线| 夜夜狠狠擅视频| 99热国产精品| gogogo免费高清日本写真| 国产剧情av在线播放| 欧美午夜免费电影| 丝袜熟女一区二区三区| 三上亚洲一区二区| 97av在线播放| a天堂视频在线| 久久九九久精品国产免费直播| 亚洲自拍偷拍一区二区三区| 电影网一区二区| 欧美一级高清片| 国产jk精品白丝av在线观看| 国产精品99一区二区| 国产欧美一区二区三区久久人妖 | 国产98色在线|日韩| 日韩高清国产精品| www欧美xxxx| 欧美一级搡bbbb搡bbbb| 蜜桃久久精品成人无码av| 精久久久久久| 91精品在线观| 成人网视频在线观看| 无码av中文一区二区三区桃花岛| 日本不卡一区二区在线观看| 精品一区二区三区在线| 午夜精品久久久久久久99黑人| 91在线观看喷潮| 国产欧美日产一区| 国产成人无码av在线播放dvd| 91嫩草精品| 欧美猛男性生活免费| 91精品视频免费在线观看| 国产丝袜在线精品| 黑人糟蹋人妻hd中文字幕| 国产精品网址| 欧美精品电影免费在线观看| 国产精品人人爽| 国产精品久久影院| 超碰在线人人爱| 精品美女久久| 国产成人精品免费视频| 欧美日韩国产中文字幕在线| 午夜激情综合网| 星空大象在线观看免费播放| 影音先锋亚洲电影| 国产另类自拍| hd国产人妖ts另类视频| 欧美电视剧在线看免费| 麻豆亚洲av成人无码久久精品| 久草这里只有精品视频| 在线观看日本一区| 婷婷久久免费视频| 久久天天躁夜夜躁狠狠躁2022| 亚洲无码久久久久久久| 国产精品国产自产拍在线| 色播五月综合网| 91视频综合| 91久久久在线| 在线三级中文| 欧美精品一区二区高清在线观看| 日韩成人免费在线观看| 99re这里只有精品首页| 欧美精品色婷婷五月综合| 亚洲丁香日韩| 国产精品久久久av久久久| 成年人在线视频免费观看| 欧美日韩美少妇| 亚洲天堂黄色片| 成人精品一区二区三区四区| 国产日韩欧美精品在线观看| 色哟哟精品丝袜一区二区| 国产成人精品免高潮费视频| 在线观看免费黄色| 欧美第一区第二区| 亚洲国产成人无码av在线| 日本一区二区动态图| 日韩av.com| 欧美色123| 欧美日本亚洲| 亚洲高清国产拍精品26u| 色综合久久久久久中文网| 色屁屁草草影院ccyycom| 日本高清视频一区二区| 日韩国产第一页| 97久久久精品综合88久久| 国产区二区三区| 狠狠色丁香久久综合频道| 蜜桃网站成人| 精品久久国产一区| 欧美综合第一页| av大全在线| 亚洲欧美在线一区| 成人激情四射网| 在线亚洲一区观看| 国产一级二级三级视频| 久久精品视频一区二区三区| 色网站在线视频| 亚洲欧美网站| 国产在线视频综合| 欧美伦理在线视频| 国产伦精品一区二区三区视频免费 | 一区精品在线播放| 亚洲欧美在线不卡| 国内精品伊人久久久久av影院| 亚洲美免无码中文字幕在线| 999国产精品视频| 蜜桃久久精品乱码一区二区 | 日韩精品一区第一页| 一区二区三区视频| 亚洲动漫精品| 国产精品久久亚洲| 国产精品日韩精品在线播放| 日本精品va在线观看| 日韩伦理av| 最近2019年手机中文字幕| 亚洲 精品 综合 精品 自拍| 欧美一区二区在线播放| 进去里视频在线观看| 欧美日韩精品在线| 久久久综合久久久| 亚洲男同1069视频| 成人欧美一区二区三区黑人一 | 爱啪啪综合导航| 久久九九有精品国产23| www黄在线观看| 亚洲欧美日韩精品久久亚洲区 | 色偷偷91综合久久噜噜| 瑟瑟在线观看| 欧美r级电影在线观看| 一卡二卡三卡在线观看| 91成人网在线| 国产精品视频一区在线观看| 亚洲成av人片在线| 国产精彩视频在线观看| 一区二区三区四区激情| 国产老头老太做爰视频| 中文字幕色av一区二区三区| 日本少妇xxxxx| 久久久国产精品麻豆| 亚洲第一页av| 91论坛在线播放| 少妇户外露出[11p]| av网站一区二区三区| 亚洲av熟女高潮一区二区| 国产.精品.日韩.另类.中文.在线.播放 | 日本中文在线视频| 中文字幕在线不卡视频| 国精产品一区一区二区三区mba| 国产精品污www在线观看| www久久久久久久| 中文字幕乱码久久午夜不卡| 手机毛片在线观看| 国产精品久久久久久久久快鸭 | 亚洲一区二区三区爽爽爽爽爽| 欧美日韩免费一区二区| 一区二区三区精品在线| 国产精品第九页| 狠狠躁夜夜躁人人爽天天天天97| 特级做a爱片免费69| 一本到三区不卡视频| 正在播放木下凛凛xv99| 欧美色图片你懂的| 国产乱淫a∨片免费视频| 日韩一区二区三区免费看| 国精品人妻无码一区二区三区喝尿 | 啊啊啊国产视频| 蜜臀久久99精品久久久久久9| 91插插插插插插插插| 国产精品中文字幕日韩精品| 色婷婷狠狠18禁久久| 91丨国产丨九色丨pron| 人妻精品久久久久中文| 最新国产の精品合集bt伙计| 免费日韩在线视频| 欧美视频精品一区| 亚洲综合五月天婷婷丁香| 日韩欧美色电影| 日本私人网站在线观看| 在线观看日韩www视频免费| 麻豆视频网站在线观看| 国内精品在线一区| 成人亚洲免费| 成人综合色站| 国产精品亚洲二区| 亚洲爆乳无码精品aaa片蜜桃| 国产精品嫩草99av在线| www.久久久精品| 97久久精品人人爽人人爽蜜臀| 国产精品无码无卡无需播放器| 亚洲精品中文在线影院| 国产又粗又爽视频| 91精品国产aⅴ一区二区| 婷婷色在线视频| 日韩一区二区在线视频| 精品三级久久| 成人黄色片网站| 综合干狼人综合首页| 做爰高潮hd色即是空| 午夜在线观看免费一区| 亚洲AV成人精品| 欧美高清在线视频| 亚洲黄色一区二区| 91精品国产91久久综合桃花| 日韩一二三四| 久久久人成影片一区二区三区观看| 性欧美hd调教| 精品999在线观看| 午夜精品久久久久久久四虎美女版| 国产乱子伦农村叉叉叉| 国产剧情在线观看一区二区 | 亚洲免费电影在线| 亚洲国产精品无码久久久| 日韩欧美国产一二三区| av一本在线| 91精品国产高清自在线看超| 欧美午夜网站| 在线观看欧美一区| 蜜桃视频在线观看一区二区| 自拍偷拍亚洲天堂| 午夜影院久久久| 精品女同一区二区三区| 精品国内亚洲在观看18黄| 成人日韩在线| 欧美成人第一区| 亚洲免费观看| 年下总裁被打光屁股sp| 亚洲男人的天堂av| 亚洲一区二区天堂| 亚洲性视频网站| 最新日韩精品| 久久精品日产第一区二区三区 | 成人3d动漫一区二区三区| 99国内精品久久| 日韩欧美中文字幕一区二区| 日韩精品一区二区三区蜜臀| 亚洲第一图区| 91嫩草在线| 欧美精选在线| 真实乱偷全部视频| 亚洲理论在线观看| 国产精品自产拍| 久久成人亚洲精品| 国产精品亚洲欧美日韩一区在线 | 不卡视频在线| 91xxx视频| 久久精品噜噜噜成人av农村| 在线小视频你懂的| 欧美影视一区在线| а√天堂中文在线资源bt在线| 国产成人av在线播放| 国产精品一线天粉嫩av| 波多野结衣作品集| 欧美激情中文字幕| 亚洲图片欧美在线| 美女视频黄免费的亚洲男人天堂| 在线欧美激情| 成人一区二区av| 丁香啪啪综合成人亚洲小说 | 日本久久电影网| 韩国三级在线观看久| 国产精品扒开腿做爽爽爽男男 | 久久久国产一区二区三区| 爱情电影网av一区二区| 美女av免费观看| 不卡的看片网站| 欧美性猛交xxxx乱大交hd | 人与动物性xxxx| 日韩亚洲欧美高清| 黄色软件视频在线观看| 青青草成人网| 国内一区二区在线| 精品视频久久久久| 亚洲男女自偷自拍图片另类| 电影在线观看一区二区| www.亚洲一区二区| 99亚偷拍自图区亚洲| 成人黄色免费网| 日韩天堂在线视频| 久久99精品国产自在现线 | 国产一区二区三区四区在线观看| 婷婷在线精品视频| 日韩精品在线免费| 欧美成人xxxx| 很污的网站在线观看| 日本一区二区三区dvd视频在线| 国产探花精品一区二区| 欧美中文字幕在线| 99久久精品费精品国产| 黄色av网址在线观看| 欧美在线免费播放| 在线不卡日本v二区707| 欧美日韩在线观看一区| 国产一区二区三区香蕉| 精品人妻一区二区色欲产成人| 久久激情视频免费观看| 天海翼亚洲一区二区三区|