精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

解決LLaMA、BERT等部署難題:首個4-bit浮點量化LLM來了

人工智能 新聞
想較于 Integer (INT) 量化,F(xiàn)loating Point (FP) 量化能更好的表示長尾分布,因而越來越多的硬件平臺開始支持 FP 量化。而這篇文章給出了大模型 FP 量化的解決方案。文章發(fā)表在 EMNLP 2023 上。

大語言模型 (LLM) 壓縮一直備受關(guān)注,后訓練量化(Post-training Quantization) 是其中一種常用算法,但是現(xiàn)有 PTQ 方法大多數(shù)都是 integer 量化,且當比特數(shù)低于 8 時,量化后模型的準確率會下降非常多。想較于 Integer (INT) 量化,F(xiàn)loating Point (FP) 量化能更好的表示長尾分布,因而越來越多的硬件平臺開始支持 FP 量化。而這篇文章給出了大模型 FP 量化的解決方案。文章發(fā)表在 EMNLP 2023 上。

圖片

  • 論文地址:https://arxiv.org/abs/2310.16836
  • 代碼地址:https://github.com/nbasyl/LLM-FP4

要了解本文,必須要先具備基本的有關(guān) Floating Point Format 以及 Floating Point Quantization 的知識,首先 Floating Point Number 可以用以下公式表示:

圖片

s 代表正負符號位 (sign bit),m 代表尾數(shù)位 (mantissa bits),e 代表指數(shù)位 (exponent bits)。p 是一個介于 0 到 2^e - 1 之間的值,用來表示當前數(shù)字該被劃分到哪一個指數(shù)區(qū)間,d 取 0 或 1 的值,用來表示第 i 個 mantissa bit。b 是 bias,一個用來調(diào)整 exponent 區(qū)間的整數(shù)值。

接下來介紹 Floating Point Quantization 是怎么運作的,首先輸入值必須經(jīng)過一個 scale and clip 的步驟,先把 input clip 到 Floating Point 能表示的最大區(qū)間 (±Qmax),如以下公式所示:

圖片


可以看到類似于 integer 量化,F(xiàn)P 量化也會加入一個 full-precision 的縮放因子 (scaling factor) 來縮放 input 到合適的區(qū)間。而縮放因子在運算矩陣乘法的時候,和低比特的矩陣乘法分開計算,所以并不會造成很大的 overhead。融入了這個 full-precision 的縮放因子之后,不同的 quantized tensor 能夠被相應地 clip 到不同的最大最小值區(qū)間。在實際使用過程中,會根據(jù)輸入 tensor 的值域確定需要的量化區(qū)間,然后利用公式 (4) 推導出相對應的 bias。注意公式 (4) 里的 bias 可以被用作實數(shù)值的縮放因子,見公式 (2)(3)。

Floating-Point Quantization 的下一個步驟是在決定好量化區(qū)間后把區(qū)間內(nèi)的值分配到相對應的量化區(qū)間內(nèi),這個步驟稱為 Compare and Quantize:

圖片

上圖直觀說明了量化的過程,當前的輸入值,在用公式 5 比較過后,量化到不同的量化區(qū)間中。

在得到量化過的 activation 和 weight 后,這里的 scaling factor 提到前面先計算,而達到如下的 efficient matrix multiplication,完成矩陣乘法的加速:

圖片

接著本文指出 FP 量化的準確度,和 exponent bits 的設(shè)定以及量化的區(qū)間息息相關(guān)。

如下圖所示,不同的 FP format (浮點數(shù)的指數(shù)位 / 尾數(shù)位設(shè)定) 之間存在巨大的量化誤差差異,只有當選取合適的 FP format 時,F(xiàn)P Quantization 比 INT Quantization 能更好的表示長尾分布。這個現(xiàn)象也在之前的論文中得到驗證 [1]。

圖片

而這篇文章提出了對應的解決方案,用一個 search-based 浮點量化算法,統(tǒng)籌搜索出最適合的浮點數(shù)的指數(shù)位 / 尾數(shù)位設(shè)定以及對應的量化區(qū)間。

除此之外,另一個同時出現(xiàn)在各種不同類別 Transformer 模型 (Bert,LLaMA,ViT) 中的現(xiàn)象也會嚴重影響量化的難度:那就是模型的 activation 中不同 channel 之間的數(shù)量級會有很高的差異,而同 channel 之間的量級十分一致。之前 LLM.int8 [2] 和 SmoothQuant [3] 也有類似的發(fā)現(xiàn),不過這篇文章指出這個現(xiàn)象不僅僅存在于 LLM 中,并且在其他 Transformer 模型里也有類似現(xiàn)象 如下如所示,LLaMA 與 BERT 以及 DeIT-S 中的 activation 的分布都發(fā)現(xiàn)了類似的現(xiàn)象:

圖片

從圖中可以看到,那些異常大的 channel 都比剩余的 channel 大很多,所以在量化 activation tensor 的過程中,量化的精度很大程度會被這些異常值決定,從而抑制其他 channel 值的量化區(qū)間,最終降低整體影響量化精度。這會導致量化的最終結(jié)果崩壞,尤其當比特數(shù)降到一定程度的時候。值得注意的是,只有 tensor-wise 和 token-wise 量化可以在 efficient matrix multipilication 的時候?qū)?scaling factor 提取出來,而 channel-wise 量化是不支持 efficient matrix multipilication 的,見下圖。

圖片

為了解決這個問題,同時維持高效率矩陣乘法 (Efficient Matrix Multiplication),本文利用少量的校正資料集,預先算出 activation 的每個 channel 的最大值,從而計算縮放因子。然后將這個縮放因子一拆為二,拆解成一個 per-tensor 的實數(shù)乘以 per-channel 的 2 的冪。而這個 2 的整數(shù)次方即用 FP 里的 exponent bias 表示。完整的過程可以用以下公式表示:

圖片

進一步地,在 calibration 完成之后,這個 per-channel exponent bias 就不再變化,因此可以和 weight quantization 一起進行預計算 (pre-compute),將這個 per-channel exponent bias 整合進量化后的 weights 中,提高量化精度。完整的過程如以下公式:

圖片

可以看到在 pre-shifted 后,原本 activation 中的 full-precision per-channel biases 的位置變成了一個 tensor-wise 的實數(shù) scaling factor ,而被拆解出來的整數(shù) per-channel biases 被移到了 weight 中原本 integer bias 的位置,如公式 4。

從而這個方法 (pre-shifted exponent bias) 能在維持 efficient matrix multiplication 的原則下,更好得提高量化精度,方法的直觀展示如下圖所示:

圖片

最后本文展示 Floating Point Quantization (FPQ) 方法,在 LLaMA, BERT 以及 ViTs 模型上,4-bit 量化皆取得了遠超 SOTA 的結(jié)果。特別是,這篇文章展示了 4-bit 量化的 LLaMA-13B 模型,在零樣本推理任務上達到平均 63.1 的分數(shù),只比完整精度模型低了 5.8 分,且比之前的 SOTA 方法平滑量高出了 12.7,這是目前少數(shù)已知可行的 4-bit 量化方案了。

圖片

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-06-03 08:49:00

2025-04-30 09:16:00

2024-04-11 08:53:57

大型語言模型BERT人工智能

2024-07-11 11:53:56

2023-08-17 11:34:55

模型AI

2024-07-31 15:38:00

2024-05-07 13:40:41

2023-11-27 09:00:00

GPTQ大型語言模型

2024-04-28 06:56:45

Llama 3大規(guī)模人工智能

2023-06-08 11:27:10

模型AI

2025-02-27 13:45:00

2025-09-05 09:15:00

2024-01-08 13:42:00

模型訓練

2023-05-11 11:53:35

模型評測

2024-01-12 17:25:45

MoE模型開源人工智能

2024-08-14 14:30:00

AI訓練

2024-03-15 09:00:00

2023-08-01 13:31:18

模型Alpacaicuna
點贊
收藏

51CTO技術(shù)棧公眾號

久久综合一区二区三区| 久久久久免费视频| 最新天堂中文在线| 亚洲www色| 99精品视频中文字幕| 国产精品免费一区二区三区都可以| 蜜臀av午夜精品久久| 久久a爱视频| 欧美日韩亚洲高清一区二区| 丰满的少妇愉情hd高清果冻传媒 | 欧美一级二区| 久久伊人精品一区二区三区| ass精品国模裸体欣赏pics| av国产精品| 在线视频国产一区| www.国产在线播放| 老司机av在线免费看| 久久欧美一区二区| 国产精品一区二区免费| 一区不卡在线观看| 日韩精品亚洲一区| 91国内免费在线视频| 午夜爱爱毛片xxxx视频免费看| 色天天色综合| 精品少妇一区二区三区| 亚洲xxx在线观看| 肉色欧美久久久久久久免费看| 亚洲黄色av一区| 亚洲综合首页| 国产视频网站在线| 91视频免费播放| 成人在线视频电影| av小说天堂网| 激情成人综合网| 国产日本欧美视频| 中文无码精品一区二区三区| 久久久夜夜夜| 97超碰蝌蚪网人人做人人爽| 精品人妻在线播放| 欧美久久99| 欧美成人免费va影院高清| 精品在线观看一区| 激情婷婷综合| 亚洲最新av在线网站| 免费a级黄色片| 五月国产精品| 日韩成人小视频| 玖玖爱在线精品视频| 都市激情久久| 亚洲激情成人网| 激情综合丁香五月| 亚州av一区| 亚洲欧洲日本专区| b站大片免费直播| 国产毛片一区二区三区| 亚洲欧美一区二区激情| 男生草女生视频| 欧美午夜精彩| 深夜成人在线观看| 亚洲一二三在线观看| 我不卡伦不卡影院| 久久99久久亚洲国产| 欧美日韩成人免费观看| 亚洲国产高清一区二区三区| 91精品国产网站| 97久久久久久久| 久久亚洲色图| 国产精品美女主播在线观看纯欲| 在线观看av大片| 国产一区二区电影| 国产精品一区二区三区免费| 香蕉国产在线视频| 国产亚洲精品中文字幕| 亚洲午夜精品久久久中文影院av| 国产剧情在线| 亚洲成av人片一区二区三区| 91视频最新入口| 日韩欧美一区二区三区免费观看 | 亚洲四区在线观看| av片在线免费| 亚洲欧美小说色综合小说一区| 91精品办公室少妇高潮对白| 久久6免费视频| 高清日韩欧美| 一区二区亚洲欧洲国产日韩| 538任你躁在线精品视频网站| 亚洲三级电影在线观看| 国产精品大陆在线观看| av中文字幕在线免费观看| 99久久综合精品| 一区二区三视频| av福利导福航大全在线| 欧美无砖砖区免费| 在线xxxxx| 久久精品国产99久久| 欧美激情精品久久久| 无码人妻av免费一区二区三区| 精品在线亚洲视频| 精品一区二区国产| 黄网站免费在线播放| 欧美日韩免费看| 天天色天天综合网| 一区二区三区日本久久久 | 视频一区亚洲| xxx性欧美| 欧美高清www午色夜在线视频| 国产十八熟妇av成人一区| 色呦哟—国产精品| 97成人精品区在线播放| 亚洲国产成人精品一区二区三区| 国产午夜精品在线观看| 福利视频一区二区三区四区| 国产精品xxx| 亚洲免费av片| 五月天婷婷网站| 国产乱人伦精品一区二区在线观看 | 欧美日韩精品区| 国内精品伊人久久久久av一坑| 欧美精品欧美精品| а√在线中文网新版地址在线| 制服丝袜亚洲精品中文字幕| 亚洲人成人无码网www国产| 亚洲无线视频| 亚洲自拍在线观看| 日本综合在线| 在线观看成人免费视频| 久久久久亚洲AV成人无码国产| 欧美人成网站| 91综合免费在线| 国内精品久久久久久野外| 日本高清视频一区二区| 国产成人无码一区二区在线观看| 国产精品国码视频| 成人精品一二区| 国产美女福利在线| 777久久久精品| 99久久精品久久亚洲精品| 日韩精品电影在线观看| 欧美日韩一区二区视频在线观看| 国产社区精品视频| 日韩欧美一区中文| 久草国产在线视频| 国产999精品久久久久久绿帽| 亚洲免费视频播放| 精品视频91| 欧美肥臀大乳一区二区免费视频| 国产美女永久免费| 一区二区视频免费在线观看| 黄色a级三级三级三级| **女人18毛片一区二区| 亚洲一区二区免费在线| sm国产在线调教视频| 日韩视频一区二区在线观看| 麻豆亚洲av熟女国产一区二| 国产成人在线视频网站| 日韩精品在线中文字幕| 久久亚洲黄色| 91国语精品自产拍在线观看性色 | 中文在线资源观看网站视频免费不卡 | 日本一区二区高清视频| 日本欧美韩国| www.日韩欧美| xxxx国产精品| 精品欧美激情精品一区| 国产ts在线播放| 麻豆国产精品视频| 免费cad大片在线观看| 成人精品毛片| 日韩免费在线播放| 黄网站免费在线播放| 欧美videos大乳护士334| 奇米影视第四色777| 久久夜色精品国产噜噜av| 黄色国产小视频| 亚洲最新av| 国产在线欧美日韩| 成人黄色免费观看| 久久99精品视频一区97| 青青青免费视频在线2| 欧美日本在线看| av资源吧首页| 欧美激情自拍偷拍| 亚洲成a人无码| 视频在线观看91| 国产 国语对白 露脸| 婷婷激情久久| 91在线视频九色| 性爽视频在线| 另类少妇人与禽zozz0性伦| 日韩在线视频第一页| 欧美三级韩国三级日本三斤| 激情小说中文字幕| 日本一区二区免费在线观看视频 | www久久久com| 在线看日本不卡| 欧美日韩精品在线观看视频 | 亚洲国产精久久久久久久| 国产精品第六页| 亚洲成人自拍一区| 久久精品一区二区三区四区五区| 99精品国产一区二区三区不卡| 可以看污的网站| 久久亚洲色图| 日韩在线综合网| 一区二区在线| 神马影院午夜我不卡| 理论片一区二区在线| 成人黄色在线播放| 欧美成人ⅴideosxxxxx| 九九视频直播综合网| 成年网站在线| 日韩精品在线免费观看| 国产小视频一区| 欧美久久一区二区| 成人一二三四区| 色94色欧美sute亚洲线路一久 | 国产日韩欧美二区| 欧美经典一区| 成人免费在线视频网址| 国产私拍福利精品视频二区| 孩xxxx性bbbb欧美| 午夜伦理大片视频在线观看| 中文字幕日韩精品在线观看| 天堂av网在线| 亚洲国产精品免费| 免费看黄色一级视频| 日韩一区二区在线看| 影音先锋黄色网址| 欧美日韩在线精品一区二区三区激情 | 伊人色**天天综合婷婷| 午夜精品一区二区在线观看| 伊人久久大香线蕉综合网站 | 色综合激情久久| 在线能看的av| 欧美三级xxx| 欧美一级特黄视频| 欧美午夜女人视频在线| 欧美不卡视频在线观看| 午夜精品福利一区二区蜜股av| 久久久精品视频在线| 亚洲理论在线观看| 精品爆乳一区二区三区无码av| 亚洲视频资源在线| 欧洲猛交xxxx乱大交3| 亚洲免费资源在线播放| 91杏吧porn蝌蚪| 亚洲午夜一区二区| 国产无遮挡又黄又爽又色| 亚洲成人你懂的| 伊人久久综合视频| 色诱亚洲精品久久久久久| 天干夜夜爽爽日日日日| 欧洲av一区二区嗯嗯嗯啊| 小泽玛利亚一区二区三区视频| 欧美性受xxxx| 国产又粗又黄又爽| 91精品国产一区二区三区蜜臀| 国产视频在线观看免费| 日韩女同互慰一区二区| 蜜桃视频污在线观看| 亚洲精品国精品久久99热 | 国语自产精品视频在线看抢先版图片| cao在线视频| 欧美在线性爱视频 | 亚洲妇熟xxxx妇色黄| 国模视频一区二区三区| 成人av三级| 国产综合福利在线| 亚洲午夜免费| 美女一区视频| 亚洲成av人片乱码色午夜| av无码久久久久久不卡网站| 久久久777| 日本精品一区在线| 不卡的看片网站| 免费网站在线高清观看| 亚洲天堂免费在线观看视频| 国产一级片免费看| 欧美性xxxxx极品少妇| 国产成人三级在线播放| 亚洲美女喷白浆| 四虎影院观看视频在线观看| 98视频在线噜噜噜国产| 日韩护士脚交太爽了| 国产欧美日韩伦理| 色88久久久久高潮综合影院| 欧美图片激情小说| 日韩二区三区在线观看| 亚洲AV无码久久精品国产一区| 91网站视频在线观看| 中文字幕求饶的少妇| 欧美日韩免费区域视频在线观看| 在线免费av片| 日韩成人中文字幕| 成人免费网址| 国产精品精品国产| 国产欧美自拍一区| 一区二区三区av在线| 国产一区二区高清| 九九九久久久久久久| 久久久久久久电影| 国产无套在线观看| 欧美精选一区二区| 黄色软件在线| 国产69久久精品成人| 欧美黄色一级| 午夜在线视频免费观看| 久久精品动漫| 精品中文字幕在线播放| 亚洲视频网在线直播| 黄色av一区二区| 亚洲黄色片网站| 日本天码aⅴ片在线电影网站| 国产精品高清免费在线观看| 国产欧美自拍一区| 欧洲精品在线播放| 国内成人精品2018免费看| 免费看91的网站| 都市激情亚洲色图| 欧洲成人一区二区三区| 久久精品亚洲国产| 一区在线影院| 日韩精品久久久| 嫩草成人www欧美| 久久久久国产精品区片区无码| 一区二区三区四区精品在线视频| 国产又粗又猛又爽| 色哟哟入口国产精品| 成人在线网站| 日韩欧美亚洲精品| 日韩精品三区四区| 亚洲成人黄色av| 在线精品国精品国产尤物884a| 日韩一区二区三区中文字幕| 国内精品久久久久久久| 51亚洲精品| 久无码久无码av无码| 国产成人av电影| 精品无码人妻一区二区三区品| 日韩片之四级片| 污污视频在线| 国产精品青青草| 99成人免费视频| 偷拍女澡堂一区二区三区| 岛国av一区二区| 九九九伊在人线综合| 国产精品jizz在线观看麻豆| 视频国产一区| 天天色综合社区| 17c精品麻豆一区二区免费| 国产av精国产传媒| 欧美人在线观看| 久久1电影院| 日本wwww视频| 国产精品天干天干在观线| 最近中文字幕在线视频| 日韩网站免费观看高清| 国产一精品一av一免费爽爽| a级片一区二区| 成人avav在线| 欧美brazzers| 久久亚洲影音av资源网| 91精品丝袜国产高跟在线| 国产视频九色蝌蚪| 国产日韩一级二级三级| 国产精品久久久久毛片| 欧美日韩成人精品| 日韩av中文字幕一区| 久久久久久久少妇| ●精品国产综合乱码久久久久| 亚洲国产精品欧美久久| 555www成人网| 日韩精品一区二区三区免费观看| 奇米777在线视频| 欧美日韩一区免费| 午夜毛片在线| 国产精品一区二区三区精品| 爽好多水快深点欧美视频| 艳妇荡乳欲伦69影片| 亚洲精品在线观看视频| 亚洲四虎影院| 国产成人一区二区三区别| 国产偷国产偷精品高清尤物| 99久久亚洲精品日本无码| 91精品国产乱码久久久久久久久| 日韩精品永久网址| 中国xxxx性xxxx产国| 欧美少妇一区二区| 第一福利在线视频| 亚洲永久激情精品| 99re免费视频精品全部| 国产精品视频一二区| 国内久久久精品| 欧美丰满日韩| 成人h动漫精品一区| 91精品国产高清一区二区三区 | 国产福利一区二区三区在线观看| 久久久久国产精品一区二区 | 成年人网站在线| 日韩色妇久久av|