精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

又快又準,即插即用!清華8比特量化Attention,兩倍加速于FlashAttention2,各端到端任務均不掉點!

人工智能 新聞
大模型中,線性層的低比特量化(例如 INT8, INT4)已經逐步落地;對于注意力模塊,目前幾乎各個模型都還在用高精度(例如 FP16 或 FP32)的注意力運算進行訓練和推理。

論文第一作者張金濤來自清華大學計算機系,論文通訊作者陳鍵飛副教授及其他合作作者均來自清華大學計算機系。

大模型中,線性層的低比特量化(例如 INT8, INT4)已經逐步落地;對于注意力模塊,目前幾乎各個模型都還在用高精度(例如 FP16 或 FP32)的注意力運算進行訓練和推理。然而,隨著大型模型需要處理的序列長度不斷增加,Attention(注意力運算)的時間開銷逐漸成為網絡優化的主要瓶頸。

為了提高注意力運算的效率,清華大學陳鍵飛團隊提出了 8Bit 的 Attention(SageAttention)。實現了 2 倍以及 2.7 倍相比于 FlashAttention2 和 xformers 的即插即用的推理加速,且在視頻、圖像、文本生成等大模型上均沒有端到端的精度損失

圖片


  • 論文標題:SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration
  • 論文鏈接:https://arxiv.org/abs/2410.02367
  • 開源代碼:https://github.com/thu-ml/SageAttention

即插即用舉例

SageAttention 可以一行代碼輕松替換掉 torch 中當前最優的 Attention 接口(scaled_dot_product_attention),實現即插即用的推理加速。

圖片

具體來說,SageAttention 的使用非常方便,使用 pip install sageattention 后,

只需要在模型的推理腳本前加入以下三行代碼即可:

圖片

效果上,以開源視頻生成模型 CogvideoX 為例,使用 SageAttention 可以端到端加速 35%,且生成的視頻無損:

全精度 Attention

SageAttention

接下來,將從背景與挑戰,技術方案,以及實驗效果介紹 SageAttention。

背景

隨著大模型需要處理的序列長度越來越長(比如 Llama3.1 支持 128K 的序列長度),Attention 的速度優化變得越來越重要。下圖展示了一個標準的 Transformer 模型中各運算隨著序列長度變化的時間占比:

圖片

挑戰

為了方便指代注意力元算中包含的矩陣,我們先回顧一下注意力的計算公式:

圖片

將神經網絡中各運算的數值類型從高比特量化至低比特是一種有效提升計算和訪存效率的方法。然而,研究團隊發現直接將注意力運算中的 Q, K, P, V 從 FP16 量化為 INT8 或者 FP8 后將會導致在幾乎所有模型和任務上都會得到極差的結果,例如,在 Unidiffuser 文生圖模型中,會得到一張完全模糊的圖像;在 Llama2-7B 進行四選一選擇題任務上得到 25.5% 的準確率。

圖片

經過仔細分析后,研究團隊發現主要是兩個原因導致了量化注意力的不準確:

  • 大多視頻、圖像生成模型中,矩陣 K 表現出了極強的通道維度的異常值分布,直接使用 INT8 或者 FP8 數據類型對其進行量化會導致巨大的誤差。

圖片


  • 在所有模型中,對矩陣 P, V 進行量化不能保證一個模型中所有層的精度。下表展示了對 P, V 量化后,Llama2-7B 和 Unidiffuser 模型所有層中,最差情況的層對應的量化注意力的準確度,(該準確度為量化注意力相比全精度注意力的誤差),可以發現不管對 P, V 矩陣進行何種 8Bit (INT8,E4M3,E5M2)量化,總有些層的準確率非常差,導致了端到端效果的下降。

圖片

技術方案

為了解決上述的兩個關鍵問題,研究團隊提出了對應的解決辦法。

  • 對 K 進行平滑處理。SageAttention 采用了一個簡單但非常實用的方法來消除矩陣 K 的異常值:K = K – mean (K) 其中 mean (K) 是沿著通道維度求平均值。這個簡單的做法不僅不會影響注意力計算的正確性 Softmax (QK^T) = Softmax (Q (K-mean (K))^T) ;且對整個 Attention 速度的影響只有 0.2%;同時還保證了量化后的注意力運算的精度:

圖片

  • 對 Q, K 進行分塊 INT8 量化。對于矩陣 Q, K,SageAttention 采用了以 FlashAttention 的分塊大小為粒度的 INT8 量化。這是因為:1. 對 Q, K 矩陣進行 INT8 量化相比于進行 FP8 量化,注意力的精度更高。2. 在一些常用卡上,比如 RTX4090,INT8 矩陣乘法(INT32 為累加器)的速度是 FP8(FP32 為累加器)的兩倍。
  • 對 P, V 采用 FP16 數據類型的矩陣乘法累加器。對于矩陣 P, V,SageAttention 采用了保留 P, V 為 FP16 的類型,但進行矩陣乘法時采用 FP16 數據類型的累加器。這是因為:1. PV 矩陣乘法的數值范圍始終在 FP16 的表示范圍內,且經過大量實驗驗證,FP16 作為累加器的數據類型不會帶來任何精度損失(見下表)。2. 在一些常用卡上,比如 RTX4090,以 FP16 為累加器數據類型的矩陣乘法的速度是 FP32 作為累加器的兩倍。

圖片

SageAttention 的流程圖及算法如下所示:

圖片

圖片

實驗效果

SageAttention 實現了底層的 GPU Kernel,在算子速度以及各個模型的端到端精度上都有十分不錯的表現。

具體來說,算子速度相比于 FlashAttention2 和 xformers 有 2.1 以及 2.7 倍的加速。以下 4 張圖展示了在 RTX4090 上,不同的序列長度下 SageAttention 的各種 Kernel 與其他方法的速度比較。

圖片


圖片

以下 4 張圖展示了在 RTX3090 上,不同的序列長度下 SageAttention 的各種 Kernel 與其他方法的速度比較。

圖片


圖片

下表展示了在 RTX4090 上,各模型中的注意力模塊中 SageAttention 相比于使用模型原始的注意力的加速比。

圖片

真實任務的精度上,下表展示了 SageAttention 在視頻、圖像、文本生成等大模型上均沒有端到端的精度損失:

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-27 09:30:00

AI數據訓練

2025-06-30 08:42:00

模型訓練AI

2025-06-19 09:07:00

2025-07-08 09:10:00

2024-06-06 16:16:00

2009-06-30 19:12:16

云計算SOAIT

2025-06-30 14:02:00

視覺模型AI

2025-03-27 09:47:23

訓練模型AI

2024-07-09 10:24:13

2025-07-01 09:21:33

2022-12-15 22:01:04

TLog日志標簽

2025-05-08 09:14:54

2024-12-05 13:50:00

AI大模型

2011-11-11 16:29:00

斐訊電力貓FH2001

2009-08-19 16:59:51

美國西蒙光纜結構綜合布線

2016-11-28 14:11:32

搜索

2021-06-08 21:49:06

比特幣區塊鏈礦工

2023-09-04 19:09:00

訓練模型數據

2017-09-19 10:11:57

德國電信

2019-09-23 16:06:50

物聯網大數據IOT
點贊
收藏

51CTO技術棧公眾號

成人免费视频视频| 欧美电影免费| 黑人欧美xxxx| 日本视频精品一区| 一级黄在线观看| 影音先锋成人在线电影| 亚洲国产欧美自拍| 激情五月婷婷久久| 中文字幕有码在线观看| 91小视频在线观看| 国产在线一区二区三区| 天堂资源在线播放| 欧美日韩在线播放视频| 日韩一区二区三区电影| 少妇性饥渴无码a区免费| 日韩黄色影院| 不卡av免费在线观看| 国产噜噜噜噜久久久久久久久| 欧洲第一无人区观看| 日本欧美高清| 欧美一区在线视频| 午夜dv内射一区二区| 国产精品69xx| 中文字幕亚洲一区二区va在线| 国严精品久久久久久亚洲影视| 夜夜躁很很躁日日躁麻豆| 国产午夜精品一区二区三区欧美 | 91福利在线视频| 99视频精品免费视频| 成人网页在线免费观看| 久久久久在线视频| 激情文学一区| 九九热这里只有精品免费看| 人与嘼交av免费| 啪啪激情综合网| 精品少妇一区二区三区在线播放| 日韩一区二区三区不卡视频| 欧美大片1688| 五月婷婷综合激情| 大伊香蕉精品视频在线| 国产欧美久久久久久久久| 欧美激情一区二区三区四区| 久久66热这里只有精品| 欧美一级特黄aaaaaa| 国产综合色在线| 91精品久久久久久久久久久| 久久久999久久久| 久久男女视频| 欧美在线视频一区二区| aaa人片在线| 国产精品永久| 欧美亚洲另类视频| 六月丁香婷婷综合| 亚洲高清在线| 91精品国产91久久久久久最新| 免看一级a毛片一片成人不卡| 一区二区电影| 欧美国产在线电影| 五月天婷婷网站| 在线欧美视频| 97国产一区二区精品久久呦 | www.av一区视频| a毛片在线免费观看| 国产美女av一区二区三区| 成人激情在线播放| 国产成人a人亚洲精品无码| 国产在线乱码一区二区三区| 亚洲精品免费一区二区三区| 99热这里只有精品9| 国产精品1024| 国产伦精品一区二区三区四区视频| 丰满少妇高潮在线观看| 99国产精品国产精品毛片| 久久国产精品亚洲va麻豆| 欧美孕妇孕交| 一色屋精品亚洲香蕉网站| 在线观看免费黄色片| heyzo高清中文字幕在线| 欧美日韩性视频在线| 黑人粗进入欧美aaaaa| 国产精品亚洲成在人线| 欧美一区二区视频观看视频| 手机免费看av片| 欧美调教在线| 中文字幕国内精品| 91精品一区二区三区蜜桃| 国产精品videosex极品| 日本韩国欧美精品大片卡二| 一级片免费观看视频| 成人综合婷婷国产精品久久| 欧美不卡1区2区3区| 免费在线观看黄| 亚洲成人在线免费| 一道本视频在线观看| 97久久综合区小说区图片区| 日韩精品在线播放| 久久一级免费视频| 最新国产拍偷乱拍精品 | 精品久久国产一区| 日韩风俗一区 二区| 久久久久人妻一区精品色| 影音先锋久久精品| 国产精品亚洲片夜色在线| 亚洲乱码在线观看| 国产欧美日韩在线观看| 日本熟妇人妻xxxx| 成人激情视屏| 亚洲激情 国产| 少妇高潮一区二区三区喷水| 国产欧美激情| 99se婷婷在线视频观看| 国产一级在线| 亚洲国产精品麻豆| 在线看免费毛片| 美女毛片一区二区三区四区最新中文字幕亚洲 | 国产日韩欧美91| 香蕉久久一区二区三区| 亚洲品质自拍视频网站| 午夜dv内射一区二区| 老司机在线精品视频| 久久人人爽人人爽爽久久| 国产剧情在线视频| 成人精品小蝌蚪| 五月天在线免费视频| 国产精品亚洲d| 亚洲精品一区中文字幕乱码| 草视频在线观看| 蜜桃av一区二区| 日本高清一区| 东京一区二区| 亚洲国产成人91精品| 欧美丰满艳妇bbwbbw| 久久国产视频网| 亚洲成人精品电影在线观看| 中文字幕在线视频久| 精品电影一区二区| 久久国产精品二区| 国产精品一区二区久激情瑜伽| 亚洲精品在线视频观看| 在线成人视屏| 国产香蕉97碰碰久久人人| 在线观看免费av片| 久久麻豆一区二区| 91视频最新入口| 妖精视频一区二区三区免费观看 | 先锋影音男人资源| avtt久久| 欧美插天视频在线播放| 国产乱淫av片免费| 亚洲天堂精品视频| 99精品999| 雨宫琴音一区二区三区| 92国产精品久久久久首页| 国产在线日韩欧美| 奇米视频888战线精品播放| 98色花堂精品视频在线观看| 日韩一二在线观看| 永久免费看片直接| 麻豆精品蜜桃视频网站| 一区精品在线| 北岛玲精品视频在线观看| 久久精品国产v日韩v亚洲| 97超碰人人草| 国产精品理论在线观看| 美女少妇一区二区| 香港欧美日韩三级黄色一级电影网站| 国产美女搞久久| a视频在线免费看| 欧美tk—视频vk| 五月天综合激情网| 国产色婷婷亚洲99精品小说| 粉色视频免费看| 欧美精品二区| 久久久久久99| 国产三级一区| 欧美福利在线观看| 亚洲欧洲成人在线| 欧美性受xxxx黑人xyx| 国产美女福利视频| 成人免费的视频| 国产免费人做人爱午夜视频| 97人人精品| 99久热re在线精品996热视频| 麻豆mv在线观看| 色七七影院综合| 囯产精品一品二区三区| 色久综合一二码| 高h视频免费观看| 91蜜桃网址入口| 午夜av中文字幕| 国产精品美女久久久| 亚洲一区精彩视频| 久久a级毛片毛片免费观看| 国产成人av在线| 婷婷色在线播放| 亚洲视频欧洲视频| 精品国产无码一区二区| 色诱视频网站一区| 91精品国产高清一区二区三蜜臀| 久久视频一区二区| 天天做天天干天天操| 一本色道久久综合亚洲精品不| 先锋影音亚洲资源| 国产成人精品福利| 成人高清视频观看www| 原纱央莉成人av片| 欧美激情国内偷拍| 欧美jizzhd欧美| 亚洲天堂av女优| 欧性猛交ⅹxxx乱大交| 欧美猛男超大videosgay| 五月天综合激情网| 亚洲一区二区三区四区在线免费观看| 精品无码人妻一区二区免费蜜桃| 成人美女在线观看| 九九九九九伊人| 日本最新不卡在线| 91好吊色国产欧美日韩在线| 欧美+日本+国产+在线a∨观看| 欧洲精品码一区二区三区免费看| 成人激情自拍| 99热国产免费| 国产精品亚洲欧美日韩一区在线| 国产精品1234| 成人小电影网站| 77777少妇光屁股久久一区| 天天干在线视频论坛| 久久精品国产欧美亚洲人人爽| 国产一级免费在线观看| 日韩精品视频在线免费观看| 好吊视频一区二区三区| 日韩欧美一级精品久久| 97成人在线观看| 欧美日韩免费视频| 真实新婚偷拍xxxxx| 一本大道综合伊人精品热热| 欧美日韩精品区| 午夜私人影院久久久久| 久久久久久免费观看| 一区二区三区中文字幕精品精品| 婷婷久久综合网| 17c精品麻豆一区二区免费| 精品日韩在线视频| 中文字幕欧美激情一区| 手机看片福利视频| 亚洲国产精品二十页| 午夜时刻免费入口| 中文一区二区完整视频在线观看| 免费黄色片网站| 中文字幕一区二区三区四区不卡 | 欧美一级片中文字幕| 免费一级欧美片在线播放| 国产免费毛卡片| 亚洲在线一区| 男人的天堂日韩| 久久er精品视频| www.午夜av| 国产成人在线视频免费播放| 一级全黄裸体片| www.99精品| 中文字幕国产综合| 国产日韩视频一区二区三区| 精品手机在线视频| 中文字幕视频一区| 欧美色图亚洲视频| 亚洲精品成人在线| 日韩成人免费在线观看| 色综合天天综合在线视频| 久久这里只有精品9| 欧美精品tushy高清| 精品二区在线观看| 日韩精品视频三区| 91亚洲精选| 欧美肥婆姓交大片| 色是在线视频| 国产色视频一区| 综合视频一区| 免费久久久一本精品久久区| 日韩一区二区三区免费播放| 最近免费观看高清韩国日本大全| 亚洲视频观看| 久草在在线视频| 国产精品一卡二卡在线观看| 91玉足脚交白嫩脚丫| 国产日本欧洲亚洲| 青青草免费av| 欧美日韩国产中字| 在线观看国产成人| 亚洲第一精品自拍| yw在线观看| 欧美交受高潮1| 久久久人成影片一区二区三区在哪下载| 国产在线高清精品| 欧美1区2区3区4区| 五月天色婷婷综合| 亚洲欧美日韩国产一区| 天美一区二区三区| 久久久亚洲午夜电影| 欧美日韩在线国产| 91豆麻精品91久久久久久| 国产黄色大片网站| 亚洲最新中文字幕| av电影院在线看| 成人看片人aa| 精品香蕉视频| 777av视频| 韩日av一区二区| 日韩av在线看免费观看| 亚洲一区二区三区四区在线| 亚洲免费视频二区| 精品中文字幕久久久久久| 91极品在线| 国产自产女人91一区在线观看| 欧美一级三级| 欧美极品少妇无套实战| 久99久精品视频免费观看| wwwwxxxx国产| 午夜久久久久久久久久一区二区| 国产精品一级二级| 在线观看日韩www视频免费| 中文字幕乱码在线播放| 国产精品夜夜夜一区二区三区尤| 亚洲成人tv| 久久婷婷综合色| 日本一区二区视频在线| 草久视频在线观看| 亚洲成人黄色网址| 污片在线免费观看| 亚洲xxxxx电影| 亚洲成人tv| 欧美激情国内自拍| 亚洲视频一区在线观看| 国产一区二区三区四区视频| 国产一区二区三区18| 粉嫩一区二区三区| 日本不卡二区| 日韩高清在线观看| 国产aⅴ激情无码久久久无码| 欧美视频免费在线| 天天爽夜夜爽夜夜爽| 久久久在线视频| 凹凸成人在线| 九色在线视频观看| 久久天天做天天爱综合色| 免费av网站在线| 亚洲色无码播放| 成人国产网站| 中文字幕在线中文字幕日亚韩一区| 麻豆精品蜜桃视频网站| 色婷婷粉嫩av| 日韩一区国产二区欧美三区| 91在线中文| 国产欧美一区二区三区另类精品| 亚洲性感美女99在线| 亚洲欧美日本一区| 欧美日韩一区二区三区| 免费av在线电影| 国产精品视频白浆免费视频| 色婷婷一区二区三区| 99中文字幕在线| 亚洲曰韩产成在线| 完全免费av在线播放| 一区二区三区欧美| 天天干天天草天天射| 日韩免费精品视频| 日韩在线观看电影完整版高清免费悬疑悬疑| 我要看一级黄色大片| 亚洲精品中文字幕在线观看| 高h调教冰块play男男双性文| 欧美中文在线视频| 波多野结衣一区| 成年人看片网站| 精品久久久久久久久久久久久| 裸体xxxx视频在线| 成人性生交大片免费看视频直播 | 91麻豆精品国产91久久久平台| 国产又黄又猛的视频| 亚洲高清视频中文字幕| 可以在线观看的黄色| 成人性教育视频在线观看| 亚洲免费激情| 青青草华人在线视频| 亚洲成人激情在线| 视频在线日韩| 91传媒免费视频| 国产亚洲一区二区三区在线观看 | 精品视频久久久久久| 亚洲欧美专区| 免费无码不卡视频在线观看| 国产精品网站在线| 欧美一级一区二区三区| 国产精品美女久久久免费| 激情欧美丁香| 99热6这里只有精品| 亚洲国产黄色片| 亚洲欧美久久精品| 久久国产色av免费观看| 亚洲黄色片在线观看| 成人在线免费观看| 国产精品果冻传媒潘|