精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比標準Attention提速5-9倍,大模型都在用的FlashAttention v2來了

人工智能 新聞
一年時間,斯坦福大學提出的新型 Attention 算法 ——FlashAttention 完成了進化。這次在算法、并行化和工作分區等方面都有了顯著改進,對大模型的適用性也更強了。

近來,幾種長上下文語言模型陸續問世,包括 GPT-4(上下文長度為 32k)、MosaicML 的 MPT(上下文長度為 65k)Anthropic 的 Claude(上下文長度為 100k)。長文檔查詢和故事寫作等新興用例已經表明擴展語言模型上下文窗口是非常必要的。

然而,擴大 Transformer 的上下文長度是一個挑戰,因為其核心的注意力層在時間復雜度和空間復雜度與輸入序列長度的平方成正比。

一年前,來自斯坦福大學、紐約州立大學布法羅分校的研究者共同提出一種快速、內存高效的注意力算法 ——FlashAttention。該算法無需任何近似即可加速注意力并減少內存占用。現在,已經有許多機構和研究實驗室采用 FlashAttention 來加速訓練和推理

FlashAttention 示意圖。FlashAttention 示意圖。

盡管 FlashAttention 的速度已經是優化基線的 2-4 倍,但它仍然有相當大的改進空間。FlashAttention 仍然不如優化過的矩陣乘法 (GEMM) 運算快,僅達到理論最大 FLOPs/s 的 25-40%。

現在,研究團隊宣布推出 FlashAttention-2。FlashAttention-2 完全從頭開始重寫,使用 Nvidia 的 CUTLASS 3.x 及其核心庫 CuTe 的原語(primitive)。

圖片圖片

FlashAttention-2 開發者 Tri Dao。他是斯坦福大學博士生,還是 Together.AI 首席科學家,并將于 2024 年 9 月開始任職普林斯頓大學計算機科學助理教授。

FlashAttention-2 的速度是 FlashAttention 的 2 倍,在 A100 GPU 上達到 230 TFLOPs/s。在端到端訓練 GPT 類語言模型時,FlashAttention-2 可讓訓練速度高達 225 TFLOPs/s(模型 FLOP 利用率為 72%)。

FlashAttention-2 將加速現有模型的訓練、微調和推理。這意味著我們可以用相同成本訓練 2 倍上下文長度的語言模型。這將有助于語言模型理解長篇書籍和報告、高分辨率圖像、音頻和視頻。

圖片圖片

  • 項目地址:https://github.com/Dao-AILab/flash-attention
  • 技術報告:https://tridao.me/publications/flash2/flash2.pdf

FlashAttention 是什么?

FlashAttention 是一種重新排序注意力計算的算法,它利用平鋪、重計算等經典技術來顯著提升計算速度,并將序列長度中的內存使用實現從二次到線性減少。其中平鋪意味著將輸入塊從 HBM(GPU 內存)加載到 SRAM(快速緩存),并對該塊執行注意力操作,更新 HBM 中的輸出。

此外通過不將大型中間注意力矩陣寫入 HBM,內存讀寫量減少,帶來了 2-4 倍的時鐘時間加速。

下圖為 FlashAttention 的前向傳遞圖:通過平鋪和 softmax 重新縮放,研究者按塊進行操作,避免從 HBM 中讀取 / 寫入,同時獲得正確的輸出,無需近似操作。

圖片圖片

然而,FlashAttention 仍然存在一些低效率問題,原因在于不同線程塊之間的工作分區不理想以及 GPU 上的 warp。這些導致低占用率或不必要的共享內存讀寫。

FlashAttention-2

更好的算法、并行化和工作分區


更少的非矩陣乘法 Flops

研究者調整了 FlashAttention 的算法,從而減少了非矩陣乘法(non-matmul)的 Flops 數量。這點很重要,因為現代 GPU 具有專門的計算單元(例如 Nvidia GPU 上的張量核心),使得矩陣乘法速度更快。

舉例而言,A100 GPU 的 FP16/BF16 矩陣乘法的最大理論吞吐量為 312 TFLOPs/s,但非矩陣乘法 FP32 的理論吞吐量僅為 19.5 TFLOPs/s。

換一種思考方式,每個非矩陣乘法 FLOP 比矩陣乘法 FLOP 的代價高 16 倍。為了保持高吞吐量,研究者希望在矩陣乘法 FLOP 上花費盡可能多的時間。因此他們重寫了 FlashAttention 中使用的在線 softmax 技巧,以減少重新縮放操作、邊界檢查和因果掩碼操作的數量,而無需更改輸出

更好的并行化

FlashAttention v1 在批大小和頭(head)數量上進行并行化。研究者使用 1 個線程塊來處理一個注意力頭,總共有(批大小 * 頭數量)個線程塊。每個線程塊都計劃在流式多處理器(SM)上運行,例如 A100 GPU 上有 108 個這樣的 SM。當這個數字非常大(如 >= 80)時,這種調度是有效的,這時可以高效地使用 GPU 上幾乎所有計算資源。

在長序列的情況下(通常意味著小批量或少量頭),為了更好地利用 GPU 上的多處理器,現在研究者在序列長度維數上額外地進行并行化,使該機制顯著加速

更好的工作分區

即使在每個線程塊內,研究者也必須決定如何在不同的 warp 之間劃分工作(一組 32 個線程一起工作)。通常情況下,每個線程塊使用 4 或 8 個 warp,分區方案如下圖所述。 

研究者改進了 FlashAttention-2 中的這種分區,減少不同 warp 之間的同步和通信量,進而減少共享內存讀寫

圖片圖片

對于每個塊,FlashAttention 將 K 和 V 分割到 4 個 warp 上,同時保持 Q 可被所有 warp 訪問。這被稱為「sliced-K」方案。不過,這種方案是低效的,原因在于所有 warp 都需要將它們的中間結果寫入共享內存,并同步,然后將中間結果相加。這些共享內存讀寫會減慢 FlashAttention 中的前向傳遞速度。

在 FlashAttention-2 中,研究者將 Q 分割在 4 個 warp 上,同時保持 K 和 V 可被所有的 warp 訪問。每個 warp 執行矩陣乘法以獲得 Q K^T 的切片,然后只需與 V 的共享切片相乘就能獲得相應的輸出切片。warp 之間不需要通信。共享內存讀寫的減少也可以提升速度。

新特性:頭維數高達 256、多查詢注意力

我們知道,FlashAttention 僅支持最高 128 的頭維數,這適用于大多數模型,但有一些模型被遺漏了。

因此,FlashAttention-2 支持了高達 256 的頭維數,這意味著 GPT-J、CodeGen 和 CodeGen2、StableDiffusion 1.x 等模型可以使用 FlashAttention-2 來獲得加速和節省內存

此外,FlashAttention-2 還支持了多查詢注意力(multi-query attention, MQA)以及分組查詢注意力(grouped-query attention, GQA)。它們是注意力的變體,其中多個查詢頭關注相同的鍵和值頭,以減少推理過程中 KV 緩存的大小,并可以顯著提高推理吞吐量。

注意力基準結果

研究者在 A100 80GB SXM4 GPU 上,測量不同設置(無 / 有因果掩碼、頭維數 64 或 128)下不同注意力方法的運行時。 

結果發現, FlashAttention-2 的速度是 FlashAttention(以及 xformers 庫和 Triton 中的其他實現)的 2 倍。與 PyTorch 中的標準注意力實現相比,FlashAttention-2 的速度最高是它們的 9 倍。

A100 GPU 上的注意力前向 + 后向速度

A100 GPU 上的注意力前向 + 后向速度。

此外只需要在 H100 GPU 上 運行相同的實現(不使用特殊指令來利用 TMA 和第四代 Tensor Core 等新硬件功能),研究者最高獲得了 335 TFLOPs/s。

圖片

H100 GPU 上的注意力前向 + 后向速度。

當用于端到端 GPT 類模型訓練時,FlashAttention-2 有助于在 A100 GPU 上實現最高 225 TFLOPs/s(模型 FLOPs 利用率為 72%)。與優化良好的 FlashAttention 模型相比,端到端實現 1.3 倍加速。

圖片

這里的基線是不使用 FlashAttention 的 Megatron-LM,它現在也可以選擇使用 FlashAttention 了。不久的將來,FlashAttention-2 也將集成到 Megatron-LM 中

研究團隊表示:下一步將針對 H100 GPU 優化 FlashAttention-2,以使用新的硬件功能。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-15 08:49:44

GoJSONAPI

2023-01-09 12:41:55

模型

2020-06-12 14:25:36

框架PyTorch開發

2023-07-18 14:18:00

Attention模型圖像

2023-09-29 11:55:55

2024-06-28 16:03:38

2024-01-03 13:06:50

2024-12-27 09:30:00

AI數據訓練

2024-12-27 09:50:00

模型數據測試

2013-07-17 10:07:29

Windows Pho功能

2024-05-10 08:47:22

標準庫v2Go

2023-06-27 17:35:39

FastSAM模型SAM

2024-03-13 13:49:22

Sora核心組件DiT

2023-12-11 15:40:32

PyTorch代碼大模型

2023-08-05 13:49:31

鴻蒙操作系統

2010-08-06 14:07:21

RIP V2

2010-08-05 17:00:04

RIP V2協議

2024-01-02 15:15:00

AI模型開源

2023-06-20 08:01:09

RoseDB存儲數據

2025-06-05 08:40:00

點贊
收藏

51CTO技術棧公眾號

色婷婷综合久久久久| 午夜av一区二区三区| 国产精品一区二区久久国产| 亚洲AV无码国产成人久久| 天天综合av| 久久久精品免费观看| 欧美一级片久久久久久久| 中文字幕5566| 久久99国产精品二区高清软件| 92国产精品观看| 国产精品久久久久久久av大片 | 大陆成人av片| 97精品一区二区三区| 最新日本中文字幕| 伊人久久在线| 综合久久综合久久| 国产精品一区二区a| 在线观看日本视频| 欧美gay男男猛男无套| 欧美一级二级三级蜜桃| 今天免费高清在线观看国语| 黄色一级a毛片| 日韩成人精品在线| 美女黄色丝袜一区| 在线免费观看a级片| 国产69精品久久久久9999人| 一区二区三区四区不卡在线| 久久大香伊蕉在人线观看热2| 最近中文在线观看| 亚洲精选91| 最近中文字幕日韩精品| 中文视频在线观看| 国产精品99| 午夜激情一区二区三区| 亚洲综合av一区| 亚洲色欧美另类| 激情综合五月天| 日本精品视频在线观看| www欧美com| 国产欧美日韩免费观看| 日韩精品一区国产麻豆| 少妇网站在线观看| 亚洲十八**毛片| 一区二区三区欧美| 亚洲一区二区在线免费观看| 神马午夜精品95| 国产一二三精品| 国产精品国模在线| 国产成人无码精品久在线观看| 欧美顶级大胆免费视频| 亚洲欧美日韩直播| 黄色录像a级片| 精品一区二区三区四区五区| 在线观看亚洲精品| www国产精品内射老熟女| 色老头在线观看| 最新日韩av在线| 亚洲 国产 欧美一区| 神马久久久久| 波多野结衣在线一区| 5566中文字幕一区二区| 亚洲一级黄色大片| 人人超碰91尤物精品国产| 清纯唯美日韩制服另类| 国产一级做a爰片在线看免费| 久久精品不卡| 中文字幕亚洲无线码在线一区| 中文字幕免费看| 亚州av一区| 亚洲精品国产精品国产自| 国产无套精品一区二区三区| 一区二区三区无毛| 欧美日本在线看| 亚洲激情在线看| 日韩一级特黄| 制服丝袜亚洲网站| 图片区乱熟图片区亚洲| 高清一区二区中文字幕| 欧美日韩精品电影| 中文字幕第88页| 四虎国产精品免费久久5151| 欧美三级视频在线观看| 污污的网站18| av一级久久| 欧美图区在线视频| 亚洲一区二区三区四区五区| 四虎地址8848精品| 欧美一级久久久久久久大片| 亚洲免费在线播放视频| 亚洲超碰在线观看| 亚洲成av人乱码色午夜| 少妇一级淫片免费放播放| 亚洲欧洲国产精品一区| 亚洲电影成人av99爱色| 国产传媒第一页| 香蕉久久精品| 中文字幕av一区二区三区谷原希美| 亚洲精品一区二区三区影院忠贞| 精品国产一级毛片| 久久亚洲精品国产亚洲老地址| 九九九视频在线观看| 91精品国产成人观看| 九九热精品视频| 五月婷婷激情网| 青娱乐精品在线视频| 亚洲aa中文字幕| 天天综合网在线| 亚洲国产精品激情在线观看| 五月婷婷综合色| caoporn免费在线| 天天综合天天综合色| 日本美女高潮视频| 日韩成人久久| 亚洲人成在线观看| 国产97免费视频| 免费日韩一区二区| 亚洲精品欧美极品| 人妻精品一区一区三区蜜桃91| 久久综合久久久久88| 四虎免费在线观看视频| av在线加勒比| 欧美日韩亚洲综合一区二区三区| 中文字幕在线视频精品| 国产suv精品一区| 少妇激情综合网| 草久久免费视频| 国内久久精品视频| 久久精品五月婷婷| 成人免费看片| 欧美中文字幕一区二区三区| 久久久久亚洲av无码专区首jn| 猛男gaygay欧美视频| 欧美成人四级hd版| 丰满人妻一区二区三区四区| 国产真实乱偷精品视频免| 欧美精品尤物在线| 色图在线观看| 在线不卡中文字幕| 亚洲综合色一区| 中文亚洲免费| 成人免费观看网站| 免费日本一区二区三区视频| 欧美午夜宅男影院在线观看| 色网站在线视频| 色综合咪咪久久网| 国产精品va在线播放我和闺蜜| 高清一区二区三区四区| 综合欧美一区二区三区| 九色91popny| 国产精品羞羞答答在线观看| 国内精品一区二区三区四区| 国产草草影院ccyycom| 中文字幕成人网| 一本久道中文无码字幕av| 欧美美女啪啪| 性色av一区二区三区免费| www.久久综合| 一区二区在线观看不卡| 三日本三级少妇三级99| 久久精品影视| 国产精品久久久久久久app| 久青青在线观看视频国产| 亚洲高清久久久| 日韩av成人网| 亚洲激情中文在线| 成人在线精品视频| 激情综合闲人网| 一本大道av伊人久久综合| 欧洲成人午夜精品无码区久久| 91日韩欧美| 成人a免费视频| 国产精品一卡二卡三卡| 欧美丰满美乳xxx高潮www| 一本色道久久88| 久久91精品国产91久久小草| 亚洲一二区在线| 色8久久久久| www.99久久热国产日韩欧美.com| 国产夫妻性生活视频| 午夜精品爽啪视频| 欧美黄色高清视频| 国产精品中文字幕一区二区三区| 精品人妻大屁股白浆无码| 欧美黑白配在线| 国产美女久久精品| www.超碰在线| 日韩在线视频网站| 日本韩国在线观看| 欧美日韩国产中文| 黄色片视频网站| 国产精品久久毛片av大全日韩| 亚洲天堂小视频| 久久精品一区二区三区中文字幕| 亚洲图片在线观看| 国产欧美自拍一区| 国产久一一精品| 欧亚在线中文字幕免费| 久久精品福利视频| 日产精品久久久久久久性色| 欧美妇女性影城| 亚洲视频 欧美视频| 亚洲视频在线一区| 久久久视频6r| 99久久久久久| gogo亚洲国模私拍人体| 久久一区二区三区四区五区 | 色综合一个色综合| 亚洲欧美一区二区三区四区五区| 久久嫩草精品久久久久| 性生交大片免费看l| 青青草91视频| 日本熟妇人妻xxxxx| 激情婷婷亚洲| 潘金莲一级淫片aaaaaa播放1| 久久综合亚洲| 国产精品免费一区二区三区四区 | 精品人在线二区三区| 岳乳丰满一区二区三区| 欧美视频精品一区| 国产亚洲精品久久久久久打不开| 国产精品亲子伦对白| 久久久无码人妻精品一区| 成人视屏免费看| 天天爽夜夜爽视频| 精品午夜久久福利影院 | 国产在线播放一区三区四| 国产精品动漫网站| 亚洲欧洲日本mm| 老司机激情视频| 久久精品欧美一区| 伊人久久青草| 久久精品播放| 在线成人av电影| 色综合色综合| 亚洲欧美精品在线观看| 日韩激情在线| 亚洲综合第一| 91久久夜色精品国产按摩| 亚洲成人第一| 久久一区二区三区电影| 日韩免费毛片| 日韩理论电影| 伊人久久青草| 91精品电影| 在线观看视频黄色| 婷婷久久国产对白刺激五月99| 亚洲成人蜜桃| 午夜激情久久| 精品一区二区成人免费视频| 91精品婷婷色在线观看| 日韩精品第1页| 欧美日韩天堂| 免费一级特黄毛片| 亚洲在线黄色| 99视频免费播放| 美女网站一区二区| 精品亚洲视频在线| 成人三级伦理片| 免费看黄色aaaaaa 片| 久久久亚洲午夜电影| jizz18女人高潮| 亚洲卡通欧美制服中文| 精品少妇一二三区| 亚洲成人激情综合网| 日本va欧美va国产激情| 欧美视频在线免费| 在线免费看av的网站| 7777精品伊人久久久大香线蕉最新版| 国产美女永久免费| 欧美精品一区二区三区蜜臀| 凸凹人妻人人澡人人添| 在线观看中文字幕亚洲| 黄色一级大片在线免费看产| 欧美黑人狂野猛交老妇| 中文在线аv在线| 国产精品吴梦梦| 99re6热只有精品免费观看| 精品一区在线播放| 91亚洲人成网污www| 久久久国产一区二区三区| 午夜爽爽爽男女免费观看| 日韩亚洲在线| 九色91popny| 国产91富婆露脸刺激对白| 日本黄色网址大全| 亚洲人xxxx| av网站中文字幕| 制服丝袜亚洲色图| 免费成人av电影| 欧美成人一区在线| 欧美舌奴丨vk视频| 91免费版网站入口| 日韩最新在线| 中国一级黄色录像| 久久一二三四| 秘密基地免费观看完整版中文| 国产视频一区在线观看| 久久精品国产亚洲AV无码麻豆 | 中文无码精品一区二区三区| 日韩欧美精品在线| 高清在线观看av| 久久久久久国产精品三级玉女聊斋 | 国产精品久久久久久亚洲伦| 久久久久久蜜桃| 欧美日韩视频一区二区| 日本人妻熟妇久久久久久 | a黄色片在线观看| 日韩av片电影专区| 高潮按摩久久久久久av免费| 视频一区二区综合| 精品96久久久久久中文字幕无| 狠狠操狠狠干视频| 久久久久久久久久久电影| 日本三级黄色大片| 日韩视频免费观看高清完整版 | 亚洲少妇一区二区| 中文字幕永久在线不卡| 男人天堂2024| 亚洲国产欧美日韩精品| 四虎影视国产在线视频| 国产在线视频一区| 成人6969www免费视频| 国产精品宾馆在线精品酒店| 大美女一区二区三区| 2021亚洲天堂| 欧美一区二区三区视频免费播放 | 中文幕一区二区三区久久蜜桃| 日本免费观看视| 精品国产凹凸成av人导航| 国产在线高清视频| 91精品久久久久久久久不口人| 欧美午夜精彩| 熟女人妇 成熟妇女系列视频| av网站一区二区三区| 国产无码精品视频| 亚洲第一色中文字幕| 2021中文字幕在线| 激情小说综合网| 亚洲看片一区| 三叶草欧洲码在线| 精品久久久久久中文字幕一区奶水 | 亚洲人成在线免费观看| 欧美日韩大片| 视频三区二区一区| 精品一区二区三区影院在线午夜 | 午夜国产精品一区| 午夜18视频在线观看| 1769国产精品| 久久99蜜桃| 国产九九热视频| 日韩理论片中文av| 亚洲精品无码久久久| 国内精品久久久久| 欧美一性一交| av视屏在线播放| 综合久久综合久久| 亚洲精品.www| 欧美一级大片在线免费观看| 久操成人av| 蜜臀一区二区三区精品免费视频 | 亚洲午夜久久久影院| 性欧美1819sex性高清| 亚洲国产精品综合| 国产一区二区三区av电影| 久久久久久久久久一区二区三区| 亚洲国产私拍精品国模在线观看| 97蜜桃久久| 欧美一区二区综合| 精东粉嫩av免费一区二区三区 | 欧美性猛交xxxx富婆弯腰| 国产视频二区在线观看| 成人观看高清在线观看免费| 欧美欧美全黄| 国产又爽又黄无码无遮挡在线观看| 欧美中文一区二区三区| 91精选在线| 免费一区二区三区| 极品销魂美女一区二区三区| 精品无码久久久久久久久| 精品伊人久久97| 亚洲伦理一区二区| 天天夜碰日日摸日日澡性色av| 国产日韩欧美精品电影三级在线| 97超碰人人草| 2019最新中文字幕| 国产精品久久久久久| 在线中文字日产幕| 欧美色视频一区| 国产福利电影在线播放| 亚洲bbw性色大片| 不卡一区在线观看| 在线观看中文字幕网站| 97超级碰碰碰久久久| 午夜精品一区二区三区国产 | 日韩不卡的av| 色噜噜狠狠成人中文综合| 91在线中字| 亚洲一区在线免费| 99精品视频在线观看| 国产老妇伦国产熟女老妇视频|