精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?新一代注意力機制Lightning Attention-2:無限序列長度、恒定算力開銷、更高建模精度

人工智能 新聞
Lightning Attention-2 是一種新型的線性注意力機制,讓長序列的訓練和推理成本與 1K 序列長度的一致。

大語言模型序列長度的限制,極大地制約了其在人工智能領域的應用,比如多輪對話、長文本理解、多模態數據的處理與生成等。造成這一限制的根本原因在于當前大語言模型均采用的 Transformer 架構有著相對于序列長度的二次計算復雜度。這意味著隨著序列長度的增加,需要的計算資源成幾何倍數提升。如何高效地處理長序列一直是大語言模型的挑戰之一。

之前的方法往往集中在如何讓大語言模型在推理階段適應更長的序列。比如采用 Alibi 或者類似的相對位置編碼的方式來讓模型自適應不同的輸入序列長度,亦或采用對 RoPE 等類似的相對位置編碼進行差值的方式,在已經完成訓練的模型上再進行進一步的短暫精調來達到擴增序列長度的目的。這些方法只是讓大模型具有了一定的長序列建模能力,但實際訓練和推理的開銷并沒有減少。 

OpenNLPLab 團隊嘗試一勞永逸地解決大語言模型長序列問題。他們提出并開源了 Lightning Attention-2—— 一種新型的線性注意力機制,讓長序列的訓練和推理成本與 1K 序列長度的一致。在遇到顯存瓶頸之前,無限地增大序列長度并不會對于模型訓練速度產生負面影響。這讓無限長度預訓練成為了可能。同時,超長文本的推理成本也與 1K Tokens 的成本一致甚至更少,這將極大地減少當前大語言模型的推理成本。如下圖所示,在 400M、1B、3B 的模型大小下,隨著序列長度的增加,FlashAttention2 加持的 LLaMA 的訓練速度開始快速下降,然而 Lightning Attention-2 加持的 TansNormerLLM 的速度幾無變化。

圖 1

圖片

  • 論文:Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths in Large Language Models
  • 論文地址:https://arxiv.org/pdf/2401.04658.pdf
  • 開源地址:https://github.com/OpenNLPLab/lightning-attention

Lightning Attention-2 簡介

讓大模型的預訓練速度在不同序列長度下保持一致,這聽起來是一個不可能的任務。事實上,如果一個注意力機制的計算復雜度相對于序列長度保持線性關系的話,就可以實現這一點。自 2020 年線性注意力【https://arxiv.org/abs/2006.16236】橫空出世以來,研究人員一直在為了線性注意力的實際效率符合它的理論線性計算復雜度而努力。在 2023 年之前,大多數的關于線性注意力的工作均集中在對齊它們與 Transformer 的精度上。終于在 2023 年中期,改進的線性注意力機制【https://arxiv.org/abs/2307.14995】在精度上可以與最先進的 Transformer 架構對齊。然而,線性注意力中將計算復雜度變成線性的最關鍵的 “左乘變右乘” 的計算 Trick (如下圖所示),在實際實現中遠慢于直接左乘的算法。其原因在于右乘的實現需要用到包含大量循環操作的累積求和(cumsum),大量的 IO 操作使得右乘的效率遠低于左乘。

圖片

圖 2

為了更好的理解 Lightning Attention-2 的思路,讓我們先回顧下傳統 softmax attention 的計算公式:O=softmax ((QK^T)⊙M_) V,其中 Q, K, V, M, O 分別為 query, key, value, mask 和輸出矩陣,這里的 M 在單向任務(如 GPT)中是一個下三角的全 1 矩陣,在雙向任務(如 Bert)中則可以忽略,即雙向任務沒有 mask 矩陣。

作者將 Lightning Attention-2 的整體思路總結為以下三點進行解釋:

1. Linear Attention 的核心思想之一就是去除了計算成本高昂的 softmax 算子,使 Attention 的計算公式可以寫為 O=((QK^T)⊙M_) V。但由于單向任務中 mask 矩陣 M 的存在,使得該形式依然只能進行左乘計算,從而不能獲得 O (N) 的復雜度。但對于雙向任務,由于沒有沒有 mask 矩陣,Linear Attention 的計算公式可以進一步簡化為 O=(QK^T) V。Linear Attention 的精妙之處在于,僅僅利用簡單的矩陣乘法結合律,其計算公式就可以進一步轉化為:O=Q (K^T V),這種計算形式被稱為右乘,相對應的前者為左乘。通過圖 2 可以直觀地理解到 Linear Attention 在雙向任務中可以達到誘人的 O (N) 復雜度!

2. 但是隨著 decoder-only 的 GPT 形式的模型逐漸成為 LLM 的事實標準,如何利用 Linear Attention 的右乘特性加速單向任務成為了亟待解決的難題。為了解決這個問題,本文作者提出了利用 “分而治之” 的思想,將注意力矩陣的計算分為對角陣和非對角陣兩種形式,并采用不同的方式對他們進行計算。如圖 3 所示,Linear Attention-2 利用計算機領域常用的 Tiling 思想,將 Q, K, V 矩陣分別切分為了相同數量的塊 (blocks)。其中 block 自身(intra-block)的計算由于 mask 矩陣的存在,依然保留左乘計算的方式,具有 O (N^2) 的復雜度;而 block 之間(inter-block)的計算由于沒有 mask 矩陣的存在,可以采用右乘計算方式,從而享受到 O (N) 的復雜度。兩者分別計算完成后,可以直接相加得到對應第 i 塊的 Linear Attention 輸出 Oi。同時,通過 cumsum 對 KV 的狀態進行累積以在下一個 block 的計算中使用。這樣就得到了整個 Lightning Attention-2 的算法復雜度為 intra-block 的 O (N^2) 和 inter-block 的 O (N) 的 Trade-off。怎么取得更好的 Trade-off 則是由 Tiling 的 block size 決定的。

3. 細心的讀者會發現,以上的過程只是 Lightning Attention-2 的算法部分,之所以取名 Lightning 是因為作者充分考慮了該算法過程在 GPU 硬件執行過程中的效率問題。受到 FlashAttention 系列工作的啟發,實際在 GPU 上進行計算的時候,作者將切分后的 Q_i, K_i, V_i 張量從 GPU 內部速度更慢容量更大的 HBM 搬運到速度更快容量更小的 SRAM 上進行計算,從而減少大量的 memory IO 開銷。當該 block 完成 Linear Attention 的計算之后,其輸出結果 O_i 又會被搬回至 HBM。重復這個過程直到所有 block 被處理完畢即可。

想要了解更多細節的讀者可以仔細閱讀本文中的 Algorithm 1 和 Algorithm 2,以及論文中的詳細推導過程。Algorithm 以及推導過程都對 Lightning Attention-2 的前向和反向過程進行了區分,可以幫助讀者有更深入的理解。

圖片

圖 3

圖片

圖片

Lightning Attention-2 精度對比

研究人員首先在小規模(400M)參數模型上對比了 Lightning Attention-2 與 Lightning Attention-1 的精度區別,如下圖所示,二者幾無差別。

圖片

隨后研究人員在 1B、3B 上將 Lightning Attention-2 加持的 TransNormerLLM(TNL-LA2)與其它先進的非 Transformer 架構的網絡以及 FlashAttention2 加持的 LLaMA 在相同的語料下做了對比。如下圖所示,TNL-LA2 與 LLaMA 保持了相似的趨勢,并且 loss 的表現更優。這個實驗表明,Lightning Attention-2 在語言建模方面有著不遜于最先進的 Transformer 架構的精度表現。

圖片

在大語言模型任務中,研究人員對比了 TNL-LA2 15B 與 Pythia 在類似大小下的大模型常見 Benchmark 的結果。如下表所示,在吃掉了相同 tokens 的條件下,TNL-LA2 在常識推理和多項選擇綜合能力上均略高于基于 Softmax 的注意力的 Pythia 模型。

圖片

Lightning Attention-2 速度對比

研究人員對 Lightning Attention-2 與 FlashAttention2 進行了單模塊速度與顯存占用對比。如下圖所示,相比于 Lightning Attention-1 和 FlashAttention2,在速度上,Lightning Attention-2 表現出了相比于序列長度的嚴格線性增長。在顯存占用上,三者均顯示出了類似的趨勢,但 Lightning Attention-2 的顯存占用更小。這個的原因是 FlashAttention2 和 Lightning Attention-1 的顯存占用也是近似線性的。

圖片

筆者注意到,這篇文章主要關注點在解決線性注意力網絡的訓練速度上,并實現了任意長度的長序列與 1K 序列相似的訓練速度。在推理速度上,并沒有過多的介紹。這是因為線性注意力在推理的時候可以無損地轉化為 RNN 模式,從而達到類似的效果,即推理單 token 的速度恒定。對于 Transformer 來說,當前 token 的推理速度與它之前的 token 數量相關。

筆者測試了 Lightning Attention-1 加持的 TransNormerLLM-7B 與常見的 7B 模型在推理速度上的對比。如下圖所示,在近似參數大小下,Lightning Attention-1 的吞吐速度是百川的 4 倍,ChatGLM 的 3.5 倍以上,顯示出了優異的推理速度優勢。

圖片

小結

Lightning Attention-2 代表了線性注意力機制的重大進步,使其無論在精度還是速度上均可以完美的替換傳統的 Softmax 注意力,為今后越來越大的模型提供了可持續擴展的能力,并提供了一條以更高效率處理無限長序列的途徑。OpenNLPLab 團隊在未來將研究基于線性注意力機制的序列并行算法,以解決當前遇到的顯存屏障問題。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-09-19 10:07:41

2018-08-26 22:25:36

自注意力機制神經網絡算法

2024-12-26 09:01:13

2025-01-13 08:23:07

LLMMHAMLP

2025-04-29 09:05:00

2023-04-14 14:42:07

騰訊人工智能

2017-08-03 11:06:52

2025-02-25 09:40:00

模型數據AI

2024-10-31 10:00:39

注意力機制核心組件

2024-06-28 08:04:43

語言模型應用

2024-12-09 00:00:10

2020-09-17 12:40:54

神經網絡CNN機器學習
點贊
收藏

51CTO技術棧公眾號

日韩欧美一区二区视频在线播放| 亚洲日韩视频| 一色桃子久久精品亚洲| 成人网欧美在线视频| 亚洲一级二级片| 国产精品毛片无码| 亚洲综合一区二区| 麻豆av一区| 国产精品一区二区av白丝下载 | 丝袜美腿av在线| 九色综合国产一区二区三区| 欧美激情精品久久久久久变态| 乳色吐息在线观看| 成人做爰视频www网站小优视频| 26uuu另类欧美亚洲曰本| 国产精品视频播放| 中文字幕美女视频| 另类春色校园亚洲| 欧美日韩一区三区| av磁力番号网| 免费在线观看污视频| 久久国产成人午夜av影院| 久久久伊人日本| 欧美性生交大片| 免费欧美一区| 精品久久久久久久久久久院品网| 免费激情视频在线观看| 成人免费网址| 国产三级一区二区三区| 成人情趣片在线观看免费| 亚洲另类欧美日韩| 国产精品v亚洲精品v日韩精品| 日韩激情在线视频| 久久婷五月综合| 美足av综合网| 亚洲欧美偷拍卡通变态| 亚洲v国产v在线观看| 青青草免费观看视频| 婷婷综合久久| 日韩毛片在线观看| 国产伦精品一区二区三区精品| 欧美日韩国产观看视频| 中文字幕亚洲欧美在线不卡| 日本在线观看一区二区| 日本私人网站在线观看| 国产suv一区二区三区88区| 国产成人久久久精品一区| 精品久久免费视频| 欧美日韩午夜| 蜜臀久久99精品久久久久久宅男 | 人妻内射一区二区在线视频 | 亚洲欧美高清视频| 国产剧情av麻豆香蕉精品| 国产精品爽爽爽爽爽爽在线观看| 波多野结衣视频在线看| 国产精品日韩| 欧美一级在线亚洲天堂| 一级片中文字幕| 亚洲综合二区| 国产成人久久久精品一区| 日韩精品久久久久久免费| 亚洲二区免费| 午夜精品久久久久久久99黑人| 久久久久成人精品无码| 亚洲午夜91| 欧美精品videosex性欧美| 精品少妇爆乳无码av无码专区| 欧美黄色免费| 欧美激情一级二级| 日韩黄色在线视频| 久久久噜噜噜| 国产精品久久久久久亚洲影视 | 最爽无遮挡行房视频在线| 亚洲久草在线视频| 青青青在线视频播放| 三妻四妾完整版在线观看电视剧| 色婷婷精品久久二区二区蜜臀av| 欧美精品成人网| 国产精品诱惑| 日韩欧美一二三| 日本五十肥熟交尾| 欧美人成在线观看ccc36| 亚洲欧洲日产国产网站| 美女100%露胸无遮挡| 天天做天天爱天天综合网| 欧美大片在线看| 国产微拍精品一区| 久久99国产精品尤物| 亚洲一区美女视频在线观看免费| 亚洲欧美高清视频| 国产嫩草影院久久久久| 日韩国产精品毛片| 亚洲女色av| 欧美日韩国产三级| 亚洲色图欧美日韩| 日韩欧美视频专区| 久久久久国产精品www| 精产国品一区二区| 国产剧情一区二区| 日本黄网免费一区二区精品| yellow91字幕网在线| 怡红院av一区二区三区| 成人在线观看a| 日韩精品一区二区三区中文 | 亚洲xxxx视频| 久久精品蜜桃| 亚洲自拍偷拍综合| av动漫免费看| 国内精品视频| 精品粉嫩超白一线天av| 日本午夜精品视频| 中国女人久久久| 国产女同一区二区| 日韩精品一二| 亚洲永久精品大片| 无码少妇一区二区三区芒果| 国产一区二区三区四区五区3d| 精品国产免费一区二区三区四区 | 丰满人妻中伦妇伦精品app| 亚洲综合资源| 一本色道久久综合亚洲精品小说| 久久久久久天堂| 精品亚洲国内自在自线福利| 国内精品久久国产| 国产黄在线观看| 精品国产老师黑色丝袜高跟鞋| 日韩高清第一页| 国产精品一区二区99| 国内精品久久久久| 国产成人精品一区二三区四区五区 | 国产 日韩 欧美在线| 国产亚洲精彩久久| 国产一区二区三区视频在线观看 | 在线观看亚洲a| 色婷婷狠狠18禁久久| 四虎国产精品免费观看| 日韩美女福利视频| 日韩中文字幕影院| 最好看的中文字幕久久| 国产成人黄色网址| 精品久久久久中文字幕小说 | 一区二区福利视频| 91久久久久久久久久久久久久| 日韩va亚洲va欧美va久久| 韩国精品一区二区三区六区色诱| 羞羞视频在线观看免费| 欧美一区二区在线免费播放| 美国黄色特级片| 日韩成人av影视| 亚洲欧洲在线一区| 欧美亚洲大片| 亚洲欧美在线一区| 中文字幕天堂在线| 国产精品国产成人国产三级| 日本成人在线免费视频| 欧美日韩播放| 青青久久av北条麻妃黑人| 青青草在线免费观看| 天天av天天翘天天综合网色鬼国产| 亚洲国产精品第一页| 91超碰成人| 成人av中文| 超碰资源在线| 亚洲护士老师的毛茸茸最新章节| 日产精品久久久久| 成人白浆超碰人人人人| 日本xxxxx18| 国产在线不卡一区二区三区| 欧美精品福利视频| 亚洲人成色777777精品音频| 日韩欧美一区二区三区久久| 成人性生交大免费看| 免费精品99久久国产综合精品| 亚洲国产欧美日韩| 欧美男男gaygay1069| 久久在线观看视频| 天堂中文在线看| 91黄色免费看| 放荡的美妇在线播放| av毛片久久久久**hd| 亚洲熟妇国产熟妇肥婆| 精品国产一区二区三区久久久樱花 | 牛牛精品在线视频| 日韩精品在线视频美女| 中文在线观看av| 亚洲综合一区二区| 男女做爰猛烈刺激| 国产美女精品一区二区三区| 五月天男人天堂| 国产精品香蕉| 国产精品视频不卡| 9765激情中文在线| 自拍偷拍亚洲精品| www.中文字幕| 91国产丝袜在线播放| 欧美日韩国产精品综合| 97久久人人超碰| 亚洲欧美日韩三级| 亚洲欧美成人综合| 午夜久久久久久久久久久| 99re8精品视频在线观看| 2019中文字幕免费视频| 黄色av电影在线播放| 精品久久国产老人久久综合| 波多野结衣在线电影| 一区二区三区在线不卡| 在线观看免费小视频| 成人午夜大片免费观看| 激情五月俺来也| 国产精品亚洲欧美| 国产激情片在线观看| 国产精品视屏| 国产日韩精品在线观看| xx欧美视频| 久久久久久com| 欧美性videos| 亚洲天堂av在线免费观看| 国产夫妻自拍av| 欧美午夜精品久久久久久超碰| 久久久久无码精品国产| 成人免费在线视频| 九九热免费在线| 97超碰欧美中文字幕| 中文字幕avav| 久久精品国产**网站演员| 欧美污视频网站| 一本久道久久综合婷婷鲸鱼| 成人在线免费观看视频网站| 日韩一级电影| 国产一区在线观| 精品成人18| 国产日韩精品在线| 懂色aⅴ精品一区二区三区| 欧美裸体男粗大视频在线观看| 第九色区av在线| 亚洲九九九在线观看| 手机在线精品视频| 亚洲第一福利网| 精品国产九九九| 欧美疯狂做受xxxx富婆| 无码无套少妇毛多18pxxxx| 香蕉乱码成人久久天堂爱免费| jizz日本在线播放| 精品写真视频在线观看| 日本在线播放一区二区| 久久精品久久综合| 亚洲天堂国产视频| 看片的网站亚洲| 日本一极黄色片| 亚洲欧美卡通另类91av| 日本久久久精品视频| 首页综合国产亚洲丝袜| 91亚洲精品国产| 午夜激情久久| 日韩欧美精品一区二区| 欧美亚洲激情| 制服诱惑一区| 欧美二区不卡| 分分操这里只有精品| 国产精品日韩| 波多结衣在线观看| 九色|91porny| 野花视频免费在线观看| 成人综合在线观看| av不卡中文字幕| 成人avav影音| 91成年人网站| 国产精品天美传媒沈樵| 国产精品视频一区二区在线观看 | 天堂网av2018| 国产天堂亚洲国产碰碰| 国产麻豆a毛片| 一区二区视频在线看| 看片网站在线观看| 亚洲午夜精品网| 国产香蕉视频在线| 疯狂欧美牲乱大交777| 国产又粗又猛又黄视频| 欧美高清一级片在线| 丰满人妻av一区二区三区| 精品电影一区二区三区 | 日本一区二区三区四区 | 日韩欧美在线观看一区二区| 中文字幕亚洲天堂| 污污网站在线观看| 欧美性在线视频| 欧美91在线|欧美| 国产日韩欧美综合精品 | av不卡在线| 精品久久久久久久免费人妻| 水野朝阳av一区二区三区| 日韩av加勒比| 99久久精品国产精品久久| 国产精品久久无码| 国产精品久久久久aaaa樱花| 久久综合色综合| 欧美性猛交xxxxxxxx| 国内精品久久久久久久久久久 | 97在线观看免费观看高清| 欧美巨大黑人极品精男| 忘忧草在线影院两性视频| 国产精品丝袜一区二区三区| 日本高清久久| 日韩欧美亚洲在线| 一区二区三区国产盗摄| 国产精品97在线| 日韩av在线播放中文字幕| 亚洲v在线观看| 亚洲国产成人自拍| 天天综合天天干| 日韩一区二区三区视频在线 | 天天综合久久综合| 欧美一二三在线| se在线电影| 欧美壮男野外gaytube| 成人亚洲精品| 亚洲精蜜桃久在线| 美日韩精品视频| 中文字幕第66页| 国产精品水嫩水嫩| 男人天堂av在线播放| 亚洲国产成人精品女人久久久| 国产日产一区二区| 国产精品夜色7777狼人| 九九热线有精品视频99| 国产极品尤物在线| 国产成人亚洲综合a∨婷婷图片| 自拍偷拍你懂的| 欧美亚洲综合久久| 亚洲乱熟女一区二区| 久久久精品久久久| 欧美香蕉视频| 国内一区二区三区在线视频| 欧美久久久久| 超级砰砰砰97免费观看最新一期| 91免费国产在线| 日本视频免费在线| 亚洲精品乱码久久久久久金桔影视 | 日本一区二区三区视频在线看| 伊人精品久久久久7777| 免费不卡在线观看| 日本污视频网站| 欧美日韩三级在线| 永久免费av在线| 国产97人人超碰caoprom| 一区二区三区日本久久久| www.欧美黄色| 成人激情校园春色| 99视频在线看| 国产视频一区在线| 亚洲承认视频| 人偷久久久久久久偷女厕| 一区在线视频| 国产精品无码在线| 精品久久在线播放| 性xxxx搡xxxxx搡欧美| 久久久久在线观看| 婷婷精品在线观看| 亚洲高清在线免费观看| 国产欧美精品一区| 亚洲天堂久久久久| 免费97视频在线精品国自产拍| 日本一区二区三区播放| 欧美日韩福利在线| 26uuu亚洲婷婷狠狠天堂| 男人天堂视频在线| 日韩在线视频免费观看| 亚洲**毛片| 337p粉嫩大胆噜噜噜鲁| 国产性色一区二区| 国产又粗又长又大视频| 中文字幕在线视频日韩| 国产亚洲久久| 天天想你在线观看完整版电影免费| 国产精品夜夜爽| 日韩av电影网址| 国产亚洲xxx| 日本精品裸体写真集在线观看| 一区二区三区四区在线视频| 毛片不卡一区二区| 国产一级久久久| 亚洲欧美精品中文字幕在线| 欧美7777| 国产女人18毛片| 91小视频在线观看| 97人妻精品一区二区三区| 欧美高清在线观看| 精品影片在线观看的网站| 91亚洲精品久久久蜜桃借种| 亚洲国产精品久久人人爱| 国产农村妇女aaaaa视频| 日韩亚洲欧美中文在线| 国产精品高清一区二区| 久久久久久久久久久福利| 亚洲精品视频在线观看网站| 色综合888| 国产九九精品视频| 欧美国产精品| 婷婷色一区二区三区| 日韩一级片网站|