精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

單卡A100實現百萬token推理,速度快10倍,這是微軟官方的大模型推理加速

人工智能 新聞
微軟的這項研究讓開發者可以在單卡機器上以 10 倍的速度處理超過 1M 的輸入文本。

大型語言模型 (LLM) 已進入長上下文處理時代,其支持的上下文窗口從先前的 128K 猛增到 10M token 級別。

然而,由于注意力機制的二次復雜度,模型處理輸入提示(即預填充階段)并開始產生第一個 token 可能需要幾分鐘時間。導致首個 token 生成的時間過長,從而嚴重影響了用戶體驗,這也極大地限制了長上下文 LLM 的廣泛應用。 

舉例來說(如圖 2a 所示),在單臺裝有 A100 的機器上為 LLaMA-3-8B 提供服務時,如果提示有 30 萬個 token,模型需要 6 分鐘才能完成預填充( pre-filling)階段,如果提示增加到 100 萬個 token,這個數字將增加到 30 分鐘。

自注意力計算的開銷占到了總預填充延遲的 90% 以上,這使其成為 LLM 處理長上下文時的主要瓶頸。現有的加速預填充方法在應用于長上下文 LLM 時通常無法保持可接受的準確性或效率。

為了解決上述問題,來自微軟、薩里大學的研究者提出了一種旨在加速長序列處理預填充的稀疏計算方法:MInference( Milliontokens Inference )。

圖片

  • 論文地址:https://arxiv.org/pdf/2407.02490
  • 論文主頁:https://hqjiang.com/minference.html
  • 論文標題:MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

MInference 可以直接應用于現有 LLM,無需對預訓練設置進行修改或額外的微調。

通過對各種下游任務(包括 InfiniteBench、RULER、PG-19 和 Needle In A Haystack)以及模型(包括 LLaMA-3-1M、Yi-200K、GLM-4-1M、Phi-3-128K 和 Qwen2-128K)進行評估,實驗證明 MInference 可有效將 A100 上的預填充推理延遲降低多達 10 倍,同時保持準確性。

圖片

使用 MInference 1.0 ,長上下文 LLM(如 LLaMA-3-8B-1M、GLM-4-1M)在單個 A100 上的推理速度實現了 10 倍提升,并且準確度更高。

方法介紹

作者提出了 MInference,這個名字反映了他們希望在一臺 A100 機器上實現百萬(million)token 推理的雄心。

MInference 是一種無需訓練的高效方法,用于基于動態稀疏注意力的長上下文 LLM 的預填充階段。

研究者認為注意力,特別是在長上下文中,是稀疏和動態的,即在不同的輸入中,稀疏模式有很大的不同。這種動態稀疏性呈現出三種適用于所有輸入的獨特空間聚合模式:A 形(A-shape)、垂直 - 斜線(Vertical-Slash)和塊狀 - 稀疏(Block-Sparse)。

MInference 首先使用內核感知稀疏模式搜索算法為每個頭部離線確定最佳動態稀疏模式,如算法 1 所示。在推理過程中,它會根據頭部的模式動態逼近動態稀疏指數,如算法 2、3 所示。最后,作者使用優化后的 GPU 內核執行高效的動態稀疏注意力計算,大大減少了長上下文 LLM 的預填充階段延遲。

圖片

例如,對于「垂直 - 斜線」模式,作者首先利用最后一個 Q 和 K 之間的注意力計算來估計垂直線和斜線的最佳指數。然后,他們利用動態稀疏編譯器 PIT 和 Triton 構建垂直 - 斜線 FlashAttention 內核,加速注意力計算。對于 A 形、垂直 - 斜線和塊狀 - 稀疏模式,作者首先在注意力計算中使用 Q 和 K 的均值池。利用均值池和 MatMul 的交換屬性,可以估算出塊狀 - 稀疏指數。然后,他們使用 Triton 構建塊稀疏 FlashAttention 內核,加速注意力計算。有關內核的詳細實現,請參閱附錄 C.4 和代碼。

在長上下文基準中的評估結果

作者在一系列場景中測試了 MInference,包括 QA、編碼、基于檢索的任務、multi-hop QA、總結和數學任務。RULER 基準包括幾個復雜的 multi-hop 或 multi-needle 任務,有效地反映了 LLM 的實際上下文窗口大小。如表 1 所示,MInference 有效地保留了 LLM 的實際上下文窗口處理能力,甚至將實際上下文窗口大小略微擴展到 32K。

圖片

作者還使用平均 token 長度為 214K 的 InfiniteBench 在更廣泛的任務中測試了 MInference,如表 2 所示。與 SoTA 基線相比,MInference 在所有任務中都始終保持了良好的性能。值得注意的是,在更具挑戰性的檢索任務(如 KV 檢索任務)中,所有基線都無法做出準確預測,準確率低于 1.2%。但是,MInference 成功地保留了處理動態 KV 對檢索的能力。

圖片

為了進一步評估不同上下文長度和關鍵信息在提示中不同位置時的性能,作者使用「大海撈針」任務測試了各種模型和方法。如圖 1 所示,MInference 在不同的模型、上下文窗口和提示信息位置下都表現良好,與原始模型相比,其性能保持不變甚至略有提高。在 LLaMA-3-8B 和 GLM-4-9B-1M 的情況下,MInference 在高達 1M 的上下文窗口中實現了完全綠色的性能。相比之下,即使在 70K 上下文窗口中,StreamingLLM 和 InfLLM 在提示的中間段性能也會下降到 20% 以下。

圖片

作者還使用 PG-19 在語言模型任務中測試了 MInference,其中包括多達 100k 的 token。如圖 2 所示,MInference 有效地保持了 LLaMA-3-8B 和 Yi-9B-200K 的困惑度,而所有基線都出現了不同程度的困惑度下降。此外,與標準的 StreamingLLM 相比,使用膨脹和步長配置的 StreamingLLM 更好地保持了困惑度性能。

圖片

延遲和內核中的稀疏模式 

圖 3 展示了本文提出的三種注意力模式以及 FlashAttention 的微基準測試結果。可以看出,Vertical-Slash 是三種模式中最慢的,但在 1M 上下文窗口下,相比 FlashAttention 仍然實現了 13 倍的加速。

圖片

圖 4 展示了 Vertical-Slash 頭部內核中的稀疏索引。垂直線通過 PIT FlashAttention 使用 1x64 塊計算,而斜線通過塊級 FlashAttention 使用 64x64 塊計算。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-06-11 14:39:50

AILLMMistral

2025-11-04 16:01:56

英偉達模型AI

2024-07-19 09:59:31

2023-12-22 09:32:13

引擎模型

2024-01-24 13:11:00

AI模型

2023-01-05 09:33:37

視覺模型訓練

2023-01-18 09:51:56

模型開源

2025-10-14 08:58:00

2023-12-11 15:40:32

PyTorch代碼大模型

2025-10-21 08:54:00

微軟LLM模型

2024-09-09 08:31:15

2024-01-10 17:13:42

模型數據

2023-11-30 18:25:57

數據訓練

2023-05-30 14:17:00

模型推理

2023-03-22 13:53:26

芯片英偉達

2025-01-08 13:15:02

2024-09-23 08:20:00

模型訓練

2023-01-05 13:11:20

模型

2023-01-08 13:22:03

模型

2025-06-16 14:41:07

模型開源AI
點贊
收藏

51CTO技術棧公眾號

亚洲人午夜精品免费| 国产精品久久福利| 欧美在线一级视频| 人妻一区二区视频| 青青草国产一区二区三区| 亚洲欧美日韩国产另类专区 | 久久久久久久| 国产精品久久网站| 国产精品久久久久久久久久久久冷 | 欧美老熟妇喷水| 伊人免费在线| 成人爱爱电影网址| 国产精品无av码在线观看| 免费在线一区二区三区| 国产亚洲第一伦理第一区| 欧美丰满一区二区免费视频| 一本久道高清无码视频| 成人在线播放视频| 成人av电影在线观看| 国产一区二区色| 人人做人人澡人人爽欧美| 免费拍拍拍网站| 亚洲成人影院麻豆| 91视频在线观看免费| 成人黄色免费看| 国产一级免费视频| 一区免费在线| 久久久999国产精品| 国精产品一区一区三区免费视频| 深夜福利一区| 欧美视频中文字幕| 男人日女人的bb| 午夜激情在线观看| 国产片一区二区三区| 精品国产乱码久久久久久108| 一级特黄特色的免费大片视频| 99久久夜色精品国产亚洲狼 | 国产精品夜间视频香蕉| 中文字幕亚洲高清| 亚洲第一区色| 欧美激情一区二区三区成人| 波多野结衣在线网址| 欧美一级淫片| 夜夜嗨av色综合久久久综合网| 久久久久麻豆v国产精华液好用吗| 欧美电影院免费观看| 欧美日本精品一区二区三区| 色婷婷狠狠18| jizz亚洲女人高潮大叫| 色噜噜狠狠成人中文综合| 色综合久久久久无码专区| 国产深夜视频在线观看| 亚洲国产wwwccc36天堂| 中文字幕日韩精品无码内射| 米奇精品一区二区三区| 国产精品色哟哟网站| 国产亚洲一区字幕| 日本免费久久高清视频| 制服.丝袜.亚洲.中文.综合懂色| 亚洲精品社区| 性欧美视频videos6一9| 韩国av免费观看| 亚洲一区二区成人| 国产成人在线一区| 性高潮视频在线观看| 美女脱光内衣内裤视频久久网站| 国产精品欧美日韩| 97人妻一区二区精品免费视频 | 午夜视频一区在线观看| 欧美 日韩 国产 高清| 亚洲性色av| 欧美午夜一区二区三区免费大片| 色片在线免费观看| 日韩区欧美区| 日韩激情视频在线| 一级片久久久久| 五月综合激情| 欧美精品激情在线| 国产精品视频一区在线观看| 美女视频黄a大片欧美| 91日本在线观看| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的 | 久久99精品久久久| 99爱精品视频| 猫咪在线永久网站| 自拍偷拍亚洲欧美日韩| 成人网站免费观看入口| 成人在线爆射| 欧美肥胖老妇做爰| 99re久久精品国产| 欧美成人自拍| 性欧美长视频免费观看不卡| 中文字幕一区二区人妻视频| 激情图片小说一区| 极品日韩久久| 麻豆影视在线观看_| 亚洲午夜在线视频| 一区二区三区入口| 黄色欧美在线| 色偷偷av一区二区三区乱| 国产在线拍揄自揄拍| 日日夜夜精品视频天天综合网| 成人免费网站在线看| 午夜在线观看视频18| 亚洲少妇最新在线视频| 成人毛片视频网站| 精品一级视频| 国产亚洲精品91在线| 久久久夜色精品| 日本视频一区二区| http;//www.99re视频| 成人三级黄色免费网站| 亚洲高清三级视频| 911福利视频| 中文字幕精品影院| 久久久欧美一区二区| 一区不卡在线观看| 久久久亚洲综合| 91精品国产91久久久久麻豆 主演| 日韩国产网站| 精品调教chinesegay| 青青草原在线免费观看视频| 日韩精品成人一区二区三区| 国产精品.com| 18+激情视频在线| 欧美色综合网站| 泷泽萝拉在线播放| 亚洲经典视频在线观看| 91在线观看欧美日韩| 成人性爱视频在线观看| 色婷婷久久久亚洲一区二区三区| 69xxx免费视频| 中文字幕一区二区av| 国产综合香蕉五月婷在线| 户外极限露出调教在线视频| 午夜亚洲国产au精品一区二区| 香蕉在线观看视频| 亚洲综合婷婷| 91色在线视频| 成人免费网站在线观看视频| 欧美军同video69gay| 成人午夜剧场视频网站| 亚洲一区二区动漫| 欧美久久综合性欧美| 成人av观看| 亚洲男人天堂手机在线| 99精品人妻国产毛片| 久久综合国产精品| 日本中文字幕片| 国产精品中文字幕亚洲欧美| 日本久久久a级免费| 午夜性色福利影院| 色av综合在线| 欧美亚洲色综久久精品国产| 青青草97国产精品免费观看 | 99热6这里只有精品| 免费不卡在线观看| 在线视频亚洲自拍| 国产一区一区| 欧美激情一区二区三区久久久| 丰满熟妇人妻中文字幕| 亚洲电影一级黄| 欧洲一级黄色片| 久久在线精品| 一区二区三区四区欧美| **国产精品| 欧美激情啊啊啊| 亚洲av激情无码专区在线播放| 色综合一个色综合| www成人啪啪18软件| 国内成人免费视频| 美脚丝袜脚交一区二区| 亚洲妇女av| 国产精品三级久久久久久电影| 黄a在线观看| 欧美精品一区二区久久婷婷| 久久久久久久久久久久久av| 国产婷婷精品av在线| 欧美精品性生活| 97久久夜色精品国产| 亚洲综合视频1区| 免费成人在线电影| 色偷偷av一区二区三区| 黄色片一区二区| 色狠狠色狠狠综合| 亚洲欧美一区二区三区四区五区| 成人h动漫精品一区二| 一级特黄性色生活片| 在线精品视频在线观看高清| 久久av一区二区| 日本美女久久| 久久久免费在线观看| eeuss影院www在线播放| 精品少妇一区二区三区视频免付费| 日本污视频在线观看| 国产精品入口麻豆原神| 国产精品亚洲一区二区无码| 日韩福利电影在线| avav在线播放| 日韩a一区二区| 精品卡一卡二| 精品国产亚洲一区二区三区大结局 | 美女视频网站黄色亚洲| 福利视频一二区| 婷婷亚洲综合| 欧洲成人一区二区| jizz国产精品| 亚洲sss综合天堂久久| 欧美www.| 97在线视频免费看| 肉体视频在线| 日韩在线观看精品| 国产在线自天天| 亚洲精品电影网在线观看| 国产人妖一区二区| 在线亚洲+欧美+日本专区| 国产午夜视频在线| 日韩美女精品在线| 黄色片网站免费| 久久综合久久鬼色| 女性生殖扒开酷刑vk| 国产一区二区在线看| 久久99999| 可以看av的网站久久看| www.国产在线视频| 午夜久久一区| youjizz.com亚洲| 日韩影院二区| 亚洲国产精品视频一区| 久久99视频| 就去色蜜桃综合| 日韩伦理一区二区三区| 国产精品我不卡| 伊人精品久久| 高清视频在线观看一区| 日韩一区二区三区精品| 成人欧美在线观看| 青青青国产精品| 国产日韩欧美综合| 一区二区三区| 91精品综合视频| 国产区一区二| 亚洲a在线观看| 欧美激情精品| www.成人av.com| 538任你躁精品视频网免费| 51国偷自产一区二区三区 | 激情黄产视频在线免费观看| 久久久久久有精品国产| 国产福利在线免费观看| 欧美激情亚洲另类| 免费看男女www网站入口在线 | 欧美日韩视频免费| 极品少妇一区二区三区| 亚洲一区二区三区av无码| 影音先锋中文字幕一区| 欧美,日韩,国产在线| 中国女人久久久| 久久精品99国产| 日韩精品免费专区| 国产探花在线看| 国产精品一级黄| 欧美性生交xxxxx| 97超碰欧美中文字幕| 尤物视频最新网址| 中文字幕亚洲在| 免费中文字幕在线观看| 欧美日韩亚洲国产一区| 少妇一级淫片日本| 91精品在线麻豆| 少妇喷水在线观看| 国产一区二区三区日韩欧美| 蜜桃av在线免费观看| 欧美激情国内偷拍| 日日av拍夜夜添久久免费| 国产精品午夜一区二区欲梦| 亚洲天堂av资源在线观看| 久久久av水蜜桃| 日韩欧美网站| 很污的网站在线观看| 日精品一区二区| 性一交一黄一片| 久久无码av三级| 免费中文字幕日韩| 欧美性猛交xxxx黑人| 一级全黄少妇性色生活片| 欧美xxxx在线观看| 国产鲁鲁视频在线观看免费| 久久亚洲国产成人| 波多视频一区| 97久久天天综合色天天综合色hd| 色婷婷av一区二区三区丝袜美腿| 亚洲一区3d动漫同人无遮挡 | 91av视频免费观看| 99精品偷自拍| 男人操女人的视频网站| 一本一道久久a久久精品| 国产视频手机在线观看| 亚洲欧美日韩久久久久久| sm国产在线调教视频| 日本不卡视频在线播放| 日韩精品成人在线观看| 日本不卡在线观看| 亚洲国产精品第一区二区三区| 网站一区二区三区| 久久综合九色综合97婷婷女人| 男的操女的网站| 欧美三级在线视频| 日韩av视屏| 欧美黑人xxxx| 亚洲精品一区av| 奇米888一区二区三区| 国产精品地址| 91 视频免费观看| 国产天堂亚洲国产碰碰| 亚洲天堂一区在线观看| 欧美tickling挠脚心丨vk| 99reav在线| 日韩av色综合| 日韩激情啪啪| 国产精品12345| 国产精一品亚洲二区在线视频| 免费成人深夜天涯网站| 欧美性生交xxxxx久久久| 人妻va精品va欧美va| 欧美另类极品videosbestfree| 久久久加勒比| 日韩欧美99| 日韩精品一级二级 | 欧美人与拘性视交免费看| www精品久久| 波多野结衣中文一区| 久久久久久久国产精品毛片| 欧美一区二区三区在线电影| 免费网站成人| 国产日韩欧美在线看| 四季av一区二区凹凸精品| 污版视频在线观看| 国产精品美女久久久久aⅴ| 国产精品第6页| 亚洲欧洲在线免费| 国产精品亚洲一区二区三区在线观看| 精品在线视频一区二区三区| 亚洲美女视频在线免费观看 | 一本久久青青| 毛片一区二区三区四区| 久久久久久亚洲综合影院红桃| 久久久久99精品成人片我成大片| 日韩av综合网站| 夜鲁夜鲁夜鲁视频在线播放| 美国av一区二区三区| 蜜桃av一区| 超碰人人干人人| 911国产精品| 亚洲妇熟xxxx妇色黄| 成人一区二区三区四区| 亚洲日本视频| 亚洲最大成人网站| 在线观看www91| 免费av不卡| 国产98在线|日韩| 亚洲综合不卡| 精品人妻一区二区三区四区| 欧美老肥妇做.爰bbww| 日本乱理伦在线| 精品一区二区三区国产| 久久精品伊人| 亚洲一二三四五六区| 欧美成人一区二区| 深夜福利视频一区二区| 午夜久久资源| 国产乱码精品一区二区三 | 欧美日韩一卡二卡| www国产在线观看| 精品一卡二卡三卡四卡日本乱码 | 亚洲国产精品狼友在线观看| 性欧美疯狂xxxxbbbb| 国产在线一在线二| 96pao国产成视频永久免费| 亚洲精品极品| 天堂av网手机版| 精品成人一区二区三区四区| 原纱央莉成人av片| 青青草影院在线观看| 99精品久久免费看蜜臀剧情介绍| 国产成人无码专区| 久操成人在线视频| 国产一区二区三区探花| 亚洲欧美日韩一二三区| 精品女厕一区二区三区| 欧美成人xxx| 久久久久综合一区二区三区| 久久 天天综合| 日本中文字幕在线| 久久精品青青大伊人av| 日韩高清电影免费| 中文字幕1区2区| 欧美日韩视频一区二区| 欧美xxxhd| 黄色一级大片免费|