精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達(dá)提出全新Star Attention,10倍加速LLM推理!登頂Hugging Face論文榜

人工智能 新聞
大模型如今已具有越來越長的上下文,而與之相伴的是推理成本的上升。英偉達(dá)最新提出的Star Attention,能夠在不損失精度的同時(shí),顯著減少推理計(jì)算量,從而助力邊緣計(jì)算。

當(dāng)下的手機(jī)及AIPC中都會(huì)安裝本地大模型,然而上下文長度增加,推理時(shí)的計(jì)算成本也會(huì)顯著增長。最明顯的一個(gè)后果就是,用戶輸入問題后需要等待很久才能看到結(jié)果。

為此,已有多種優(yōu)化方案提出,例如Flash Attention,而11月26日英偉達(dá)提出的Star Attention機(jī)制,可用于提升Transformer模型在處理長序列時(shí)的效率和準(zhǔn)確性。

值得一提的是,這篇文章受到了廣泛的關(guān)注,登頂Hugging Face每日論文榜首。

圖片

論文地址:https://arxiv.org/abs/2411.17116

Star Attention如何降低推理成本

在了解Star Attention如何改進(jìn)大模型推理前,讓我們先看看當(dāng)前大模型的推理過程涉及的兩個(gè)步驟:

1)prompt編碼,即模型處理輸入并在緩存中存儲(chǔ)KV(鍵值)向量;

2)token生成,即模型關(guān)注KV緩存并自回歸生成新令牌,同時(shí)用新 的KV向量更新緩存。

在許多長上下文任務(wù)中,輸入由一個(gè)長上下文后跟一個(gè)短查詢和一個(gè)短答案組成。當(dāng)大模型的上下文變得越來越長之后,回答查詢所需的信息通常局限在上下文的小部分內(nèi),意味著上下文只需關(guān)注附近的token,而查詢token需要關(guān)注所有之前上下文涉及的內(nèi)容。

圖片Star Attention下的兩階段推理

系統(tǒng)中所有設(shè)備被分組為多個(gè)主機(jī)(host),其中一個(gè)主機(jī)被標(biāo)記 為「查詢」主機(jī)。輸入序列分為兩個(gè)階段處理。

階段一:上下文編碼

輸入的上下文部分被分割成較小的塊,并分配到各個(gè)主機(jī)。除了第一個(gè)塊之外,所有塊的前面都加上一個(gè)初始?jí)K,稱為「錨點(diǎn)」塊(anchor block)。每個(gè)主機(jī)處理其分配的塊,并存儲(chǔ)非錨點(diǎn)部分的KV緩存。

階段二:查詢編碼和token生成

輸入查詢被廣播到所有主機(jī),在每個(gè)主機(jī)中,它首先訪問在第一階段計(jì)算出的本地KV緩存。然后「查詢」主機(jī)通過聚合所有主機(jī)的softmax歸一化統(tǒng)計(jì)數(shù)據(jù)來計(jì)算全局注意力。這個(gè)過程對(duì)于每個(gè)生成的token都會(huì)重復(fù)。

用一個(gè)不那么嚴(yán)謹(jǐn)?shù)睦觼砀攀錾厦娴倪^程:想象一場(chǎng)烹飪比賽(上下文token),每個(gè)廚師(主機(jī))負(fù)責(zé)準(zhǔn)備一道菜的一部分(塊)。

為了確保味道一致,每個(gè)廚師除了準(zhǔn)備自己的部分,還在前面加了一點(diǎn)「錨點(diǎn)」調(diào)料(錨點(diǎn)塊)。每個(gè)廚師準(zhǔn)備好自己的部分后,記住自己部分的口味(KV緩存)。

階段二的查詢編碼和token生成可視為:評(píng)委(查詢token)來品嘗菜肴,并決定下一道菜的口味(生成新token)。評(píng)委先品嘗每個(gè)廚師的部分,看看哪個(gè)部分最符合他們的口味。

最后,評(píng)委匯總所有廚師的意見,確定下一道菜的口味,并告訴廚師們。

Star Attention的性能提升

Star Attention帶來的性能提升,主要體現(xiàn)在以下兩個(gè)方面:

1)高達(dá)11倍的加速

在多個(gè)長上下文基準(zhǔn)測(cè)試上,Star Attention所加持的8B Llama3的推理速度顯著提升,隨著序列長度增加,加速比從1.1x提升到2.7x。

而在參數(shù)量更大的Llama3.1-70B上,推理的加速比提升更為顯著。

圖片

與此同時(shí),對(duì)比采用全局注意力的基準(zhǔn),Star Attention相對(duì)準(zhǔn)確率的降低只在0~3%范圍內(nèi)。

圖片

隨著上下文長度的增加,star attention推理的準(zhǔn)確性相比全局注意力幾乎相同,但推理計(jì)算成本顯著下降

在更長的上下文尺度(128K)中,上下文編碼過程中不同塊的大小,也會(huì)影響推理的準(zhǔn)確性和速度。塊尺寸越大,Star Attention 的準(zhǔn)確性越高。

圖片

在 RULER 基準(zhǔn)測(cè)試上,不同塊大小對(duì)Star Attention準(zhǔn)確性的影響,塊大小范圍從4K到32K,適用于序列長度為128K的Llama-3.1-8B instruct 模型

用于評(píng)估的RULER,包含了13個(gè)任務(wù),分為4個(gè)領(lǐng)域:大海撈針 (檢索)、多跳追蹤、聚合和問答,

圖片

不同任務(wù)中,全局注意力和Star Attention的準(zhǔn)確性差異對(duì)比

圖片

而在上下文長度更大,達(dá)到1048K時(shí),Star Attention的推理準(zhǔn)確性依舊保持在原基準(zhǔn)90%,推理加速比達(dá)到了10.8×~16.9×。

而在更大的Llama3.1-70B中,Star Attention能實(shí)現(xiàn)更大的加速比,同時(shí)保持相似水平的準(zhǔn)確率下降。

由于其運(yùn)行機(jī)制不涉及具體模型,Star Attention可以無縫集成到大多數(shù)通過全局注意力訓(xùn)練的基于Transformer的LLMs中,無需額外的模型微調(diào)。

由于減少了推理的計(jì)算成本,Star Attention顯著減少了內(nèi)存需求,使得在本地設(shè)備(如手機(jī),筆記本中)用LLM處理更長的序列成為可能。

實(shí)驗(yàn)發(fā)現(xiàn),將塊大小設(shè)置為總序列長度的約四分之一,可以在精度和速度之間取得最佳平衡。而用戶也可以根據(jù)需求調(diào)整塊大小,以在計(jì)算效率和精度之間進(jìn)行權(quán)衡。

結(jié)論

未來的研究,會(huì)嘗試將Star Attention擴(kuò)展到更長的序列(最長可達(dá)1M)和更大的模型,并希望能觀察到甚至更的加速,同時(shí)保持相似水平的準(zhǔn)確率。同時(shí)專注于優(yōu)化「錨塊」機(jī)制,并在更復(fù)雜的長上下文任務(wù)上提高性能,以增強(qiáng)Star Attention的可擴(kuò)展性和穩(wěn)健性。

總的來看,對(duì)于想要開發(fā)部署本地大模型的廠商,Star Attention是一項(xiàng)不容錯(cuò)過的技術(shù)。使用Star Attention后,本地LLM能夠更快地回復(fù)用戶,還可在有限的內(nèi)存中兼容更長的上下文序列,從而在RAG任務(wù)中閱讀更長的文本。

而對(duì)于云端大模型的提供商,Star Attention能夠在幾乎不影響用戶體現(xiàn)的前提下,顯著提升推理成本,實(shí)現(xiàn)「降本增效」,同時(shí)減少能源消費(fèi)(碳足跡)。

通過在多個(gè)主機(jī)間分配上下文處理,Star Attention使上下文長度能夠隨主機(jī)數(shù)量線性擴(kuò)展。


責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-02-29 16:35:01

StarCoder2大型語言模型人工智能

2023-10-08 09:00:00

LLMGitHub人工智能

2023-03-22 13:53:26

芯片英偉達(dá)

2025-10-21 08:54:00

微軟LLM模型

2025-07-30 08:40:00

AI編程模型

2025-03-12 09:35:45

2023-09-10 12:37:38

模型英偉達(dá)

2024-01-02 09:10:17

k開源數(shù)據(jù)

2025-07-21 09:11:00

2023-05-23 14:06:53

微軟研究

2022-10-27 16:03:57

2018-11-26 14:56:15

云計(jì)算UCloud云主機(jī)

2025-06-18 13:59:11

計(jì)算英偉達(dá)視覺

2025-03-05 04:00:00

2025-08-26 15:31:35

英偉達(dá)模型架構(gòu)

2024-10-21 10:20:00

訓(xùn)練模型

2022-06-01 16:47:53

AI模型開源

2023-05-30 14:17:00

模型推理

2024-09-09 16:22:51

2023-09-01 15:22:49

人工智能數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩不卡手机在线v区| 视频免费一区二区| 国产精品毛片久久久久久久| 92看片淫黄大片欧美看国产片 | 亚洲视频香蕉人妖| 亚洲直播在线一区| www.中文字幕在线观看| 日韩在线综合| 亚洲第一av网| 国产原创精品在线| 91高清视频在线观看| 国产欧美精品一区| 国产精品成人观看视频免费| 国产视频1区2区| 欧美~级网站不卡| 国产亚洲a∨片在线观看| theporn国产精品| 色在线视频观看| 亚洲精品日产精品乱码不卡| 久久人人爽爽人人爽人人片av| 中文字幕永久免费视频| 在线欧美不卡| 久久久成人av| 无码人妻丰满熟妇啪啪欧美| 成人性生交大片免费看96| 欧美亚洲尤物久久| 欧美成人高潮一二区在线看| 蜜桃视频在线观看www社区| 91麻豆国产精品久久| 91久久精品国产91久久性色tv| 天天爱天天做天天爽| 亚洲黑丝一区二区| 欧美精品性视频| 污污视频网站在线免费观看| 亚洲欧洲免费| 亚洲国产精品悠悠久久琪琪| 91小视频在线播放| 国产成人精选| 在线一区二区三区四区五区 | 制服丝袜亚洲精品中文字幕| 97视频在线免费播放| 丰乳肥臀在线| 亚洲综合男人的天堂| 久久久国产精华液999999| 久久精品人人做人人爽电影| 一本一本久久a久久| 香蕉一区二区| 亚洲黄色www网站| 人妻体体内射精一区二区| 全球中文成人在线| 欧美性大战久久| 亚洲 中文字幕 日韩 无码| 性爽视频在线| 欧美日韩综合视频| 乱人伦xxxx国语对白| √8天堂资源地址中文在线| 亚洲精品国产成人久久av盗摄| 一区二区三区四区在线视频| 午夜视频在线观看免费视频| 国产精品久久久久久久久搜平片| 神马影院一区二区| 黄色片免费在线| 欧美激情一区在线| 一本久道久久综合| 免费在线观看av| 亚洲欧洲av在线| 妞干网这里只有精品| 黄色网在线免费观看| 亚洲品质自拍视频网站| 欧美日韩dvd| 男人添女人下部高潮视频在线观看| 亚洲久本草在线中文字幕| 4444在线观看| 1234区中文字幕在线观看| 精品日韩美女的视频高清| 亚洲精品无码国产| 都市激情亚洲一区| 精品视频色一区| 亚洲在线观看网站| 国产福利一区二区精品秒拍| 日韩av最新在线观看| 亚洲理论片在线观看| 日本一本不卡| 久久6免费高清热精品| 一级片免费网址| 日韩极品在线观看| 91视频8mav| 天天综合网天天综合| 久久美女艺术照精彩视频福利播放 | 日本vs亚洲vs韩国一区三区二区| 国产精品久久久久久久久借妻 | 周于希免费高清在线观看 | 欧美丰满少妇xxxxx| 日韩av综合在线| 视频一区免费在线观看| 国产在线98福利播放视频| wwwav在线播放| wwwwxxxxx欧美| 宅男一区二区三区| 182在线视频观看| 欧美在线小视频| 亚洲 欧美 另类人妖| 成人线上播放| 在线电影欧美日韩一区二区私密| 日韩女优一区二区| 日韩专区欧美专区| 高清国语自产拍免费一区二区三区| 欧美色18zzzzxxxxx| 成人免费在线视频| 欧美成人免费高清视频| 国产精品xnxxcom| 亚洲少妇激情视频| 九九视频免费在线观看| 日韩高清在线观看| 国产九色91| 国产在线激情| 91福利精品第一导航| 少妇搡bbbb搡bbb搡打电话| 国产一区二区三区四区大秀| 欧美激情精品久久久| 中文字幕一区二区三区四区视频| 99精品久久只有精品| 青青草原网站在线观看| 成人精品国产亚洲| 日韩二区三区在线| 久久久久久国产精品免费播放| 日韩av一区二| 久久大香伊蕉在人线观看热2| h网站久久久| 欧美日韩视频在线第一区| 久久99国产精品久久久久久久久| 性欧美videossex精品| 国产精品调教视频| 久久91亚洲精品中文字幕奶水| 最新在线中文字幕| 国产午夜亚洲精品理论片色戒| 麻豆tv在线播放| eeuss国产一区二区三区四区| 久久夜色精品国产欧美乱| 中文在线免费看视频| 国产三级精品视频| 久久综合久久色| 丝袜连裤袜欧美激情日韩| 久久久女人电视剧免费播放下载 | 日本欧美久久久久免费播放网| 国产在线一区二区三区欧美| 免费看电影在线| 日韩一级欧美一级| 欧美成人黄色网| 国产一区二区三区久久久 | 18成人免费观看网站下载| 一级毛片视频在线观看| 欧美日免费三级在线| 五月天精品视频| 日韩精品免费专区| 日本a级片久久久| 人人鲁人人莫人人爱精品| 亚洲欧美一区二区三区四区| 特级毛片www| 久久麻豆一区二区| 最新中文字幕免费视频| 欧美xxxxx视频| 成人性生交大片免费看小说 | 美女精品一区最新中文字幕一区二区三区 | 久久久久9999| 久久久久久9| 视频一区二区三| 欧美aaaaaaaa| 欧美老女人在线视频| 亚洲AV无码一区二区三区少妇| 中国色在线日|韩| 欧美日韩天堂| 日韩视频国产视频| 久久国产精品波多野结衣av| 国产激情一区二区三区| 欧美一三区三区四区免费在线看| 99福利在线观看| 波多野结衣在线观看一区二区三区| 国产精品xxx视频| 国产视频一区二区| 精品国产凹凸成av人网站| 欧美a∨亚洲欧美亚洲| 国产欧美一区二区三区在线看蜜臀| 亚洲一区日韩精品| 亚洲午夜电影| 欧美视频小说| 超碰国产精品一区二页| 欧美极品第一页| 欧美日韩国产亚洲沙发| 欧美精品一卡二卡| 国产精品999久久久| 国产日产欧美一区二区视频| 做a视频在线观看| 国产精品久久久一区二区| 亚洲国产精品久久久久久女王| 天堂av网在线| 综合激情婷婷| 99re视频在线播放| 高清电影一区| 欧美日本亚洲视频| 久草在现在线| 精品久久人人做人人爰| 无码人妻熟妇av又粗又大| 日韩一区欧美小说| 特大黑人巨人吊xxxx| 国模无码大尺度一区二区三区| 欧美激情视频免费看| av在线不卡顿| 精品国产一区二区三区免费| 97精品资源在线观看| 欧美有码在线视频| av在线免费观看网址| 国产亚洲欧洲黄色| 人妻91麻豆一区二区三区| 欧美年轻男男videosbes| www.日本精品| 亚洲午夜羞羞片| 亚洲怡红院在线观看| 久久一二三国产| 国产高潮失禁喷水爽到抽搐| 狠狠狠色丁香婷婷综合久久五月| 日韩精品一区二区三区色欲av| 欧美日韩精品一本二本三本 | av亚洲免费| 精品国产乱码久久久久软件| 精品国产亚洲一区二区三区| 日本sm极度另类视频| 福利小视频在线| 欧美另类99xxxxx| 欧美人xxx| 亚洲色图在线观看| 欧美孕妇孕交| 日韩av影视综合网| 欧日韩在线视频| 精品久久免费看| 亚洲精品国产av| 欧美一区欧美二区| 国产精品久久无码一三区| 欧美性色欧美a在线播放| 不卡av电影在线| 色婷婷久久久亚洲一区二区三区| 日本免费在线播放| 亚洲综合色在线| 国产一级特黄毛片| 亚洲综合在线观看视频| 在线观看成人毛片| 《视频一区视频二区| 一级免费黄色录像| 国产精品毛片无遮挡高清| 美女av免费看| 国产精品成人免费在线| 你懂得视频在线观看| 久久久久久免费网| 天天舔天天操天天干| 国产三级精品视频| youjizz亚洲女人| 国产精品高潮呻吟久久| 日韩在线不卡av| 亚洲女同一区二区| 99久久99久久精品国产| 国产精品毛片大码女人| 91制片厂在线| 亚洲精品视频观看| 国产无精乱码一区二区三区| 亚洲国产你懂的| 久久久久亚洲av成人毛片韩| 精品久久久久久久久久久久| 在线天堂中文字幕| 91福利区一区二区三区| 国产精品久久久久久久免费| 日韩一区二区免费视频| 欧美一级一区二区三区| 日韩大片免费观看视频播放| 国产一级在线| 欧美xxxx18国产| 成人福利电影| 国产精彩精品视频| 国产高清日韩| 国产伦精品一区二区三区免| 久久99国产精一区二区三区| 亚洲欧美丝袜| 欧美日韩影院| 成人黄色片视频| 狠狠色丁香久久婷婷综合丁香| xfplay5566色资源网站| 久久久亚洲欧洲日产国码αv| 日本黄区免费视频观看| 亚洲曰韩产成在线| 伊人久久久久久久久久久久 | 国产精品麻豆一区二区| 女性裸体视频网站| 五月天视频一区| 正在播放木下凛凛xv99| 欧美成人一区二区三区在线观看 | 国产激情片在线观看| 亚洲在线黄色| 超碰91在线播放| 91视频精品在这里| 国产又粗又硬又长又爽| 精品国产91久久久久久老师| 怡红院男人天堂| 欧美精品一区二区三区蜜桃视频| 黄色av网站在线免费观看| 美女少妇精品视频| 日韩一区二区三区在线免费观看| 亚洲自拍小视频| 少妇精品久久久| 成人av在线不卡| 久草在线在线精品观看| 国产制服丝袜在线| 亚洲男人的天堂在线aⅴ视频| gv天堂gv无码男同在线观看| 亚洲国产精品人人做人人爽| 亚洲图片中文字幕| 国产婷婷成人久久av免费高清 | 91精品国产91| 国产激情精品一区二区三区| 日本免费高清不卡| 亚洲国产一区二区精品专区| www.com久久久| 国产欧美一区二区三区在线看蜜臀| 国产极品美女高潮无套嗷嗷叫酒店| 欧美嫩在线观看| av电影在线网| 国产成人一区二区三区小说| 大香伊人久久精品一区二区| 在线丝袜欧美日韩制服| 日本中文一区二区三区| 国产中文字幕一区二区| 亚洲一区二区在线播放相泽 | 精品国产一区二区国模嫣然| 日本美女在线中文版| 国产精品9999| 亚洲丝袜啪啪| koreanbj精品视频一区| 国产成人精品www牛牛影视| 亚洲女人久久久| 精品视频在线看| 成年人视频网站在线| 国产成人高清激情视频在线观看| 亚洲97av| 男人天堂999| 久久综合国产精品| 日韩不卡视频在线| 精品亚洲一区二区三区四区五区| 超碰中文在线| 国产伦精品一区二区三区视频孕妇 | 国产宾馆实践打屁股91| 国产大片免费看| 欧美一区二区免费观在线| 欧美精品七区| 午夜视频一区| 国产成人精品一区二区三区在线观看| 亚洲人成在线播放网站岛国| 97人妻人人澡人人爽人人精品| 色偷偷偷综合中文字幕;dd| 久久天天久久| 日本在线视频www色| 国产精品主播直播| 国产真实乱人偷精品视频| 亚洲第一国产精品| 久久男人天堂| 日本视频精品一区| 麻豆精品视频在线观看| 免费看特级毛片| 欧美zozo另类异族| 黄色软件视频在线观看| 欧美国产综合视频| 美日韩一级片在线观看| 黄色录像免费观看| 精品久久久三级丝袜| 蜜桃av在线| 视频一区视频二区视频| 精品一区二区影视| 久久久美女视频| 亚洲美女免费精品视频在线观看| 户外露出一区二区三区| 精品国产三级a∨在线| 国产成人三级在线观看| 99热在线观看免费精品| 在线播放日韩av| 国产免费av国片精品草莓男男| 国产一级做a爰片久久毛片男| 99久久99久久免费精品蜜臀| 91视频久久久| 久热精品视频在线| 久久精品国产亚洲blacked| 激情网站五月天| 中文字幕色av一区二区三区| 亚洲精品国产片| 日本精品视频在线观看| 久久在线免费| 美女露出粉嫩尿囗让男人桶| 国产综合色在线观看| 日韩精品一区二区三区丰满| 久久精品理论片| 欧美激情www| 六月丁香综合在线视频| 国产无遮挡裸体免费视频| 亚洲欧美三级伦理|