精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RAG新突破:塊狀注意力機(jī)制實(shí)現(xiàn)超低延遲檢索增強(qiáng)

人工智能 新聞
最近,論文《Block-Attention for Efficient RAG》為檢索增強(qiáng) (RAG) 場(chǎng)景實(shí)現(xiàn)了一種塊狀注意力機(jī)制,Block-Attention,通過分塊獨(dú)立編碼檢索到的文檔,使得模型無需重復(fù)編碼計(jì)算已經(jīng)在其他 query 中已經(jīng)見過的文檔,從而實(shí)現(xiàn)線上推理效率的有效提升。

在工業(yè)場(chǎng)景中,往往會(huì)利用檢索技術(shù)來為大語言模型添加一些來自外部數(shù)據(jù)庫的知識(shí)文檔,從而增強(qiáng)大語言模型的回復(fù)可信度。一般來說,RAG 被公認(rèn)是最有效的為 LLM 注入特定領(lǐng)域知識(shí)的方式。

然而,RAG 也有其不足之處。通常來說,在實(shí)際應(yīng)用中,為確保能召回包含正確知識(shí)的文檔,對(duì)于每個(gè)用戶的查詢,會(huì)檢索多個(gè)文檔(一般在 5 到 30 個(gè)之間),并把這些文檔整合到輸入提示中供大語言模型處理。這樣一來,輸入提示的序列長度增加,使得推理效率大幅降低。具體來講,以首次生成標(biāo)記的時(shí)間(TTFT)來衡量,RAG 大語言模型的推理延遲比非 RAG 大語言模型高很多。

由于數(shù)據(jù)庫中同一文檔經(jīng)常會(huì)被不同 query 召回,大家很自然的會(huì)想到:是否能夠把已經(jīng)算好的文檔表示(KV states)存在緩存中,以供二次使用?很遺憾, 由于自回歸注意力機(jī)制的限制,大語言模型中每個(gè)文檔的 KV States 都與上下文相關(guān),所以遇到新的 query 時(shí),模型必須重新編碼 KV states 才能確保準(zhǔn)確預(yù)測(cè)。

最近,論文《Block-Attention for Efficient RAG》為檢索增強(qiáng) (RAG) 場(chǎng)景實(shí)現(xiàn)了一種塊狀注意力機(jī)制,Block-Attention,通過分塊獨(dú)立編碼檢索到的文檔,使得模型無需重復(fù)編碼計(jì)算已經(jīng)在其他 query 中已經(jīng)見過的文檔,從而實(shí)現(xiàn)線上推理效率的有效提升。在實(shí)驗(yàn)中,該方法能夠讓使用 RAG 技術(shù)的模型與不使用 RAG 的模型有幾乎一樣的響應(yīng)速度。同時(shí),該方法甚至還能略微提升在 RAG 場(chǎng)景下的模型準(zhǔn)確率。

圖片

  • 論文標(biāo)題:Block-Attention for Efficient RAG
  • 論文地址:https://arxiv.org/pdf/2409.15355

如下圖所示,該方法把整個(gè)輸入序列分成若干個(gè) block,每個(gè) block 獨(dú)立計(jì)算其 KV States,只有最后一個(gè) block 能夠關(guān)注其他 blocks(在 RAG 場(chǎng)景中,最后一個(gè) block 即用戶的輸入)。在 RAG 場(chǎng)景中,block-attention 讓模型不再需要重復(fù)計(jì)算已經(jīng)在其他 query 中見過的文檔。

圖片

Block-Attention 的實(shí)現(xiàn)并不復(fù)雜:1)獨(dú)立編碼除最后一個(gè) block 以外的所有 blocks;2)為每個(gè) blocks 重新計(jì)算位置編碼;3)將所有 blocks 拼接在一起,并計(jì)算最后一個(gè) block 的 KV State。然而直接把模型不加任何修改的從 self-attention 切換到 block-attention 會(huì)導(dǎo)致大語言模型懵圈,畢竟模型在訓(xùn)練階段從來沒見過 block-attention 方式編碼的輸入。一個(gè)量化的對(duì)比是,直接切換為 block-attention 會(huì)讓 Llama3-8B 在四個(gè) RAG 數(shù)據(jù)集上的平均準(zhǔn)確率由 67.9% 下降至 48.0%。

為了讓模型適應(yīng) block-attention,作者們對(duì)模型進(jìn)行了進(jìn)一步微調(diào),作者們發(fā)現(xiàn)在 100-1000 步微調(diào)之后,模型就能快速適應(yīng) block-attention,在四個(gè) RAG 數(shù)據(jù)集上的平均準(zhǔn)確率恢復(fù)至 68.4%。另外,block-attention 方式的模型在 KV cache 技術(shù)的幫助下,能達(dá)到與無 RAG 模型相似的效率。在用戶輸入長度為 50 而 prompt 總長度為 32K 的極端情況下,block-attention model 的首字延時(shí)(Time To First Token, TTFT)和首字浮點(diǎn)運(yùn)算數(shù)(FLOPs To Frist Token, (FLOPs-TFT)分別能降低至 self-attention model 的 1.3% 和 0.2%,與無 RAG 模型的效率基本持平。

推理流程

關(guān)于 block-attention 的實(shí)現(xiàn)和詳細(xì)推導(dǎo),讀者們請(qǐng)移步原文,這里主要介紹 block-attention 模型的推理流程。如下圖所示,首先從緩存中查詢并提取前 K 個(gè) block 的 KV states。然后,根據(jù)每個(gè) block 在輸入序列中的位置,作者們對(duì)每個(gè) block 的位置編碼進(jìn)行了重新計(jì)算。具體的操作過程詳見論文的公式 3。最后,根據(jù)前 k-1 個(gè) KV States 計(jì)算最后一個(gè)數(shù)據(jù)塊的鍵值狀態(tài)以及模型的輸出。

圖片

實(shí)驗(yàn)結(jié)果

在實(shí)驗(yàn)中,作者們主要想探究兩個(gè)問題的答案:1)在 RAG 場(chǎng)景中,block-attention 模型能否達(dá)到與自 self-attention 相同的準(zhǔn)確率?2)block-attention 對(duì)效率的提升有多大?

圖片

對(duì)于問題一,上圖給出了答案。作者們根據(jù)實(shí)驗(yàn)結(jié)果給出了三個(gè)結(jié)論:

1. 直接從 self-attention 切換到 block-attention 是不可取的,因?yàn)檫@會(huì)導(dǎo)致準(zhǔn)確率急劇下降。例如,對(duì)于 Llama3-8B 和 Mistral-7B 模型,去除微調(diào)過程會(huì)導(dǎo)致在所有四個(gè)基準(zhǔn)上平均絕對(duì)性能下降 21.99%。

2. 然而,如果作者們?cè)谖⒄{(diào)階段使用塊注意力機(jī)制,那么得到的模型與自注意力模型的性能幾乎相同,甚至在某些數(shù)據(jù)集上略好。例如,Mistral-7B-block-ft 在四個(gè)基準(zhǔn)上的性能優(yōu)于自回歸方式訓(xùn)練的模型,平均準(zhǔn)確率由 59.6% 上升至 62.3%。

3. 位置重新編碼操作對(duì)于 block-attention 模型至關(guān)重要。去除它會(huì)導(dǎo)致性能顯著下降 —— 在四個(gè)數(shù)據(jù)集上準(zhǔn)確率平均下降 4%。

對(duì)于效率的提升,作者們也通過另一組實(shí)驗(yàn)進(jìn)行了驗(yàn)證。他們將用戶的問題長度固定在 50 個(gè) token,然后逐漸增加被召回文檔的數(shù)量,讓輸入序列總長度從 50 一直增加到 32K。模型在不同 prompt 長度下的首字延時(shí)(Time To First Token, TTFT)和首字浮點(diǎn)運(yùn)算數(shù)(FLOPs To Frist Token, (FLOPs-TFT)如下圖所示。顯然,加速效果令人滿意:當(dāng)輸入序列的長度為 512 時(shí),使用 block-attention 可以將 TTFT 減少 48%,將 FLOPs-TFT 減少 90.1%。隨著總長度的增加,block-attention 模型的 TTFT 和 FLOPs-TTF 保持基本不變的趨勢(shì)。當(dāng)總長度達(dá)到 32K 時(shí),加速效果可以達(dá)到驚人的 98.7%,F(xiàn)LOPs-TFT 的消耗甚至減少了 99.8%。作者們將此實(shí)驗(yàn)結(jié)果總結(jié)為:“文本越長,block-attention 越重要”。

圖片

作者們最后還指出,block-attention 在很多場(chǎng)景中都有著重要作用,并不局限于 RAG。由于一些保密原因,作者們暫時(shí)無法透露在其他工業(yè)應(yīng)用中是如何使用它的。作者們期待社區(qū)的研究人員能夠進(jìn)一步探索 block-attention 的潛力,并將其應(yīng)用于合適的場(chǎng)景。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-07-08 09:00:00

2018-08-26 22:25:36

自注意力機(jī)制神經(jīng)網(wǎng)絡(luò)算法

2024-09-19 10:07:41

2021-05-07 15:40:36

計(jì)算機(jī)互聯(lián)網(wǎng) 技術(shù)

2023-11-24 12:36:00

模型訓(xùn)練

2025-10-11 01:45:00

MANO多模態(tài)Swin

2025-09-29 18:51:01

2023-10-14 17:46:17

RAG提示工程GPT-3

2024-07-16 14:15:09

2024-10-31 10:00:39

注意力機(jī)制核心組件

2024-06-28 08:04:43

語言模型應(yīng)用

2025-02-27 10:55:44

2025-04-07 07:47:00

模型訓(xùn)練AI

2025-10-31 16:00:45

AI模型架構(gòu)

2025-04-29 09:15:49

AI數(shù)據(jù)模型

2025-04-01 09:25:09

2024-04-03 14:31:08

大型語言模型PytorchGQA

2024-05-20 08:31:33

檢索增強(qiáng)生成LLM大型語言模型

2024-12-09 00:00:10

2020-09-17 12:40:54

神經(jīng)網(wǎng)絡(luò)CNN機(jī)器學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日本vs亚洲vs韩国一区三区二区| 久久精品亚洲成在人线av网址| 国产免费成人在线视频| 成人福利视频在线观看| 国产中文字幕免费| 香蕉久久99| 欧美人妇做爰xxxⅹ性高电影| 热久久最新网址| 天堂网2014av| 久久精品999| 久久免费福利视频| 成人小视频免费看| 国产视频一区二| 五月婷婷色综合| 亚洲最新在线| 亚洲欧美日韩成人在线| 激情五月婷婷综合网| 91sa在线看| 永久免费看片视频教学| 精品网站aaa| 欧美日韩性生活| 国产特级黄色大片| а√中文在线8| 2023国产精品视频| 亚洲精品免费网站| 国产亚洲欧美日韩高清| 欧美午夜不卡影院在线观看完整版免费| 日韩国产激情在线| 美女流白浆视频| 国产经典一区| 日韩欧美有码在线| 国产精品久久久久久久久电影网| eeuss影院在线播放| 99这里只有精品| 成人动漫视频在线观看完整版| 日本黄色中文字幕| 国产视频亚洲| 久久久久久网址| 欧美成人精品欧美一| 日本一二区不卡| 国产亚洲欧洲高清一区| 国产夫妻性爱视频| 一区二区视频| 欧美一级一区二区| 国产一区二区在线观看免费视频| 精品成人av| 一本色道a无线码一区v| 内射国产内射夫妻免费频道| 久久青青色综合| 一区二区在线观看av| 伊人婷婷久久| 成人av福利| 专区另类欧美日韩| 国产一二三四区在线观看| 91在线网址| 国产精品狼人久久影院观看方式| 视频在线99| av网站在线免费观看| 国产亚洲人成网站| 日韩午夜视频在线观看| 成人在线免费看| 国产精品女同互慰在线看| 一区二区三区偷拍| 久久综合之合合综合久久| 中文字幕制服丝袜一区二区三区| 亚洲欧洲精品在线| 欧美性猛交xxx乱大交3蜜桃| 国产精品美女一区二区三区| 亚洲亚洲精品三区日韩精品在线视频| 成年人视频在线看| 欧美激情中文字幕一区二区| 亚洲精品国产精品国自产| 麻豆最新免费在线视频| 亚洲视频综合在线| 日韩亚洲欧美一区二区| 男女视频在线| 日韩欧美视频一区二区三区| www.xxx亚洲| 95精品视频| 欧美videofree性高清杂交| www男人天堂| 欧美人成在线观看ccc36| 国产亚洲精品美女| 黄色片子在线观看| 影音先锋亚洲精品| 国产精品第七十二页| 国产女人高潮的av毛片| 成人国产在线观看| 日韩精品一区二区三区外面 | 女厕盗摄一区二区三区| 一本色道久久综合狠狠躁的推荐 | 97se亚洲国产综合在线| 神马影院我不卡午夜| a视频在线播放| 日本久久精品电影| 性生活在线视频| 免费精品国产的网站免费观看| 中文字幕亚洲欧美| 国产在线拍揄自揄拍| 日本不卡一区二区| 成人激情av| av在线免费播放网站| 一片黄亚洲嫩模| 国产自偷自偷免费一区| 在线日韩成人| 久久精品国产成人| 日本视频网站在线观看| 国产精品自拍一区| 日韩欧美手机在线| 麻豆视频在线观看免费网站黄| 欧美日韩精品系列| 国产精品无码一区二区三区免费| 国产精品久久久久久久免费观看| 性亚洲最疯狂xxxx高清| 国产色在线视频| 久久综合久久综合久久综合| 国产精品视频一二三四区| 成人午夜sm精品久久久久久久| 亚洲第一区在线观看| 国产黄a三级三级| 久久久国产亚洲精品| a级国产乱理论片在线观看99| 在线观看av黄网站永久| 欧美性xxxx18| 你懂的在线观看网站| 亚洲精品在线观看91| 国产精品第一区| 性xxxxbbbb| 亚洲午夜精品一区二区三区他趣| 91 视频免费观看| 日韩久久综合| 国产精品福利片| 青青操视频在线| 精品欧美aⅴ在线网站| 久久黄色一级视频| 午夜激情久久| 国产日韩欧美成人| 99免在线观看免费视频高清| 色综合久久88色综合天天免费| 99re久久精品国产| 在线国产精品一区| 国产欧美在线一区二区| 超碰97国产精品人人cao| 日韩美女在线视频| 久久精品99久久久久久| 久久99精品国产麻豆不卡| 亚洲开发第一视频在线播放| 日本中文字幕一区二区| 怡红院精品视频| 中文字幕有码视频| 国产精品系列在线| 亚洲天堂网2018| 91高清一区| yy111111少妇影院日韩夜片| 四季久久免费一区二区三区四区| 日韩欧美国产综合| 国产亚洲欧美精品久久久www| 丁香天五香天堂综合| 久久亚洲a v| 欧美爱爱网站| 欧美性受xxx| 九色在线免费| 欧美日韩中文字幕一区| 日韩av手机在线免费观看| 国产乱一区二区| 久久手机在线视频| 欧美有码在线| 国产aaa精品| 欧美私人网站| 亚洲第一天堂av| 69国产精品视频免费观看| 国产三级欧美三级日产三级99 | 99国产精品久久久| 无码人妻丰满熟妇区五十路百度| 欧美日韩一二三四| 91热精品视频| 女厕盗摄一区二区三区| 一区二区三区视频观看| 99国产精品99| 精品久久久免费| www中文在线| 国产成人精品免费网站| 国产精品97在线| 天天综合网91| 精品综合久久久| 亚洲国产综合在线观看| 国内精品久久久久影院 日本资源 国内精品久久久久伊人av | 亚洲黄色毛片| 色综合视频二区偷拍在线| 国产欧美视频在线| 欧美有码在线视频| 国产激情视频在线| 亚洲精品在线91| www香蕉视频| 日本久久电影网| 国产精品18p| 中文字幕亚洲不卡| av2014天堂网| 国产精品一卡二| 成人在线观看黄| 国内精品99| 亚洲一区二区免费视频软件合集 | 日韩在线电影一区| 成功精品影院| 国产免费一区二区三区在线观看| 美女日批视频在线观看| 丝袜情趣国产精品| 亚洲aaa在线观看| 欧美一区二区三区四区视频 | 欧美一区二区在线不卡| 韩国av中文字幕| 一区二区三区在线看| 久久午夜精品视频| 91啦中文在线观看| 亚洲美女精品视频| 日本在线小视频| 亚洲东热激情| 午夜探花在线观看| 国产精品一区二区99| 国产精品日韩二区| 精品国产一级| 国产欧美在线视频| 88xx成人免费观看视频库| 久久免费在线观看| 在线电影福利片| 日韩中文第一页| 草碰在线视频| 伊人久久久久久久久久| 久久久久久青草| 亚洲娇小xxxx欧美娇小| 成人av一区二区三区在线观看| 精品视频一区 二区 三区| 岛国av中文字幕| 欧美性xxxx18| 日韩中文字幕在线观看视频| 亚洲.国产.中文慕字在线| 免费无码毛片一区二区app| 亚洲天堂av一区| 情侣偷拍对白清晰饥渴难耐| 国产精品传媒入口麻豆| 天堂av网手机版| 中文字幕一区二区在线观看| 大吊一区二区三区| 国产精品免费久久| 欧美特黄一级片| 亚洲精品欧美在线| 玖玖爱免费视频| 亚洲国产精品久久艾草纯爱| 精品无码m3u8在线观看| 午夜久久久久久久久久一区二区| 成年人免费看毛片| 精品久久久久久久久久国产 | 欧美视频一区二区三区| 天码人妻一区二区三区在线看 | 午夜精品久久久久久久无码| 亚洲第一精品影视| 国产午夜伦鲁鲁| 日韩av一区二区在线影视| 九九热在线免费| 韩国精品久久久| av不卡中文字幕| 91麻豆视频网站| www久久久久久久| 亚洲欧洲精品天堂一级 | 国模吧视频一区| 欧美色图另类小说| 日韩精品一级二级 | 久久久久久久久久久久久久久99| 精品少妇一区二区三区免费观| 久久久蜜桃精品| 成年人看的免费视频| 亚洲欧美色一区| 黄网站免费在线| 一本大道久久a久久综合婷婷| 免费一级a毛片| 91精品国产综合久久香蕉麻豆| 丰满人妻一区二区| 亚洲免费电影在线观看| 五月婷婷在线观看| 欧美日韩成人精品| 唐人社导航福利精品| 国产综合香蕉五月婷在线| heyzo欧美激情| 日本一区二区视频| 女人色偷偷aa久久天堂| 97视频久久久| 麻豆成人综合网| 538国产视频| 亚洲欧美激情在线| 台湾佬中文在线| 日韩精品一区二区三区视频在线观看| 日韩在线观看视频一区| 色yeye香蕉凹凸一区二区av| 91九色美女在线视频| 国产精品久久久久免费a∨| 中文字幕一区日韩精品| 亚洲v国产v在线观看| 伊人影院久久| www.51色.com| 国产亚洲精品中文字幕| 国产亚洲精品久久久久久打不开| 欧美亚洲动漫制服丝袜| 殴美一级特黄aaaaaa| 日韩中文字幕在线播放| 日本а中文在线天堂| 成人在线一区二区| 国产乱码精品一区二区亚洲| 成人免费观看在线| 国产综合色产在线精品| 久久精品无码一区| 亚洲主播在线观看| 99久久久久成人国产免费| 亚洲午夜精品久久久久久久久久久久 | 国产96在线 | 亚洲| 久久成人18免费观看| 色欲av无码一区二区三区| 亚洲午夜一区二区三区| 国产乱码久久久久| 中文字幕亚洲综合久久筱田步美| 性爽视频在线| 国产麻豆日韩| 欧美1区2区3区| 玖玖爱视频在线| 国产女同性恋一区二区| 91丝袜一区二区三区| 亚洲第一精品电影| 菠萝蜜视频在线观看www入口| 国产一区二区丝袜高跟鞋图片| 亚洲资源网站| 国产精品-区区久久久狼| av爱爱亚洲一区| 日韩成人免费在线视频| 欧美精品一区二区三区在线| 性xxxfreexxxx性欧美| 亚洲一区亚洲二区亚洲三区| 日韩在线精品| 手机免费av片| 最新日韩av在线| 97人妻精品一区二区三区软件| 色偷偷av亚洲男人的天堂| 国产第一精品| 亚洲一区三区| 看片的网站亚洲| 一级黄色片日本| 香蕉久久国产| 久久精品第九区免费观看 | 久久中文字幕在线视频| 外国成人毛片| 午夜在线视频免费观看| 韩国午夜理伦三级不卡影院| 日韩三级在线观看视频| 欧美欧美欧美欧美首页| 毛片免费不卡| 91福利入口| 在线国产精品一区| 亚洲av无码国产精品久久| 欧美性猛交xxxx久久久| 电影av一区| 国产精品主播视频| 亚洲有吗中文字幕| 美国黄色一级视频| 欧美视频裸体精品| 成年人视频网站在线| 亚洲一区二区免费| 黄色av一区| 少妇户外露出[11p]| 欧美性猛片xxxx免费看久爱| www.久久ai| 精品九九九九| 奇米影视一区二区三区| 日韩欧美国产成人精品免费| 色八戒一区二区三区| 日本中文在线| 高清不卡日本v二区在线| 久久精品人人| 欧美第一页在线观看| 亚洲电影第1页| 台湾成人免费视频| 天堂а√在线中文在线 | 欧美精品与人动性物交免费看| 人妖欧美一区二区| 免费在线观看日韩| 亚洲人成网站999久久久综合| 日韩欧美激情| 亚洲精品无码久久久久久| 中文字幕在线一区| 视频一区二区在线播放| 91精品国产综合久久久久久蜜臀| 黄色精品免费| 亚洲精品国产精品国自| 欧美成人video| 日韩毛片在线| 日韩欧美在线综合网| 91免费视频播放| 97精品国产97久久久久久| 日韩一区二区三区免费播放| 95视频在线观看| 欧美日韩国产一二三| 手机在线观看av| 可以免费看的黄色网址|