精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

重新定義 RAG 新架構設計,10倍提升長文本處理慢問題 原創

發布于 2025-9-11 09:17
瀏覽
0收藏

現在的大語言模型(比如:DeepSeek、GPT 系列)在做 “檢索增強生成”(RAG)時,經常會遇到一個大麻煩:為了生成準確答案,需要把從外部檢索到的很多段落都塞進模型里當 “參考資料”,但這些資料太長了,會導致兩個嚴重問題:

速度變慢:模型要處理的文字越多,生成第一個 token 的時間(TTFT)就越長,甚至成倍數增加;后續每個 token 的生成時間(TTIT)也會變長,整體反應變慢。

內存不夠用:模型需要專門的 “鍵值緩存”(KV Cache)來存這些參考資料,資料越長,緩存占用的內存就越多,有時候甚至會超出硬件限制,導致程序崩潰。

更關鍵的是,RAG 里的參考資料其實 “水分很大” --  檢索到的 10 段話里,可能只有 2 段和用戶的問題直接相關,剩下的 8 段都是 “無效信息”。但傳統模型會把所有段落都當成 “重點” 來處理,做了很多無用功。而且這些檢索到的段落,因為來源不同、內容差異大,模型在 “關注” 它們時,只會盯著同一段落里的文字,很少會跨段落關聯,這和平時寫文章時的 “連貫關注” 不一樣,進一步說明很多計算是多余的。

Meta 提出了新 RAG 架構設計:REFRAG,優雅地解決了這個問題。

重新定義 RAG 新架構設計,10倍提升長文本處理慢問題-AI.x社區

下文我們詳細剖析之。

一、新 RAG 架構設計剖析

1、新 RAG 架構設計 REFRAG 是怎么解決問題的?

簡單說,REFRAG 的核心思路是 “壓縮無用信息、聚焦有用信息”,不用改模型本身的結構,只在 “給模型喂數據” 和 “模型解碼” 這兩步做優化,具體分 3 步:

第一步:把參考資料 “打包壓縮”

先把檢索到的長參考資料切成一小塊一小塊(比如:每 16 個 token 算一塊),然后用一個輕量級的 “編碼器”(比如:RoBERTa 模型)把每一小塊壓縮成一個 “濃縮向量”(叫 “塊嵌入”)。這個向量就像 “資料摘要”,能保留小塊里的關鍵信息,但長度只有原來的 1/16(甚至 1/32)。

舉個例子:如果檢索到一段 128 個 token 的參考資料,切成 8 塊(每塊 16 詞),壓縮后就變成 8 個 “濃縮向量”,相當于把 128 個 token 的輸入量變成了 8 個 “虛擬 token”,模型要處理的內容直接少了 16 倍。

而且這些 “濃縮向量” 可以提前算好存起來,比如:同一個段落被多次檢索到,不用每次都重新壓縮,直接拿現成的用,又能省不少時間。

第二步:用 “智能判斷” 決定要不要解壓

不是所有 “濃縮向量” 都完美 -- 有些關鍵段落(比如:直接回答問題的句子)壓縮后可能會丟信息。所以 REFRAG 訓練了一個輕量級的 “判斷模型”(用強化學習 RL 訓練的),能自動識別:哪些 “濃縮向量” 對應的段落很重要,需要解壓回原來的文字;哪些不重要,保持壓縮狀態就行。

比如用戶問 “Bruce Lee 怎么去世的”,檢索到 5 段資料,其中 2 段詳細講了醫學原因,“判斷模型” 就會把這 2 段的 “濃縮向量” 解壓成文字,剩下 3 段保持壓縮,既不丟關鍵信息,又能繼續省時間。

第三步:給模型 “喂優化后的數據”

最后給模型的輸入,就變成了 “用戶的問題(原文字)+ 壓縮 / 解壓后的參考資料”。因為參考資料被大幅壓縮,模型的 “鍵值緩存” 占用會少很多,生成第一個詞的時間(TTFT)也會大幅縮短,比如:壓縮率 16 倍時,TTFT 能快 16 倍;壓縮率 32 倍時,TTFT 能快 30 多倍。

更妙的是,這種方式還能讓模型 “裝下更多參考資料”:原來模型只能處理 4000 個 token 的參考資料,用 REFRAG 壓縮后,能處理 64000 個詞(擴展 16 倍),相當于讓模型 “讀更多書” 卻 “花更少時間”。

2、REFRAG 效果到底怎么樣?

通過多次實驗表明,核心結論就 3 個:

第一、速度快很多,還不丟精度

生成第一個 token 的速度(TTFT):壓縮率 32 倍時,比傳統 LLaMA 模型快 30.85 倍,比之前最先進的方法(CEPE)快 3.75 倍。

回答精度:不管是算 “困惑度”(模型對答案的自信程度,越低越好),還是 RAG 的回答準確率(比如:MMLU、常識問答等任務),REFRAG 和用完整參考資料的模型差不多,甚至在 “參考資料質量差”(比如:檢索到很多無關段落)的場景下,因為能裝更多資料,精度還會更高。

比如:在 “弱檢索器” 場景(隨機選檢索結果),REFRAG 比傳統 LLaMA 的回答準確率平均高 1.93%,同時速度快 5 倍多。

第二、能處理更長的參考資料

傳統 LLaMA-2-7B 模型最多只能處理 4000 個詞的參考資料,REFRAG 能擴展到 64000 個詞(16 倍),而且處理 64000 個詞時,速度比傳統模型處理 4000 個詞還快,精度也沒下降。

第三、適用場景廣

除了 RAG,REFRAG 在 “多輪對話”(比如:客服聊天,需要記之前的對話 + 檢索資料)和 “長文檔總結”(比如:總結一篇 10 萬字的論文)里效果也很好。

多輪對話時,傳統模型會因為對話歷史太長而 “忘事”,REFRAG 能壓縮歷史對話,同時保留檢索資料,回答更準確。

長文檔總結時,比如:總結 Arxiv 論文或 PubMed 醫學文獻,REFRAG 生成的摘要和人工寫的相似度(Rouge 指標)比傳統模型高 10% 左右,同時速度快 6 倍。

3、和之前的方法比,REFRAG 好在哪?

之前也有方法想解決 “長文本處理慢” 的問題,比如:

StreamingLLM:能省內存,但不能加快生成第一個 token 的速度;

CEPE:能省內存,但只能處理 “開頭的參考資料”,多輪對話或中間插參考資料就不行;

壓縮 Transformer:需要重新訓練整個模型,成本高,還不能復用之前的壓縮結果。

而 REFRAG 的優勢很明顯:

不用改模型:基于現有 LLaMA、RoBERTa 等模型就能用,不用重新訓練大模型;

靈活:參考資料可以在輸入的任意位置(開頭、中間、結尾),支持多輪對話、長文檔總結等場景;

能復用:“濃縮向量” 可以提前存,多次檢索不用重復算;

智能解壓:不會因為壓縮丟關鍵信息,精度有保障。

二、新 RAG 架構設計總結

REFRAG 本質上是給 RAG 做了個 “數據優化插件”:通過 “壓縮無用資料、智能解壓關鍵資料”,讓模型在 “讀更多參考資料” 的同時,“速度更快、內存用得更少”,而且不用改模型本身的結構,容易落地。

不管是企業落地做智能客服(多輪對話 + 檢索)、學術問答(長論文總結 + RAG),還是 Web 搜索(快速處理大量檢索結果),REFRAG 都能派上用場 -- 相當于讓大模型 “既聰明又敏捷”,不用再在 “速度” 和 “精度” 之間做妥協。

好了,這就是我今天想分享的內容。

?

本文轉載自??玄姐聊AGI??  作者:玄姐

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
久久久久久视频| 国产小视频免费| 亚洲国产无线乱码在线观看 | 经典一区二区三区| 色青青草原桃花久久综合| 黄色aaaaaa| rebdb初裸写真在线观看| 国产99一区视频免费| 2020欧美日韩在线视频| 亚洲欧美另类日本| 日韩电影在线观看完整免费观看| 欧美三级欧美一级| 免费看欧美一级片| 都市激情在线视频| 99久久国产综合色|国产精品| 国产精品久久久久久久久久久久 | 国产日韩精品综合网站| 中文字幕在线观看成人| gogogo高清在线观看一区二区| 日韩免费视频一区二区| 尤蜜粉嫩av国产一区二区三区| 日本中文字幕中出在线| 国产欧美一区二区三区在线看蜜臀| 91九色在线免费视频| 国产乱码77777777| 亚洲视频www| 欧美俄罗斯性视频| 日韩在线视频网址| 欧美一区三区| 亚洲新中文字幕| 精品国产人妻一区二区三区| 久久国际精品| 欧美日韩一卡二卡三卡 | 特黄毛片在线观看| 亚洲一区二区三区国产| 中文字幕剧情在线观看一区| 酒色婷婷桃色成人免费av网| 99精品欧美一区二区三区小说| 亚洲free性xxxx护士白浆| 欧美成人一区二区视频| 久久久久久一区二区| 欧美一级大片视频| 日韩一区二区视频在线| 一区二区日韩免费看| 性色av一区二区三区在线观看 | 天天综合色天天综合| 日本道在线视频| 美女羞羞视频在线观看| 国产精品美女久久久久高潮| 欧美污视频久久久| 国产午夜视频在线观看| 久久九九久久九九| 欧美区高清在线| 免费国产在线观看| 国产亚洲福利社区一区| 欧美尤物一区| av电影在线播放高清免费观看| 国产丝袜美腿一区二区三区| 欧美一卡2卡3卡4卡无卡免费观看水多多 | 麻豆久久精品| 国产成人综合一区二区三区| 极品国产91在线网站| 日韩电影免费在线看| 国产精品天天狠天天看| 国产一区二区三区成人| 狠狠色丁香久久婷婷综| 亚洲综合国产精品| 亚洲国产精品一| 97精品视频在线观看自产线路二| 免费精品视频一区二区三区| 国产毛片av在线| 亚洲四区在线观看| av在线免费观看国产| av资源网在线播放| 日本久久电影网| 伊人国产在线视频| 成人在线日韩| 日韩高清免费观看| 99精品全国免费观看| 国产精品久久久久9999赢消| 欧美日韩国产91| 日本韩国欧美中文字幕| 免费视频最近日韩| 51精品国产人成在线观看| 欧洲av在线播放| 久久久久久久性| 中文字幕一区二区三区最新| 免费污视频在线观看| 欧美性20hd另类| mm131亚洲精品| 9l亚洲国产成人精品一区二三| 亚洲欧美日韩高清| 国产黄色小视频网站| 亚洲少妇自拍| 成人在线一区二区| 天天综合网在线观看| 中文字幕欧美区| 国产aaa免费视频| 欧美日韩在线精品一区二区三区激情综合| 欧美一卡在线观看| 国产夫妻性爱视频| 亚洲影视一区| 国产成人福利网站| 亚洲奶汁xxxx哺乳期| 国产亚洲女人久久久久毛片| 少妇一晚三次一区二区三区| 高清av一区二区三区| 精品成人a区在线观看| аⅴ天堂中文在线网| 影音先锋久久精品| 国产精品午夜一区二区欲梦| 少妇人妻精品一区二区三区| 综合av第一页| 亚洲色图38p| 久久中文资源| 久久成人免费视频| 黄色网址中文字幕| 99国产精品视频免费观看| 国产欧美综合一区| 日本一区免费网站| 精品亚洲aⅴ在线观看| 亚洲熟女www一区二区三区| 免费人成在线不卡| 欧美日韩免费精品| 第一av在线| 日韩午夜激情免费电影| a一级免费视频| 日韩avvvv在线播放| 狼狼综合久久久久综合网| 欧洲黄色一区| 日韩欧美一区电影| 中文字幕91视频| 人人爽香蕉精品| 日韩高清三级| 黄色精品视频| 一个人www欧美| 男人天堂视频网| 久久久久久亚洲综合影院红桃 | 亚洲不卡中文字幕| 最新日韩精品| 亚洲男人天天操| 男人天堂中文字幕| 成人午夜激情视频| 草草视频在线免费观看| av日韩精品| 97视频国产在线| 亚州男人的天堂| 欧美特级www| 麻豆av免费观看| 天堂成人国产精品一区| 日韩精品伦理第一区| 久久久人成影片一区二区三区在哪下载| 日韩h在线观看| 无码人妻精品一区二区三区9厂 | 另类图片综合电影| 亚洲欧美变态国产另类| 天天干天天操天天爱| 久久久精品欧美丰满| 天天爱天天操天天干| 日韩在线观看| 亚洲最大成人网色| 国内激情视频在线观看| 亚洲欧洲av一区二区| 国产又粗又猛又爽又| 国产精品久久久久久久久久免费看| 色片在线免费观看| 亚洲国产不卡| 国产综合av一区二区三区| 精品国产第一福利网站| 视频一区视频二区国产精品| 国产精品污视频| 亚洲一级电影视频| 亚洲区免费视频| 精品在线视频一区| 日韩精品一区二区三区四| 日韩系列在线| 成人免费观看网址| 成人在线黄色电影| 中文字幕精品国产| 精品国产无码一区二区| 精品国产户外野外| 中文天堂资源在线| 成人av在线资源网| 色综合天天色综合| 韩日成人av| 日日骚一区二区网站| 亚洲精品午夜| 国产成人aa精品一区在线播放| 国产精品实拍| 亚洲天堂男人天堂女人天堂| 国产99对白在线播放| 欧美日韩亚洲一区二区三区| 亚洲色图27p| 91麻豆6部合集magnet| 天堂中文av在线| 欧美综合国产| 中文精品无码中文字幕无码专区| 少妇高潮一区二区三区| 91视频网页| 一区二区视频免费完整版观看| 久久久久成人精品| 日本不卡在线| 亚洲男人天堂2024| 人妻妺妺窝人体色www聚色窝| 欧美午夜电影网| 中文字幕亚洲精品在线| 亚洲精品一二三四区| 精品亚洲aⅴ无码一区二区三区| 国产二区国产一区在线观看| 黄色国产小视频| 99日韩精品| 激情成人开心网| 小小影院久久| 日韩免费电影一区二区| 欧美久久精品| 国产精品推荐精品| 超碰国产精品一区二页| 国产精品9999| 午夜影院在线播放| 国内外成人免费激情在线视频网站 | 亚洲熟女综合色一区二区三区| 亚洲午夜视频在线| 久久国产美女视频| 中文字幕亚洲在| 亚洲精品国产精品国自| 久久九九99视频| 丝袜美腿中文字幕| 99在线视频精品| 亚洲麻豆一区二区三区| 国产一区二区调教| 免费成人黄色大片| 久久激情五月婷婷| 色婷婷成人在线| 美女久久久精品| 日韩一级片播放| 日韩成人一区二区| 蜜桃免费在线视频| 美女视频黄 久久| 污色网站在线观看| 蓝色福利精品导航| 天堂在线中文在线| 国产在线一区观看| 久久精品无码一区二区三区毛片| 寂寞少妇一区二区三区| xxxx在线免费观看| 国产精品一区专区| 日本人妻一区二区三区| 成人性生交大片免费看中文| 人妻互换一二三区激情视频| 成人性色生活片| 亚洲少妇18p| 91视频.com| 制服 丝袜 综合 日韩 欧美| 国产亚洲视频系列| 日韩免费av一区| 最新热久久免费视频| 欧美激情一区二区视频| 亚洲国产成人高清精品| 91视频免费网址| 在线观看日韩av先锋影音电影院| 怡红院av久久久久久久| 欧美中文一区二区三区| 一级片视频免费| 欧美va亚洲va香蕉在线| 无码国精品一区二区免费蜜桃 | 毛片在线不卡| 久久97久久97精品免视看| a级大胆欧美人体大胆666| 欧美一级大胆视频| 日韩成人在线电影| 懂色av一区二区三区在线播放| 日韩福利视频一区| 亚洲毛片aa| 欧美日韩蜜桃| 久章草在线视频| 国精产品一区一区三区mba桃花 | 午夜视频www| 在线性视频日韩欧美| 在线观看男女av免费网址| 91sa在线看| 日韩成人精品一区二区三区| 国产伦精品一区二区| 欧洲杯半决赛直播| 妞干网视频在线观看| 久久综合图片| 亚洲熟女乱综合一区二区| 久久亚洲免费视频| 亚洲xxxx3d动漫| 色综合久久88色综合天天免费| 国产一区二区在线视频聊天| 精品国产成人系列| av中文在线| 欧美亚洲日本黄色| 国产精品3区| 神马影院一区二区| 在线看片日韩| 人人爽人人爽av| 久久久久成人黄色影片| 亚洲av无码一区二区三区在线| 大荫蒂欧美视频另类xxxx| 一级做a爱片久久毛片| 日韩精品中文字幕有码专区| 午夜激情视频在线| 57pao国产成人免费| 日韩在线观看中文字幕| 日韩一区免费观看| 国产一区白浆| 污视频在线观看免费网站| 久久久久久97三级| 国产乡下妇女做爰视频| 在线不卡a资源高清| 国产视频第一区| 国模视频一区二区| 999精品视频在线观看| 欧美系列一区| 国产精品婷婷| 中国特级黄色大片| 一区二区三区欧美视频| 亚洲一级av毛片| 亚洲视频在线观看| 欧美大胆性生话| 九色综合日本| 午夜性色一区二区三区免费视频| 污污动漫在线观看| 国产欧美精品一区二区色综合| 日日夜夜综合网| 亚洲黄色在线看| 福利成人导航| 99热国产免费| 国产精品porn| 中国老熟女重囗味hdxx| 亚洲视频免费在线观看| 亚洲天堂免费av| 在线丨暗呦小u女国产精品| 国产精成人品2018| 日韩精品久久久毛片一区二区| 久久视频一区| 欧美熟妇一区二区| 91久久国产综合久久| 国产三级视频在线播放线观看| 日韩美女免费视频| 国产乱码精品一区二区三区四区 | 国产一区二区不卡在线| 我要看黄色一级片| 日韩欧美另类在线| 色帝国亚洲欧美在线| 成人免费视频网站入口| 黑丝一区二区三区| 88av在线播放| 欧美日韩人人澡狠狠躁视频| 婷婷国产在线| 日韩美女免费观看| 日韩一区二区在线免费| 超碰人人草人人| 亚洲精品中文在线观看| 欧美天堂在线视频| 全亚洲最色的网站在线观看| 久久综合欧美| 亚洲综合色在线观看| 亚洲欧美日韩中文播放| 亚洲第一视频在线播放| 97高清免费视频| 狠狠操综合网| 日韩a一级欧美一级| 亚洲中国最大av网站| 午夜影院免费视频| 国产精品人人做人人爽| 久久久久久久久久久9不雅视频 | 天堂va在线高清一区| 国产精品12345| 久久精品视频免费| 国产一区二区视频免费观看| 欧美国产日韩中文字幕在线| 欧美a一欧美| 污版视频在线观看| 亚洲高清一区二区三区| 国产中文字幕在线| 91九色视频导航| 亚洲精品1区2区| 欧美另类69xxxx| 日韩精品一区二| 欧美日一区二区三区| 国产91视频一区| 久久久亚洲综合| 99久久精品无免国产免费| 91爱视频在线| 五月婷婷亚洲| av无码av天天av天天爽| 欧美日韩成人一区| 国产资源在线观看入口av| 一区二区三区四区视频在线观看 | 欧美精品久久久| 国产在线精品一区在线观看麻豆| 免费观看一区二区三区毛片| 久久九九免费视频| 亚洲欧美日本伦理| 少妇熟女视频一区二区三区| 在线观看av一区| 91精品国产黑色瑜伽裤| 日韩第一页在线观看|