精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破? 原創 精華

發布于 2025-2-28 10:37
瀏覽
0收藏

編者按: 你是否曾經遇到過這樣的困擾:在開發基于 RAG 的應用時,實時檢索的延遲讓用戶體驗大打折扣?或者在處理復雜查詢時,檢索結果的不準確導致回答質量不盡如人意?

在當前大語言模型應用大規模落地的背景下,這些挑戰正成為制約產品競爭力的關鍵瓶頸。傳統 RAG 方案中的檢索延遲、準確性波動以及系統復雜度,都在考驗著開發者的耐心和智慧。

緩存增強生成(CAG)技術巧妙地利用了新一代大語言模型處理長上下文的能力,通過預加載文檔和預計算 KV 緩存,消除了實時檢索的需求。實驗結果表明,在可管理的知識庫場景下,這種方案不僅能將推理時間縮短數倍,還能提供更連貫、更準確的響應。

作者 | Vishal Rajput

編譯 | 岳揚

檢索增強生成(RAG)作為一種通過整合外部知識源來增強語言模型的強大方法而備受矚目。不過,這種方法也帶來了一些挑戰,比如檢索過程的延遲、文檔挑選時可能出現的誤差,以及系統復雜度的增加。

隨著能夠處理更長上下文的大語言模型(LLMs)的興起,緩存增強生成(CAG)技術應運而生,它避免了實時的信息檢索。這項技術通過將所有必要資源預先加載到模型的擴展上下文中,并在緩存其相關運行時(runtime)參數,尤其在處理數量有限且易于管理的文檔或知識時更為有效。

話不多說,讓我們來深入探討這一新穎的技術。

本文將討論以下主題:

  • RAG 如何擴展上下文的處理能力?
  • 無限擴展的上下文窗口
  • CAG 技術有何優勢?
  • 其他方面的改進
  • CAG 框架的運作原理
  • 總結

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

01 RAG 如何擴展上下文的處理能力?

RAG 是一種半參數化系統,其中參數化部分由大語言模型構成,而非參數化部分則包括其他元素。將這兩部分結合,便形成了半參數化系統。在 LLMs 中,所有信息都以編碼形式存儲在模型的權重或參數中,而系統的其他部分則沒有用參數來定義這些知識。

那么,這種設計是如何解決問題的呢?

  • 通過在 LLMs 中靈活地替換索引(即特定的信息),能夠實現信息的個性化定制,這意味著我們不會因為信息過時而受限,同時也能夠更新索引的內容。
  • 將 LLMs 與這些索引相結合,可以減少錯誤信息的產生,并且我們能夠通過指向信息原始來源來進行引用和歸屬描述。

因此,從理論上講,RAG 提升了我們為 LLMs 創建更佳上下文的能力,使其表現更加出色。

但這個過程真的這么簡單嗎?答案是否定的。

現有的 RAG 系統并不夠智能,它們相對簡單,無法應對那些需要大量自定義上下文的復雜任務。

因此,簡而言之,正是由于上下文窗口對 LLMs 的限制,RAG 才得以發展起來。

02 無限擴展的上下文窗口

相關論文在此:《Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention》。

這篇論文提出了一種高效的方法,可以在有限的內存和計算資源約束下,將基于 Transformer 的大語言模型(LLMs)擴展到處理無限長的輸入。該方法中的一個關鍵創新是一種名為 Infini-attention 的全新注意力機制。

Infini-attention 的核心思想是將局部注意力和全局注意力相結合。具體來說,首先將整篇文章分割成多個片段,在其中一個片段上應用標準的注意力機制,而為了獲取前一個片段的上下文,我們采用了一種線性注意力機制。以下是對這篇論文的簡要概述:

  • 混合注意力機制:局部注意力集中于單詞周圍的即時上下文,而長距離注意力則通過參考迄今為止所見的整個序列的壓縮摘要來保持全局視野。
  • 壓縮記憶:利用線性注意力來記憶之前的文本片段。
  • 高效更新:為了避免冗余和節省計算量,Infini-attention 不會直接將新信息添加到記憶中。相反,它會首先檢查已知信息,然后只更新記憶中的新信息或不同信息,這與 ResNet 中的跳躍連接(skip connections)類似。
  • 權衡控制:通過一個超參數來調節局部信息和壓縮記憶的混合比例。

03 CAG 技術有何優勢?

無檢索長上下文范式:提出了一種創新方法,通過利用預加載文檔和預計算 KV 緩存的長上下文 LLMs,消除了檢索延遲、錯誤和系統復雜性。

性能比較:實驗表明,長上下文 LLMs 的性能優于傳統的 RAG 系統,特別是在可管理的知識庫中。

實用見解:提出可操作的優化策略以提升知識密集型工作流效率,通過實證驗證無檢索方法在特定應用場景下的可行性。

CAG 相較于傳統 RAG 系統具有以下顯著優勢:

  • 縮短推理時間:由于無需實時檢索,推理過程變得更快、更高效,能夠更快地響應用戶查詢。
  • 統一上下文:將整個知識集合預加載到 LLM 中,可提供對文檔的整體和連貫理解,從而在各種任務中提高響應質量和響應一致性。
  • 簡化架構:通過移除整合檢索器和生成器的需求,系統變得更加簡潔,降低了系統復雜性,提高了可維護性,并減少了開發成本。

04 其他方面的改進

對于知識密集型任務而言,增加的計算資源通常被用來融入更多的外部知識。然而,如果沒有有效地利用這些知識,單純地擴展上下文并不總是能提升性能。

兩種推理擴展策略:上下文學習(In-context learning)和迭代式提示技術(iterative prompting)。

這些策略為擴展測試時計算(test-time computation)提供了額外的靈活性(例如,通過增加檢索的文檔數量或生成步驟),從而增強 LLMs 獲取和利用上下文信息的能力。

我們需要回答兩個關鍵問題:

(1) 在進行最優配置時,RAG 性能如何通過推理計算規模的擴展獲得提升?

(2) 能否通過建模 RAG 性能與推理參數之間的量化關系,預測給定預算約束下的最優測試時計算資源分配?

在最優推理參數配置下,RAG性能隨著測試時計算量級的提升呈現近似線性增長。基于實驗觀測,我們推導出RAG的推理擴展規律及其配套計算資源分配模型,該模型可預測不同超參數配置下的系統性能表現。

欲了解更多信息請閱讀此論文:??https://arxiv.org/pdf/2410.04343??

另一項工作則更多地從硬件(優化)設計的角度出發:

研究團隊開發了智能知識存儲系統(Intelligent Knowledge Store, IKS),這是一種基于 CXL 2.0 協議的設備,采用橫向擴展的近內存加速架構,通過在主機 CPU 與近內存加速器之間構建新型緩存一致性接口實現性能突破。

在 512GB 向量數據庫上,IKS 執行精確最近鄰搜索的速度相比 Intel Sapphire Rapids CPU 提升 13.4-27.9 倍。這種搜索性能優勢使典型 RAG 應用的端到端推理時間縮短 1.7-26.3 倍。作為內存擴展器,IKS 的內部 DRAM 可解耦供服務器其他應用使用,有效避免當今服務器中最昂貴的 DRAM 資源閑置浪費。

欲了解更多信息,請閱讀這里:??https://arxiv.org/pdf/2412.15246??

另一篇論文系統性地研究了長上下文對 20 種主流開源和商業大語言模型(LLM)的檢索增強生成(RAG)性能影響。研究團隊通過在三個專有領域數據集上改變總上下文長度(從 2,000 到 128,000 tokens,并在可能情況下擴展至 200 萬 tokens)運行 RAG 工作流,揭示了長上下文在 RAG 應用中的優勢與局限性。

他們的研究發現,雖然檢索更多文檔可以提高性能,但只有少數最新一代的最先進 LLMs 能夠在超過 64k tokens 的長上下文中保持穩定的準確性。 他們還確定了長上下文場景中的不同故障模式,為未來的研究提出了方向。

欲了解更多信息,請閱讀此論文:??https://arxiv.org/pdf/2411.03538??

05 CAG 框架的運作原理

CAG 框架利用長上下文 LLMs 的擴展上下文能力,消除了實時檢索的需求。通過預加載外部知識源(例如,文檔集合 D={d1,d2,…} )并預計算鍵值(KV)緩存(C_KV),它克服了傳統 RAG 系統的效率低下問題。該框架主要分三個階段運行:

1. 外部知識預加載

  • 對精選的文檔集合 D 進行預處理,使其適配模型的擴展上下文窗口。
  • LLM 處理這些文檔,將它們轉換為預計算的鍵值(KV)緩存,該緩存封裝了 LLM 的推理狀態。LLM(M)將文檔集合 D 編碼成預計算的 KV 緩存:

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

  • 該預計算緩存被存儲以供復用,確保無論后續執行多少次查詢,處理文檔集合D的計算成本僅需支付一次。

2. 推理階段

  • 在推理階段,KV 緩存(C_KV)與用戶查詢 Q 一起加載。
  • LLM 利用這個緩存中的上下文來生成響應,從而消除了檢索延遲,并減少了由于動態檢索引起的錯誤或遺漏的風險。LLM 通過利用緩存中的上下文來生成響應:

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

這種方法消除了檢索延遲,將檢索錯誤的風險降至最低。組合提示詞 P=Concat(D,Q) 確保了對外部知識和查詢的統一理解。

3. 緩存重置

  • 為維持性能,需對 KV 緩存進行高效重置。在推理過程中,隨著新 token(t1,t2,…,tk)被添加至上下文窗口,重置過程會截斷這些 tokens:

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

  • 隨著新 token 的連續添加,KV 緩存逐漸增長,重置時僅需截斷這些新增 token,即可實現快速重新初始化,無需從磁盤重新加載整個緩存。這種設計避免了全量緩存加載的 I/O 瓶頸,確保了系統響應速度的持續穩定。

06 Conclusion

緩存增強生成(CAG)在實時檢索不可行或需要極低延遲響應的場景中優勢顯著。通過將海量外部知識嵌入模型的上下文窗口,CAG 能夠生成信息豐富且上下文相關的回答,避免了傳統檢索增強生成(RAG)系統的檢索延遲。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the author

Vishal Rajput

3x??Top writer in AI |

AI Book ??: ??https://rb.gy/xc8m46?? |

LinkedIn +: ??https://www.linkedin.com/in/vishal-rajput-999164122/??

END

本期互動內容 ??

?你認為隨著大模型上下文窗口持續擴大,RAG和CAG的技術路線會如何演進?哪些場景仍然更適合使用RAG?

原文鏈接:

??https://medium.com/aiguys/dont-do-rag-it-s-time-for-cag-fb24ff87932b??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
国产精品久久久久久久岛一牛影视| 日本在线观看不卡视频| 亚洲精品电影网在线观看| 欧美日韩中文在线视频| 久cao在线| 97久久人人超碰| 91精品久久久久久久久久久| 日韩欧美三级在线观看| 91影院成人| 日韩精品久久久久久久玫瑰园| 777视频在线| 高清精品在线| 亚洲精品写真福利| 日韩精品第一页| 黄频网站在线观看| 老色鬼精品视频在线观看播放| 久久人人97超碰精品888 | 色爱av综合网| 91精品国产一区二区三区蜜臀 | 蜜臀av在线播放一区二区三区| 欧美精品videosex性欧美| 91视频免费在观看| 亚洲另类av| 欧美大黄免费观看| 亚洲a级黄色片| free欧美| 精品日韩中文字幕| 欧美黄色免费网址| 黄在线免费看| 国产精品久久久久四虎| 欧美日韩国产精品一卡| 刘玥91精选国产在线观看| 久久草av在线| 国产欧美最新羞羞视频在线观看| 九九热精品视频在线| 欧美亚洲不卡| 久久国产精品免费视频 | 亚洲图片欧美综合| 国产一二三四区在线观看| 草草影院在线观看| 久久人人97超碰com| 国产视频99| 丰满少妇被猛烈进入| 国产一区视频导航| 91久久久在线| 国产欧美一区二区三区视频在线观看| 另类调教123区| 国产精品丝袜一区二区三区| 一区二区三区在线观看av| 国产精品毛片| 91av免费观看91av精品在线| 好吊操这里只有精品| 欧美激情综合| 欧美国产日韩一区二区三区| 国产精品成人免费观看| 亚洲成av人电影| 久久综合久久八八| 日本一级二级视频| 亚洲欧美综合| 欧美激情性做爰免费视频| 破处女黄色一级片| 悠悠资源网久久精品| 国产+人+亚洲| 日本va欧美va国产激情| 久久国产高清| 国产美女久久精品| 午夜免费福利视频| zzijzzij亚洲日本少妇熟睡| 精品日本一区二区| 黄色av网站在线看| 国产精品久久久久久久久动漫| 中文字幕一区二区三区在线乱码| 超碰在线观看免费版| 亚洲午夜免费福利视频| 一女被多男玩喷潮视频| 日本高清不卡一区二区三区视频| 精品视频在线免费| 午夜视频在线观| av在线亚洲色图| 日韩成人在线视频网站| 免费在线观看a视频| 日韩精品看片| 欧美精品videos另类日本| 久久国产精品免费看| 日韩av电影一区| 亚洲综合色激情五月| 少妇高潮久久久| 国产女同性恋一区二区| 欧美少妇在线观看| 免费高潮视频95在线观看网站| 欧洲av在线精品| 中文字幕一二三| 伊人成综合网yiren22| 久久久999成人| 久久国产黄色片| 黑人巨大精品欧美一区| 美女黄毛**国产精品啪啪| 国产在线观看91| 色婷婷综合久久| 国产成人精品综合久久久久99| 亚洲区小说区| 久久99久久99精品免观看粉嫩| 天堂网中文字幕| 国产精品一区久久久久| 日本视频一区二区不卡| 色www永久免费视频首页在线| 欧美日韩亚洲网| 91精产国品一二三| 第一会所sis001亚洲| 国模精品一区二区三区色天香| 自拍偷拍福利视频| 99久久免费精品| 免费观看国产视频在线| 国产私拍福利精品视频二区| 欧美va在线播放| 毛片视频免费播放| 米奇777在线欧美播放| 成人精品水蜜桃| 黄色在线免费看| 一本到三区不卡视频| 四虎成人免费视频| 2023国产精品久久久精品双| 国产精品成人v| 色欲av永久无码精品无码蜜桃 | 亚洲一级黄色片| 日韩精品一区二区不卡| 国产成人免费视| 中文字幕在线亚洲三区| 九色成人搞黄网站| 亚洲老头同性xxxxx| 豆国产97在线 | 亚洲| 国产乱子伦一区二区三区国色天香| 性欧美大战久久久久久久免费观看| 自拍视频在线看| 亚洲精品久久久久久久久久久久久 | 国产乱码精品一区二区| 日本一区二区成人| 日本成人在线免费视频| 亚洲精品无吗| 国产91精品青草社区| 手机看片福利永久| 亚洲成人1区2区| 污网站免费观看| 狠狠综合久久av一区二区老牛| 亚洲自拍另类欧美丝袜| 麻豆最新免费在线视频| 7799精品视频| 日韩a级片在线观看| 国产美女在线精品| 青青青在线观看视频| 日韩一级淫片| 国内精品久久久| 日本v片在线免费观看| 欧美午夜精品久久久久久久| 欧美狂猛xxxxx乱大交3| 日韩1区2区3区| 五月天色婷婷综合| 视频二区欧美| 97国产在线视频| 日韩一区二区三区中文字幕| 日本乱人伦aⅴ精品| av手机在线播放| 日本中文字幕不卡| 大桥未久一区二区三区| 好吊妞视频这里有精品| 国产91精品青草社区| eeuss影院www在线播放| 在线播放国产精品二区一二区四区| 午夜精品福利在线视频| 成人免费毛片高清视频| 黄色一级一级片| 国产精品久久久久久久久妇女| 亚洲自拍偷拍视频| 国产精品一二三产区| 亚洲天堂免费观看| 国产精品爽爽久久久久久| 亚洲影视在线播放| 精品无码一区二区三区| 国精产品一区一区三区mba桃花 | 日韩免费观看高清完整版 | 久久综合久久久| 久久xxx视频| 欧美激情视频一区二区| 极品白浆推特女神在线观看| 正在播放亚洲一区| 人人干人人干人人干| 国产精品久久久久一区二区三区| 国产乱淫av麻豆国产免费| 久久精品一区二区国产| 樱空桃在线播放| 婷婷国产精品| 96pao国产成视频永久免费| 精精国产xxx在线视频app | 不卡视频观看| 日韩在线观看免费全集电视剧网站| 成人激情四射网| 在线欧美一区二区| 久久久久久久久精| 国产精品视频yy9299一区| www日本在线观看| 青青草成人在线观看| 成年人午夜免费视频| 久久精品不卡| 欧美极品日韩| 成人线上播放| 成人在线中文字幕| 欧美色网一区| 久久免费视频在线观看| 日本中文在线| 亚洲欧美综合v| 狠狠综合久久av一区二区| 欧美日韩第一区日日骚| 亚洲天堂一区在线| 亚洲综合视频网| 亚洲人做受高潮| 久久久精品影视| 亚洲精品乱码久久| 国产精品一级在线| 性chinese极品按摩| 久久欧美肥婆一二区| 精品久久久久久无码中文野结衣| 亚洲精品一二三区区别| 亚洲国产精品一区二区第一页| 秋霞影视一区二区三区| 成人一区二区三区四区| 国产 日韩 欧美| 国产精品久久久久久婷婷天堂| 丝袜老师在线| 性欧美长视频免费观看不卡| 视频在线这里都是精品| 久久久久999| 国产在线激情| 久久精品成人一区二区三区| eeuss影院在线播放| 伊人久久五月天| 成年人在线免费观看| 亚洲精品中文字幕av| 日韩二区三区| 亚洲美女喷白浆| 飘雪影视在线观看免费观看| 日韩成人中文字幕在线观看| 天天操天天操天天| 亚洲精品720p| 三级在线观看| 亚洲欧美日韩图片| 国产三级视频在线播放线观看| 亚洲欧美国产视频| 免费在线黄色影片| 亚洲一区999| 尤物在线视频| 久久久国产成人精品| 午夜dj在线观看高清视频完整版| 欧美另类老女人| cao在线视频| 欧洲一区二区视频| 在线成人视屏| 95av在线视频| 国产精品国产| 欧美日韩喷水| 日本a口亚洲| 国产免费xxx| 极品av少妇一区二区| 99热成人精品热久久66| 裸体一区二区三区| 日本人dh亚洲人ⅹxx| 99精品热视频| 国产精品免费无码| 亚洲色图第一区| 日韩av在线播| 精品视频一区三区九区| 午夜精品久久久久久久99老熟妇| 亚洲国产三级网| 国产区视频在线播放| 久久久成人的性感天堂| 欧美a级在线观看| 成人黄在线观看| eeuss国产一区二区三区四区| 久久久久久国产精品mv| 97视频精品| 成人一区二区免费视频| 日韩高清一级片| 少妇献身老头系列| 国产午夜精品一区二区三区四区| 黑人狂躁日本娇小| 精品成人乱色一区二区| 一区二区视频免费观看| 精品久久国产97色综合| 99re在线视频| 97久久精品人人澡人人爽缅北| 不卡亚洲精品| 精品国产一二| 91精品国产91久久久久久黑人| 男女超爽视频免费播放| 韩国女主播成人在线观看| 亚洲av无码一区二区三区网址| 亚洲欧美在线视频| 97人人澡人人爽人人模亚洲| 欧美精品三级在线观看| 亚洲欧美综合一区二区| 欧美乱妇40p| 国产精品高潮久久| 久久久亚洲综合网站| 午夜精彩国产免费不卡不顿大片| 国产xxxxx视频| www.欧美色图| 91嫩草丨国产丨精品| 色av一区二区| 天天干免费视频| 色中色综合影院手机版在线观看| 日韩欧美一区二区三区在线观看 | 国产在线视频欧美| 九九综合九九| 免费拍拍拍网站| 国产美女视频一区| 国产一级淫片久久久片a级| 欧美日韩亚洲激情| 天堂av手机版| 欧美大荫蒂xxx| www.久久爱.com| 亚洲欧美国产不卡| 久久一综合视频| 久久精品一区二区免费播放| 亚洲高清视频在线| 国内精品久久久久久久久久久 | 精品国产91久久久久久久妲己 | 免费av不卡在线| 国产日韩成人精品| 少妇高潮av久久久久久| 亚洲精品一区二区三区精华液| 性欧美videos高清hd4k| 成人免费视频网| 希岛爱理一区二区三区| 亚洲国产日韩欧美在线观看| 亚洲国产经典视频| 国产真人无遮挡作爱免费视频| 亚洲欧美成人网| 亚洲性受xxx喷奶水| 蜜桃网站成人| 老司机午夜免费精品视频| 精品欧美一区二区久久久| 色欲综合视频天天天| 久久经典视频| 国产精品99免视看9| 日韩极品一区| 五月天婷婷在线观看视频| 亚洲品质自拍视频网站| 99久久免费国产精精品| 九九热精品在线| 国产精品网址| 黄在线观看网站| 国产欧美视频一区二区三区| 国产裸体美女永久免费无遮挡| 中文字幕久精品免费视频| 欧美videos粗暴| 日韩最新中文字幕| 国产成人自拍在线| 国产第一页在线播放| 日韩福利在线播放| 日韩高清不卡| 可以免费看的黄色网址| 国产69精品久久99不卡| 免费观看一区二区三区毛片 | 国产精品日韩高清| 国产精品外国| 精品手机在线视频| 欧美一区二区女人| 日韩激情电影| 亚洲欧洲一二三| 国产成人鲁色资源国产91色综| 久热这里只有精品6| 中文字幕欧美专区| 欧美日韩中出| av免费播放网址| 国产精品欧美精品| 乱色精品无码一区二区国产盗| 欧美中文字幕视频| 欧美国产一级| 国产黄色三级网站| 欧美性生活影院| 暖暖在线中文免费日本| 久久综合伊人77777麻豆| 久久精品国产一区二区| 久久久久久久国产精品毛片| 亚洲九九九在线观看| 国产视频一区二| 国产男女在线观看| 亚洲丝袜自拍清纯另类| 亚欧洲精品视频| 91久久久在线| 香蕉精品999视频一区二区| 中文字幕在线观看2018| 日韩精品极品视频免费观看| av日韩一区| 男女av免费观看| 玉米视频成人免费看| 久草在线免费福利资源| 痴汉一区二区三区| 久久精品免费看| 亚洲天堂视频网站| 欧美激情奇米色|