2025 年過半,RAG 領(lǐng)域進(jìn)展如何?這份報(bào)告為你深度解析

2025 年已經(jīng)過半,在 LLM 領(lǐng)域,RAG(檢索增強(qiáng)生成)技術(shù)一直是備受關(guān)注的焦點(diǎn)。近期,RAGFlow 團(tuán)隊(duì)發(fā)布了 2025 年過半的 RAG 進(jìn)展報(bào)告下面來(lái)詳細(xì)看下。
1、RAG 與智能體的關(guān)系

被誤讀的 "智能體化 RAG"
2025 年 AI 圈最熱鬧的話題莫過于智能體系統(tǒng),隨之而來(lái)的 "智能體無(wú)需 RAG" 論調(diào)一度引發(fā)行業(yè)困惑。事實(shí)上,這種說法更像是市場(chǎng)噱頭 —— 從技術(shù)本質(zhì)看,RAG 與智能體并非對(duì)立關(guān)系,而是形成了 "智能體賦能 RAG 推理,RAG 支撐智能體記憶" 的共生架構(gòu)。
需要澄清的是,"智能體化 RAG(Agentic RAG)" 概念的源頭可追溯至 RAGFlow 在 2024 年推出的 Agent 功能。其核心并非用智能體取代 RAG,而是通過工作流實(shí)現(xiàn)二者的交互協(xié)作,從而有效解決意圖模糊、長(zhǎng)上下文理解等推理方面的難題。
智能體賦能 RAG 的核心機(jī)制
智能體對(duì) RAG 的賦能核心體現(xiàn)在反思驅(qū)動(dòng)與記憶支撐兩大機(jī)制:
- 反思驅(qū)動(dòng)的雙路徑進(jìn)化:
基于工作流的方法(如 Self-RAG、RAPTOR)通過預(yù)定義規(guī)則實(shí)現(xiàn)推理循環(huán),適合場(chǎng)景明確的標(biāo)準(zhǔn)化任務(wù);
基于Agentic的方法(如 Search O1、Search R1)則依賴 LLM 提示或強(qiáng)化學(xué)習(xí)自主驅(qū)動(dòng)反思,更適應(yīng)復(fù)雜動(dòng)態(tài)場(chǎng)景。
兩種路徑的共同目標(biāo)是解決 RAG 在意圖模糊、長(zhǎng)上下文理解等場(chǎng)景的推理短板。
- 記憶系統(tǒng)的分工協(xié)作:
RAG 是智能體長(zhǎng)期記憶的核心載體,通過索引、遺忘、整合三大功能管理任務(wù)元數(shù)據(jù)與上下文;而智能體的短期記憶則處理會(huì)話交互與個(gè)性化數(shù)據(jù),二者協(xié)同形成完整的記憶架構(gòu),為智能體的持續(xù)運(yùn)行和高效決策提供了有力支撐。
例如,OpenAI 2025 年投資 Supabase 的動(dòng)作,本質(zhì)就是為智能體打造更高效的記憶管理工具,而 RAG 在其中承擔(dān)著非結(jié)構(gòu)化數(shù)據(jù)處理的關(guān)鍵角色。
2、RAG 的技術(shù)挑戰(zhàn)與突破瓶頸
長(zhǎng)文本推理的解決方案
長(zhǎng)文本推理一直是 RAG 技術(shù)面臨的難點(diǎn),目前行業(yè)內(nèi)的解決方案主要集中在以下三類:
- 無(wú)分塊全文檔檢索:看似簡(jiǎn)單直接,實(shí)則僅適用于少量文檔場(chǎng)景。當(dāng)文檔規(guī)模擴(kuò)大,全局上下文理解能力不足會(huì)導(dǎo)致相關(guān)性急劇下降。
- 分層索引與文檔內(nèi)agentic RAG:通過構(gòu)建樹狀索引還原文檔結(jié)構(gòu)(章節(jié)、小節(jié)),結(jié)合智能體遍歷定位相關(guān)片段,實(shí)現(xiàn) "先定位文檔,再深挖細(xì)節(jié)" 的精準(zhǔn)檢索。
- 重疊分塊與多粒度檢索:通過文檔、章節(jié)、段落的多層索引平衡召回率與精度,適合需要跨層級(jí)關(guān)聯(lián)信息的場(chǎng)景。
此外,“注意力引擎(Attention Engine)” 技術(shù),如 RetrievalAttention、AlayaDB,嘗試通過稀疏注意力來(lái)優(yōu)化長(zhǎng)上下文推理。但該技術(shù)需要與 LLM 深度集成,目前僅在開源模型與本地部署場(chǎng)景中顯現(xiàn)潛力,在實(shí)際應(yīng)用中存在一定局限性。對(duì)于企業(yè)級(jí)應(yīng)用,傳統(tǒng) RAG 在精確檢索上仍具不可替代性。
多模態(tài) RAG(MM-RAG)的困境
盡管多模態(tài) RAG(MM-RAG)被視為重要趨勢(shì),但 2025 年的發(fā)展仍受制于基礎(chǔ)設(shè)施瓶頸:
多模態(tài) RAG 的發(fā)展面臨著諸多挑戰(zhàn),其中核心障礙是基礎(chǔ)設(shè)施的不成熟。多模態(tài)數(shù)據(jù)(如圖像)的向量表示使得存儲(chǔ)需求激增,例如,單張圖像可能需要 1024 個(gè) 128 維向量表示,導(dǎo)致存儲(chǔ)需求最高增加兩個(gè)數(shù)量級(jí),給數(shù)據(jù)存儲(chǔ)和管理帶來(lái)了巨大壓力,成為商業(yè)化落地的首要障礙。
為緩解這一問題,行業(yè)內(nèi)提出了多種解決方案:
- 在數(shù)據(jù)庫(kù)層面,通過二進(jìn)制量化將存儲(chǔ)需求壓縮至 1/32,配合量化向量索引與重排序器補(bǔ)償精度損失;
- 在模型層面,則通過降維(如 64 維向量)、向量合并(如 1024→128 個(gè)補(bǔ)丁)減少數(shù)據(jù)量,但會(huì)犧牲部分召回準(zhǔn)確性。
然而,這些方案只是權(quán)宜之計(jì),多模態(tài) RAG 的實(shí)際應(yīng)用仍依賴于基礎(chǔ)設(shè)施的完善和升級(jí)。
3、RAG 的現(xiàn)狀與未來(lái)趨勢(shì)
2025 年的 RAG 技術(shù)正處于典型的 "平臺(tái)期"—— 核心突破有限,更多是增量改進(jìn)。但這種平靜背后,是 RAG 在 AI 架構(gòu)中定位的悄然升級(jí):
互補(bǔ)性
智能體的強(qiáng)大離不開 RAG 的記憶支撐,而 RAG 的進(jìn)化也需要智能體的推理賦能。
RAG 與智能體之間存在著緊密的相互依賴關(guān)系。RAG 為智能體提供了長(zhǎng)期記憶和非結(jié)構(gòu)化數(shù)據(jù)管理能力,是智能體高效運(yùn)行的基礎(chǔ);而智能體則通過反思機(jī)制,顯著提升了 RAG 的推理效率。二者相輔相成,缺一不可,共同推動(dòng)著 AI 技術(shù)在實(shí)際場(chǎng)景中的應(yīng)用。
未來(lái)方向
- 從工具到架構(gòu)層的躍遷:隨著智能體應(yīng)用的普及,RAG 不再是孤立的檢索工具,而是成為連接非結(jié)構(gòu)化數(shù)據(jù)與智能體系統(tǒng)的關(guān)鍵架構(gòu)層。企業(yè)級(jí)智能體的落地,幾乎離不開 RAG 提供的長(zhǎng)期記憶支撐。
- 與 LLM 推理引擎的深度融合:稀疏注意力機(jī)制的探索(如將 KV 緩存與數(shù)據(jù)庫(kù)技術(shù)結(jié)合),預(yù)示著 RAG 與 LLM 推理引擎的邊界將逐漸模糊,形成 "檢索即推理" 的新范式。
- 基礎(chǔ)設(shè)施的協(xié)同進(jìn)化:長(zhǎng)文本處理的精準(zhǔn)化、多模態(tài)存儲(chǔ)的輕量化、智能體記憶的高效化,將推動(dòng) RAG 從 "檢索增強(qiáng)生成" 向 "知識(shí)驅(qū)動(dòng)決策" 升級(jí)。
4、總結(jié)
2025 年過去這半年中,RAG 雖然沒有出現(xiàn)顛覆性的技術(shù)突破,但它與智能體的協(xié)同已成為核心發(fā)展方向。在企業(yè)級(jí)應(yīng)用中,RAG 作為智能體長(zhǎng)期記憶的基礎(chǔ),具有不可替代的作用。而 RAG 技術(shù)瓶頸的突破,并非一蹴而就,需要依賴基礎(chǔ)設(shè)施與模型的共同進(jìn)化和發(fā)展。我們有理由相信,隨著技術(shù)的不斷進(jìn)步,RAG 將在 AI 領(lǐng)域發(fā)揮更加重要的作用,為各行各業(yè)帶來(lái)更多創(chuàng)新和價(jià)值。































