比RAG提升27.4%，阿里等ComRAG利用“質心式”記憶機制實現實時社區問答

PaperAgent

發布于 2025-8-28 07:25

瀏覽

0收藏

社區問答（CQA）平臺（如 Stack Overflow、AskUbuntu）沉淀了大量高質量知識，但在工業界落地時仍面臨三大挑戰：

靜態知識不足：僅靠官方文檔難以覆蓋真實業務場景的“坑”。
歷史 QA 質量參差不齊：早期答案可能已被更好答案取代。
實時性 + 存儲爆炸：新問題持續涌入，如何快速檢索并控制存儲增長？

現有方法要么只檢索社區歷史，要么只用靜態文檔，缺少“動態反思 + 高效存儲”的機制。ComRAG 正是為了解決這些痛點而生。

比RAG提升27.4%，阿里等ComRAG利用“質心式”記憶機制實現實時社區問答-AI.x社區

ComRAG 框架概覽

比RAG提升27.4%，阿里等ComRAG利用“質心式”記憶機制實現實時社區問答-AI.x社區

*圖 1：ComRAG 實時社區問答（CQA）架構。系統整合了一個靜態知識向量庫和兩個動態 CQA 向量庫（高質量與低質量），后者通過基于質心的記憶機制進行管理。

核心思想一句話：“既要官方文檔的權威，也要社區歷史的經驗，還要隨時間動態遺忘低質量內容”。

技術拆解

1.1 靜態知識向量庫

用 embedding 模型把官方文檔切成 chunk → 建索引 → 向量檢索。
負責兜底：當社區沒有相似 QA 時，由官方文檔直接生成答案。

1.2 動態 CQA 向量庫

為了處理“質量不一致 + 存儲無限膨脹”兩個問題，作者提出雙庫 + 質心記憶機制：

組件	作用	更新邏輯
High-Quality Store	存放高質量 QA（得分 ≥ γ）	用質心聚類 + 替換低分舊 QA
Low-Quality Store	存放低質量 QA（得分 < γ）	同樣聚類，但僅作為“反面教材”提示 LLM 不要重蹈覆轍

比RAG提升27.4%，阿里等ComRAG利用“質心式”記憶機制實現實時社區問答-AI.x社區

圖 4：利用質心聚類控制存儲增長，ProCQA 上 10 輪迭代后 chunk 增長率從 20.23% 降到 2.06%

1.3 三路徑查詢策略

收到新問題 q 時，ComRAG 按相似度閾值 τ, δ 走三條路徑之一：

直接復用：與高質量庫中某 QA 幾乎一樣（sim ≥ δ），直接返回答案。
參考生成：與高質量 QA 有點相似（τ ≤ sim < δ），把相關 QA 作為上下文讓 LLM 重寫。
避坑生成：高質量庫里沒類似問題，則拿低質量 QA 做“負面例子”+ 官方文檔，讓 LLM 生成更可靠答案。

1.4 自適應溫度

根據檢索到的歷史答案得分方差 Δ 動態調整 LLM temperature：

方差小 → 答案一致 → 提高溫度增加多樣性

方差大 → 答案分歧 → 降低溫度保證可靠

比RAG提升27.4%，阿里等ComRAG利用“質心式”記憶機制實現實時社區問答-AI.x社區

實驗驗證

2.1 數據集與指標

數據集	領域	KB 片段數	初始 QA 對	測試問題
MSQA	Microsoft 技術	557 k	9 518	571
ProCQA	Lisp 編程	14 k	3 107	346
PolarDBQA	PolarDB 數據庫	1.4 k	1 395	153

指標：

語義：BERT-Score F1、SIM（embedding 余弦相似度）
詞匯：BLEU、ROUGE-L
效率：Avg Time（秒/問題）

2.2 主實驗結果

比RAG提升27.4%，阿里等ComRAG利用“質心式”記憶機制實現實時社區問答-AI.x社區

表 1：三大數據集上 ComRAG 均顯著優于所有基線

質量提升：SIM 提升 2.1 %–25.9 %
延遲降低：比次優方法快 8.7 %–23.3 %
可擴展性：10 輪迭代后延遲最多再降 52.5 %（ProCQA）

圖 2：PolarDBQA 上移除任一模組都會顯著降低 BERT-Score 或增加延遲

移除高質量庫 → BERT-Score ?2.6，延遲 +4.9 s
移除質心記憶 → BERT-Score ?0.5，延遲 +2.2 s
移除自適應溫度 → 直接可復用答案比例下降

關鍵結論 & 工業落地啟示

維度	ComRAG 帶來的收益
效果	語義相似度最高提升 25.9 %，顯著優于 DPR/BM25/RAG
效率	延遲隨時間遞減，最多再降 52 %，適合高并發場景
存儲	chunk 增長率被壓制到 < 2.1 %，節省 90 % 存儲
可插拔	LLM、embedding、打分器、向量庫全部可替換

“ComRAG 的核心價值不在于模型本身，而在于用質心記憶機制把‘時間’和‘質量’顯式建模進了檢索-生成流程。”

https://arxiv.org/abs/2506.21098
ComRAG: Retrieval-Augmented Generation with Dynamic Vector Stores for Real-time Community Question

?本文轉載自????????????????PaperAgent??

標簽

RAG

ComRAG

高效存儲

已于2025-8-29 06:30:26修改

贊

回復

舉報

回復

相關推薦

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率

大語言模型論文跟蹤 ? 5072瀏覽 ? 0回復
百度也來卷RAG了，Self-Reasoning比Self-RAG最高提升11.8%

PaperAgent ? 4331瀏覽 ? 0回復
Agentic RAG Golden-Retriever：顯著提升企業知識庫問答準確性、檢索效率！

PaperAgent ? 4508瀏覽 ? 0回復
美國律師協會：ChatGPT等生成式AI，能幫助律師提升效率

Aceryt ? 4163瀏覽 ? 0回復
RAG開發新技術：利用語義相似度提升標簽過濾質量

51CTO內容精選 ? 4449瀏覽 ? 0回復
RAG：如何通過實時數據提升AI準確性并減少“幻覺”

Halo咯咯 ? 1.2w瀏覽 ? 0回復
深度解析 REAcT Agent 的實現：利用 LlamaIndex 和 Gemini 提升智能代理工作流

Halo咯咯 ? 1.0w瀏覽 ? 0回復
R2AG:將檢索信息融入RAG，提升問答系統準確性

大模型自然語言處理 ? 3412瀏覽 ? 0回復
RAG 應用效果不太理想？試試以下RAG優化策略大幅提升問答效果

AI博物院 ? 1.1w瀏覽 ? 0回復
ChunkRAG：比CRAG提升10個點準確率

大語言模型論文跟蹤 ? 3676瀏覽 ? 0回復
利用Milvus向量數據庫，帶你實現GraphRAG

AI科技論談 ? 4537瀏覽 ? 0回復
聊聊 GPU 監控那些事：利用率 & 故障等

amei2000go ? 1.2w瀏覽 ? 0回復
MedRAG：利用知識圖譜引導推理提升醫療Copilot的RAG能力 - 新加坡南洋理工等

知識圖譜科技 ? 6933瀏覽 ? 0回復
如何利用AGI技術實現核聚變？

唐克 ? 3390瀏覽 ? 0回復
Graph RAG 迎來記憶革命：“海馬體”機制如何提升準確率？

凝固的雨_1 ? 4592瀏覽 ? 0回復
EDC2-RAG：利用聚類和壓縮技術提升RAG準確性

大語言模型論文跟蹤 ? 3477瀏覽 ? 0回復
記憶機制、思維模式與跨領域推理

sbf_2000 ? 2363瀏覽 ? 0回復
用于實時工業社區問答的RAG新框架-ComRAG

大模型自然語言處理 ? 1592瀏覽 ? 0回復
突破AI記憶瓶頸！阿里通義實驗室ReSum技術讓大模型實現"無限思考"

柏企閱文 ? 3023瀏覽 ? 0回復

PaperAgent

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

51CTO

51CTO博客

51CTO學堂

比RAG提升27.4%，阿里等ComRAG利用“質心式”記憶機制實現實時社區問答

ComRAG 框架概覽

技術拆解

1.1 靜態知識向量庫

1.2 動態 CQA 向量庫

1.3 三路徑查詢策略

1.4 自適應溫度

實驗驗證

2.1 數據集與指標

2.2 主實驗結果

關鍵結論 & 工業落地啟示

目錄