MIRAGE:并行圖檢索增強推理鏈擴展Test-Time推理
論文(MIRAGE: Scaling Test-Time Inference with Parallel Graph-Retrieval-Augmented Reasoning Chains)介紹了一個Test-Time(后面使用“測試時”來翻譯)推理框架,將單一線性鏈替換為多個并行的、基于實體的醫學知識圖譜鏈。MIRAGE將查詢分解為子問題,在錨點和橋接模式下運行自適應圖檢索,然后通過跨鏈驗證來協調答案,相比線性ToT或以網絡為中心的代理RAG,能獲得更高的準確性和更清晰的來源追溯?;趫D的檢索在處理復雜數據的眾多應用中都很有用
圖片
新穎之處:在結構化知識圖譜上進行并行多鏈推理,而不僅僅是更長的單鏈。兩種檢索模式:錨點(單實體鄰域)和橋接(實體對之間的多跳路徑)。合成器驗證跨鏈一致性并在輸出簡潔最終答案前標準化醫學術語。
圖片
意義 :線性鏈會累積早期錯誤并將證據視為平面文本?;趫D的檢索保持關系和層次結構,支持精確的多跳醫學推理和可追溯路徑。
效果: 在三個醫學問答基準測試中達到最先進水平。在ExplainCPE上,MIRAGE達到84.8%的準確率和最佳GPT-4o排名;在GenMedGPT-5k和CMCQA上也有類似提升。當替換為DeepSeek-R1-32B作為骨干模型時,魯棒性依然保持。GenMedGPT-5k上的人類評估也更偏好MIRAGE。
圖片
洞察: 更多子問題有幫助,直到過度分解增加噪音為止,而允許更多檢索步驟顯示出遞減但穩定的收益。調整子問題上限和檢索預算是關鍵。
圖片
可解釋性:每個聲明都可以追溯到明確的知識圖譜鏈,具有分解、查詢和合成的審計記錄。案例研究對比了MIRAGE的解耦鏈與單鏈網絡搜索方法,朝著連貫診斷的方向解決問題。
本文轉載自??????????AI帝國??????????,作者:無影寺

















