精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

EMNLP 2025 | CARE:無需外部工具,讓大模型原生檢索增強推理實現上下文高保真

人工智能 新聞
來自 MetaGPT、蒙特利爾大學和 Mila 研究所、麥吉爾大學、耶魯大學等機構的研究團隊發布 CARE 框架,一個新穎的原生檢索增強推理框架,教會 LLM 將推理過程中的上下文事實與模型自身的檢索能力有機結合起來。

近日,來自 MetaGPT、蒙特利爾大學和 Mila 研究所、麥吉爾大學、耶魯大學等機構的研究團隊發布 CARE 框架,一個新穎的原生檢索增強推理框架,教會 LLM 將推理過程中的上下文事實與模型自身的檢索能力有機結合起來。該框架現已全面開源,包括訓練數據集、訓練代碼、模型 checkpoints 和評估代碼,為社區提供一套完整的、可復現工作。

  • 項目主頁:https://foundationagents.github.io/CARE
  • 論文地址:https://arxiv.org/abs/2509.13683
  • 開源代碼:https://github.com/FoundationAgents/CARE
  • 開源模型 & 數據集:

https://huggingface.co/collections/sheryc/care-datasets-emnlp-2025-68be35242afab58f4bed7d97

https://huggingface.co/collections/sheryc/care-checkpoints-emnlp-2025-68be35dbd732816c9d98f258

研究背景

從“外部搜索”到“原生檢索”的轉變

1、現有方法的困境

目前解決上下文保真度問題主要有兩條路:1. 搭建復雜的 RAG 系統,依賴向量數據庫、檢索器等一整套基礎設施;2. 讓模型去調用搜索引擎,但這樣反而忽略了用戶已經提供的寶貴信息。這兩種方法都把檢索當作一個獨立的外部過程,沒有真正融入模型的思考流程。與此同時,目前的LLM有著較強的多任務能力,所以檢索器和理解模型在長上下文閱讀中或許可以被LLM所統一。

2、CARE:讓檢索成為推理的一部分

CARE 的突破在于提出了原生檢索增強推理這一全新范式。簡單來說,就是教會模型在推理過程中利用模型本身的能力自然地引用輸入文本中的關鍵信息。就像學生在答題時會在試卷上劃重點一樣,模型會在思考過程中插入類似“根據文檔第三段提到...”這樣的引用,確保每一步推理都有據可依。

這種方法的優勢顯而易見:不需要額外的檢索系統,不增加推理延遲,部署極其簡單。對于使用 LLM 的項目來說,只需要替換模型權重就能獲得顯著的性能提升。

技術實現:兩階段訓練策略

CARE 采用了精心設計的兩階段訓練流程,確保模型既能學會檢索-推理的格式,又能在各種場景下靈活運用。

第一階段:讓模型學會“引用”

研究團隊首先基于 HotpotQA 數據集構建了訓練數據。通過一個巧妙的數據生成流程,他們將原始的問答數據轉換成包含明確引用的推理鏈。例如,當模型需要回答“約翰的媽媽買的電影票價格合理嗎”時,它會先思考“需要從用戶輸入中抽取約翰的媽媽買票的價格”,再利用自身能力自回歸地引用用戶輸入中出現的原文片段“票價是 15 美元”。之后,它再次思考“需要從用戶輸入中抽取普通票價”,再自回歸地引用“普通場次票價范圍是 10-12 美元”,最后得出結論。

這個階段使用監督學習,讓模型熟悉這種“先查找,再推理”的思考模式。關鍵是使用特殊標記來標識引用內容,讓模型清楚地區分哪些是從原文提取的事實,哪些是自己的推理。

第二階段:強化學習優化檢索質量

然而,僅僅學會格式還不夠,模型需要知道什么時候該檢索,檢索什么內容。第二階段采用強化學習,通過三個精心設計的獎勵信號來引導模型:

準確性獎勵確保最終答案正確,格式獎勵保證輸出規范,研究團隊在檢索獎勵上進行了創新:它鼓勵模型檢索的內容必須真實存在于原文中,不能憑空捏造。這個看似簡單的約束,實際上極大地提升了模型的上下文忠實度。

在此基礎上,為了讓模型能夠適應各種不同長度的輸入輸出,研究團隊引入了課程學習策略,讓模型從簡單的短文本問答逐步過渡到復雜的多跳推理任務。這就像教小孩先學會在一頁紙上找答案,再逐步學會在整本書中尋找線索。

評估效果

為了全面驗證 CARE 框架的有效性,研究團隊在真實世界和反事實(Counterfactual)兩大類問答基準上進行了嚴謹的實驗,并與多種主流方法進行了對比。實驗結果清晰地表明,CARE 在模型上下文保真度和回答準確性方面取得了全面且顯著的提升。

真實世界問答任務:全面超越現有方法

在涵蓋了多領域、長文本、多跳推理等復雜場景的四大主流 QA 基準(MFQA, HotpotQA, 2WikiMQA, MuSiQue)上,CARE 表現出了壓倒性的優勢。

  • 性能顯著提升:實驗數據顯示,以 Llama-3.1-8B 模型為例,搭載了 CARE 框架后的模型平均 F1 分數提升了 15.29%。 這一提升在需要綜合多個信息點進行推理的復雜多跳任務(如 2WikiMQA 和 MuSiQue)上尤為明顯,漲幅分別達到了 29.42% 和 18.92%
  • 普適性強:無論是在 Llama 還是 Qwen 等不同架構和尺寸的模型上,CARE 都能帶來一致的性能增益,證明了該框架的強大通用性。

反事實問答任務:真正做到“忠于原文”

為了測試模型在面對與自身“知識”相悖的上下文時,是否能堅守原文信息,研究團隊在 CofCA 基準上進行了測試。這被認為是檢驗模型上下文保真度的“試金石”。CofCA基準將測試中使用的長文檔由維基百科替換為了真實世界中不存在的信息,利用反事實的上下文,測試模型在用戶輸入極度OOD時的幻覺表現。

  • 上下文保真度大幅領先:CARE 能夠在給定上下文與模型預訓練知識沖突時,依然準確依據上下文作答,在 LLaMA-3.1 8B 上實現了 13.69% 的性能飛躍。
  • 揭示外部搜索的弊端:相比之下,依賴外部搜索引擎的傳統方法在這一任務上表現不佳,因為外部信息反而加劇了模型混淆,導致其忽略了眼前的“標準答案”。這凸顯了 CARE 原生檢索范式的關鍵優勢:優先并忠實于用戶提供的即時信息。

事實檢索能力評估:答得對,更找得準

CARE 的成功不僅體現在最終答案的準確性上。通過在 HotpotQA 基準上對模型檢索出的事實進行直接評估,研究團隊發現:

  • 檢索質量更高:與其他方法相比,CARE 在定位和提取關鍵支撐事實方面的能力更強,其檢索內容的 BLEU 和 ROUGE-L 分數均達到最高。 這證明了 CARE 真正學會了如何在推理過程中精準地“引用”原文,為最終答案的可靠性提供了堅實的基礎。

綜合來看,CARE 框架通過其創新的原生檢索增強推理機制,不僅在各項評估中取得了 SOTA 級別的性能,更重要的是,它為解決大型語言模型在實際應用中的“幻覺”和“上下文遺忘”問題,提供了一條高效、低成本且易于部署的全新路徑。

總結

針對 LLM 在上下文中容易丟失事實信息的固有問題,雖然已有借助 RAG 流程或調用檢索引擎進行改進的方式,但使得整體流程更長,耗時更久。CARE 則通過一種結合課程學習策略 + RL 的方法來提升 LLM 自身檢索能力,讓模型更多關注到上下文中的事實信息并進一步回答的更準確。這種使用原生檢索增強推理的范式降低了使用者的對接成本,具備更靈活的落地應用性。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-28 07:00:00

2024-09-05 08:24:09

2025-10-11 18:05:23

AI智能體模型

2024-03-14 08:11:45

模型RoPELlama

2024-01-29 08:49:36

RAG模型檢索

2025-10-31 01:00:00

2025-05-07 08:35:11

2025-03-18 08:14:05

2022-09-15 08:01:14

繼承基礎設施基礎服務

2017-05-11 14:00:02

Flask請求上下文應用上下文

2025-03-04 08:42:19

2024-03-29 14:04:00

模型訓練

2012-12-31 10:01:34

SELinuxSELinux安全

2024-04-30 16:17:34

RAGLLM

2025-08-07 08:00:00

2023-11-24 17:01:30

模型推理

2023-10-23 13:23:03

數據訓練

2022-09-14 13:13:51

JavaScript上下文
點贊
收藏

51CTO技術棧公眾號

性欧美ⅴideo另类hd| 国产精品久久久久久久久毛片 | 91大神xh98hx在线播放| 狠狠色丁香久久婷婷综| 久久免费精品视频| 黄色三级生活片| 亚洲精品福利| 91久久香蕉国产日韩欧美9色| 在线播放豆国产99亚洲| 男人天堂网在线视频| 日本不卡免费在线视频| 久久久久五月天| 1024手机在线观看你懂的| 97青娱国产盛宴精品视频| 91福利社在线观看| 久久成人福利视频| 思思99re6国产在线播放| www.欧美日韩| 91精品国产综合久久香蕉| 国产成人免费观看视频| 亚洲情侣在线| 尤物yw午夜国产精品视频明星| 国产麻豆剧传媒精品国产| 日本少妇一区| 欧美日韩国产一中文字不卡| 97超碰免费观看| аⅴ资源新版在线天堂| 91丨九色丨黑人外教| 国产高清在线一区二区| 国产精品国产三级国产aⅴ| 久久一区二区三区超碰国产精品| 欧美国产日韩中文字幕在线| 日韩精品久久久久久久的张开腿让| 清纯唯美亚洲经典中文字幕| 日韩欧美一区二区在线视频| 色啦啦av综合| 国产精品传媒麻豆hd| 一本色道**综合亚洲精品蜜桃冫| 国产真实老熟女无套内射| 色综合久久久久综合一本到桃花网| 久久视频一区二区| 韩国一区二区三区美女美女秀| 国产激情视频在线播放| 狠狠久久亚洲欧美| 国产精品自产拍在线观| 亚洲精品国产精品乱码视色| 丝袜美腿亚洲综合| 青青久久av北条麻妃黑人| 91av在线免费视频| 亚洲黄页一区| 97av在线影院| 五月婷婷亚洲综合| 国产精品免费看| 91国自产精品中文字幕亚洲| 日本污视频在线观看| 国模一区二区三区| 欧美成人三级视频网站| 欧美日韩激情在线观看| 国产精品v日韩精品v欧美精品网站| 精品国偷自产在线| 国产精品99久久久久久成人| 亚洲成人精品| 色综合男人天堂| 国产无码精品视频| 国产精品美女久久久浪潮软件| 国产91精品久久久久| youjizz在线视频| 日韩高清在线一区| 国产精品一久久香蕉国产线看观看| 中文字幕第三页| 久久成人av少妇免费| 91久久精品一区| 囯产精品一品二区三区| 91日韩一区二区三区| 欧洲亚洲一区| 欧美人xxx| 亚洲特级片在线| 天堂8在线天堂资源bt| 波多野结衣中文字幕久久| 精品国产乱码久久久久酒店| 色欲av无码一区二区人妻| 亚洲不卡系列| 日韩一区二区三区四区| 黄色国产在线观看| 欧美理论电影大全| 成人97在线观看视频| 尤物视频在线观看国产| 日韩成人av影视| 亚洲wwwav| 天堂а在线中文在线无限看推荐| 欧美激情一区三区| 欧美做受777cos| 午夜不卡影院| 欧美人动与zoxxxx乱| 潘金莲一级淫片aaaaaaa| 日本欧美高清| 日韩中文综合网| 日本少妇激情舌吻| 免费一级欧美片在线观看| av日韩免费电影| 视频二区在线| 亚洲综合区在线| 亚洲福利精品视频| 激情av综合| www.亚洲天堂| 欧美精品一二三四区| 国产在线国偷精品产拍免费yy| 久久99精品久久久久久久久久| 日本中文字幕伦在线观看| 婷婷夜色潮精品综合在线| 一起操在线视频| 亚洲小说图片视频| 欧美成年人视频| 久久永久免费视频| www.日韩av| 国产制服91一区二区三区制服| 精品91久久| 精品奇米国产一区二区三区| 男女全黄做爰文章| 久久久成人网| 国产乱码一区| 黄色网在线免费看| 欧美色图12p| 丰满少妇一区二区| 欧美大片专区| 国产一区二区在线免费视频| 国产午夜在线视频| 欧美日韩国产丝袜美女| 亚洲乱妇老熟女爽到高潮的片| 91精品综合久久久久久久久久久| 日本精品一区二区三区在线播放视频| 亚洲精品国产手机| 亚洲精品国产a| 男女污污视频网站| 99热国内精品| 国产精品视频精品| 成人在线观看免费| 色菇凉天天综合网| 99久久久无码国产精品性| 一本色道久久综合亚洲精品不卡| 国产福利不卡| 成人av影院在线观看| 欧美大片拔萝卜| 久久精品视频免费在线观看| 精品一区二区三区av| 一区二区三区四区在线视频| 欧美va在线观看| 亚洲欧美日韩一区在线| 久久久久久久久久影院| 99久久婷婷国产综合精品| 黄色一级片在线看| 久久国产精品色av免费看| 久久久久久久久国产精品| 亚洲乱码在线观看| 亚洲一区二区在线视频| 天天躁日日躁狠狠躁av麻豆男男 | 一级片在线免费观看视频| 久久综合国产精品| 亚洲中文字幕无码不卡电影| 一呦二呦三呦国产精品| 国产91色在线|| h视频在线观看免费| 欧美日韩一区高清| 看黄色录像一级片| 国产高清不卡一区| 少妇人妻无码专区视频| 猛男gaygay欧美视频| 国产精品99导航| 米奇精品一区二区三区| 日韩一区二区三区在线视频| 日本三级2019| 久久久久久久久久久久久久久99 | 国产一级理论片| a亚洲天堂av| 老司机午夜av| 51精产品一区一区三区| 成人精品一二区| 高清毛片在线观看| 亚洲欧洲在线播放| 亚洲天堂中文字幕在线| 一区二区三区精品视频在线| 亚洲第九十七页| 久久av中文字幕片| 欧美中日韩在线| 国产一区二区三区四区二区| 成人午夜激情免费视频| 97在线超碰| 中文字幕亚洲欧美在线| 成人乱码一区二区三区 | 久久黄色片视频| 久久社区一区| 精品伦精品一区二区三区视频| 91精品影视| 久久99精品国产99久久6尤物| 日韩午夜影院| 日韩一卡二卡三卡国产欧美| 亚洲影院在线播放| 亚洲欧美色一区| 美女爆乳18禁www久久久久久 | 亚洲av成人精品一区二区三区| 媚黑女一区二区| 国产911在线观看| 国产欧美日韩一区二区三区四区| 亚洲一区二区三区777| 僵尸再翻生在线观看| 久久九九国产精品怡红院| 四虎精品在线| 日韩午夜激情av| 中文无码av一区二区三区| 亚洲成人动漫一区| 老熟妇高潮一区二区三区| 久久久亚洲精品一区二区三区 | 奇米一区二区| 国产精品久久久久av| 91精品国产黑色瑜伽裤| 久久久97精品| 岛国最新视频免费在线观看| 亚洲第一中文字幕| a级片在线视频| 欧美日韩国产综合一区二区| 久久久久久久久久久久久av| 亚洲主播在线观看| 久久国产高清视频| 欧美高清在线视频| 成人片黄网站色大片免费毛片| 成人av网站大全| 极品白嫩少妇无套内谢| 久久aⅴ国产欧美74aaa| 在线免费观看视频黄| 欧美亚洲一级| 久久精品国产精品亚洲色婷婷| 黄色av一区| 超碰人人爱人人| 7777久久香蕉成人影院| 一区二区不卡在线视频 午夜欧美不卡'| 亚洲第一论坛sis| 九色视频成人porny| 精品人人人人| 国产在线精品一区二区三区| 91精品啪在线观看国产手机| 91久久久一线二线三线品牌| 96视频在线观看欧美| 成人免费xxxxx在线观看| 成人在线视频观看| 国产精品久久久久久av福利| 在线成人视屏| 国产精品白嫩美女在线观看| 中文.日本.精品| 国产精品视频久久| 精品福利在线| 成人xxxx视频| 激情综合婷婷| 国产伦精品一区| 日韩av网站在线免费观看| 久久国产主播精品| 久久99高清| 亚洲人体一区| 中文字幕一区二区三三| 成人在线视频一区二区三区| 激情久久一区| 亚洲午夜精品久久久久久人妖| 亚洲免费一区二区| 日韩无套无码精品| 久久精品国产在热久久| 伊人色在线视频| 国产精品亚洲成人| 中文字幕天堂网| 久久综合av免费| 婷婷综合在线视频| 亚洲乱码国产乱码精品精可以看| 久久精品免费av| 欧美日韩中文在线观看| 91麻豆精品在线| 69成人精品免费视频| 成人毛片视频免费看| 亚洲视频在线观看视频| 黄视频在线观看网站| 性欧美xxxx交| 成人黄色视屏网站| 91久色国产| 校花撩起jk露出白色内裤国产精品 | 1024av视频| 蜜臀av一区二区| 亚洲成人福利视频| 久久综合久久鬼色中文字| 女性裸体视频网站| 亚洲午夜精品久久久久久久久| 精品国产乱子伦| 日韩一区二区精品| 免费a在线观看| 精品少妇一区二区30p| 波多野结衣亚洲| 91视频最新| 大色综合视频网站在线播放| 精品人妻人人做人人爽| 老牛国产精品一区的观看方式| 91人妻一区二区三区| 久久久久久电影| 久久精品一区二区三| 欧美综合一区二区三区| 亚洲精品字幕在线| 在线精品国产成人综合| 9lporm自拍视频区在线| 91精品啪aⅴ在线观看国产| 妖精视频一区二区三区| a级黄色片免费| 秋霞影院一区二区| 免费a在线观看播放| 一区二区不卡在线播放| 国产情侣呻吟对白高潮| 亚洲国产精品va在线观看黑人| 国产一区久久精品| 国产精品成人久久久久| 欧美有码在线| 日韩一级性生活片| 国产在线一区观看| 国产精成人品免费观看| 精品国产91乱高清在线观看| 精品国产伦一区二区三| 中文字幕不卡av| 电影一区二区三| 久久艳妇乳肉豪妇荡乳av| 黄色欧美成人| 杨幂一区二区国产精品| 中文字幕一区二区三区在线观看| 波多野结衣在线电影| 日韩精品在线观看一区二区| аⅴ资源天堂资源库在线| aa成人免费视频| 欧美在线网站| 欧美国产在线一区| 最新久久zyz资源站| 亚洲无码精品在线观看| 国产一区二区黑人欧美xxxx| 台湾佬成人网| 欧美lavv| 亚久久调教视频| 日韩精品电影一区二区| 岛国视频午夜一区免费在线观看| 人人妻人人澡人人爽人人欧美一区 | 91麻豆制片厂| 欧美午夜精品理论片a级按摩| 久草在线网址| 国产精品99久久久久久人| 国产日产一区| 亚洲天堂av线| 日本一区二区免费在线观看视频| 欧美日韩综合一区二区三区| 亚洲视频国产视频| 精品3atv在线视频| 日本成人黄色免费看| 日韩专区欧美专区| 亚洲精品91在线| 欧美日韩国产综合久久| 精品国产99久久久久久| 亚洲a级在线播放观看| 牛牛国产精品| 成熟妇人a片免费看网站| 午夜精品久久久久久久99水蜜桃| 亚洲欧洲精品视频| 日韩美女视频免费看| 日本精品三区| 永久av免费在线观看| 亚洲动漫第一页| 青青草在线播放| 国产精品久久av| 亚洲老妇激情| 性色av蜜臀av浪潮av老女人| 精品国产91乱高清在线观看| 成人精品一区二区三区免费| 国产裸体写真av一区二区| 中文一区一区三区免费在线观看| 中文在线字幕观看| 色婷婷综合在线| 秋霞午夜在线观看| 97久草视频| 香蕉视频成人在线观看| 欧美成人另类视频| 欧美一级搡bbbb搡bbbb| 免费成人在线电影| 亚洲黄色成人久久久| 国产sm精品调教视频网站| 91video| 另类少妇人与禽zozz0性伦| 老司机成人在线| 国产三级国产精品国产专区50| 夜夜爽夜夜爽精品视频| 精品一二三区视频| 亚洲一区二区日本| 三级久久三级久久| 欧美成人精品欧美一级私黄| 亚洲欧美激情另类校园| 精品三级久久久| 日韩 欧美 高清| 亚洲精品综合在线| 国产中文字幕在线观看| 动漫3d精品一区二区三区| 日韩不卡在线观看日韩不卡视频| 免费毛片在线播放免费| 亚洲一区第一页|