精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2025 Spotlight | 讓檢索、推理真正「合體」的小而強模型,AceSearcher來了

人工智能 新聞
近期,來自埃默里大學,佐治亞理工大學,羅格斯大學,紐約州立大學奧爾巴尼分校,得克薩斯大學西南醫學中心的研究團隊發布 AceSearcher 模型。

如何讓一個并不巨大的開源大模型,在面對需要多步檢索與復雜邏輯整合的問題時,依然像 “冷靜的研究員” 那樣先拆解、再查證、后歸納,最后給出可核實的結論?

近期,來自埃默里大學,佐治亞理工大學,羅格斯大學,紐約州立大學奧爾巴尼分校,得克薩斯大學西南醫學中心的研究團隊發布 AceSearcher 模型,一個讓同一語言模型在推理時兼任 “問題分解者(Decomposer)” 與 “答案求解者(Solver)” 的合作式自博弈框架:它以兩階段訓練(SFT→RFT)為骨架,把 “會拆題、會找料、會整合” 的完整能力鏈擰成了一根繩。更重要的是,這不是單純的 “又一個新模型”,而是一個更優的框架:它把公開的推理數據集引入到檢索增強的訓練流程中,讓模型真正學會如何把推理與檢索結合起來,顯著提升了復雜檢索任務的效果。

在三大類推理密集任務、十個數據集上,它拿到了平均 EM +7.6% 的優勢;32B 版本在文檔級金融推理上,表現可對標 685B 的 DeepSeek-V3,但參數量卻不到 5%。

  • 論文題目:AceSearcher: Bootstrapping Reasoning and Search for LLMs via Reinforced Self-Play
  • 接收會議:NeurIPS 2025 Spotlight
  • 論文地址:https://arxiv.org/pdf/2509.24193
  • 模型 / 數據集地址:https://huggingface.co/AceSearcher
  • 代碼地址:https://github.com/ritaranx/AceSearcher/

把人類的 “拆解 — 檢索 — 整合” 過程,規約成一個統一策略

現實世界的問題,常常不是 “一問一答” 能解決:線索散落在不同文檔,需要多跳檢索把證據拼齊,還要在此基礎上進行跨段落乃至跨文檔的整合推理。傳統 RAG 在這里容易 “卡殼”—— 單步檢索召回不足、推理鏈整合不穩、推理時擴展又容易帶來延遲和資源開銷。

AceSearcher 的關鍵,是把這一流程變成一個單模型、雙角色的閉環:

  • 分解者 :把原始問題  拆成子問題序列 ,以子問題為查詢錨點,逐跳拉起相關證據;
  • 求解者:在每一跳證據上產出中間答案,最終基于匯總出答案

直觀來說:分解更好 → 檢索更準 → 整合更穩 → 答案更對。AceSearcher 就是沿著這條因果鏈,推動  與  在一個模型體內彼此成就。

AceSearcher 到底 “練” 了什么?

一、Stage I:監督微調(SFT)——“打底三件套”:會搜、會拆、會想

SFT 階段的訓練集是一個覆蓋面很廣的混合拼盤(約 18 萬樣本),包括:

1. 上下文豐富的 QA(NQ、SQuAD、DROP、NarrativeQA、Quoref、ROPES、FEVER、TAT-QA),讓模型學會在證據上作答;

2. 問題分解數據(GSM8K、ConvFinQA、StrategyQA),讓模型學會把復雜問題拆成子目標;

3. 鏈式推理數據(GSM8K、TabMWP、IfQA、MathInstruct 等 CoT/PoT),讓模型形成多步推理的 “肌肉記憶”。

這一步的關鍵是:AceSearcher 首次系統地把這些公開的推理數據集,與檢索增強任務結合起來。我們希望模型不僅學會了 “如何在上下文中找答案”,更學會了 “如何通過推理去驅動檢索、再通過檢索去支撐推理”。這是它與以往 RAG 方法最大的差別之一。

二、Stage II:偏好強化微調(RFT)—— 只看 “最終答案”,也能學會 “更好的過程”

現實里很難拿到 “中間推理步驟” 的標注。AceSearcher 的 RFT 階段因此選擇只用最終答案來給獎勵:

  • 在 RAG 環境(HotpotQA、2WikiMHQA、HOVER 等)下, 先采樣 m 條分解路徑,每條分解上  再采樣 條完整解答軌跡;
  • 在上下文推理環境(GSM8K、TabMWP、ConvFinQA 等)下,仍負責拆題, 在表格 / 文本等上下文上生成中間答案與最終解;
  • 獎勵基于 EM(Exact Match) 與格式校驗,對整條軌跡  評分;
  • 把 “最好 vs 最差” 的分解、子問答、最終回答構造成偏好對,合并成 ,用 DPO(Direct Preference Optimization) 類目標訓練;并采用在線多輪迭代(第 t 輪用當前策略采樣偏好,再更新到 t+1 輪)。

實現上還有兩個細節很 “工程”:

  • 控制長度與成本:中間子問題階段只產出短答案,僅在最終回答處生成較完整的推理;
  • 檢索預算分配:總檢索配額 N=15,如果分解出 n 個子問題,則每個子問題最多分到  個文檔,以免某一步 “吃太多”。

在這里,利用推理數據集預訓練出來的 “分解與推理能力”,在 RFT 階段通過最終答案獎勵被進一步固化和遷移到復雜檢索任務,形成了推理與檢索的真正耦合。

評測設置:任務譜系、檢索器與指標

論文的評測覆蓋三個任務大類,共十個公開數據集:

  • 多跳問答:2WikiMHQA、HotpotQA、Bamboogle、MusiQue;
  • 多跳事實驗證:HOVER、ExFEVER;
  • 文檔級金融 / 數學推理:我們使用 DocMath-Eval 基準,包含 TAT-QA、FinQA、MultiHiertt、TAT-HQA 等任務。

實驗結果分析:既要 “能搜會拆”,也要 “合并同類項”

1)多跳 QA / 事實驗證:平均提升 7.6%,小中模型亦能 “越級”

在六個數據集的綜合評測中(2WikiMHQA、HotpotQA、Bamboogle、MusiQue、HOVER、ExFEVER),AceSearcher 全面優于近期開源 / 閉源基線;其中 32B 版本的綜合得分達到 60.7,相對多種強基線的平均 EM 最高可增 7.6%。更具代表性的是 “參數效率”:1.5B 版本已可對標 / 超越 8B 級基線,8B 版本還壓過 70B 級模型。

2)文檔級推理:32B ≈ DeepSeek-V3@685B(≈1/20 參數)

在 DocMath-Eval 上,AceSearcher-32B 的平均準確率與 DeepSeek-V3(685B) 幾乎持平;14B 版本還超過了若干 72B 級模型;8B 相對同量級 / 略大模型亦有明顯優勢。這表明 “分解→檢索→整合” 的統一范式,能在長文檔與表格混合的復雜情境里保持穩健的泛化。

3)效率與可擴展性:少量數據就能 “拉滿”,推理 - 時間性價比更優

  • 數據效率:SFT 只取 2K 樣本時,性能已可追平如 Search-R1 等強基線;RFT 追加 5K 提示后進一步拉升。
  • 推理效率:雖然比分步 RAG 多了 “分解 + 多跳” 的環節,但相對樹搜索 / 思維鏈擴展等方法,AceSearcher 在相近推理時間下拿到更高分。

消融:為什么一定要 “分解 + 求解” 都練?

系統消融清晰地回答了這個問題:

  • 缺哪樣都不行:去掉 RFT 或 SFT,成績明顯下滑;把  替換成 “凍結” 的通用指令模型,也會失分;
  • 只練上下文 QA 遠遠不夠:不加入 “分解 / 推理” 類數據,泛化與魯棒性都不如 “全配方”;
  • RL 替代方案不如在線迭代 DPO 穩定:RAFT、REST-EM、離線 DPO、迭代 SimPO 都做了橫比,AceSearcher 綜合更優。

這背后,其實是  與 的正反饋回路:好分解讓好檢索與好整合更容易發生,而持續的最終答案獎勵又把這條路走得更穩。這再次印證:AceSearcher 的貢獻不僅是性能超越,更是框架的超越。它證明了推理與檢索不該被割裂開來,而應在一個統一框架中通過數據與優化手段協同提升。

未來:從 “固定檢索器” 到 “聯合優化”,再到更廣的任務譜系

AceSearcher 證明了:聰明的訓練范式勝過盲目擴參。接下來有三條有潛力的路:

1. 檢索 - 推理聯合優化:目前檢索器固定,未來可嘗試把檢索表征、重排與生成策略聯學,進一步提高 “證據命中→推理穩定” 的閉環質量;

2. 極端時延場景的工程優化:在保持性能的前提下做緩存、動態步長與早停機制;

3. 更廣任務類型:從多跳問答 / 事實驗證 / 長文檔,擴展到對話式信息采集、實時工具使用、跨模態檢索等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-11 08:45:00

2025-11-07 08:42:00

AI模型數據

2025-10-16 08:57:00

AI模型訓練

2025-10-09 13:19:47

2025-10-23 09:18:46

2025-11-20 08:38:46

2025-05-21 08:47:00

2024-12-17 11:30:00

2025-10-08 11:22:01

2025-11-06 08:50:00

2025-11-12 08:56:15

2023-02-16 13:48:56

模型論文

2024-12-02 13:30:00

2025-06-30 08:36:00

AI模型強化學習

2025-09-26 10:58:03

AI視覺語言模型

2024-12-05 13:00:00

2025-10-17 09:08:05

2025-03-03 07:15:00

模型訓練AI

2025-08-29 09:09:00

AI模型數據
點贊
收藏

51CTO技術棧公眾號

亚欧精品在线| 国产精品日韩精品| 欧美h视频在线| 国产精品成人久久久| 精品成人18| 亚洲一区视频在线| 日本亚洲自拍| 99久久精品国产色欲| 99综合视频| 日韩在线观看免费网站| www.男人天堂| 香蕉久久一区| 欧美日韩免费网站| 黄色一区三区| 国产永久免费视频| 亚洲视频1区| 久久精品国产久精国产一老狼 | 97超级在线观看免费高清完整版电视剧| 国产一级黄色av| 日韩久久一区| 欧美性xxxx极品高清hd直播| 亚洲一区 在线播放| 飘雪影院手机免费高清版在线观看| 奇米色777欧美一区二区| 国产视频久久久久久久| 中文字幕第22页| 成人在线网址| 国产女同性恋一区二区| 精品婷婷色一区二区三区蜜桃| 国产精品久久久久久久免费| 香蕉久久夜色精品国产| 亚洲国产精品成人av| 午夜视频在线网站| 欧美aaa视频| 狠狠久久五月精品中文字幕| www.xxx麻豆| 黄色国产网站在线播放| 日本一区二区三区视频视频| 久久精品人人做人人爽电影| 蜜臀久久99精品久久久| 国产精品影音先锋| 亚洲a∨日韩av高清在线观看| caoporn91| 欧美偷拍自拍| 在线亚洲+欧美+日本专区| 国产精品无码av在线播放| 婷婷色在线播放| 日韩毛片在线免费观看| 国产系列第一页| 最新97超碰在线| 久久精品一区四区| 秋霞久久久久久一区二区| 五月色婷婷综合| 91亚洲精品乱码久久久久久蜜桃| 欧美性视频精品| 国产无码精品视频| 在线观看视频免费一区二区三区| 色综合视频网站| 国产女片a归国片aa| 欧美a级片网站| 精品中文字幕乱| 久久精品波多野结衣| 亚洲成人一品| 亚洲美女性视频| 成人片黄网站色大片免费毛片| 天堂av一区二区三区在线播放| 日韩精品免费在线视频| 成人h动漫精品一区| 国产精品一线天粉嫩av| 中文字幕国产亚洲2019| 亚洲制服在线观看| 日韩综合一区二区三区| 欧美成人欧美edvon| 真实乱偷全部视频| 欧美日日夜夜| 一本大道亚洲视频| 国产日产精品一区二区三区的介绍| 97精品97| 亚洲美女视频网| 亚洲毛片亚洲毛片亚洲毛片| 亚洲国产精品久久久久蝴蝶传媒| 精品网站999www| 日本在线观看| 日本成人在线电影网| 国产精品免费小视频| 91亚洲国产成人精品一区| 国产麻豆91精品| 黑人中文字幕一区二区三区| 精品av中文字幕在线毛片| 国产精品久久免费看| 国产乱子伦精品视频| 欧美gv在线观看| 欧美在线观看一二区| 欧美性猛交xx| 九一精品国产| 不卡av电影在线观看| 日韩欧美三级视频| 久久99国产精品久久99| 色哟哟国产精品| 久久久久久九九九| 亚洲不卡视频在线观看| 免费成人你懂的| 国产高清精品一区| 日韩欧美视频在线免费观看| 羞羞视频在线观看欧美| 成人福利在线视频| 午夜影院免费视频| 亚洲欧美激情在线| 一区二区精品在线观看| 97超碰免费在线| 亚洲人成网站精品片在线观看| 日韩精品一区二区免费| 欧美与亚洲与日本直播| 精品国产乱子伦一区| avhd101老司机| 亚洲精品一二| 亚洲va电影大全| 国产一级二级三级在线观看| 亚洲综合偷拍欧美一区色| 日本在线观看免费视频| 日韩精品丝袜美腿| 欧美日韩国产va另类| 中文在线最新版天堂| 99视频精品免费视频| 日本国产中文字幕| 色综合一区二区日本韩国亚洲 | 成久久久网站| 18性欧美xxxⅹ性满足| 欧美人与禽zozzo禽性配| 日韩av午夜在线观看| 精品久久久久久中文字幕动漫| 国产黄色小视频在线| 欧美日韩一区二区三区在线 | 国产精品国模大尺度视频| 免费黄色福利视频| 麻豆一区二区麻豆免费观看| 久久777国产线看观看精品| 91精品国产色综合久久不8| 久久精品免视看| 久久久久久久久久久福利| 久久99国产精品久久99大师| 久久99精品久久久久久琪琪| 国产精品久久久久久久久久久久久久久久| 久久综合九色综合97婷婷女人| 成人一区二区免费视频| 制服丝袜专区在线| 亚洲福利视频网站| 日本熟伦人妇xxxx| 日韩中文欧美在线| 欧美另类高清视频在线| 在线手机中文字幕| 亚洲欧美日韩一区在线| caoporn国产| 久久久不卡网国产精品二区| 黄色国产精品视频| 九九久久精品| 国产精品福利网| av在线播放av| 欧美军同video69gay| 亚洲一二三在线观看| 亚洲激情女人| 国产日韩一区二区三区| 多野结衣av一区| 亚洲精品综合精品自拍| 久久久久久久亚洲| 国产精品久久久久三级| 亚洲激情在线看| 欧美激情麻豆| 国产亚洲精品久久飘花| 日本一区二区三区在线视频 | 日韩免费视频在线观看| 狠狠v欧美ⅴ日韩v亚洲v大胸| 欧美在线观看视频一区二区三区 | 一区二区三区不卡在线观看| 国产精品成人免费一区久久羞羞| 亚洲福利专区| 欧美日韩精品免费看| 国产欧美自拍| 久久久久久久久久久网站| 天堂成人在线视频| 在线视频国内自拍亚洲视频| 国精产品久拍自产在线网站| 国产成人欧美日韩在线电影| 国产91美女视频| 视频在线不卡免费观看| 成人免费视频观看视频| 成人美女视频| 久久最新资源网| 先锋av资源站| 欧美日韩国产bt| 国产一级片播放| 国产午夜精品在线观看| 成人不卡免费视频| 日韩一区二区免费看| 亚洲人成人77777线观看| 久久天堂久久| 日韩免费观看网站| 欧美bbbxxxxx| 欧美色窝79yyyycom| 91成人福利视频| 91捆绑美女网站| 午夜av中文字幕| 午夜一级久久| 18视频在线观看娇喘| 亚洲区小说区图片区qvod| 国产日韩欧美中文| 性xxxxfreexxxxx欧美丶| 久久精品中文字幕电影| 日本免费不卡| 欧美成人三级在线| 一区二区精品视频在线观看| 粉嫩久久99精品久久久久久夜| 日韩精品电影一区亚洲| 性高潮久久久久久久久| 国产伦乱精品| 国产欧美精品日韩精品| 岛国av免费在线观看| 久久亚洲欧美日韩精品专区| 韩国福利在线| 精品久久久久一区| 一区二区精品视频在线观看| 色婷婷综合久久久久中文一区二区 | 忘忧草在线日韩www影院| 成人97在线观看视频| 高清毛片在线看| 亚洲精品影视在线观看| 日本高清视频www| 日韩欧美国产综合一区 | 国产美女一区二区三区| 国产视频手机在线播放| 亚洲综合二区| 黄色网页免费在线观看| 在线精品在线| 欧美不卡在线播放| 在线观看的日韩av| 国产a级片网站| 国产一区观看| 99久久久精品视频| 中文字幕一区二区三区欧美日韩| 亚洲欧美丝袜| 日韩精品一区二区久久| 色涩成人影视在线播放| 国产成人久久| 日韩资源av在线| 国产99久久精品一区二区300| 精品亚洲第一| 亚洲精品456| 日本一区不卡| 日韩免费久久| 一区二区三区我不卡| 国产精品国产一区| 中文字幕欧美人与畜| 日韩av免费大片| 亚洲草草视频| 天天精品视频| 欧美精品在欧美一区二区| 97精品一区二区| 看一级黄色录像| 午夜精品网站| 免费看日本毛片| 天堂在线一区二区| 免费涩涩18网站入口| 激情综合色播激情啊| 欧美高清精品一区二区| 国产91精品在线观看| 无码成人精品区在线观看| 91在线视频网址| 欧美熟妇激情一区二区三区| 国产精品乱人伦中文| 粉嫩av性色av蜜臀av网站| 亚洲一区二区三区四区的| 国产香蕉视频在线| 欧美性猛片aaaaaaa做受| 国产又大又粗又长| 精品国产精品一区二区夜夜嗨| 五月婷在线视频| 一个人看的www久久| а√天堂资源地址在线下载| 欧美精品videosex极品1| 惠美惠精品网| 91精品久久久久久久久青青| 99久久人爽人人添人人澡| 久久中文久久字幕| 欧美xxxx黑人又粗又长| 日本免费一区二区三区视频观看| 成人午夜毛片| 成人av男人的天堂| 国产成人精品一区二区免费看京 | 国产亚洲精品v| 污污的网站18| 成人av在线播放网址| 日本人亚洲人jjzzjjz| 一区二区三区中文字幕精品精品| 一级黄色免费网站| 91麻豆精品国产| 深夜福利在线观看直播| 久久久av网站| 国模冰冰炮一区二区| 亚洲自拍高清视频网站| 亚洲三级性片| 91精品国产毛片武则天| 久久午夜精品| 国产精品熟妇一区二区三区四区| 久久久国产精品午夜一区ai换脸| 日韩a级片在线观看| 91国产福利在线| 韩国中文字幕hd久久精品| 在线不卡免费欧美| 深爱五月激情五月| 久久精品国产成人| 亚洲第一会所| 精品高清视频| 欧美激情视频一区二区三区免费| 天天操天天摸天天爽| av欧美精品.com| 妺妺窝人体色www聚色窝仙踪| 欧美在线一区二区三区| 视频国产一区二区三区| 欧美极品少妇xxxxx| 亚洲在线资源| 91久久精品国产91久久性色tv| 国产精品一区二区三区av麻| 奇米影视亚洲色图| 国产乱国产乱300精品| 亚洲女人毛茸茸高潮| 色哟哟亚洲精品| 性感美女福利视频| 午夜精品蜜臀一区二区三区免费 | 精品成人佐山爱一区二区| 老司机精品视频在线观看6| 国产精品高清在线| 亚洲妇女av| 男人揉女人奶房视频60分| 不卡av在线网| 亚洲国产精一区二区三区性色| 日韩一区二区三区视频| 久久久久久国产精品免费无遮挡 | 欧美多人乱p欧美4p久久| 亚洲伊人伊成久久人综合网| 一区二区三视频| 韩国午夜理伦三级不卡影院| 三级黄色免费观看| 欧美嫩在线观看| 久久99精品久久久久久野外| 国产日韩亚洲欧美| 婷婷综合久久| 一级黄色免费毛片| 一级日本不卡的影视| 亚洲精品18p| 久久久久免费精品国产| 国产亚洲成av人片在线观黄桃| 免费拍拍拍网站| www.66久久| 一级片免费在线播放| 国产亚洲欧美视频| 成人不卡视频| 国产对白在线播放| 国产福利91精品一区二区三区| 久久综合久久鬼| 日韩精品高清在线| 色婷婷综合久久久中字幕精品久久| 亚洲第一导航| 国产一区二区中文字幕| 九九热精品免费视频| 亚洲娇小xxxx欧美娇小| 国模冰冰炮一区二区| 亚洲一区二区三区欧美| 国产精品一区二区不卡| 国产免费av一区二区| 夜夜嗨av一区二区三区免费区 | 亚洲国产精品一区二区久久hs| 欧美男生操女生| 懂色av一区| 视频一区亚洲| 国产精品主播直播| www.国产com| 中文字幕亚洲欧美| 丁香婷婷成人| 国产又猛又黄的视频| 一区二区在线免费观看| 亚欧在线观看视频| 成人高h视频在线| 亚洲乱码视频| 影音先锋男人看片资源| 亚洲精品一区在线观看| 日韩一级二级| 国产美女在线一区| 中文欧美字幕免费| 欧美一区二不卡视频| 国产精品精品国产| 国产综合欧美| xxxxx99| 日韩电影免费在线观看中文字幕| 欧美aaa大片视频一二区| 国产一级不卡视频| 欧美国产97人人爽人人喊| 亚洲精品一区二区三区区别| 国产精品夫妻激情| 在线不卡亚洲| www.xxxx日本|