精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Agentic Deep Research新范式,推理能力再突破,可信度增加,螞蟻安全團隊出品

人工智能 新聞
OpenAI 和 Google 的研究者們總結了 Agentic Deep Researcher 的幾大優勢:(1)深入的問題理解能力。

盡管 LLM 的能力與日俱增,但其在復雜任務上的表現仍受限于靜態的內部知識。為從根本上解決這一限制,突破 AI 能力界限,業界研究者們提出了 Agentic Deep Research 系統,在該系統中基于 LLM 的 Agent 通過自主推理、調用搜索引擎和迭代地整合信息來給出全面、有深度且正確性有保障的解決方案。

OpenAI 和 Google 的研究者們總結了 Agentic Deep Researcher 的幾大優勢:(1)深入的問題理解能力(Comprehensive Understanding):能夠處理復雜、多跳的用戶提問;(2)強大的信息整合能力(Enhanced Synthesis):能夠將廣泛甚至沖突的信息源整合為合理的輸出;(3)減輕用戶的認知負擔(Reduced User Effort):整個 research 過程完全自主,不需要用戶的過多干預。

現存最先進的 Agentic Deep Research 系統往往基于由可驗證結果獎勵指導的強化學習訓練,盡管該訓練范式帶來了顯著的性能收益,但仍存在以下核心問題:

  • 梯度沖突(Gradients Conflicts):在基于可驗證結果獎勵的強化學習范式中,即使中間的推理過程或研究策略是有效的,只要最終答案錯誤,整個推理軌跡都會受到懲罰。這種粗粒度的獎勵設計在中間推理步驟與最終答案之間引入了潛在的梯度沖突,阻礙了模型發現更優的推理能力和研究策略,從而限制了其泛化能力
  • 獎勵稀疏(Reward sparsity):基于結果的強化學習僅依賴最終答案生成獎勵,導致每個訓練樣本只能提供稀疏的反饋信號。這嚴重限制了策略優化的效率,因為它增加了對更大規模訓練數據和更長訓練周期的依賴。

以上兩個限制限制了 Agentic Deep Research 系統的性能上線,為決解這兩大限制,來自螞蟻安全與智能實驗室團隊提出了 Atom-Searcher,進一步推動了 Agentic Deep Research 系統的性能邊界。


  • 論文標題:Atom-Searcher: Enhancing Agentic Deep Research via Fine-Grained Atomic Thought Reward
  • 論文:https://arxiv.org/abs/2508.12800
  • Github: https://github.com/antgroup/Research-Venus
  • Huggingface: https://huggingface.co/dikw/Atom-Searcher

方法介紹

本研究提出了一種創新性的 Agentic Deep Research 系統訓練框架 Atom-Searcher,結合監督微調(SFT)與基于細粒度獎勵的強化學習構建強大的 Agentic Deep Research 系統。

與現存 Agentic Deep Research 訓練框架相比,Atom-Searcher 創新地提出了 Atomic Thought 推理范式,引導 LLM 進行更加深入、可信和可解釋的推理;然后引入 Reasoning Reward Model(RRM)對 Atomic Thought 式的推理過程進行監督,構建細粒度的 Atomic Thought Reward(ATR);進而提出一種課程學習啟發的獎勵融合策略將 ATR 與可驗證結果獎勵進行聚合;最后基于聚合獎勵進行強化學習訓練。

Atomic Thought 推理范式

針對 Agentic Deep Research 系統中 LLM 生成的推理軌跡(<think>)包含過多冗余 tokens 且推理深度欠缺的問題,Atomic Thought 范式將 <think> 分解為更加細粒度的 “功能單元”,如 <Verification>、<hypothesis > 等,該范式有助于引導 LLM 的推理過程更加符合人的認知行為,且高度模塊化的方式能大大減少無意義 tokens。更進一步,為激發 LLM 自主將 < think > 分解為 Atomic Thoughts(<Verification>、<hypothesis > 等)的能力,作者們精心構建了 1000k 高質量 Atomic Thought 指令微調數據,對 LLM 進行 SFT。

細粒度 Atomic Thought Reward 構建

在 Agentic Deep Research 系統中,直接使用 Reasoning Reward Model(RRM)對推理過程進行監督,往往因為 < think > 中的低信噪比(過多冗余 tokens)而效果不佳。而 Atomic Thought 的提出,很好地解決了該問題,除了減少了 < think > 中的冗余 tokens,Atomic Thoughts(<Verification>、<hypothesis > 等)還為 RRM 提供了監督錨點,清晰的模塊化結構使得 RRM 能夠準確地評估每個功能單元的質量。因此,作者們引入 RRM 對 Atom-Thoughts 進行監督,從而得到細粒度的 Atomic Thought Reward,用于緩解強化學習訓練中的梯度沖突和獎勵稀疏問題。

課程學習啟發的獎勵聚合策略

基于可驗證結果的獎勵的 Agentic Deep Research 系統之所以存在梯度沖突問題,是由于基于結果的獎勵在 token 級別的獎勵分配上過于粗糙。具體來說,它將中間推理步驟的正確性完全歸因于最終答案,常常在不考慮各步驟實際貢獻的情況下對其進行獎勵或懲罰。這種錯位在優化過程中會引發梯度沖突。為解決這一問題,我們將 ATR 與結果獎勵相結合,利用 ATR 作為輔助信號來校準結果獎勵,從而緩解梯度沖突。

然而,使用靜態的獎勵加權系數無法與訓練動態保持一致。具體而言,在訓練初期,模型能力尚有限,難以生成完全正確的答案,但更有可能探索出對最終正確解有貢獻的有用 “原子思維”。如果此階段僅依賴基于結果的獎勵,這些有益的原子思維可能因最終答案錯誤而遭到不公正的懲罰;相反,一些有害的原子思維也可能被錯誤地強化,導致嚴重的梯度沖突,因而需要 ATR 進行較強的校準。隨著訓練的推進,模型能力逐步提升,其推理軌跡與正確答案的對齊程度也日益提高。因此,梯度沖突逐漸減弱,而來自 ATR 的過度校準可能會引入不必要的噪聲,反而損害最終的準確性。

強化學習訓練

基于混合獎勵,本文采用了 GRPO 算法進行強化學習訓練。并使用了 Loss Masking 策略保證訓練的穩定性。具體而言,在原始的 GRPO 框架中,損失函數會計算整個推理路徑中所有 token 的梯度。但在 Atom-Searcher 中,模型的輸出路徑包含由外部環境檢索得到的內容(如搜索結果),這些內容不是模型生成的,也不可訓練。為了避免模型在訓練時被這些靜態、不可控的內容誤導,本文采用了 Loss Masking 機制,將檢索結果部分的 token 排除在損失計算之外。

實驗效果

主實驗

Atom-Searcher 在 In-Domain 和 Out-of-Domain 上的性能表現均十分亮眼。在 In-Domain Benchmarks (NQ、 TQ、HotpotQA、2Wiki)上 Atom-Searcher 相較于最優 baseline——DeepResearcher 取得了 8.5% 的平均性能提升,在 Out-of-Domain Benchmarks(Musique、 Bamboogle、 PopQA)上 Atom-Searcher 相較于最優 baseline——DeepResearcher 取得了 2.5% 的性能提升。

消融實驗

作者們證明了 Atom-Searcher 中 Atomic Thought 范式和 ATR 的貢獻,并證明了相較于傳統的 < think > 推理范式 Atomic Thought 范式為 RRM 提供了有效的監督錨點,從而帶來了性能提升

案例分析

作者們通過案例分析對比了 Atom-Searcher 與最優 baseline——DeepResearcher 的推理過程。展示了 Atom-Searcher 的優勢:(1)Atom-Searcher 在其推理過程中自主生成了 Atomic Thoughts,展現出更接近人類的認知行為,例如問題分析、提出解決方案假設、預測錯誤以及規劃下一步操作,使其推理過程更加深入且清晰;(2)Atom-Searcher 會觸發更多的搜索調用,從而獲取更豐富的外部信息,以確保答案的正確性。這些優勢表明,Atom-Searcher 在更復雜的 Deep Research 任務中具有巨大潛力。

  


責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-20 09:54:36

數據管理大數據

2009-08-26 18:46:38

網絡威脅Web安全Blue Coat

2010-09-09 13:57:25

網絡威脅

2025-06-09 09:32:35

2012-02-29 15:06:10

2021-03-23 11:56:47

安全工程師職業

2025-05-29 03:00:00

混合推理模型LHRMAI

2017-06-08 23:02:10

安全代碼DevOps

2013-04-26 17:30:40

2024-03-01 11:58:26

MLLMs大語言模型人工智能

2023-07-07 06:48:18

2014-04-08 13:17:42

2018-10-09 12:25:00

2018-08-20 07:09:22

2013-02-28 11:58:42

2020-06-03 10:58:49

機器學習工具人工智能

2023-07-14 16:10:09

惡意軟件

2025-07-02 08:29:38

2020-10-13 15:31:55

人工智能機器學習技術
點贊
收藏

51CTO技術棧公眾號

日本最新一区二区三区视频观看| 日韩中文字幕有码| 国产精品无码网站| 成人在线免费公开观看视频| 四虎国产精品永久在线国在线| 伊人影院久久| 欧美日韩1234| 久久精品欧美| 久久久综合久久| yy6080久久伦理一区二区| 成人午夜电影网站| 麻豆国产va免费精品高清在线| 国产又黄又猛视频| 污视频网站免费观看| 欧美影视一区| 欧美精品一卡二卡| 亚洲美女网站18| 一二三区免费视频| 国产日产精品一区二区三区四区的观看方式 | 国产又粗又大又爽| 国产日产一区| 精品国内片67194| 亚洲国产日韩美| 秋霞网一区二区| 黄色成人91| 亚洲精品一区在线观看| www.xxx麻豆| 亚洲国产福利视频| 尤物精品在线| 久久九九免费视频| 欧美污在线观看| 2024短剧网剧在线观看| 国产成人精品一区二区三区四区 | 欧洲成人一区| 国产婷婷色一区二区三区四区| 国产91精品青草社区| 国产ts丝袜人妖系列视频| 91精品福利观看| 亚洲你懂的在线视频| 91传媒视频在线观看| 久操视频免费在线观看| 久久午夜影院| 一本大道综合伊人精品热热 | 男插女视频网站| jvid一区二区三区| 在线观看日产精品| 伊人久久99| 亚洲国产日韩在线观看| 精品一区二区三区在线观看国产 | 亚洲国产精品久| 波多野结衣一区二区三区免费视频| 亚洲综合视频在线观看| 国产一区二区三区四区hd| 国产一级免费视频| 66国产精品| 日韩精品久久久久久福利| 亚洲欧美另类人妖| 亚洲一区高清| 精品人妻午夜一区二区三区四区 | 亚洲特级黄色片| 亚洲二区三区不卡| 日韩在线观看高清| 手机在线成人av| julia一区二区三区中文字幕| 色呦呦国产精品| 激情内射人妻1区2区3区 | 久久99精品网久久| 久久69精品久久久久久国产越南| 免费黄色在线播放| 国模冰冰炮一区二区| 亚洲欧洲日本在线| 久久精品国产一区二区三区日韩| 亚洲精品.www| 99国产精品国产精品毛片| 国产精品亚洲精品| 丰满少妇乱子伦精品看片| 日韩成人三级| 日韩精品在线视频| 萌白酱国产一区二区| 红桃视频 国产| av美女在线观看| 中文字幕免费一区| 国内视频一区二区| 日本大臀精品| 国产iv一区二区三区| 国产精品久久久久久久久| 国产精彩视频在线| 91精品一区二区三区综合| 欧美大尺度激情区在线播放| 亚洲一级片网站| 伊人久久综合视频| 在线亚洲欧美| 久久国产色av| 日韩av无码中文字幕| 亚洲欧美综合久久久| 亚洲日本中文字幕| 国产女人18毛片水真多18| 成人在线啊v| 欧美三级韩国三级日本一级| 日本wwww视频| 国产免费拔擦拔擦8x在线播放 | 欧美综合在线视频| 欧美日韩中文在线视频| 国产精品刘玥久久一区| 久久久久久久精| 精品久久久久久亚洲| 精品人妻伦一二三区久久 | www在线观看播放免费视频日本| 91蝌蚪国产九色| 国严精品久久久久久亚洲影视| 国产小视频免费在线网址| 91免费国产在线观看| 亚洲巨乳在线观看| 瑟瑟视频在线看| 精品欧美一区二区三区| 久色视频在线播放| www.九色在线| 欧美人xxxx| 国产一二三四五区| 国产精品中文字幕亚洲欧美| 超碰精品一区二区三区乱码| chinese国产精品| 成人动漫av在线| 激情视频一区二区| 久久亚洲天堂| 欧美在线你懂的| 国产毛片毛片毛片毛片毛片毛片| 欧美aaaaa级| 亚洲欧美日韩中文在线| 无码人妻精品一区二区三区夜夜嗨| 亚洲精品极品少妇16p| 欧美最猛性xxxx| 中文在线观看免费高清| 久久成人免费电影| 日本不卡一区二区三区在线观看| 国产三级视频在线看| 午夜精品福利在线| 熟女少妇精品一区二区| 国产区精品视频在线观看豆花| 亚洲国产成人精品电影| 国产熟妇搡bbbb搡bbbb| 精品久久国产| 美日韩精品免费视频| 91国内精品视频| 国产精品久久久爽爽爽麻豆色哟哟| 欧洲xxxxx| 僵尸再翻生在线观看| 欧美成人艳星乳罩| 妺妺窝人体色www婷婷| 国产激情视频一区二区在线观看| 免费观看黄色的网站| 黄色的视频在线观看| 欧美性猛交xxxx| 午夜一级免费视频| 97视频热人人精品免费| 国模gogo一区二区大胆私拍 | 欧美喷水一区二区| 黄色av片三级三级三级免费看| 91精品综合久久久久久久久久久| 久久久久久久一区二区三区| 7799精品视频天天看| 久久久国产一区二区三区四区小说| 中国丰满人妻videoshd| 色综合久久中文| 久久五月天综合| 国产三级第一页| 99久久综合精品| 影音先锋亚洲视频| 中文字幕日韩亚洲| 欧美裸身视频免费观看| 成人午夜福利视频| 国产精品入口麻豆九色| 亚洲天堂网站在线| 国产成人调教视频在线观看| 国产高清在线不卡| 手机在线精品视频| 综合久久综合久久| 亚洲妇女无套内射精| 日韩天堂av| 人禽交欧美网站免费| www.91精品| 久久久久久中文字幕| 免费在线观看一级毛片| 午夜视频一区在线观看| 日韩av一二区| 久久国产夜色精品鲁鲁99| 欧美亚州在线观看| sm久久捆绑调教精品一区| 亚洲欧美综合v| 国产理论片在线观看| 日本动漫同人动漫在线观看| 狠狠色综合日日| 欧美12av| 日本大片在线播放| 精品视频偷偷看在线观看| 色婷婷久久综合中文久久蜜桃av| 9l国产精品久久久久麻豆| 欧在线一二三四区| 欧美激情无毛| 91丝袜脚交足在线播放| 毛片电影在线| 久久成人这里只有精品| 能在线看的av| 日韩午夜在线影院| 五月综合色婷婷| 精品一区二区三区蜜桃| 欧美一区二区中文字幕| 高潮按摩久久久久久av免费| 国产精品福利观看| 操人在线观看| 久久视频在线播放| 久久精品国产亚洲a∨麻豆| 精品久久久中文| 欲求不满的岳中文字幕| 美女视频黄a大片欧美| 亚洲精品第一区二区三区| 久久久久观看| 成人情视频高清免费观看电影| 天堂av中文在线| 精品国产123| 一级片一区二区三区| 欧美视频专区一二在线观看| 欧美丰满艳妇bbwbbw| 亚洲国产精品av| 国产精品亚洲无码| 日本免费新一区视频| 亚洲精品欧洲精品| 亚洲盗摄视频| 国产精品久久久久久搜索| 在线观看完整版免费| 在线精品亚洲欧美日韩国产| 亚洲白拍色综合图区| 国产乱码精品一区二区三区精东| 色综合久久中文字幕| 日本免费观看视| 亚洲高清中文字幕| 素人fc2av清纯18岁| 国产98色在线|日韩| 古装做爰无遮挡三级聊斋艳谭| 国产综合自拍| 看全色黄大色大片| 国产精品久久久久久麻豆一区软件 | 亚洲免费视频网| 日韩精品在线看片z| 国产 欧美 日韩 在线| 亚洲一区二区av电影| 亚洲做受高潮无遮挡| 99re这里只有精品首页| 91丨porny丨对白| 成人黄色在线看| 荫蒂被男人添免费视频| 不卡影院免费观看| 日本japanese极品少妇| 99精品国产视频| 国产中文字幕一区二区| 久久综合五月天婷婷伊人| 91插插插插插插插插| 国产精品豆花视频| 日本精品久久久久久久久久| 欧美日韩亚洲一区二区三区在线| 天天在线免费视频| 欧美日韩四区| 免费av观看网址| 久久亚洲美女| 青青青在线观看视频| 欧美军人男男激情gay| 水蜜桃亚洲一二三四在线| 91成人噜噜噜在线播放| 国产日本欧美一区二区三区在线| 白浆在线视频| 国产97在线亚洲| sqte在线播放| 欧洲亚洲妇女av| 国产精品99精品一区二区三区∴| 91精品久久久久久久久久另类| 自拍一区在线观看| 欧美国产日韩一区二区| 91精彩视频在线观看| 不卡av在线播放| 色在线中文字幕| 国产日韩中文在线| 2023国产精华国产精品| 欧美在线激情| 亚洲综合中文| 中文字幕无码精品亚洲35| 男女男精品视频网| 极品白嫩的小少妇| 国产成人在线免费观看| 性欧美成人播放77777| 一区视频在线播放| 国产精品久久久免费视频| 亚洲成人福利片| 在线观看国产精品入口男同| 精品国内二区三区| 98在线视频| 91av视频在线播放| 中文字幕在线中文字幕在线中三区| 国产欧美一区二区三区久久 | 欧美激情一区二区三区在线视频| 91视频综合| 国产精品50p| 国产剧情在线观看一区二区| 亚洲欧美日韩三级| 麻豆91精品91久久久的内涵| av中文字幕网址| 91啪亚洲精品| 久草国产在线观看| 欧美日韩免费一区二区三区 | 日韩在线视频导航| 五月天婷婷在线视频| 正在播放国产一区| 青青草视频免费在线观看| 久久精品视频播放| 日韩在线伦理| 国产精品swag| 欧美r级电影| 国产一级特黄a大片免费| 日日嗨av一区二区三区四区| 欧美大黑帍在线播放| 日韩精品一级中文字幕精品视频免费观看 | 久久精品成人欧美大片| 欧美精品videos另类| 伊人男人综合视频网| 欧美美女色图| 久久精品欧美视频| 精品69视频一区二区三区| 精品婷婷色一区二区三区蜜桃| 欧美激情亚洲| 成年人三级黄色片| 国产清纯白嫩初高生在线观看91 | 国产suv精品一区二区三区| 欧美老熟妇乱大交xxxxx| 亚洲一区视频在线| www.成人免费视频| 日韩中文字幕欧美| 国产精品99| 日本午夜精品一区二区三区| 精品9999| 99久久国产精| 亚洲精选在线视频| 中文区中文字幕免费看| 亚洲免费福利视频| sm在线观看| 免费久久久一本精品久久区| 国内在线观看一区二区三区| 欧洲成人午夜精品无码区久久| 中文字幕在线不卡| 欧美巨胸大乳hitomi| 在线观看不卡一区| 免费动漫网站在线观看| 美女视频黄a大片欧美| 欧美成人黑人猛交| 不卡的av电影| 中文字幕第15页| 亚洲精品国产精品国自产观看浪潮| 色综合免费视频| 色综合色综合久久综合频道88| 日韩大尺度黄色| 婷婷亚洲婷婷综合色香五月| 老司机精品导航| 后入内射无码人妻一区| 欧美日韩另类一区| 制服丝袜在线播放| 99热在线国产| 卡通动漫精品一区二区三区| 欧美色图色综合| 96av麻豆蜜桃一区二区| 国产情侣小视频| 中文字幕亚洲欧美日韩在线不卡| 日韩中文视频| 亚洲免费视频播放| 国产大片一区二区| 欧美日韩精品区| 亚洲欧美日韩爽爽影院| 国产精品粉嫩| 97在线免费视频观看| 久久在线精品| 任我爽在线视频| 欧美成人官网二区| 欧美家庭影院| 精品国产一二| 天堂成人免费av电影一区| 人人艹在线视频| 欧美日本一道本在线视频| 国产精品探花在线| 欧美日本韩国一区二区三区| 久久成人免费日本黄色| 麻豆影视在线播放| 日韩经典中文字幕| 国产一区二区三区黄网站| 国内少妇毛片视频| 欧美国产乱子伦| av手机免费看| 国产精品99久久久久久www| 欧美国产一区二区三区激情无套| 这里只有精品在线观看视频| 欧美亚男人的天堂| 天天操天天干天天操| 国产成人涩涩涩视频在线观看| 91亚洲国产高清|