精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「邊思考、邊搜索、邊寫作」WebThinker開啟AI搜索&研究新紀元!

人工智能 新聞
深度研究智能體?WebThinker?賦予 LRM 在推理中自主搜索網絡、導航網頁及撰寫報告的能力。

李曉熙目前就讀于中國人民大學高瓴人工智能學院,博士二年級,導師為竇志成教授,研究方向主要包括檢索增強生成、大語言模型推理等。在國際頂級會議和期刊如 AAAI,SIGIR,TOIS 等發表多篇論文,代表工作包括 Search-o1, WebThinker, RetroLLM, GenIR-Survey, CorpusLM, UniGen 等。共同第一作者還包括人大高瓴博士生金佳杰和董冠廷。本文的通信作者為人大竇志成教授。

大型推理模型(如 OpenAI-o1、DeepSeek-R1)展現了強大的推理能力,但其靜態知識限制了在復雜知識密集型任務及全面報告生成中的表現。為應對此挑戰,深度研究智能體 WebThinker 賦予 LRM 在推理中自主搜索網絡、導航網頁及撰寫報告的能力。WebThinker 集成了深度網頁探索器,使 LRM 能自主搜索、導航并提取信息;自主思考 - 搜索 - 寫作策略無縫融合推理、信息收集與實時報告寫作;并結合強化學習訓練優化工具調用。實驗表明,WebThinker 在 GPQA、GAIA、WebWalkerQA、HLE 等復雜推理基準及 Glaive 研究報告生成任務中展現出強大性能,顯著提升了 LRM 在復雜場景下的適用性與可靠性,為構建更強大、通用的深度研究系統奠定了堅實基礎。

圖片

  • 論文標題: WebThinker: Empowering Large Reasoning Models with Deep Research Capability
  • 論文鏈接: https://arxiv.org/abs/2504.21776
  • 代碼倉庫: https://github.com/RUC-NLPIR/WebThinker

Demo

1. OpenAI 有哪些模型?它們有什么區別?

2. 2025 年我能投稿哪些 AI 頂會?

研究動機:賦予推理模型深度研究能力

大型推理模型如 OpenAI-o1 和 DeepSeek-R1 在數學、編程和科學等領域展現了卓越的推理能力。然而,當面對需要廣泛獲取實時網絡信息的復雜任務時,這些僅依賴內部參數知識的模型往往力不從心。特別是在需要深度網絡信息檢索和生成全面、準確的科學報告時,這一局限性尤為明顯。

WebThinker 應運而生,它是一個深度研究智能體,使 LRMs 能夠在推理過程中自主搜索網絡、導航網頁,并撰寫研究報告。這種技術的目標是革命性的:讓用戶通過簡單的查詢就能在互聯網的海量信息中進行深度搜索、挖掘和整合,從而為知識密集型領域(如金融、科學、工程)的研究人員大幅降低信息收集的時間和成本。

推理中自主調用工具:擺脫傳統預定義 RAG 工作流

現有的開源深度搜索智能體通常采用檢索增強生成(Retrieval-Augmented Generation, RAG)技術,依循預定義的工作流程,這限制了 LRM 探索更深層次網頁信息的能力,也阻礙了 LRM 與搜索引擎之間的緊密交互。

圖片

WebThinker 突破了傳統 RAG 工作流的限制,實現了范式的升級:

1. 傳統 RAG: 僅進行淺層搜索,缺乏思考深度和連貫性

2. 進階 RAG: 使用預定義工作流,包括查詢拆解、多輪 RAG 等,但仍缺乏靈活性

3. WebThinker: 在連續深思考過程中自主調用工具,實現端到端任務執行

WebThinker 使 LRM 能夠在單次生成中自主執行操作,無需遵循預設的工作流程,從而實現真正的端到端任務執行。

WebThinker 框架:自主的深度搜索與報告撰寫

圖片

WebThinker 框架包含兩種主要運行模式:

1. 問題解決模式:賦予 LRM 深度網頁探索器(Deep Web Explorer)功能,當遇到知識缺口時,LRM 可以自主發起網絡搜索,通過點擊鏈接或按鈕導航網頁,并在繼續推理前提取相關信息。

2. 報告生成模式:實現自主思考 - 搜索 - 寫作(Autonomous Think-Search-and-Draft)策略,將推理、信息搜索和報告撰寫無縫整合。LRM 可以使用專門的工具來草擬、檢查和編輯報告部分,確保最終報告全面、連貫且基于收集的證據。

整個過程是端到端的,LRM 可以在思考過程中自主搜索、深度探索網頁和撰寫研究報告,擺脫了傳統預定義工作流的局限。

核心組件:

1. 深度網頁探索:解決復雜推理問題

這一模塊使 LRM 能夠進行網絡搜索和導航,深度收集、遍歷和提取網頁上的高質量信息:

  • 搜索能力:能夠基于當前查詢生成搜索意圖,從搜索引擎獲取初步結果
  • 導航能力:能夠點擊鏈接或按鈕,深入探索初始搜索結果之外的內容
  • 信息提取:基于當前查詢的搜索結果,LRM 可以發起后續搜索并遍歷更深層次的鏈接,直到收集所有相關信息

2. 自主的思考 - 搜索 - 寫作:生成完整的研究報告

該策略將報告撰寫與 LRM 的推理和搜索過程深度整合:不同于在搜索后一次性生成整個報告,WebThinker 使模型能夠實時撰寫和尋求必要知識。具體來說,WebThinker 為 LRM 配備三種專門工具:(1)撰寫特定章節內容;(2)檢查當前報告已寫內容;(3)編輯 / 修改報告。這些工具使 LRM 能夠通過保持全面性、連貫性和對推理過程中新發現信息的適應性來自主增強報告質量

3. 基于強化學習的訓練策略:全面提升 LRM 調用研究工具的能力

為了進一步釋放 LRM 骨干模型的深度研究潛力,WebThinker 開發了基于強化學習的訓練策略:

  • 利用配備工具的 LRM 從復雜任務中采樣大規模推理軌跡
  • 根據推理的準確性、工具使用準確性、以及最終輸出答案或報告的質量,構建在線直接偏好優化(DPO)訓練的偏好對
  • 通過迭代、在線策略訓練,模型逐步提高感知、推理和有效交互研究工具的能力

實驗結果

圖片

實驗結果:真實世界的復雜推理任務

WebThinker 在四個知識密集型復雜推理基準上進行了評估:

1. GPQA:PhD 級別的科學問題回答數據集,覆蓋物理、化學和生物學

2. GAIA:評估 AI 助手在復雜信息檢索任務上的能力

3. WebWalkerQA:專注于深度網絡信息檢索,需要導航和提取信息

4. 人類最終考試(HLE):極具挑戰性的跨學科問題數據集

圖片

圖片

從實驗結果中可以發現:

1. 基礎推理模型和傳統 RAG 的局限:基礎推理模型雖然在某些任務上表現不錯,但在需要實時外部知識的場景中明顯力不從心;傳統 RAG 方法雖有改進,但在復雜任務中提升有限;

2. 自主搜索的優勢:而引入自主搜索能力的模型則帶來了顯著提升。WebThinker 憑借其深度網頁探索器,能夠更全面地獲取和整合網絡信息,在所有基準測試中都取得了明顯優勢。

3. RL 訓練的改進:特別是經過強化學習訓練的 WebThinker-32B-RL 版本,不僅在同等參數量模型中達到了最佳表現,甚至在某些任務上超越了參數量更大的專有模型。

實驗結果:科學研究報告生成

圖片

在 Glaive 科學報告生成任務的評估中:

1. 生成報告的質量:從完整性、徹底性、事實性和連貫性四個維度評估,WebThinker 生成的研究報告均獲得高分,整體表現優于傳統 RAG 方法和其他先進的深度研究系統;

2. 生成報告的信息邊界:特別在報告的完整性和徹底性方面表現尤為突出,通過 t-SNE 可視化分析可見,WebThinker 生成的報告內容覆蓋更廣,視角更多元,能夠從多個維度深入探索和綜合信息,為用戶提供更全面、更深入的調研。

實驗結果:適配 DeepSeek-R1 系列模型

圖片

通過在不同規模的 DeepSeek-R1 模型上進行實驗(7B, 14B, 32B),驗證了 WebThinker 框架的適應性。在不同模型規模下,都能顯著提升各類任務的性能,遠超直接推理和標準 RAG 方法,展現了該框架在增強 LRM 深度研究能力方面的通用性和有效性。

實驗結果:消融實驗

圖片

消融實驗評估了 WebThinker 各關鍵組件的貢獻。結果顯示,深度網頁探索器以及自主 「思考 - 搜索 - 寫作」 策略中的報告生成組件(尤其是自主報告起草)是確保高性能問題解決和高質量報告生成的基石,其缺失會導致性能顯著下降。強化學習訓練則主要增強了問題解決能力,對報告生成的影響相對有限。

總結與未來展望

WebThinker 框架成功地賦予了大型推理模型深度研究能力,解決了它們在知識密集型真實世界任務中的局限性。通過深度網頁探索器和自主思考 - 搜索 - 寫作策略,WebThinker 使 LRM 能夠自主探索網絡并通過連續推理過程生成全面輸出。

未來,為持續提升深度研究模型的能力,仍有很多方向值得探索:

1. 多模態深度搜索:WebThinker 基于文本推理模型,難以處理圖像等其他模態的信息。未來可以擴展到圖像、視頻等多模態內容的深度研究,來利用網頁中的多模態信息。

2. 工具學習與擴展:當前支持有限的研究工具,未來可以通過工具學習來不斷優化工具使用策略,并擴展更多工具,來支持更復雜的任務。

3. GUI 網頁探索:通過 GUI 網頁探索能力,讓模型能夠更好地理解和操作網頁界面,實現更復雜的交互任務,如訂機票、指定旅游路線圖、等等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-27 23:41:35

豆包搜索AI

2018-12-13 12:03:59

閃存

2025-02-19 08:00:00

SpringBootOllamaDeepSeek

2023-05-11 07:45:28

谷歌人工智能

2012-09-05 09:35:38

云計算微軟IT平臺

2015-08-26 13:37:51

戴爾云計算

2014-11-07 17:29:04

2012-12-04 15:47:45

2019-08-15 09:00:00

AI人工智能

2023-11-29 18:56:43

圖像搜索FAISS

2024-10-23 15:40:00

2020-12-09 15:02:10

IBM

2019-06-10 15:58:30

數據分析流量采集

2025-03-27 17:26:39

Testin云測
點贊
收藏

51CTO技術棧公眾號

狠狠综合久久av一区二区小说 | 天堂在线资源8| 亚洲国产99| 在线视频免费一区二区| 亚洲三级在线视频| 美女100%一区| 亚洲午夜精品在线| 午夜视频久久久| 亚洲国产精品国自产拍久久| 久久精品男女| 欧美肥婆姓交大片| 国产成人免费观看网站| www.国产精品一区| 欧美视频一区在线| 黄色www网站| caoporn免费在线| 久久久精品黄色| 粉嫩精品一区二区三区在线观看 | 狠狠色狠狠色合久久伊人| 88国产精品欧美一区二区三区| 三级黄色录像视频| 免费av一区| 精品国产1区2区3区| 不卡中文字幕在线观看| 日本欧美日韩| 精品久久久久久中文字幕大豆网| www.-级毛片线天内射视视| 九色蝌蚪在线| 99久久er热在这里只有精品66| 91麻豆桃色免费看| 中文字幕一级片| 久久久久久久高潮| 欧美性资源免费| 99视频在线看| 一区二区亚洲| 欧美日韩xxxxx| 日韩三级久久久| 青青草综合网| 尤物九九久久国产精品的分类| 中文字幕乱码一区| 亚洲网一区二区三区| 欧美日本不卡视频| jizz欧美性11| 国产极品一区| 欧美无人高清视频在线观看| 999香蕉视频| 另类专区亚洲| 在线观看日韩电影| 美女一区二区三区视频| 亚洲电影有码| 欧美日韩久久一区二区| 日韩一区二区三区不卡视频| 色8久久影院午夜场| 色诱亚洲精品久久久久久| 日本a级片免费观看| 自拍视频在线看| 色综合色综合色综合色综合色综合 | 18+视频在线观看| 亚洲人成7777| 国产a级黄色大片| xxxx在线视频| 色哟哟一区二区| 五月婷婷丁香色| 9999精品| 亚洲成人久久久| 99久久久久久久久久| 欧美美乳视频| 色哟哟入口国产精品| 三级黄色录像视频| 国产精品国码视频| 7m精品福利视频导航| 国产又粗又猛又黄视频| 精一区二区三区| 99re热精品| 四虎精品成人影院观看地址| 久久综合给合久久狠狠狠97色69| 日韩精品一线二线三线| 久久亚洲天堂| 欧美日韩国产中文精品字幕自在自线| 阿v天堂2017| 日韩精品三区| 日韩一区二区免费在线观看| 男女一区二区三区| 日本在线电影一区二区三区| 欧美高清视频免费观看| 亚洲天堂一区在线| 久久国内精品视频| 国产伦视频一区二区三区| 国产最新视频在线观看| 亚洲精品久久嫩草网站秘色| 夫妻免费无码v看片| 国语自产精品视频在线看抢先版结局| 日韩美女视频一区二区在线观看| 中文字字幕码一二三区| 香蕉国产精品| 8x拔播拔播x8国产精品| 99久久精品日本一区二区免费| 91亚洲精品一区二区乱码| 一区二区三区天堂av| 国产又色又爽又高潮免费| 国产精品vip| 国产成人在线一区| 性生交生活影碟片| 欧美国产精品一区二区三区| 成人性免费视频| 91成人在线网站| 国产丝袜精品视频| 国产精品三区在线观看| 日韩国产欧美三级| 国产区欧美区日韩区| 欧美成人三区| 精品毛片网大全| 人妻体体内射精一区二区| 国产区精品区| 午夜精品一区二区三区视频免费看| 中文字幕日韩三级| 久久久久久日产精品| 91黄色在线看| 136国产福利精品导航网址应用| 一区二区在线免费视频| 中文字幕黄色片| 成人91在线观看| 欧洲精品视频在线| 亚洲欧美在线人成swag| 国产亚洲欧洲在线| 欧美精品一二三四区| 成人av电影在线观看| 人人妻人人澡人人爽欧美一区 | 国产在线不卡精品| 高清在线观看av| 91国偷自产一区二区三区观看| 免费日本黄色网址| 亚洲国产二区| 国产精品一国产精品最新章节| 中文在线免费| 欧美一区二区在线观看| 熟女少妇a性色生活片毛片| 日韩精品欧美精品| 亚洲 日韩 国产第一区| 欧美人体一区二区三区| 国产亚洲成av人片在线观看桃| 国产午夜在线播放| 久久综合久久综合久久| 日韩人妻精品无码一区二区三区| 日韩精品a在线观看91| 97香蕉超级碰碰久久免费软件| 国产女人18毛片18精品| 亚洲欧美日本在线| 免费欧美一级片| 精品动漫3d一区二区三区免费版| 国产精品一区二区三区观看| 久久大胆人体| 亚洲精美色品网站| 毛片在线免费视频| 26uuu欧美日本| 成人免费毛片播放| 日韩欧美一区免费| 成人在线观看视频网站| 色屁屁www国产馆在线观看| 欧美mv和日韩mv国产网站| 久久夜靖品2区| 久久理论电影网| 久久婷婷综合色| 亚洲欧美偷拍自拍| 国语精品中文字幕| 97久久香蕉国产线看观看| 伊人久久久久久久久久久久久| 一卡二卡三卡在线| 亚洲精品va在线观看| 亚洲国产果冻传媒av在线观看| 欧美专区在线| 亚洲天堂av免费在线观看| 911亚洲精品| 日韩男女性生活视频| 日本中文字幕在线视频| 日韩免费在线观看| 国产精品久久久久久久久夜色| 国产精品久久久爽爽爽麻豆色哟哟| 日韩欧美色视频| 国产深夜精品| 综合视频免费看| 精品网站aaa| 国产精品日日做人人爱| 牛牛精品视频在线| 亚洲丝袜在线视频| 成人高潮片免费视频| 欧美性猛交xxxx乱大交3| 永久av免费网站| 97久久精品人人做人人爽50路| 国产91色在线观看| 影音国产精品| 一区二区91美女张开腿让人桶| 国产ts一区| 国产精品一区二区电影| 国模精品视频| 蜜臀久久99精品久久久无需会员| 涩爱av在线播放一区二区| 欧美一区二区高清| 国产日韩久久久| 亚洲国产日韩综合久久精品| 少妇的滋味中文字幕bd| www.欧美.com| a级大片免费看| 日本不卡视频在线| 自拍日韩亚洲一区在线| 91精品一区二区三区综合在线爱| 日韩高清dvd| 另类ts人妖一区二区三区| 成人av在线亚洲| 写真福利精品福利在线观看| 97视频网站入口| 91精选在线| www.亚洲免费视频| 巨骚激情综合| 日韩黄在线观看| 秋霞视频一区二区| 日韩一区二区精品| 92久久精品一区二区| 欧美自拍偷拍一区| 日韩久久中文字幕| 亚洲不卡一区二区三区| 欧美日韩免费一区二区| 亚洲欧美在线视频| 蜜桃av免费观看| 中文字幕欧美三区| 久久婷婷五月综合| 久久久www成人免费无遮挡大片| 久久久久亚洲av无码专区首jn| 久久se这里有精品| 亚洲欧美自偷自拍另类| 日韩在线一二三区| 五月婷婷狠狠操| 久久免费黄色| 国产性生交xxxxx免费| 日韩中文字幕1| 91视频免费版污| 欧美aaa在线| 91蝌蚪视频在线观看| 日韩黄色小视频| 91香蕉视频污版| 青青草国产成人av片免费| 欧美成年人视频在线观看| 免费在线观看一区二区三区| 亚洲36d大奶网| 九九**精品视频免费播放| av在线免费看片| 国产一区不卡视频| 肉丝美足丝袜一区二区三区四| 国产成人免费视频网站高清观看视频 | 亚洲欧美韩国| 国产精品jizz在线观看麻豆| 日韩中文影院| 91精品久久久久久久久久久久久| 亚洲精品tv| 成人h视频在线观看| 久久婷婷国产| 欧美日韩在线精品一区二区三区| 国产aⅴ精品一区二区三区久久| 日韩欧美三级一区二区| 99久久亚洲精品| 999久久欧美人妻一区二区| 精品91在线| 免费黄色特级片| 精品一区二区三区在线观看国产| 四川一级毛毛片| 97精品久久久午夜一区二区三区| 亚洲熟妇无码av| 国产精品无遮挡| 国产女人18水真多毛片18精品| 亚洲韩国一区二区三区| 欧美精品一二三四区| 欧美日本一区二区三区| 成人乱码一区二区三区| 亚洲欧美中文另类| www视频在线免费观看| 国产91精品久| www一区二区三区| 国产麻豆乱码精品一区二区三区| 国产欧美一区二区三区精品观看| 大桥未久一区二区三区| 一区二区三区导航| 污污的视频免费| av亚洲精华国产精华精华| 69xxx免费| 黄网动漫久久久| 91久久精品无码一区二区| 亚洲第一区第一页| 黄色网址在线免费播放| 欧美一区二区三区四区在线| 91精品国产一区二区在线观看| 六月婷婷久久| 欧美午夜视频| 三级在线视频观看| www.亚洲激情.com| 久久精品日韩无码| 日本韩国欧美国产| 蜜桃视频久久一区免费观看入口| 中文字幕免费精品一区| av电影在线地址| 91亚洲va在线va天堂va国| 天天躁日日躁狠狠躁欧美| 51xx午夜影福利| 日韩av中文在线观看| 四虎精品一区二区| 亚洲免费三区一区二区| 高潮无码精品色欲av午夜福利 | 黄色在线小视频| 欧美精品九九久久| 视频91a欧美| 香蕉久久夜色| 嫩草成人www欧美| 成人区人妻精品一区二| 亚洲人成电影网站色mp4| 最新中文字幕第一页| 亚洲欧美国内爽妇网| 草莓视频丝瓜在线观看丝瓜18| 91久久久久久| 视频在线不卡免费观看| 成人一区二区三| 久久久噜噜噜久久中文字幕色伊伊| 中文字幕第28页| 日韩欧美综合一区| 国产黄色在线免费观看| 成人写真视频福利网| 久久亚洲成人| 在线免费视频一区| 国产无遮挡一区二区三区毛片日本| 国产欧美日韩另类| 亚洲国产欧美一区二区丝袜黑人| 最新国产在线拍揄自揄视频| 成人午夜在线观看| 亚洲电影在线一区二区三区| 手机免费av片| 亚洲视频一区二区在线| 国产精品区在线观看| www.久久撸.com| 99视频有精品高清视频| 老汉色影院首页| 国产成人小视频| 久久久久99精品| 亚洲精品mp4| 在线看片国产福利你懂的| 久久久综合香蕉尹人综合网| 亚洲欧美激情诱惑| 亚洲最大成人网站| 欧美中文字幕久久| 亚洲图片88| 成人免费网站在线| 亚洲欧美一区在线| 日韩精品人妻中文字幕有码| 黑人巨大精品欧美一区二区三区| 日本一二三区在线视频| 国产精品欧美日韩| 91精品观看| 国产精品99久久久精品无码| 婷婷开心激情综合| 全色精品综合影院| 国产玖玖精品视频| 欧美日韩免费| 亚洲av无码一区二区三区观看| 日本福利一区二区| 久久久久久久久免费视频| 国产精品国产一区二区| 国产一区二区你懂的| 国产又黄又粗视频| 91精品国产综合久久精品| 黄色在线看片| 日韩欧美99| 国产高清精品在线| 国产在线观看黄色| 北条麻妃一区二区三区中文字幕 | 蜜桃999成人看片在线观看| 日韩成人免费在线| 外国一级黄色片| 日韩精品视频观看| 狂野欧美性猛交xxxx| 国产自产在线视频| 欧美高清在线精品一区| 亚洲国产日韩在线观看| 日本一本a高清免费不卡| 亚洲国产精品久久久天堂| 在线观看国产三级| 欧美美女bb生活片| 理论不卡电影大全神| 一区二区三区四区五区精品| 成人性生交大片| 国产精品第六页| 国产69精品久久久久99| 日韩一区三区| 野花社区视频在线观看| 欧美一区二区免费观在线| 性欧美超级视频| 日韩国产一级片| 中文字幕日韩欧美一区二区三区| 午夜影院在线视频| 91啪国产在线| 日本成人中文字幕| 中文字幕亚洲精品一区| 欧美成人免费小视频| 青青草综合网|