精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepReaserch智能體突破:阿里WebDancer原生Agentic Model讓AI自己「上網(wǎng)找答案」

人工智能
WebDancer的出現(xiàn),不僅為解決復雜的多步信息檢索問題提供了一種新的方法,也為自主智能體的研究和發(fā)展提供了重要的啟示。通過數(shù)據(jù)驅(qū)動和分階段訓練的方法,WebDancer成功地構(gòu)建了一個能夠自主進行多步信息檢索的智能體,為未來智能體的發(fā)展提供了新的思路和方向。

一、背景

在現(xiàn)實生活中,我們常常需要解決各種復雜的多步推理問題,這些問題往往需要從多個網(wǎng)頁中獲取信息,并進行綜合分析和推理才能得出答案。例如,當我們想要了解某個歷史事件的詳細經(jīng)過時,可能需要查閱多個不同來源的網(wǎng)頁,對比和分析其中的信息,才能還原事件的全貌。這種復雜的信息檢索任務(wù),對于傳統(tǒng)的搜索引擎來說是非常困難的,因為它們通常只能提供單步的搜索結(jié)果,而無法像人類一樣進行多步的推理和決策。

近年來,隨著大型語言模型(LLMs)和大型推理模型(LRMs)的發(fā)展,人們開始嘗試將這些模型應(yīng)用于信息檢索任務(wù)中。然而,這些模型在處理復雜的多步推理任務(wù)時,仍然存在一些局限性。例如,直接利用提示工程技術(shù)來引導這些模型執(zhí)行復雜任務(wù),往往無法充分利用模型的推理能力;而將搜索或瀏覽能力整合到智能體中,雖然可以通過監(jiān)督微調(diào)(SFT)或強化學習(RL)來訓練,但現(xiàn)有的訓練數(shù)據(jù)集相對簡單,無法涵蓋現(xiàn)實世界中的復雜挑戰(zhàn)。

為了解決這些問題,WebDancer應(yīng)運而生。它基于ReAct框架,通過一種數(shù)據(jù)驅(qū)動和分階段訓練的方法,構(gòu)建了一個能夠自主進行多步信息檢索的智能體。WebDancer的出現(xiàn),標志著我們在自主智能體領(lǐng)域,訓練類DeepResearch的模型邁出了重要的一步。

二、WebDancer的核心技術(shù)

WebDancer的核心創(chuàng)新體現(xiàn)在三個層面:

  1. 數(shù)據(jù)合成的層次化設(shè)計:通過兩種方法來合成數(shù)據(jù)集實現(xiàn)了兼顧“廣度覆蓋”與“深度升級”的數(shù)據(jù)集體系,解決了傳統(tǒng)數(shù)據(jù)集規(guī)模小、場景單一的問題。實驗表明,混合使用兩類數(shù)據(jù)集可使模型在GAIA基準的Pass@1指標顯著提升。
  2. 長短推理鏈的協(xié)同訓練:提出將LLM生成的短推理鏈與LRM生成的長推理鏈結(jié)合,通過拒絕采樣機制融合不同粒度的推理模式。消融實驗顯示,長推理鏈對復雜問題(GAIA Level 3)的解決率有顯著貢獻,驗證了多尺度推理的必要性。
  3. 動態(tài)采樣的強化學習策略:DAPO算法通過過濾準確率極端的樣本(0或1),聚焦難樣本的迭代優(yōu)化,使RL階段的數(shù)據(jù)利用效率顯著提升。

具體來說,WebDancer的構(gòu)建過程可以分為四個關(guān)鍵階段:瀏覽數(shù)據(jù)構(gòu)建、軌跡采樣、監(jiān)督微調(diào)以及強化學習。

(一)瀏覽數(shù)據(jù)構(gòu)建

為了訓練WebDancer,首先需要構(gòu)建高質(zhì)量的瀏覽數(shù)據(jù)。這些數(shù)據(jù)需要反映多樣化的用戶意圖和豐富的交互上下文。WebDancer采用了兩種方法來合成數(shù)據(jù)集:CRAWLQA和E2HQA。

CRAWLQA通過爬取網(wǎng)頁來構(gòu)建基于網(wǎng)頁信息的問答對。它從一些富含知識的網(wǎng)站(如arxiv、github、wiki等)的source頁面開始,模擬人類的瀏覽行為,遞歸地導航到子頁面,并收集頁面上的信息。然后,利用GPT-4o等大型語言模型,根據(jù)收集到的信息生成合成的問答對。這些問答對涵蓋了多種類型的問題,如計數(shù)問題、多跳問題和交集問題等,能夠有效地激發(fā)模型的多步推理能力。

圖片圖片


E2HQA則采用了一種從簡單到復雜的問答對合成方法。它從簡單的問答對開始,通過逐步增加問題的復雜性,將簡單的問題轉(zhuǎn)化為復雜的多步問題。具體來說,它首先從簡單的問題中選擇一個實體,然后利用搜索引擎獲取與該實體相關(guān)的信息,并根據(jù)這些信息重新構(gòu)造問題。通過這種方式,可以逐步將一個簡單的問題轉(zhuǎn)化為一個需要多步推理才能解決的復雜問題。

(二)軌跡采樣

在構(gòu)建了高質(zhì)量的問答對之后,WebDancer需要采樣出高質(zhì)量的軌跡來指導智能體的學習過程。軌跡采樣采用了拒絕采樣方法,結(jié)合了短鏈思考(Short-CoT)和長鏈思考(Long-CoT)兩種策略。

短鏈思考軌跡是通過直接利用ReAct框架,使用強大的模型(如GPT-4o)來收集的。而長鏈思考軌跡則是通過逐步提供歷史動作和觀察結(jié)果給推理模型(如QwQ-Plus),讓模型自主決定下一步的動作。在采樣過程中,會進行多次拒絕采樣,以確保生成的軌跡的質(zhì)量和連貫性。

(三)監(jiān)督微調(diào)

監(jiān)督微調(diào)階段的目的是讓模型適應(yīng)智能體任務(wù)的格式和環(huán)境。在這個階段,WebDancer利用前面采樣得到的高質(zhì)量軌跡,對模型進行微調(diào)。通過這種方式,模型能夠?qū)W習到如何在智能體任務(wù)中交替進行推理和行動,從而更好地完成多步信息檢索任務(wù)。

(四)強化學習

強化學習階段的目標是將智能體能力內(nèi)化到推理模型中,增強模型在多步、多工具使用場景下的能力。WebDancer采用了Decoupled Clip and Dynamic Sampling Policy Optimization(DAPO)算法來進行強化學習。DAPO算法通過動態(tài)采樣機制,有效地利用了在監(jiān)督微調(diào)階段未充分利用的問答對,提高了數(shù)據(jù)效率和策略的魯棒性。

圖片圖片


三、WebDancer的實驗結(jié)果

WebDancer在兩個具有挑戰(zhàn)性的信息檢索基準測試——GAIA和WebWalkerQA上進行了實驗評估。實驗結(jié)果表明,WebDancer在這些基準測試中取得了顯著的性能提升,證明了其訓練范式的有效性。 我們表現(xiàn)最佳的模型在GAIA基準測試中達到了61.1%的Pass@3分數(shù),在WebWalkerQA基準測試中達到了54.6%的Pass@3分數(shù)。

圖片圖片

四、未來展望:WebDancer 的新征程

盡管 WebDancer 已經(jīng)取得了令人矚目的成就,但它的發(fā)展之路還遠未結(jié)束。未來,WebDancer 將在多個方向上繼續(xù)探索和創(chuàng)新。

(一)更多工具的集成

目前,WebDancer 僅集成了兩種基本的信息檢索工具,未來計劃引入更多復雜的工具,如瀏覽器建模和 Python 沙盒環(huán)境。這些工具將使智能體能夠執(zhí)行更復雜的任務(wù),如網(wǎng)頁瀏覽、數(shù)據(jù)抓取、API 調(diào)用等,從而拓展智能體的能力邊界,使其能夠應(yīng)對更廣泛的挑戰(zhàn)。

(二)任務(wù)泛化與基準擴展

目前的實驗主要集中在短答案信息檢索任務(wù)上,未來 WebDancer 將擴展到開放域的長文本寫作任務(wù)。這將對智能體的推理能力和生成能力提出更高的要求,需要設(shè)計更可靠和更有效的獎勵信號。同時,WebDancer 也將參與更多基準測試,以驗證其在不同任務(wù)類型和領(lǐng)域中的泛化能力。

五、討論:Post-train Agentic Models

相比于一些驅(qū)動于強大的具有很強的agentic能力的閉源模型,例如gpt-o4,claude的promtpting工程框架,本研究的側(cè)重點在從頭訓練一個具有強大agent能力的模型,這對于實現(xiàn)agent model的開源以及推進我們對agent在開放系統(tǒng)中如何產(chǎn)生和scale的基本理解至關(guān)重要。我們使用的的原生ReAct框架秉持著簡潔性,體現(xiàn)了大道至簡的原則。 Agentic models是指那些在交互式環(huán)境中,天生支持推理、決策以及多步驟工具使用的foundation models。這些模型僅通過任務(wù)描述的提示,就能展現(xiàn)出諸如規(guī)劃、自我反思以及行動執(zhí)行等突發(fā)性能力(emergent capabilities)。 近期的 DeepSearch 和 Deep Research 等系統(tǒng),展示了強大的底層模型如何作為智能體的核心,通過其對工具調(diào)用和迭代推理的天然支持,實現(xiàn)自主的網(wǎng)絡(luò)交互。然而,由于網(wǎng)絡(luò)環(huán)境本質(zhì)上是動態(tài)的且部分可觀察的,強化學習在提升智能體的適應(yīng)性和魯棒性方面發(fā)揮了關(guān)鍵作用。在本研究中,我們的目標是通過有針對性的后訓練(post-training),在開源模型中激發(fā)自主智能體的能力。

六、WebDancer的意義與展望

WebDancer的出現(xiàn),不僅為解決復雜的多步信息檢索問題提供了一種新的方法,也為自主智能體的研究和發(fā)展提供了重要的啟示。通過數(shù)據(jù)驅(qū)動和分階段訓練的方法,WebDancer成功地構(gòu)建了一個能夠自主進行多步信息檢索的智能體,為未來智能體的發(fā)展提供了新的思路和方向。

WebDancer與Deep Research在目標上具有一致性,如果通過更系統(tǒng)化的方法來構(gòu)建和訓練智能體,使其能夠更好地適應(yīng)復雜的網(wǎng)絡(luò)環(huán)境仍是一個開放并且具有挑戰(zhàn)的課題。

總之,WebDancer的出現(xiàn)為我們解決復雜的網(wǎng)絡(luò)信息檢索問題提供了一種新的可能性。隨著技術(shù)的不斷發(fā)展和完善,我們有理由相信,未來的自主智能體將在更多的領(lǐng)域發(fā)揮重要作用,為我們的生活和工作帶來更多的便利和創(chuàng)新。

參考資料

  • 《WebDancer: Towards Autonomous Information Seeking Agency》,Jialong Wu, Baixuan Li, Runnan Fang, Wenbiao Yin, Liwen Zhang, Zhengwei Tao, Dingchu Zhang, Zekun Xi, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou,阿里巴巴通義實驗室,https://arxiv.org/pdf/2505.22648
  • 《ReAct: Synergizing Reasoning and Acting in Language Models》,Shunyu Yao等,普林斯頓大學,https://arxiv.org/abs/2210.03629
  • 《GAIA: A Benchmark for General AI Assistants》,Grégoire Mialon等,Meta AI,https://arxiv.org/abs/2311.12983
責任編輯:武曉燕 來源: 旺知識
相關(guān)推薦

2025-09-24 09:10:24

2025-11-04 02:22:00

AgenticAI多智能

2025-05-30 15:53:27

智能體模型AI

2024-12-25 09:06:44

2025-08-06 01:00:00

2023-02-26 00:19:58

AI插件功能

2025-05-30 06:48:53

2022-06-21 14:08:25

AIGitHub模仿人類

2024-01-22 12:31:18

模型訓練

2025-10-15 02:00:00

2025-11-06 01:20:00

2025-08-08 02:15:00

2025-05-15 09:08:00

2025-01-23 13:05:42

2009-01-20 10:50:00

2025-06-11 13:44:44

自動化模型智能體

2025-10-09 11:36:57

2025-11-06 14:09:12

AI人工智能開源

2024-11-26 00:14:08

點贊
收藏

51CTO技術(shù)棧公眾號

91情侣在线视频| 在线观看成人黄色| 欧美成人三级在线视频| 内衣办公室在线| 免费观看成人鲁鲁鲁鲁鲁视频| 日韩中文字幕网址| 日本一区二区在线观看视频| av有声小说一区二区三区| 亚洲视频综合在线| 国产成人精品综合| 久久久久黄色片| 一区二区美女| 日韩一区二区视频在线观看| 青青草原成人网| 在线看一级片| 国产日产欧美一区| 国产精品久久久久免费| 中文字幕男人天堂| 国产精品美女久久久浪潮软件| 中文字幕亚洲一区二区三区五十路| 性活交片大全免费看| 国产三级一区| 色哟哟国产精品| 欧美又粗又长又爽做受| av片在线看| 91色视频在线| 国产精品xxxx| 国产精品主播一区二区| 视频一区在线播放| 97成人精品视频在线观看| 在线免费观看亚洲视频| 欧美日韩一二三四| 亚洲精品视频中文字幕| www.555国产精品免费| 高清不卡一区| 欧美日本在线看| 欧美精品成人网| xx欧美视频| 亚洲成av人片一区二区梦乃| 日本一区二区免费高清视频| shkd中文字幕久久在线观看| 久久蜜桃av一区二区天堂| 好吊色欧美一区二区三区| 99精品在线看| 国产麻豆视频一区| 成人激情春色网| 在线黄色av网站| 男女男精品视频| 国产精品视频中文字幕91| 亚洲精品中文字幕乱码三区91| 99成人在线| 午夜精品一区二区三区在线视| 久久精品www人人爽人人| 这里只有精品在线| 欧美另类在线播放| 久久久久久久久久综合 | 日韩三级电影| 国产综合在线观看| 中文乱码免费一区二区| 日韩精品一区二区三区外面| 成a人片在线观看www视频| 欧美经典一区二区三区| 亚洲草草视频| 久久77777| 一级特黄大欧美久久久| 欧美日韩dvd| 波多野结衣中文在线| 性做久久久久久| 国产成人久久婷婷精品流白浆| 你懂得影院夜精品a| 欧美日韩在线精品一区二区三区激情 | 亚洲一区二区三区久久| 精品人妻无码一区二区| 成人av电影在线观看| 精品中文字幕一区| 国产在线免费观看| 亚洲欧美综合另类在线卡通| 国产情侣第一页| 欧美日韩国产观看视频| 日本韩国一区二区| 热久久久久久久久| jizzjizzjizz欧美| 亚洲精品国产欧美| www.日本高清视频| 欧美成人嫩草网站| 热re99久久精品国产66热| 中文字幕 视频一区| 国产麻豆一精品一av一免费| 精品一区二区国产| 免费在线看a| 性感美女极品91精品| 国产又黄又猛视频| 日韩成人在线看| 亚洲老板91色精品久久| av最新在线观看| 99精品免费网| 成人久久一区二区三区| 性xxxx视频播放免费| 中文字幕在线不卡| 久久久久久久久久久99| 成人免费91| 亚洲毛茸茸少妇高潮呻吟| 少妇被躁爽到高潮无码文| 免费在线成人| av资源一区二区| 最近高清中文在线字幕在线观看| 亚洲一二三级电影| 狠狠干狠狠操视频| 一区二区三区视频免费观看| 久久成人人人人精品欧| 波多野结衣家庭主妇| 福利91精品一区二区三区| 婷婷久久青草热一区二区| 999精品网| 91精品欧美久久久久久动漫| 亚洲区免费视频| 极品av少妇一区二区| 国产精品中文字幕在线观看| 日夜干在线视频| 亚洲一区二区美女| 91亚洲精品久久久蜜桃借种| 夜色77av精品影院| 性欧美视频videos6一9| av男人天堂av| 中文字幕一区二区三区色视频| 色综合久久久久无码专区| 精品视频一区二区三区在线观看 | 国产调教视频在线观看| 欧美综合天天夜夜久久| 最新在线黄色网址| 国自产拍偷拍福利精品免费一| 91在线精品播放| 美女羞羞视频在线观看| 精品婷婷伊人一区三区三| 亚洲综合色一区| 亚洲一区自拍| 精品久久精品久久| 6699嫩草久久久精品影院| 精品免费视频.| 九九九免费视频| 国产成人自拍网| 日本丰满大乳奶| 在线欧美激情| 久久精品国产亚洲7777| 一级黄色大毛片| 国产精品蜜臀av| www.亚洲高清| 香蕉精品视频在线观看| 成人精品久久久| a级毛片免费观看在线| 91精品国产福利| 在线观看成人毛片| 国产成人综合精品三级| 亚洲理论电影在线观看| 2021年精品国产福利在线| 欧美精品电影在线| 天堂中文在线资源| 欧美日韩国产一中文字不卡| 黄色正能量网站| 青青草成人在线观看| 一区二区在线不卡| 亚洲精品高潮| 国产69精品久久久久99| 三级视频网站在线| 精品视频在线看| 亚洲综合网在线| 成人av网站在线观看免费| 18禁男女爽爽爽午夜网站免费 | 懂色一区二区三区免费观看| 日韩a级在线观看| 蜜桃一区二区三区| 91精品免费看| 国内老司机av在线| 亚洲色图av在线| 国产精品一区二区黑人巨大 | 中文文精品字幕一区二区| 欧洲美女亚洲激情| av成人国产| 亚洲在线播放电影| 国产一区在线电影| 国产精品久久久久久久午夜 | 欧美怡春院一区二区三区| 精品乱码一区二区三四区视频| 欧美日韩日日夜夜| 精品一区二区三区四| 国产婷婷色一区二区三区在线| 亚洲18在线看污www麻豆| 好看的日韩av电影| 天堂av一区二区| 香蕉大人久久国产成人av| 欧美主播福利视频| а√天堂在线官网| 日韩精品在线观| 国产免费一区二区三区免费视频| 性做久久久久久久久| 久久一级免费视频| 91老司机福利 在线| 国产人妻精品久久久久野外| 国产精品免费看| 特级西西人体www高清大胆| 深爱激情久久| 懂色av一区二区三区在线播放| 日本成人片在线| 欧美—级高清免费播放| av二区在线| 日韩大陆欧美高清视频区| 国产一区二区自拍视频| 懂色av一区二区三区| 欧美色图一区二区| 国产精品天美传媒| 人妻精品久久久久中文字幕| 国产成人在线网站| 国产精品嫩草影院8vv8| 久久九九国产| 国产精品又粗又长| 欧美日韩p片| 亚洲在线观看一区| 欧洲毛片在线视频免费观看| 国产v亚洲v天堂无码| 一级欧美视频| 国产精品偷伦视频免费观看国产| 欧洲一区精品| 高清在线视频日韩欧美| 女人黄色免费在线观看| 色哟哟入口国产精品| 国产一区二区三区福利| 国产午夜精品久久久| 免费的黄色av| 精品国产一区二区国模嫣然| 国产av无码专区亚洲a∨毛片| 欧美在线观看一区二区| 黄色一级视频免费看| 欧美色视频日本高清在线观看| 久久久久久久国产精品毛片| 一区二区三区四区视频精品免费| 欧美福利在线视频| 国产精品剧情在线亚洲| 国精产品视频一二二区| 中国av一区二区三区| 欧美丰满美乳xxⅹ高潮www| 久久欧美一区二区| 91中文字幕永久在线| 国产无人区一区二区三区| 欧美激情aaa| 国产女主播一区| 国产91丝袜美女在线播放| 国产欧美久久久精品影院| 精品国产成人亚洲午夜福利| 国产欧美一区二区精品性色超碰| 久久久久久久久久久久| 国产日产欧美精品一区二区三区| 六月婷婷七月丁香| 久久精品在线免费观看| 快灬快灬一下爽蜜桃在线观看| 国产亚洲一区二区三区四区| 调教驯服丰满美艳麻麻在线视频| 国产亚洲欧美激情| 女人裸体性做爰全过| 中文字幕中文字幕在线一区| 欧美黑吊大战白妞| 婷婷中文字幕综合| 国产性生活视频| 欧美日韩精品综合在线| 国产男女猛烈无遮挡| 精品国产sm最大网站免费看| 熟妇高潮一区二区高潮| 亚洲天堂色网站| 在线观看h片| 超薄丝袜一区二区| 漫画在线观看av| 国产精品爽爽ⅴa在线观看| 精品国产三级| 国产亚洲欧美另类一区二区三区| 亚洲激情77| 影音先锋欧美在线| 亚洲成人直播| 久久久国产欧美| 国产伦精品一区二区三区免费 | 欧美码中文字幕在线| 国产精品夜夜夜爽张柏芝| 激情综合中文娱乐网| 香蕉视频网站入口| 国产成人av电影| 少妇无套高潮一二三区| 亚洲你懂的在线视频| 在线观看免费av片| 欧美高清视频一二三区| 人妻无码中文字幕| 自拍偷拍亚洲在线| 爱看av在线入口| 国产精品视频99| 国产精品极品在线观看| 亚洲人成77777| 在线成人黄色| 最新天堂在线视频| 91网上在线视频| tube国产麻豆| 欧美亚一区二区| 日本免费网站在线观看| 日韩在线视频中文字幕| 色偷偷色偷偷色偷偷在线视频| 国产色婷婷国产综合在线理论片a| 欧美三级午夜理伦三级小说| a级黄色片网站| 水野朝阳av一区二区三区| 美女又黄又免费的视频| 国产精品视频一二三| 国产成人无码精品亚洲| 制服丝袜亚洲网站| 精品99又大又爽又硬少妇毛片| 欧美激情免费观看| 不卡的国产精品| 日韩性感在线| 亚洲少妇在线| 成人做爰69片免费| 1000部国产精品成人观看| 69国产精品视频免费观看| 精品av久久707| 超碰在线caoporn| 国产一区二区在线免费视频| 国产欧美日韩一区二区三区四区| 加勒比成人在线| 粉嫩av一区二区三区在线播放| 老熟妇高潮一区二区三区| 在线看不卡av| 黄色在线网站| 日韩av高清不卡| 亚洲理论电影| 男人操女人逼免费视频| 丁香婷婷综合激情五月色| 天天干中文字幕| 91精品久久久久久久久99蜜臂| eeuss影院www在线播放| 国产精品国产三级国产aⅴ9色| 神马午夜久久| 欧美 日韩 国产 高清| 99精品在线免费| 日韩乱码一区二区| 亚洲黄色www网站| 九色porny丨国产首页在线| 国产视频一区二区三区四区| 91久久亚洲| 人妻丰满熟妇aⅴ无码| 午夜精品久久久久久久99樱桃| 好吊视频一二三区| 性色av一区二区三区红粉影视| 久久资源综合| 国产a视频免费观看| 国产亚洲一二三区| 亚洲视屏在线观看| 日韩在线观看成人| 久久9999免费视频| a天堂资源在线观看| 不卡电影一区二区三区| 国产区在线观看视频| 日韩电影在线观看中文字幕| 中文字幕乱码中文乱码51精品| 欧美另类视频在线| 美腿丝袜在线亚洲一区| 91n在线视频| 欧美成人精精品一区二区频| sm在线观看| 欧美在线视频二区| 麻豆国产精品777777在线| 麻豆视频在线免费看| 精品成人私密视频| av日韩电影| 在线亚洲美日韩| 国产不卡在线视频| 久久精品国产成人av| 在线观看欧美日韩国产| 国产精品视频一区二区三区| aa视频在线播放| 中文字幕av一区 二区| www.污视频| 日本高清视频精品| 亚洲国产老妈| 亚洲精品乱码久久| 欧美揉bbbbb揉bbbbb| 欧美hdxxx| 日韩在线第一区| 国产成人免费在线| 精品人妻一区二区三区潮喷在线 | 激情综合网五月婷婷| 亚洲视频精品在线| 国产精品一级在线观看| 成人在线免费在线观看| 国产精品美女久久久久久久久| 丰满人妻一区二区三区免费视频| 国产mv免费观看入口亚洲| 羞羞答答成人影院www| 自拍视频一区二区| 91麻豆精品国产| 92国产精品| www.激情网| 国产精品日韩精品欧美在线| 在线观看xxx| 91pron在线| 日本女优在线视频一区二区| 久久精品国产亚洲av香蕉|