精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

312條軌跡激發(fā)241%性能!上交大與SII開源電腦智能體,超越 Claude 3.7

人工智能 新聞
來自上海交通大學(xué)和 SII 的最新研究卻給出了一個非共識答案:僅需 312 條人類標注軌跡,使用 Claude 3.7 Sonnet 合成更豐富的動作決策,就能激發(fā)模型?241%?的性能。

自 Anthropic 推出 Claude Computer Use,打響電腦智能體(Computer Use Agent)的第一槍后,OpenAI 也相繼推出 Operator,用強化學(xué)習(RL)算法把電腦智能體的能力推向新高,引發(fā)全球范圍廣泛關(guān)注。

業(yè)界普遍認為,需要海量的軌跡數(shù)據(jù)或復(fù)雜的強化學(xué)習才能實現(xiàn)電腦智能體的水平突破——這可能意味著大量的人工軌跡標注,以及大規(guī)模虛擬機環(huán)境的構(gòu)建,以支撐智能體的學(xué)習與優(yōu)化。

然而,來自上海交通大學(xué)和 SII 的最新研究卻給出了一個非共識答案:僅需 312 條人類標注軌跡,使用 Claude 3.7 Sonnet 合成更豐富的動作決策,就能激發(fā)模型 241% 的性能,甚至超越 Claude 3.7 Sonnet extended thinking 模式,成為 Windows 系統(tǒng)上開源電腦智能體的新一代 SOTA。

圖片


  • 論文標題:Efficient Agent Training for Computer Use
  • 論文地址:https://arxiv.org/abs/2505.13909
  • 代碼地址:https://github.com/GAIR-NLP/PC-Agent-E
  • 模型地址:https://huggingface.co/henryhe0123/PC-Agent-E
  • 數(shù)據(jù)地址:https://huggingface.co/datasets/henryhe0123/PC-Agent-E

這一發(fā)現(xiàn)傳遞出一個關(guān)鍵信號:當前大模型已經(jīng)具備了使用電腦完成任務(wù)的基礎(chǔ)能力,其性能瓶頸主要在于長程推理(long-horizon planning)能力的激發(fā),而這一能力使用極少量高質(zhì)量軌跡即可顯著提升。

PC Agent-E:如何用極少量軌跡訓(xùn)練出強大的電腦智能體?

數(shù)據(jù)從哪來?人類提供原始操作軌跡

與以往依賴大規(guī)模人工標注或復(fù)雜自動化合成的方式不同,團隊的方法只需 312 條真實的人類操作軌跡。這些軌跡由團隊開發(fā)的工具 PC Tracker 收集而來,僅由兩位作者花一天時間操作自己的電腦,就完成了原始軌跡數(shù)據(jù)的收集。每條軌跡包含任務(wù)描述、屏幕截圖以及鍵盤鼠標操作,并確保了數(shù)據(jù)的正確性。

圖片312 條軌跡在不同軟件上的分布

思維鏈補全:讓「動作」有「思考」的支撐

人類執(zhí)行每一個動作,往往都有一定的理由或「思考過程」。但在收集的原始軌跡數(shù)據(jù)中,這部分「思維鏈」是缺失的。于是,團隊對人類動作進行了「思維鏈補全」(Thought Completion),為每一個動作步驟添加了背后的思考邏輯(符合于 ReAct 范式)。此時的數(shù)據(jù)已足以用于智能體訓(xùn)練,但團隊并未止步于此——接下來的關(guān)鍵一步,進一步大幅提升了軌跡質(zhì)量。

軌跡增強:讓 AI 幫你「腦洞大開」

 接下來,團隊提出了一個關(guān)鍵創(chuàng)新點:軌跡增強(Trajectory Boost),這正是使用極少軌跡讓模型超越 Claude 3.7 Sonnet(thinking)的關(guān)鍵。

其核心觀察為:每個電腦任務(wù)其實可以通過多種路徑完成。也就是說,除了人類采取的動作以外,軌跡中的每一步其實都有多個「合理的動作決策」。為了捕捉這種軌跡內(nèi)在的多樣性,團隊利用前沿模型 Claude 3.7 Sonnet,為軌跡的每一步合成更多的動作決策。團隊注意到,軌跡中每一步記錄的數(shù)據(jù),作為「環(huán)境快照(environment snapshot)」,已足以為人類或智能體提供決策信息。于是,團隊將這些快照提供給 Claude 3.7 Sonnet,采樣多個包含思考過程的動作決策。這一過程極大豐富了軌跡數(shù)據(jù)的多樣性。

圖片

思維鏈補全與軌跡增強

模型訓(xùn)練:少量數(shù)據(jù)也能訓(xùn)出強大模型

最終,團隊在開源模型 Qwen2.5-VL-72B 的基礎(chǔ)上進行訓(xùn)練,得到 PC Agent-E 智能體。作為一款原生智能體模型(native agent model),PC Agent-E 無需依賴復(fù)雜的工作流設(shè)計,即可實現(xiàn)端到端的任務(wù)執(zhí)行。令人驚喜的是,在僅使用 312 條人工標注軌跡的情況下,模型性能便達到了訓(xùn)練前的 241%,展現(xiàn)出極高的樣本效率。

團隊在 WindowsAgentArena-V2 上進行評測——這是對原始 WindowsAgentArena 存在問題進行改進后的新版本。實驗結(jié)果顯示,PC Agent-E 的表現(xiàn)甚至超過了 Claude 3.7 Sonnet 的「extended thinking」模式,而用于數(shù)據(jù)合成的 Claude 3.7 Sonnet 并未啟用這一模式。這標志著 PC Agent-E 成為當前 Windows 系統(tǒng)上開源電腦智能體的新一代 SOTA!與此同時,PC Agent-E 在 OSWorld 上也表現(xiàn)出不俗的跨平臺泛化性能。

圖片

不同電腦智能體在 WindowsAgentArena-V2 上的評估結(jié)果

軌跡增強方法的有力驗證

論文的關(guān)鍵創(chuàng)新之一——軌跡增強方法在人類軌跡的每一步補充了 9 個合成動作決策。為了進一步驗證該方法的效果,團隊調(diào)整訓(xùn)練時使用的合成動作數(shù)量,并觀察其對模型性能的影響。

如圖所示,隨著合成動作數(shù)量的增加,模型性能顯著提升,并展現(xiàn)出良好的拓展趨勢。相比僅使用人類軌跡訓(xùn)練(性能提升僅 15%),PC Agent-E 在引入合成動作后實現(xiàn)了高達 141% 的性能飛躍,充分證明了軌跡增強方法對智能體能力突破的關(guān)鍵作用。

圖片

模型能力隨訓(xùn)練數(shù)據(jù)中動作決策的擴展倍數(shù)的變化

結(jié)論與展望

實驗結(jié)果有力證明了一個關(guān)鍵觀點:少量高質(zhì)量軌跡,就足以激發(fā)智能體強大的長程推理(long-horizon planning)能力。無需海量人類標注,就能訓(xùn)練出當前最優(yōu)(SOTA)的電腦智能體。

目前,即使是最前沿的電腦智能體,其能力與人類相比仍有明顯差距。在這種情況下,在預(yù)訓(xùn)練和監(jiān)督微調(diào)階段引入一定的人類認知,仍然是為后續(xù)強化學(xué)習打下堅實基礎(chǔ)的必要步驟。

團隊方法提供了一種新的思路:在人類標注軌跡注定有限的情況下,可以通過提高軌跡質(zhì)量來實現(xiàn)高效的性能提升。這不僅降低了數(shù)據(jù)需求,也為未來構(gòu)建更智能、更自主的數(shù)字代理鋪平了道路。PC Agent-E 只是一個開始。通往真正能理解并自如操作數(shù)字世界的智能代理之路,仍在繼續(xù)。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-06-23 08:56:00

2025-02-07 09:00:00

2023-11-13 19:35:12

訓(xùn)練數(shù)據(jù)

2022-12-12 11:31:39

數(shù)據(jù)學(xué)習

2025-07-02 08:50:00

AI智能體模型

2024-12-25 09:06:44

2025-11-20 08:35:59

2025-08-18 08:30:00

AI模型開源

2024-10-28 10:00:00

蘋果AI

2025-10-27 09:00:09

2025-10-10 02:10:00

2024-03-11 00:20:00

模型論文

2021-07-22 15:25:14

開源技術(shù) 框架

2025-06-06 14:17:11

模型訓(xùn)練AI

2024-10-15 17:28:05

2025-07-14 03:22:00

2024-11-25 09:35:00

AI測試
點贊
收藏

51CTO技術(shù)棧公眾號

日本japanese极品少妇| 干日本少妇视频| 中文永久免费观看| 一区二区国产在线| 精品久久久久久最新网址| 无码人妻精品一区二区蜜桃百度| 天天操天天操天天| 免费在线一区观看| 久久久久久久激情视频| 国产jjizz一区二区三区视频| 巨大黑人极品videos精品| 亚洲综合清纯丝袜自拍| 日本一区二区高清视频| 亚洲精品97久久中文字幕无码| 久久福利一区| 欧美激情成人在线视频| 国产人妻大战黑人20p| 爱高潮www亚洲精品| 欧美午夜电影在线播放| 日本人体一区二区| 看黄网站在线| 91免费观看在线| 91精品啪aⅴ在线观看国产| 九九热在线视频播放| 亚洲最大黄网| 日韩中文字幕视频在线观看| 中文字幕av观看| 深夜福利一区| 4438x亚洲最大成人网| 欧美aⅴ在线观看| 国产精品国精产品一二| 综合久久给合久久狠狠狠97色| 久久精品日韩精品| 亚洲欧美另类综合| 国产精品一二三在| 91精品国产综合久久久久久蜜臀| 一区二区三区福利视频| 激情自拍一区| 欧美黑人国产人伦爽爽爽| 日本二区三区视频| 精品国产一区二区三区久久久蜜臀| 精品国产一区二区三区四区四| 色片在线免费观看| 我爱我色成人网| 激情懂色av一区av二区av| www婷婷av久久久影片| 国产在线看片| 亚洲欧洲日产国产综合网| 五月天亚洲综合小说网| 国产精品一级伦理| 久久久91精品国产一区二区三区| 韩国成人一区| 日韩欧美在线观看一区二区| 成人a区在线观看| 国产伦理久久久| 免费看av毛片| 99精品国产热久久91蜜凸| 国产精选一区二区| 日本黄色一区二区三区| 9l国产精品久久久久麻豆| 国产美女在线精品免费观看| 人妻无码中文字幕免费视频蜜桃| 成人夜色视频网站在线观看| 国产一区二区免费电影| 全部免费毛片在线播放一个| av一区二区三区四区| 国产一区二区高清视频| 青青青草原在线| 国产片一区二区三区| 神马影院一区二区三区| av电影在线观看一区二区三区| 国产清纯白嫩初高生在线观看91| 亚洲图片都市激情| 制服丝袜中文字幕在线| 亚洲一区二区三区四区不卡| 欧美午夜小视频| 向日葵视频成人app网址| 日本久久电影网| 久久人人爽av| 911精品国产| 亚洲欧美另类自拍| 成人黄色短视频| 欧美日韩国产欧| 26uuu久久噜噜噜噜| 一级片在线观看免费| 免费成人在线观看视频| 亚洲一区精品电影| 日韩在线一区二区三区四区| 国产视频视频一区| 日本女人高潮视频| 在线天堂新版最新版在线8| 色爱区综合激月婷婷| 拔插拔插华人永久免费| 国偷自产av一区二区三区| 亚洲色图偷窥自拍| www青青草原| 麻豆精品网站| 99re6热在线精品视频播放速度| 欧美熟妇交换久久久久久分类 | 91最新国产视频| 五月婷婷丁香花| 日韩理论在线观看| www.爱色av.com| 激情综合婷婷| 亚洲一级片在线看| 久久午夜无码鲁丝片| 日韩成人av影视| 国产精品一区二区三区免费观看| 国产精品久久一区二区三区不卡| 亚洲色图视频免费播放| 情侣黄网站免费看| caoporn成人| 色噜噜狠狠色综合网图区| 自拍偷拍欧美亚洲| 国产在线不卡一区| 日韩欧美在线观看强乱免费| av色在线观看| 日韩亚洲欧美在线| 亚洲激情图片网| 欧美一级久久| 国产伦精品一区二区三区视频黑人 | 亚洲三级在线播放| 伊人成色综合网| 一区二区三区四区视频免费观看| 亚洲男女自偷自拍图片另类| 久久久久亚洲AV| 国内精品免费在线观看| 日韩激情视频| 欧美片第一页| 日韩经典中文字幕| 国产奶水涨喷在线播放| 国产精品91一区二区| 亚洲欧美久久234| 欧美片第一页| 亚洲欧美日韩国产成人| 日韩成人在线免费视频| 国产福利精品一区| 99热一区二区三区| 成人黄色理论片| 日韩中文字幕不卡视频| 国产美女www| 国产欧美一区二区精品婷婷| 粗暴91大变态调教| 一区二区三区视频免费观看| 69**夜色精品国产69乱| 手机av在线免费观看| 亚洲1区2区3区视频| 久草免费资源站| 国产精品av一区二区| 成人看片视频| 国模私拍视频在线播放| 精品国产99国产精品| 国产中文字幕免费| 成人精品小蝌蚪| 熟女少妇在线视频播放| 青青一区二区| 国产成人精品免费视频| 国产大片在线免费观看| 91久久国产综合久久| 一区二区精品免费| 蜜臀久久久久久久| 国产精品无码乱伦| 久久国产精品美女| 欧美精品videosex牲欧美| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的 | 亚洲一级特黄毛片| 日韩久久一区二区| 国产无套精品一区二区三区| 精品1区2区3区4区| 美脚丝袜一区二区三区在线观看| 男人皇宫亚洲男人2020| 视频在线观看99| 国产黄色一区二区| 懂色aⅴ精品一区二区三区蜜月| 中文字幕国产综合| 毛片av中文字幕一区二区| 黄频视频在线观看| 国产香蕉精品| 国产激情综合五月久久| 精品视频在线一区二区| 欧美成人aa大片| 亚洲视频 欧美视频| 亚洲欧洲精品一区二区三区不卡| 91porn在线| 爽爽淫人综合网网站| 午夜欧美性电影| 97久久综合精品久久久综合| 日韩美女av在线免费观看| 三级外国片在线观看视频| 精品国产乱码久久久久久牛牛| 可以在线观看av的网站| 亚洲欧洲精品一区二区精品久久久| 中文字幕永久免费| 日本欧美韩国一区三区| www.国产在线视频| 欧美丝袜激情| 精品久久久久久一区| 久久亚洲人体| 欧美自拍视频在线观看| h片在线免费观看| 国产视频在线观看一区二区| 国产精品免费无遮挡| 欧美日韩亚洲一区二区| 放荡的美妇在线播放| 国产午夜精品理论片a级大结局| 国产999免费视频| 日日夜夜精品视频天天综合网| 人妻激情另类乱人伦人妻| 激情五月综合| 国产在线观看一区| 国产精品视频首页| 国产成人精品av在线| √8天堂资源地址中文在线| 久久久精品视频成人| 国产系列电影在线播放网址| 亚洲大胆人体在线| 97在线公开视频| 在线观看精品一区| 黄色片视频网站| 亚洲综合图片区| 成人免费毛片东京热| 国产精品天干天干在线综合| 国产熟妇搡bbbb搡bbbb| 高清成人在线观看| 亚洲国产欧美91| 久久69国产一区二区蜜臀| 日韩无套无码精品| 亚洲综合社区| 日日碰狠狠添天天爽超碰97| 欧美三区视频| 免费的av在线| 欧美成人首页| 日本xxx免费| 91精品国偷自产在线电影 | 99精品国产高清一区二区| 欧洲亚洲精品| 成人激情视频小说免费下载| 国产综合色在线观看| 日韩男女性生活视频| 中文不卡1区2区3区| 亚洲91av视频| 无遮挡爽大片在线观看视频| 久久久久久久成人| freexxx性亚洲精品| 97成人超碰免| 综合日韩av| 国产999精品| 成人啊v在线| 国产日韩欧美在线观看| 精品176极品一区| 成人妇女淫片aaaa视频| 91成人短视频在线观看| 91在线中文字幕| 视频精品一区二区三区| 成人永久免费| 欧美日韩看看2015永久免费| 久久99精品久久久久久水蜜桃| 欧美在线关看| 日本午夜精品一区二区三区| 成人影视亚洲图片在线| 亚洲视频在线观看日本a| 香蕉av一区二区| 成人在线免费观看视频网站| 亚洲国产影院| 可以免费在线看黄的网站| 久久激五月天综合精品| 色欲无码人妻久久精品| av在线这里只有精品| 一区二区三区四区免费| 国产精品狼人久久影院观看方式| 污污的视频在线免费观看| 一区二区三区四区在线播放| 国产无遮无挡120秒| 色av一区二区| 国产女人爽到高潮a毛片| 欧美精品一区男女天堂| 欧美色视频免费| 日韩视频一区在线| av毛片午夜不卡高**水| 国产精品999| 国产精品亚洲欧美一级在线| 国产精品一区二区三区在线观| 国产伦精品一区二区三区视频| 亚洲国产一区二区三区在线| 欧美日韩国产高清| 人妻丰满熟妇av无码区app| 国内久久精品视频| 91精品小视频| 综合电影一区二区三区| 日产精品久久久久久久| 欧美视频一区二区三区四区| 亚洲国产精品suv| 亚洲人成网7777777国产| 伊人影院在线视频| 国产suv精品一区二区三区88区| 成人午夜888| 欧美不卡三区| 欧美午夜a级限制福利片| 99视频精品免费| 成人精品视频一区二区三区尤物| av在线播放中文字幕| 婷婷综合在线观看| 91午夜交换视频| 亚洲欧美日韩第一区| 国产探花视频在线观看| 国产日产久久高清欧美一区| 香蕉久久精品| 日韩国产小视频| 久久电影网站中文字幕| 玖草视频在线观看| 亚洲综合精品久久| 中文字幕一区二区三区波野结| 亚洲激情在线视频| 宅男网站在线免费观看| 国产在线播放91| 国产精品一线天粉嫩av| 夜夜添无码一区二区三区| 狠狠色综合色综合网络| 亚洲一区二区三区日韩| 欧美性生交大片免费| 亚洲精品综合久久| 久久伊人91精品综合网站| 91p九色成人| 欧美日韩精品久久| 99精品视频免费| 国产亚洲精品成人a| 亚洲欧美另类小说视频| 亚洲天堂中文字幕在线| 国产一区二区三区直播精品电影| 日韩av影片| 国产一区喷水| 亚洲区一区二| 亚洲精品女人久久久| 亚洲国产日韩a在线播放| 性猛交xxxx乱大交孕妇印度| 久久久99久久精品女同性| 成人毛片免费| 亚洲日本精品| 久久精品国产精品亚洲红杏| 久久久久久成人网| 欧美午夜一区二区三区| av播放在线| 国产欧美 在线欧美| 手机亚洲手机国产手机日韩| 亚欧激情乱码久久久久久久久| 欧美国产一区二区在线观看| 久久这里只有精品9| 亚洲性视频网站| yy6080久久伦理一区二区| 亚洲精品高清视频| 久久99精品视频| 国产一区二区三区在线视频观看| 欧美一区二区三区啪啪| 丝袜在线观看| 国产亚洲精品久久飘花| 国产精品婷婷| 国内精品卡一卡二卡三| 欧美揉bbbbb揉bbbbb| 国产激情在线| 国产精品视频在线免费观看| 亚洲在线电影| 精品日韩在线视频| 666欧美在线视频| 欧美日韩色网| 另类视频在线观看+1080p| 日韩精品乱码免费| 99精品中文字幕| 日韩精品一区二区三区在线| 国产一二三在线| 日韩jizzz| 国产一区二区h| 久久草视频在线| 永久免费毛片在线播放不卡| 成人乱码手机视频| 日本一道本久久| 国产精品网曝门| 精品欧美一区二区精品少妇| 性色av一区二区三区在线观看| 国产日韩欧美一区二区三区| 看看黄色一级片| 亚洲高清免费视频| 爱爱爱免费视频在线观看| 成人性生交xxxxx网站| 亚洲精品三级| 久久精品色妇熟妇丰满人妻| 日韩三区在线观看| 日韩精品一区二区三区| 中文字幕第50页| 国产亚洲人成网站| 性少妇videosexfreexxx片| 热99精品只有里视频精品| 亚洲精品午夜av福利久久蜜桃| 欧美大片免费播放器| 欧美高清视频在线高清观看mv色露露十八 | 三级三级久久三级久久18| 精品一区二区av| 性无码专区无码| 日韩中文字幕精品| 欧美精品momsxxx| 绯色av蜜臀vs少妇|