精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節(jié)Seed最新版原生智能體來了!一個模型搞定手機/電腦/瀏覽器自主操作

人工智能 新聞
這就是Seed最新發(fā)布的智能體UI-TARS-2,它不止采用了All in one這樣的原生設(shè)計,而且表現(xiàn)更是優(yōu)于Claude和OpenAI Agent等競爭對手。

AI自己玩手機、玩電腦、操作網(wǎng)頁瀏覽器……背后還只靠一個模型。

卷王字節(jié)Seed又把智能體帶到了一個全新level~

比如任務(wù)是醬紫的:

編寫一個可以轉(zhuǎn)換重量單位的函數(shù)。如果原始單位是千克,目標(biāo)單位是克,并且要轉(zhuǎn)換的值是Mathilde Seigner(法國知名演員)被提名凱撒獎的次數(shù)加1,最終結(jié)果會是多少?

而通過一系列操作,Agent僅用時35s就得出了答案為4000克。

這就是Seed最新發(fā)布的智能體UI-TARS-2,它不止采用了All in one這樣的原生設(shè)計,而且表現(xiàn)更是優(yōu)于Claude和OpenAI Agent等競爭對手。

來看團隊成員曬出的成績單,不管是操作電腦/手機,還是使用瀏覽器、玩15款小游戲,其絲滑程度和完成率現(xiàn)在已經(jīng)超越一眾競爭對手,并進一步接近人類水平。

而且這里還透露了UI-TARS-2背后的關(guān)鍵秘訣:

一個通過多輪強化學(xué)習(xí)訓(xùn)練的原生GUI智能體

劃重點,多輪強化學(xué)習(xí)。依靠這一技巧,UI-TARS-2核心解決了“讓AI自主操作圖形界面(GUI)”的四大難題:

  • 數(shù)據(jù)稀缺:以往方法需要上百萬級高質(zhì)量標(biāo)注數(shù)據(jù),成本極高,擴展困難。
  • 環(huán)境割裂:不同任務(wù)(電腦、手機、網(wǎng)頁、終端、游戲)通常要在不同框架里訓(xùn)練,無法統(tǒng)一。
  • 能力單一:大多數(shù)智能體只能做GUI點擊或終端命令,難以完成真實復(fù)雜任務(wù)。
  • 訓(xùn)練不穩(wěn)定:強化學(xué)習(xí)在GUI任務(wù)上容易出現(xiàn)獎勵稀疏、策略崩潰,模型很難可靠收斂。

且看字節(jié)團隊如何見招拆招——

針對四大難題打出“組合拳”

先來看UI-TARS-2的整體設(shè)計思路和框架。

其核心目標(biāo)為:構(gòu)建一個真正原生、通用、跨平臺的GUI智能體,能在電腦、手機、網(wǎng)頁、終端,甚至游戲里自主完成復(fù)雜任務(wù)。

為此,UI-TARS-2架構(gòu)主要包含下面這幾個部分:

1、統(tǒng)一的Agent架構(gòu):以大語言模型為核心決策器(Planner),將自然語言指令→GUI/終端/工具操作,全部納入一個通用執(zhí)行循環(huán),同時支持GUI點擊、鍵盤輸入、終端命令、API調(diào)用等多種操作流。

2、多模態(tài)感知與環(huán)境交互:輸入端整合屏幕截圖(視覺)+文本上下文+歷史操作軌跡,輸出端可以是點擊坐標(biāo)、拖拽動作、命令行、甚至API請求,形成感知—決策—執(zhí)行—反饋的完整閉環(huán)。

3、多輪強化學(xué)習(xí):不依賴人工標(biāo)注,而是通過環(huán)境反饋獎勵優(yōu)化策略,同時采用模擬環(huán)境(sandbox)+自動化任務(wù)生成,構(gòu)建出“數(shù)據(jù)飛輪”,讓模型能不斷自我進化。

4、混合操作流(Hybrid Flows):在一次任務(wù)軌跡中,智能體可以無縫組合GUI點擊、終端命令和API調(diào)用。例如,在網(wǎng)頁上找資料(GUI),處理數(shù)據(jù)(終端),再調(diào)用搜索API(工具)。

下面這個讓UI-TARS-2玩游戲的例子,很好地展示了這套框架的具體運作過程:

而基于這套框架,UI-TARS-2逐一解決了智能體自主操作GUI面臨的四大難題。

靠“數(shù)據(jù)飛輪”解決數(shù)據(jù)少的問題

為了打造數(shù)據(jù)飛輪,團隊采用了以下策略:

1、冷啟動:這一階段主要是廣泛收集原始數(shù)據(jù),以及通過合成數(shù)據(jù)和人工標(biāo)注來構(gòu)建監(jiān)督微調(diào)所需的原始高質(zhì)量、任務(wù)針對性強的數(shù)據(jù)。

2、多輪迭代:有了數(shù)據(jù)之后,先讓模型通過預(yù)訓(xùn)練學(xué)習(xí)更廣泛的知識(如不同GUI操作流程、任務(wù)解決思路等),再使用高質(zhì)量特定任務(wù)數(shù)據(jù)對模型進行優(yōu)化,最后通過強化學(xué)習(xí)進行端到端優(yōu)化。

在每輪迭代中,團隊會使用拒絕采樣(RFT)或交互標(biāo)注生成新軌跡,這些軌跡記錄了模型在執(zhí)行任務(wù)過程中的推理、動作、環(huán)境狀態(tài)以及反饋等信息,將其按質(zhì)量篩選后,高質(zhì)量的進微調(diào)數(shù)據(jù)集,低質(zhì)量的進預(yù)訓(xùn)練數(shù)據(jù)集。

3、循環(huán)增強:然后模型用更新后的數(shù)據(jù)集重新訓(xùn)練,能力提升后又能生成更好的軌跡,形成“模型變好→數(shù)據(jù)變好→模型更好”的循環(huán),不斷解決數(shù)據(jù)稀缺問題。

用“多輪強化學(xué)習(xí)”讓AI操作更穩(wěn)

針對傳統(tǒng)強化學(xué)習(xí)在GUI長周期任務(wù)中“獎勵稀疏、優(yōu)化不穩(wěn)定、信用分配難” 的問題,團隊從任務(wù)設(shè)計、獎勵機制、訓(xùn)練流程三方面進行了優(yōu)化。

如何進行任務(wù)獎勵設(shè)計?團隊先對任務(wù)類型進行拆分:

對可驗證任務(wù)(如游戲得分、網(wǎng)頁信息檢索),用明確信號(成功/失敗、LLM對比答案打分)當(dāng)獎勵;

對模糊任務(wù)(如復(fù)雜GUI操作),訓(xùn)練UI-TARS-2自身作為“獎勵模型”,根據(jù)軌跡和截圖輸出任務(wù)成功分數(shù),保證獎勵可靠。

確定了這一模式后,團隊摒棄“等所有任務(wù)完成再訓(xùn)練”的模式,轉(zhuǎn)而采用“異步rollout”——

把模型推理環(huán)節(jié)單獨拿出來,和實際執(zhí)行過程分離,互不干擾;同時只要湊夠最少需要的軌跡數(shù)量,就立刻用這些完成的軌跡開始訓(xùn)練,那些未完成的就留到下一輪。

等到訓(xùn)練時,團隊還在PPO算法上進行了3處優(yōu)化,從而讓模型操作更穩(wěn),包括用“解耦GAE”避免長序列價值估計偏差、用“不對稱裁剪”鼓勵模型嘗試那些看似不常用、但可能有效的操作等。

打造“混合操作環(huán)境”突破界面限制

為解決純GUI操作(僅鼠標(biāo)/鍵盤)無法應(yīng)對數(shù)據(jù)處理、軟件開發(fā)等復(fù)雜工作流的問題,團隊構(gòu)建了“GUI+多工具”融合的交互環(huán)境:

不僅整合多操作流,比如在同一環(huán)境里,智能體既能做GUI基礎(chǔ)操作(點擊、輸入、滾動網(wǎng)頁/APP),又能直接調(diào)用終端命令(如用Bash處理文件)、調(diào)用API,無需切換上下文。

還為其適配多場景載體,比如在云虛擬機里,內(nèi)置文件系統(tǒng)、遠程VS Code、Jupyter等工具;在瀏覽器沙箱里,也能關(guān)聯(lián)終端功能,讓操作覆蓋“桌面-移動-游戲” 全場景。

建“統(tǒng)一沙盒平臺”支撐大規(guī)模訓(xùn)練

針對傳統(tǒng)環(huán)境“難復(fù)現(xiàn)、易崩潰、吞吐量低”的工程瓶頸,團隊打造了兼容多載體的統(tǒng)一沙盒,保障百萬級交互訓(xùn)練需求。

簡單來說,這就是一個虛擬的模型訓(xùn)練場,支持智能體在里面大規(guī)模練習(xí)、試錯和進化。

以下為一個瀏覽器沙盒的示意圖,據(jù)此也能看到沙盒的大致運作方式:

優(yōu)于Claude和OpenAI Agent等競爭對手

那么,UI-TARS-2的實際表現(xiàn)如何呢?

根據(jù)介紹,UI-TARS-2是團隊基于Seed-thinking-1.6(總參數(shù)230B,含532M視覺編碼器 + 23B激活參數(shù)),經(jīng)過多輪迭代訓(xùn)練而成。

在多個權(quán)威GUI測試里,比如OSWorld(369個Windows/Ubuntu/macOS任務(wù))、WindowsAgentArena(150個 Windows任務(wù))、TerminalBench(命令行任務(wù))等,它的得分都比Claude、OpenAI的同類模型更高。

換句話說,在電腦、手機、瀏覽器操作上,UI-TARS-2的表現(xiàn)明顯更好。

而且在15款小游戲(比如2048、拼圖、迷宮)里,它的平均得分差不多是人類水平的60%,比OpenAI、Claude的游戲AI強不少,有的游戲(如“Shapes”)甚至比人玩得還好。

即使面對一些更復(fù)雜的游戲測試(LMGame-Bench),它也能和o3打得有來有回。

當(dāng)然了,它不光會點界面、玩游戲,還能干“查資料”、“寫代碼修bug” 這樣的活兒,而且成績比只靠界面操作強很多。

總之,UI-TARS-2無疑驗證了多輪強化學(xué)習(xí)在智能體進化上的有效性。

論文:https://arxiv.org/abs/2509.02544

demo:https://seed-tars.com/showcase/ui-tars-2/

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2009-12-16 10:04:51

Chrome瀏覽器漏洞

2009-05-27 08:56:49

IQ瀏覽器瀏覽器新功能

2009-04-13 08:43:01

微軟IE8 瀏覽器

2012-07-03 09:22:09

2009-05-30 10:09:03

Chrome瀏覽器Google

2012-04-01 10:08:28

瀏覽器評測

2015-02-05 15:58:06

2013-10-08 14:52:56

瀏覽器性能測試

2009-05-26 09:25:55

2021-11-10 19:00:47

微軟Edge Canary瀏覽器

2017-03-22 20:30:40

2021-03-08 05:42:26

瀏覽器FirefoxVIA瀏覽器

2025-11-06 01:44:00

2025-01-24 08:53:46

2012-06-04 10:04:26

2009-05-27 08:54:15

瀏覽器平臺Chrome

2017-12-14 15:45:02

2010-12-21 10:11:35

手機瀏覽器

2011-03-23 10:02:24

Opera Mini Opera Mobil

2011-11-03 11:02:00

瀏覽器排行榜
點贊
收藏

51CTO技術(shù)棧公眾號

国产午夜在线视频| 四虎国产精品成人免费入口| 黄片毛片在线看| 欧美日韩亚洲三区| 精品精品国产高清a毛片牛牛| 国产成人永久免费视频| 色欲久久久天天天综合网| 国产日韩视频| 亚洲丝袜一区在线| 亚洲自拍第三页| 成人免费观看在线观看| 国产欧美精品一区二区色综合朱莉| 国产精品露脸自拍| 91人妻一区二区三区蜜臀| 亚洲综合影院| 色婷婷久久久久swag精品| 中文字幕欧美日韩一区二区三区| 亚洲va欧美va| 中文欧美日韩| 中文字幕日韩欧美| 五月天丁香社区| 欧美影视资讯| 亚洲一级二级三级| 视频在线99re| 国产高清视频免费| 久久久久国产精品午夜一区| 久久久97精品| 一本色道综合久久欧美日韩精品| 国产精品原创视频| 亚洲香肠在线观看| 亚洲色图自拍| 亚洲欧美综合一区二区| 国产一区啦啦啦在线观看| 欧美中文字幕视频在线观看| 青草影院在线观看| 国产99亚洲| 日韩欧美精品在线视频| 黄色免费网址大全| 91av久久| 中文字幕一区二区三区四区不卡 | 极品尤物av久久免费看| 97精品久久久| 成人观看免费视频| 欧美日韩一二| 精品久久一二三区| 高潮一区二区三区| 无遮挡在线观看| 一区二区三区成人| 异国色恋浪漫潭| 国产福利第一视频在线播放| 91在线免费播放| 国产精品一区二| 国产视频在线观看免费| 欧美a级理论片| 欧美中文在线观看国产| 国产无码精品视频| 欧美日韩日本国产亚洲在线| 日韩在线视频播放| 999久久久国产| 国产麻豆精品久久| 精品国产sm最大网站免费看| 日本xxxx免费| 久久精品九色| 欧美日韩1234| 成人性生交免费看| 成人日韩av| 日本精品视频一区二区| 色欲av无码一区二区人妻| 成入视频在线观看| 天天影视色香欲综合网老头| www.99热这里只有精品| 黄色18在线观看| 午夜精品免费在线观看| 国产无限制自拍| 黑丝av在线播放| 全球中文成人在线| 欧美三区在线视频| 污网站免费在线| 粉嫩91精品久久久久久久99蜜桃| 色哟哟一区二区三区| 日韩激情免费视频| 毛片在线网站| 亚洲国产欧美在线人成| www.射射射| 一区二区精品伦理...| 欧美性猛交xxxx免费看漫画| 青青在线免费观看视频| 91久久久久久白丝白浆欲热蜜臀| 在线观看欧美精品| 日韩av片网站| 精品视频一区二区三区在线观看| 91精品国产色综合久久久蜜香臀| 国模大尺度视频| 动漫av一区| 亚洲深夜福利视频| 污污视频网站在线免费观看| 亚洲成人三区| 久久久久久久久亚洲| 国产欧美一区二区三区在线看蜜臂| 在线亚洲国产精品网站| 国产精品美女免费视频| 国产视频第一页| aaa欧美日韩| 精品久久久三级| 国产在线三区| 亚洲欧美一区二区三区极速播放| 亚洲国产精品无码av| 在线手机中文字幕| 欧美老年两性高潮| 国产性猛交96| 日韩激情一区| 久久国产视频网站| 久草手机在线视频| 国内精品自线一区二区三区视频| 国产色综合一区二区三区| 精品无人乱码| 一区二区三区小说| 日韩在线第三页| 疯狂欧洲av久久成人av电影| 国产婷婷97碰碰久久人人蜜臀 | 免费成人动漫| 欧美日韩久久不卡| 深夜做爰性大片蜜桃| 亚洲瘦老头同性70tv| 久久久精品国产网站| 日韩视频在线观看一区| 久久精品国产久精国产| 国产区二精品视| 日本www在线观看视频| 亚洲成人动漫一区| jizz欧美性11| 婷婷成人影院| 成人97在线观看视频| 高清乱码免费看污| 99视频精品在线| 精品久久免费观看| free欧美| 日韩三级视频在线看| www亚洲色图| 亚洲全部视频| 亚洲在线免费看| 瑟瑟视频在线| 在线免费观看一区| 日韩成人av一区二区| 911精品美国片911久久久| 日本欧美国产在线| 手机看片一区二区| 亚洲一区在线观看免费| 欧美婷婷精品激情| 伊人久久大香线蕉| 久久久久久久久亚洲| 国产丝袜在线视频| 亚洲色图一区二区三区| 色综合手机在线| 精品久久久久久久| 日本a级片电影一区二区| 后进极品白嫩翘臀在线视频| 亚洲精品成a人| 日日干日日操日日射| 日韩在线第七页| 国产精品激情自拍| 国产日韩精品在线看| 色诱视频网站一区| 国产精品无码一区二区三区| 亚洲欧美日本国产专区一区| 久久本道综合色狠狠五月| 91超碰国产在线| 亚洲国产精品久久久久秋霞蜜臀| 国产一区二区播放| 国产最新精品免费| 久久天堂国产精品| 亚洲插插视频| 中文字幕日韩综合av| 99热这里只有精品66| 亚洲国产中文字幕在线视频综合| 欧美图片一区二区| 免费观看30秒视频久久| 手机福利在线视频| 欧美精品中文| 国产精品久久久久久久天堂| gogo在线高清视频| 亚洲国产精品高清久久久| 日韩精品一区不卡| 亚洲天堂av老司机| 国产精品无码一区二区三| 日韩av一区二| 日韩极品视频在线观看| 精品国产一区二区三区香蕉沈先生| 国产欧美精品久久久| 9999在线视频| 日韩中文字幕在线观看| 五月天激情婷婷| 欧美日韩dvd在线观看| 国产乱码久久久久久| 国产精品无遮挡| 国产一级黄色录像| 蜜桃av噜噜一区| 久久亚洲中文字幕无码| 91亚洲人成网污www| 加勒比在线一区二区三区观看| 久久国产三级| 欧美亚州一区二区三区| 91麻豆免费在线视频| 亚洲欧美成人一区二区在线电影| 国产日韩在线观看一区| 色综合色狠狠综合色| 久久综合久久鬼| 亚洲欧美一区二区视频| 三上悠亚ssⅰn939无码播放| 国产成人午夜片在线观看高清观看| 免费高清在线观看免费| 国内揄拍国内精品久久| 一区二区三区不卡在线| 精品影片在线观看的网站| 国产99在线免费| 99tv成人影院| 国产精品久久久亚洲| 中文字幕乱码在线播放| 欧美国产在线视频| 麻豆网站在线| 亚洲老司机av| 天天插天天干天天操| 日韩女优毛片在线| 国产又粗又猛视频免费| 色播五月激情综合网| 青青国产在线观看| 亚洲国产欧美在线人成| 国产这里有精品| 亚洲欧美自拍偷拍| 999福利视频| 国产欧美va欧美不卡在线| 鲁大师私人影院在线观看| 成人美女在线观看| 99免费观看视频| 国产成人在线观看免费网站| 亚洲日本黄色片| 九色|91porny| 天天色综合社区| 日本v片在线高清不卡在线观看| 日韩黄色片视频| 久久久噜噜噜久久狠狠50岁| 日本wwww视频| 亚洲专区一区| 成人在线观看黄| 久久综合影视| 玩弄japan白嫩少妇hd| 久久久久久婷| 亚洲色图久久久| 免费一区二区视频| 亚洲男人天堂av在线| 国模无码大尺度一区二区三区| 999久久久精品视频| 精品一区二区免费在线观看| 国产精品久久久久久9999| 国产精品一区在线观看乱码| 欧美xxxx日本和非洲| av男人天堂一区| 亚洲精品国产熟女久久久| 国产欧美一区二区三区沐欲| 成年人看的免费视频| 亚洲成人影院麻豆| 久久香蕉精品香蕉| 亚洲最大av在线| av动漫精品一区二区| 国产一区二区三区无遮挡| 欧美久久香蕉| 天堂一区二区三区| 国产精品国产一区| 无码人妻精品一区二区蜜桃百度| 亚洲婷婷在线| 国产黄色特级片| 久久成人18免费观看| 成年人性生活视频| 91视频免费播放| 欧美亚洲色综久久精品国产| 亚洲免费观看高清完整版在线观看 | 亚洲精品久久7777777| aaa一区二区三区| 欧美videos大乳护士334| 好吊色一区二区| 亚洲欧洲在线看| 日本美女在线中文版| 欧美成人精品在线播放| 成人一级福利| 国产女人精品视频| 福利欧美精品在线| 午夜精品aaa| 538精品在线视频| 精品国产乱码久久久久久婷婷| 五月天中文字幕| 日韩精品一区二| 成年人视频在线看| 欧美激情aaaa| 精品人妻一区二区三区日产乱码| 欧美成a人免费观看久久| 国产区亚洲区欧美区| 日韩在线观看一区二区三区| 免费精品视频一区| 欧美一区不卡| 99视频免费播放| 成人av先锋影音| 精品在线观看一区| 欧美日韩亚洲精品一区二区三区| 国产精品色综合| 亚洲色图激情小说| 黄视频网站在线观看| 成人有码在线播放| 国产麻豆一区二区三区精品视频| 欧美亚洲色图视频| 精品亚洲国产成人av制服丝袜| 久久一区二区电影| 一区二区三区视频在线看| 欧美男人天堂网| 日韩成人免费视频| 亚洲综合影视| 国产中文字幕日韩| 精品免费一区二区| 黄色动漫在线免费看| 国产91丝袜在线播放九色| 夫妇露脸对白88av| 色婷婷久久久亚洲一区二区三区| 国模无码一区二区三区| 久久中文字幕在线视频| 国产成人精品一区二区三区在线 | 欧美老熟妇喷水| 成人综合在线观看| www青青草原| 丝袜美腿高跟呻吟高潮一区| 裸体丰满少妇做受久久99精品| 欧美va天堂| 日本在线观看视频一区| 国产精品全国免费观看高清 | 日韩在线视频网址| 欧美日韩视频在线第一区| 精品久久av| 日本成人黄色片| 国产亚洲一区| 免费激情视频在线观看| 久久免费偷拍视频| 久久国产视频精品| 亚洲免费福利视频| 韩国美女久久| 日本不卡一二三区| 日本视频一区二区| 日本一道本视频| 欧美久久久久久蜜桃| 黄色网页在线免费看| 亚洲一区亚洲二区| 国产精品国码视频| 艳妇乳肉亭妇荡乳av| 清纯唯美综合亚洲| 国产视频精品网| 99在线|亚洲一区二区| 五十路六十路七十路熟婆| 欧美午夜宅男影院在线观看| 国产在线视频网| 国产精品亚洲网站| 97精品国产| 四川一级毛毛片| 亚洲一区二区三区国产| 天堂网av在线播放| 国产成人精品日本亚洲| 欧美亚洲国产激情| 久久久精品高清| 一区二区三区在线免费视频| 深爱激情五月婷婷| 欧洲午夜精品久久久| 成人看的视频| 天堂一区在线观看| 亚洲在线免费播放| 偷拍自拍在线| 国产欧美精品在线播放| 国精品一区二区三区| 韩国无码一区二区三区精品| 欧美日韩久久一区二区| av中文字幕在线播放| 久久久久成人精品免费播放动漫| 欧美96一区二区免费视频| 加勒比av在线播放| 亚洲欧美三级在线| japansex久久高清精品| 成年人网站免费视频| 国产人伦精品一区二区| 成 人 免费 黄 色| 国产盗摄xxxx视频xxx69| 91精品秘密在线观看| 精品一区二区视频在线观看 | 国产suv一区二区| 91av在线不卡| 婷婷亚洲图片| 亚洲欧美日本一区| 欧美日韩国产乱码电影| www.综合| 一区二区三视频| 久久亚洲综合色| 国产夫妻自拍av| 国产精品视频免费在线观看| 亚洲精品国产日韩| 女同久久另类69精品国产 | 亚乱亚乱亚洲乱妇|