精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

UI-R1 | 僅136張截圖,vivo開源DeepSeek R1式強化學習,提升GUI智能體動作預測

人工智能 新聞
vivo 與香港中文大學的研究團隊受到 DeepSeek-R1 的啟發,首次將基于規則的強化學習(RL)應用到了 GUI 智能體領域。

基于規則的強化學習(RL/RFT)已成為替代 SFT 的高效方案,僅需少量樣本即可提升模型在特定任務中的表現。

該方法通過預定義獎勵函數規避人工標注成本,如 DeepSeek-R1 在數學求解中的成功應用,以及多模態領域在圖像定位等任務上的性能突破(通常使用 IOU 作為規則 reward)。

vivo 與香港中文大學的研究團隊受到 DeepSeek-R1 的啟發,首次將基于規則的強化學習(RL)應用到了 GUI 智能體領域。

圖片

  • 論文標題:UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning
  • 論文地址:https://arxiv.org/abs/2503.21620
  • 項目主頁:https://yxchai.com/UI-R1/
  • 項目代碼:https://github.com/lll6gg/UI-R1

簡介

本研究創新性地將規則 RL 范式拓展至基于低級指令的 GUI 動作預測任務。具體實現中,多模態大語言模型為每個輸入生成包含推理標記和最終答案的多條響應軌跡,在訓練和測試時的 prompt 設計如下:

圖片

隨后通過我們設計的獎勵函數評估每條響應,并采用 GRPO 等策略優化算法更新模型參數。該獎勵函數包含三個維度:

  • 動作類型獎勵:根據預測動作與真實動作的匹配度計算;
  • 動作參數獎勵(聚焦點擊操作):通過預測坐標是否落入真實邊界框評估;
  • 格式規范獎勵:評估模型是否同時提供推理過程和最終答案。

數據制備方面,僅依據難度、多樣性和質量三原則篩選 130 余個移動端訓練樣本,展現出卓越的數據效率。實驗表明,UI-R1 在桌面端和網頁平臺等跨領域(OOD)數據上均取得顯著性能提升,印證了規則 RL 處理跨領域復雜 GUI 任務的潛力。

方法:強化學習驅動的 GUI 智能體

圖片

我們提出的 UI-R1 模型采用了三個關鍵創新:

1. 獨特的獎勵函數設計

研究團隊設計了專門針對 GUI 任務的獎勵函數:R = R_T + R_C + R_F

  • R_T:行為類型獎勵(點擊、滑動、返回等)
  • R_C:坐標準確度獎勵(點擊位置是否準確)
  • R_F:格式獎勵(輸出的格式是否正確)

2. 精心篩選的高質量數據

與其使用大量普通數據,我們提出采用了「質量優先」的策略,從三個維度精選訓練數據:

  • 質量:選擇標注準確、對齊良好的樣本
  • 難度:專注于基礎模型難以解決的「困難」樣本
  • 多樣性:確保涵蓋各種行為類型和元素類型

最終只使用了 136 個高質量樣本,比傳統方法少了幾百甚至上千倍,就能夠訓練得到比 SFT 方式更優的效果。

3. 群體相對策略優化算法

UI-R1 采用了一種名為 GRPO(Group Relative Policy Optimization)的算法。這種算法不需要額外的評論家模型,而是通過比較同一問題的多個不同回答來學習什么是「好」的回答。

實驗結果

1. 域內效果提升明顯

圖片

在 AndroidControl 基準測試上,UI-R1-3B 與基礎模型 Qwen2.5-VL-3B 相比:

  • 行為類型準確率提高了 15%
  • 定位準確率提高了 10.3%

2. 域外泛化能力驚人

圖片

圖片

UI-R1 在從未見過的桌面 PC 端和網頁界面上表現同樣出色:

  • 在 ScreenSpot 測試中,UI-R1-3B 的平均準確率達到 78.6%,超越 CogAgent-18B 等大模型。
  • 在專業高分辨率環境 ScreenSpot-Pro 測試中,UI-R1-3B 達到 17.8% 的平均準確率,提升了與使用 76K 數據訓練的 OS-Atlas-7B(18.9%)性能相當。

分析

我們關于 UI-R1 做了一系列分析,研究發現:在 GRPO 的強化學習微調的方式下,數據質量比數據數量重要

圖片

  • 困難樣本更有價值按難度選擇的方法比隨機選擇的性能顯著更好。
  • 數據增長收益遞減:隨著訓練數據量增加,性能提升趨于平緩。
  • 精選小數據集比大數據集更有效:三階段數據選擇方法優于使用整個數據集或者隨機篩選相同數量的子集。

此外,我們還發現動作預測的難度與思考的長度之間存在關聯:思考長度越長,準確率越低(說明問題越難),但通過 UI-R1 形式的強化學習微調之后,對于難樣本的成功率提升也更加明顯。

圖片

這一現象證明了強化微調的價值,通過讓模型自主思考來提升難樣本的準確率,這個特性是之前的監督微調所難以獲得的。

未來探索方向

UI-R1 初步探索了大模型強化學習和推理技術在 GUI Agent 領域的應用。下一步,我們將嘗試將 UI-R1 從 RFT 拓展到 SFT + RFT 的組合,實現大規模 UI 數據下統一的思考、決策、規劃的 GUI Agent 大模型。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-09 09:15:00

數據模型AI

2025-01-27 12:30:07

2025-02-20 15:32:28

2025-03-04 17:27:05

2025-02-07 13:10:06

2025-09-11 06:57:11

2025-07-08 08:53:00

2025-03-06 09:55:49

2025-04-25 13:34:53

R1DeepSeekAgent

2025-02-11 08:35:30

2025-02-25 08:20:50

AI程序員DeepSeek

2025-02-12 12:12:59

2025-02-08 11:31:17

DeepseekR1模型

2025-02-20 09:11:28

2025-02-15 08:15:04

聯想DeepSeek

2025-02-26 11:16:18

2025-07-04 09:08:00

AI模型架構

2018-09-30 11:53:39

開源 操作系統功能

2025-03-12 13:55:05

2025-02-08 17:47:08

點贊
收藏

51CTO技術棧公眾號

日本99精品| 大地资源第二页在线观看高清版| 国产二级片在线观看| 亚洲天堂自拍偷拍| 天天躁日日躁狠狠躁欧美巨大小说 | av电影天堂一区二区在线观看| 亚洲精品一二区| 91人成网站www| a天堂中文字幕| 美女的胸无遮挡在线观看| 国产精品888| 日韩中文字幕视频| www.夜夜爽| 免费在线一级视频| av综合网页| 亚洲精品中文在线| 91亚洲精品在线| 国产午夜性春猛交ⅹxxx| 精品素人av| 性久久久久久久| 好吊色欧美一区二区三区视频| 久久久精品一区二区涩爱| 国产精品亚洲一区二区在线观看 | 欧美a一区二区| 欧美一区二区美女| 激情五月五月婷婷| 国产免费无遮挡| 一区二区三区中文| 欧美v日韩v国产v| 野外做受又硬又粗又大视频√| 欧洲精品久久一区二区| 国产日韩欧美三区| 中文字幕av一区中文字幕天堂 | 久久亚洲私人国产精品va| 亚洲36d大奶网| 卡通欧美亚洲| 国产精品久久午夜| 亚洲中国色老太| 久久中文字幕无码| 国产精品99一区二区三区| 制服.丝袜.亚洲.另类.中文| www.亚洲成人网| 婷婷国产在线| 日韩精品91亚洲二区在线观看| 中文字幕一精品亚洲无线一区| 天堂久久久久久| 成人精品国产| 亚洲在线观看免费| 玛丽玛丽电影原版免费观看1977| 欧美一区二区三区不卡视频| 日韩午夜电影网| 欧美mv日韩mv亚洲| 夜夜爽久久精品91| 午夜影院在线观看国产主播| 国产精品少妇自拍| 亚洲激情图片| 成人免费公开视频| 久久中文精品| 久久资源免费视频| jizz亚洲少妇| 免费欧美一区| 日韩你懂的在线观看| 免费看的黄色大片| 欧美jizzhd欧美| 337p粉嫩大胆色噜噜噜噜亚洲| 国产精品一区二区三区久久久 | 好男人香蕉影院| 日韩不卡视频在线观看| 亚洲精品久久久久久国产精华液| 精品国产乱码一区二区三区四区| 色屁屁草草影院ccyycom| 免费成人av资源网| 成人网在线视频| 亚洲欧美自拍视频| 亚洲高清影视| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 国产成人精品电影| 五月天丁香激情| 国产精品嫩草影院在线看| 日韩一区二区三| 国产xxxxx视频| a天堂资源在线| 一区二区三区在线视频免费 | 国产成人无码精品久久二区三| av亚洲在线观看| 亚洲第一区在线| 国产精品久久久久久久99| 欧美91看片特黄aaaa| 亚洲成人第一页| av日韩在线看| www免费在线观看| 亚洲视频在线一区二区| 亚洲成人精品电影在线观看| 老司机在线永久免费观看| 99精品国产91久久久久久| 亚洲影视九九影院在线观看| 高清一区二区三区四区| 国产调教视频一区| 欧美韩国日本精品一区二区三区| 成人久久久精品国产乱码一区二区| www.爱久久.com| 亚洲自拍偷拍二区| 成黄免费在线| 国产亚洲欧美日韩在线一区| 色一情一乱一乱一区91| 国产欧美久久久久久久久| 黄色一区二区三区| 成人中文字幕在线播放| 日韩电影免费观看高清完整版在线观看| 色中色一区二区| 欧在线一二三四区| 日本精品不卡| 欧美午夜久久久| 免费观看美女裸体网站| 精品三级在线| 51精品久久久久久久蜜臀| 精品中文字幕在线播放 | 日韩精品一区二区在线观看| 国产伦理片在线观看| 校园春色另类视频| 色综合久综合久久综合久鬼88| 1024手机在线视频| 日本网站在线观看一区二区三区 | 精品国产aⅴ| 97超级碰碰碰| 黄色在线免费观看| 国产91丝袜在线观看| 俄罗斯精品一区二区| www.色呦呦| 白白色 亚洲乱淫| 影音先锋成人资源网站| 高清欧美日韩| 国产小视频国产精品| sm捆绑调教视频| 永久亚洲成a人片777777| 国产精品久久久久久久久久久不卡 | 手机在线看片日韩| 在线日本成人| 欧美专区日韩视频| 精品久久久久久久久久久久久久久久久久| 日韩极品在线观看| 久久久99国产精品免费| 91xxx在线观看| 亚洲精品老司机| 黑人性生活视频| 自拍自偷一区二区三区| 日韩在线不卡视频| 亚洲精品国产精品乱码视色| 国产精品538一区二区在线| 伊人精品久久久久7777| 123区在线| 亚洲国产毛片完整版| 久久视频一区二区三区| 狠狠色丁香久久综合频道| 57pao精品| 国产熟女一区二区三区五月婷| 一区免费观看视频| 成人免费aaa| 自拍亚洲一区| 国产女人18毛片水18精品| 日本在线看片免费人成视1000| 午夜伦理一区二区| 欧美精品欧美极品欧美激情| 免费日韩av| www.成人av.com| 麻豆视频在线| 欧美一区二区久久久| 青青操国产视频| 91在线播放网址| 国产精品一区二区羞羞答答| 成人在线视频中文字幕| 97精品伊人久久久大香线蕉 | 国产在线拍揄自揄拍视频| 欧美视频日韩视频在线观看| 中文字幕国产高清| 一本色道久久综合狠狠躁的番外| 日本一区二区在线免费播放| 亚洲精品无amm毛片| 国产精品美女视频| 美女被艹视频网站| 宅男噜噜噜66一区二区| 91传媒视频免费| 日本在线免费| 亚洲а∨天堂久久精品喷水| 日韩影院一区二区| 成人av电影在线| 青青青在线观看视频| 一区二区三区视频免费观看| 国产在线视频一区| av网站大全在线观看| 日韩一区二区精品在线观看| 亚洲伊人成人网| 自拍偷在线精品自拍偷无码专区| 加勒比精品视频| 奇米一区二区三区av| 国产精品久久久久7777| 成人综合久久| 国产精品第10页| 天天色天天射天天综合网| 91精品国产一区二区| 国产精品suv一区二区三区| 国产精品电影一区二区三区| 三级a在线观看| 狠狠爱成人网| 亚洲视频sss| 欧美精品国产白浆久久久久| 91精品国产色综合| 黄视频网站在线看| 国产亚洲精品久久久优势| 亚洲乱码在线观看| 欧美人牲a欧美精品| 国产稀缺精品盗摄盗拍| 国产一区二区三区免费在线观看| 在线播放 亚洲| 神马久久一区二区三区| 国产精品一码二码三码在线| 欧美高清另类hdvideosexjaⅴ| 7777精品伊人久久久大香线蕉经典版下载| www日韩精品| 久久一区二区三区四区| 爆乳熟妇一区二区三区霸乳| 亚洲特色特黄| 亚洲国产精品女人| 日韩在线欧美| 亚洲国产精品视频一区| 欧美极品中文字幕| 久久精品综合一区| 嫩草国产精品入口| 国产精品麻豆免费版| 亚洲无线观看| 国产91精品在线播放| 9999在线视频| 韩国美女主播一区| 超碰中文在线| 久久久久久久久综合| 手机在线观看毛片| 欧美成人精品福利| 国产www视频| 欧美日韩一区二区三区在线免费观看 | 另类中文字幕国产精品| 国产精品99久久久久久久久 | 久久久人人爽| 欧美一级三级| 欧美高清一区二区| 国内精品久久久久久久久电影网 | 性欧美高清come| 欧美成人精品h版在线观看| 国内爆初菊对白视频| 日韩欧美色电影| 国产成人精品a视频| 日韩色在线观看| 性猛交xxxx乱大交孕妇印度| 日韩无一区二区| 亚洲精品97久久中文字幕| 欧美精品一区二区三区蜜桃 | 91精品尤物| 国产精品久久久久久久久久久久冷 | 97caopron在线视频| 日韩精品福利在线| 99热这里只有精品9| 欧美一区二区三区四区在线观看 | 亚洲欧美日韩高清| 国产露脸国语对白在线| 精品久久久久久久久久国产| 国产成人在线免费观看视频| 日韩欧美中文字幕在线播放| 欧美性受xxx黑人xyx性爽| 欧美理论片在线| 一区二区三区在线观看av| 91久久精品一区二区| 国产精品111| 亚洲三级视频在线观看| 激情五月婷婷在线| 成人欧美一区二区三区视频网页 | 精品少妇一区二区三区免费观| 国产一区二区三区黄视频 | 国产精品初高中害羞小美女文| 婷婷伊人五月天| 黄色一区二区在线| 一道本在线视频| 亚洲成人激情图| av资源种子在线观看| 欧美国产日产韩国视频| 伊人久久视频| 亚洲精品日韩av| 蜜桃视频欧美| 女同性恋一区二区| 男人天堂欧美日韩| av在线播放亚洲| 日韩成人精品在线| 国产69视频在线观看| 国产精品综合网| 欧美xxxxxbbbbb| 91在线国产福利| 国产在线免费看| 亚洲欧洲成人自拍| 国产无套丰满白嫩对白| 91精品国产入口| 你懂的在线播放| 色综合视频一区中文字幕| 8av国产精品爽爽ⅴa在线观看| 国产精品播放| 久久久久亚洲| 91激情视频在线| 99r精品视频| 国产这里有精品| 欧美日韩在线亚洲一区蜜芽| 亚洲av激情无码专区在线播放| 亚洲缚视频在线观看| 欧美精品日韩少妇| 日本老师69xxx| jizzjizzjizz欧美| 懂色av一区二区三区四区五区| 另类av一区二区| av在线播放网址| 樱桃视频在线观看一区| 在线观看日韩一区二区| 日韩成人在线电影网| 性欧美ⅴideo另类hd| 91在线精品视频| 久久免费av| 国产精品视频一二三四区| 日本va欧美va精品| 受虐m奴xxx在线观看| 国产精品色噜噜| 免费黄色av片| 亚洲人成电影在线观看天堂色| 午夜免费播放观看在线视频| 青青草原成人在线视频| 国产精品15p| 麻豆91蜜桃| 亚洲毛片网站| 香港日本韩国三级网站| 国产一区二区不卡在线 | 日韩在线理论| 国产一区二区在线免费播放| 国产色综合一区| 中文字幕永久在线| 717成人午夜免费福利电影| jizz在线观看视频| 国产精品视频久| 9l视频自拍九色9l视频成人| 国产91porn| 国产精品综合在线视频| 欧美久久久久久久久久久久| 欧美一级精品在线| 性直播体位视频在线观看| 99在线视频免费观看| 极品日韩av| 男男做爰猛烈叫床爽爽小说| 欧美日韩亚洲高清| 欧美日韩国产综合视频| 国产成人自拍视频在线观看| 精品国产一区二区三区香蕉沈先生 | 男女男精品网站| 中文字幕无码日韩专区免费| 欧美一区二区视频网站| 污污的视频在线观看| 国产精品一国产精品最新章节| 国产乱码精品| 天堂av网手机版| 日韩欧美国产综合在线一区二区三区| 欧美videos另类精品| 精品视频在线观看| 日韩成人免费看| 午夜写真片福利电影网| 亚洲加勒比久久88色综合| 欧美xx视频| 国产又爽又黄ai换脸| 成人激情免费电影网址| 色av性av丰满av| 色综合伊人色综合网| 秋霞伦理一区| 性欧美大战久久久久久久免费观看| 日韩一区二区免费看| 国产综合精品在线| 欧美一区二区三区四区久久 | 欧美久久影院| 污污网站免费观看| 一区二区三区四区在线免费观看 | 亚洲视频三区| 久久美女福利视频| 成人h动漫精品一区二区| 欧美在线观看不卡| 日韩在线观看你懂的| 荡女精品导航| 老熟妇仑乱视频一区二区| 亚洲精品免费播放| 国产香蕉视频在线看| 国产www精品| 亚洲天堂免费| 久久久久久九九九九九| 欧美一区日韩一区| 成人做爰视频www网站小优视频| 亚洲一区二区三区免费看| 成人教育av在线| 亚洲一区二区色| 国外成人免费在线播放 | 偷拍视频一区二区| 丁香另类激情小说|