精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

新聞 人工智能
李飛飛帶領三位英偉達博士發表論文,通過魯棒性策略學習,對具有大分布偏移的未見視覺環境進行零樣本泛化,提出視覺策略新模型「SECANT」,實驗結果顯示,新模型在零樣本泛化方面超過SOTA。

  [[412771]]

沒錯!又是李飛飛!

上次報道李飛飛是因為她為學界爭取到了亞馬遜谷歌云數據中心。

而這次,她和研究團隊帶著一篇論文向我們走來!

走在隊伍前面的,是來自斯坦福大學的博士,李飛飛的門生!

(不好意思最近重溫了一下08奧運開幕式……)

先來看看李飛飛團隊這次在arXiv上發表了的論文題目:

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

SECANT:用于視覺策略零樣本泛化的自專家克隆

廢話少說,給大家介紹一下這篇論文的大致內容。

論文介紹

簡要介紹

強化學習中的泛化(generalization),是指通過不斷跟環境交互,產生出一種網絡的記憶性。

這個網絡能夠根據環境中特定的信號完成相應的動作,經過訓練的agent能夠記住在什么狀態下要做什么,還能通過識別狀態的細微差別來采取不同的動作。

再通俗一點,就是在未見過的測試數據上也能夠進行預測。

因此,提升模型的泛化是機器學習領域中的一個重要研究。

特別是視覺強化學習方面,泛化很容易被高維觀察空間中,一些無關痛癢的因素分散了注意力。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

機器學習中的泛化:欠擬合、擬合、過度擬合

針對這個問題,團隊通過魯棒性策略學習,對具有大分布偏移的未見視覺環境進行零樣本泛化。

因此,團隊提出「SECANT」模型,一種可以適應新測試環境的自專家克隆方法(Self Expert Cloning for Adaptation to Novel Test-environments)。

這個方法能夠在兩個階段利用圖像增廣,分離魯棒性表征和策略優化。

首先,專家策略通過弱增廣從頭開始進行強化學習的訓練。

而學生網絡就是通過強增廣的監督學習來模仿專家策略,其表征與專家策略相比,對視覺變化更具魯棒性。

實驗表明,SECANT在DMControl(Deepmind Control)、自動駕駛、機器人操作和室內物體導航這四個具有挑戰性的領域中,在零樣本泛化方面超過了之前的SOTA模型,分別實現了26.5%、337.8%、47.7%和15.8%的提升。

主要貢獻

  • 提出了SECANT模型,可以依次解決策略學習和魯棒性表征學習問題,從而實現了對未見過的視覺環境的強大零樣本泛化性能。
  • 在自動駕駛、機器人操作和室內物體導航四個領域中,設計并制定了一套多樣化的基準測試。除了DMControl外,其它3種環境都具有代表實際應用程序的測試時視覺外觀漂移。
  • 證明了SECANT在以上4個領域中,大多數任務都能達到SOTA。

SECANT框架

SECANT的主要目標是發展自我專家克隆技術,通過這種技術可以實現零樣本生成不一樣的視覺樣本。

作者研究的SECANT訓練模型可以分解為兩步,代碼已公開。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

專家策略

第一步,作者在原始環境中通過弱增廣訓練了一套高性能的專家策略。在視覺連續控制任務中,這套策略通過前饋深度卷積網絡進行參數化,然后將觀察到的圖像轉化為d維連續動作向量。

在實際應用中,作者采用了幀疊加技術,在時間信息維度上,連接T個連續圖像進行觀測。然后通過語義保持圖像變換來生成數據擴增的算子。采用隨機裁剪圖像的方法作為默認的弱增廣方法來訓練專家策略。

這套專家策略可以通過任何標準的RL算法進行優化。作者選擇了Soft Actor-Critic (SAC),因為它在連續控制任務中被廣泛采用。然后采用梯度下降法對專家參數進行優化,使專家參數最小化。

學生策略

在第二階段,作者訓練一個學生網絡來預測專家策略采取的最優行動,在同樣的觀察的條件下,通過劇烈變化的圖像來進行測試。在這個階段不需要進一步接觸獎勵信號。

從形式上來看,學生策略也是一個深度卷積神經網絡,但與專家策略不同的是它有著不同的架構。本質上來說,學生策略是根據DAgger模仿流程,從專家策略中延伸而來的。

作者使用專家策略來收集軌跡的初始數據集D。接下來,在每一次迭代中,選擇一個強擴增算子,并將其應用于采樣的一批觀測數據。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

作者通過將原有視覺元素進行插入色塊(Cc)、隨機卷積(Cv)、補充高斯噪聲(G)以及添線性混合(M)等方式來生成不同的視覺樣本。

作者還研究了以上的組合,并試圖發現從低頻和高頻結構噪聲中的隨機抽樣產生最佳的總體結果。作者注意到,在混合中添加隨機裁剪略微有利于性能的提升,可能是因為它改善了學生策略表征的空間不變性。

實驗內容

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

四種不同場景的視覺策略泛化基準測試(從上至下):DMControl Suite、CARLA、Robosuite和iGibson

首先,作者提出了一個適用于四種不同領域的基準測試,系統地評估視覺agent的泛化能力。

在每個領域中,團隊研究了在一個環境中訓練的算法,在零樣本設置中的各種未見環境中的表現如何。此時沒有獎勵信號和額外的試驗。

在每個任務中,SECANT以之前的SOTA算法為基準:SAC、SAC+crop、DR、NetRand、SAC+IDM和PAD。

DMControl

研究團隊依照前人的設置,使用來自DMControl的8個任務進行實驗。

測量泛化能力,隨機生成背景和機器人本身的顏色,將真實的視頻作為動態背景。

除了一項任務外,SECANT在所有任務中都顯著優于先前的SOTA,通常高出88.3%。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

所有方法都經過50萬步訓練,有密集的任務特定獎勵。

Robosuite:機器人操作模擬器

Robosuite是用于機器人研究的模塊化模擬器。

作者在4個具有挑戰性的單臂和雙手操作任務上對SECANT和先前方法進行了基準測試。

使用具有操作空間控制的Franka Panda機器人模型,并使用特定于任務的密集獎勵進行訓練。

所有agent都接收一個168×168以自我為中心的RGB視圖作為輸入。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

與之前SOTA相比,SECANT有337.8%的提升

實驗表明,與之前的最佳方法相比,SECANT在簡單設置中獲得的獎勵平均增加了287.5%,在困難設置中增加了374.3%,在極端設置中增加了351.6%。

CARLA:自動駕駛模擬器

為了進一步驗證SECANT對自然變化的泛化能力,作者在CARLA模擬器中構建了一個具有視覺觀察的真實駕駛場景。

測試目標是在1000個時間步長內沿著8字形高速公路(CARLA Town 4)行駛盡可能遠,不與行人或車輛發生碰撞。

agent在「晴朗的中午」情景接受訓練,并在中午和日落時對各種動態天氣和光照條件進行評估。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA
李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

例如,潮濕天氣的特點是道路具有高反射點。經過平均每個天氣超過10集和5次訓練運行,SECANT在測試中能夠比之前的SOTA行駛的距離增加47.7%。

iGibson:室內物體導航

iGibson是一個交互式模擬器,有高度逼真的3D房間和家具。

在這個模擬器中,實驗的目標是盡可能接近一盞燈。

獎勵函數激勵agent使燈在視野中所占的像素比例最大,當這個比例在連續10個步驟中超過5%時就算成功。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

在本測試中,在未見過的房間里,SECANT的成功率比之前的方法高出15.8%。

作者簡介

[[412773]]

本文一作是李飛飛門下得意弟子Linxi Fan,他畢業于上海實驗中學,本科就讀于紐約哥倫比亞大學,目前在斯坦福大學攻讀博士,主修計算機視覺、強化學習以及機器人技術。在英偉達實習期間完成了本論文。

[[412774]]

本文二作黃德安同樣師從李飛飛,本科畢業于國立臺灣大學,獲得了卡內基梅隆大學碩士學位。目前在斯坦福大學計算機科學專業攻讀博士學位,在NVIDIA做泛化學習類研究。

[[412775]]

三作禹之鼎也是來自NVIDIA的科學家,獲得華南理工大學電機工程聯合班學士學位、香港科技大學電子工程學士學位,2017年在卡內基梅隆大學獲得了ECE博士學位。

2018年加入英偉達,現在是英偉達機器學習研究組的高級研究科學家。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-02-06 11:25:50

2012-07-25 09:37:22

虛擬化

2025-02-06 08:45:22

2022-06-13 11:57:04

谷歌模型計算

2024-02-07 12:13:19

AI數據

2025-04-21 08:26:00

模型強化學習AI

2024-06-25 09:35:04

模型訓練

2025-02-07 10:10:05

MusicMagus擴散模型音樂編輯

2025-10-14 13:56:59

AI3D模型

2023-05-19 13:49:17

神經網絡AI

2021-09-08 17:23:33

谷歌模型開發

2024-10-14 14:30:00

2025-02-08 11:12:34

ZAPS影像模型

2024-11-20 16:51:00

目標檢測模型

2023-02-24 10:22:15

2025-05-09 07:45:23

存儲系統數據安全

2024-09-12 08:00:00

2024-09-03 14:30:00

機器人模型

2025-02-06 14:28:16

2022-10-25 13:50:40

模型參數
點贊
收藏

51CTO技術棧公眾號

91av在线不卡| 亚洲国产欧美久久| 警花观音坐莲激情销魂小说 | 久久精品首页| 色偷偷9999www| 97精品人人妻人人| 日韩三区免费| 亚洲国产裸拍裸体视频在线观看乱了| 欧美不卡三区| 国产三级伦理片| 羞羞视频在线观看欧美| 久久久久99精品久久久久| 国产熟女高潮一区二区三区| 激情欧美一区二区三区黑长吊| 亚洲精品ww久久久久久p站| 欧美日韩国产高清视频| 国产超碰人人模人人爽人人添| 久久精品91| 欧美黑人一级爽快片淫片高清| 亚洲а∨天堂久久精品2021| 成人香蕉社区| 欧美日产在线观看| 黑人糟蹋人妻hd中文字幕| bestiality新另类大全| 久久综合给合久久狠狠狠97色69| 亚洲综合视频1区| 亚洲性猛交富婆| 国产麻豆综合| 欧美精品激情在线观看| 黄色精品视频在线观看| 色综合综合网| 亚洲美女性视频| 91精品又粗又猛又爽| 亚洲欧美专区| 欧美日韩一区二区三区免费看| www国产精品内射老熟女| 污片视频在线免费观看| 综合婷婷亚洲小说| 日本一区高清不卡| 嫩草在线播放| 91亚洲精品久久久蜜桃| 国产精品播放| 亚洲av综合色区无码一区爱av| 久久精品国内一区二区三区| 国产成人精品久久二区二区91| 国产香蕉视频在线| 99香蕉国产精品偷在线观看| 欧美激情视频在线免费观看 欧美视频免费一 | 91老师片黄在线观看| 国产99视频精品免费视频36| 国产ts变态重口人妖hd| 激情久久久久久久久久久久久久久久| 国产精品xxx视频| 精品一区二区无码| 久久精品亚洲| 国产精品丝袜视频| 亚洲熟妇av乱码在线观看| 日本不卡一二三区黄网| 国产免费一区二区三区在线观看| 综合久久中文字幕| 免播放器亚洲一区| 91亚洲人电影| 性生交生活影碟片| 成人毛片老司机大片| 国产女人水真多18毛片18精品| 刘玥91精选国产在线观看| www.爱久久.com| 久久精品午夜一区二区福利| 黄色av免费在线观看| 国产婷婷色一区二区三区四区| 日韩av一区二区三区美女毛片| 成人在线播放视频| 自拍偷拍亚洲欧美日韩| 国产欧美久久久久| 国产高清自产拍av在线| 色综合久久66| 性欧美在线视频| 免费欧美网站| 日韩av在线免费| 久久久久久久久久久久| 欧美激情成人| 国内精品小视频| 免费看日批视频| 免费成人在线观看| 91免费观看| 欧美老女人性开放| 成人欧美一区二区三区白人 | 国产夫妻在线播放| 欧美三日本三级三级在线播放| 天堂在线精品视频| 无码少妇一区二区三区| 色偷偷偷亚洲综合网另类| 欧美日韩大片在线观看| 母乳一区在线观看| 亚洲aaa激情| 久草在线免费福利资源| 亚洲日韩欧美一区二区在线| 99热亚洲精品| 欧美日韩视频免费看| 精品久久久久久久人人人人传媒| 日韩毛片无码永久免费看| 欧美fxxxxxx另类| 青青草原成人在线视频| 国产精品一级二级| 26uuu久久天堂性欧美| 国产精品99久久久久久大便| 精精国产xxxx视频在线播放| 欧美男生操女生| 中文字幕 日本| 99久久影视| 人人爽久久涩噜噜噜网站| 国产高清第一页| 中文字幕欧美日本乱码一线二线| www.国产在线播放| 四虎影视国产精品| 亚洲天堂开心观看| 国产一级特黄aaa大片| 久久精品国产精品亚洲红杏| 鲁片一区二区三区| 久久99亚洲网美利坚合众国| 欧美日韩激情在线| 日韩精品卡通动漫网站| 好看的日韩av电影| 51精品国产人成在线观看| 国产午夜在线视频| 欧美性猛交xxxx乱大交极品| 国产成人av片| 亚洲国产一区二区三区在线播放| 国产成人激情视频| 秋霞av在线| 精品露脸国产偷人在视频| 亚洲丝袜在线观看| 亚洲色图网站| 成人久久一区二区| xxxxx日韩| 日韩欧美高清视频| 给我看免费高清在线观看| 国内一区二区三区| 成人在线看片| sis001亚洲原创区| 欧美成人aa大片| 久草网站在线观看| 国产精品一区二区x88av| 免费看污污视频| 高清不卡一区| 久久资源免费视频| 国产福利免费视频| 亚洲一级在线观看| 亚洲av无码专区在线播放中文| 午夜精品亚洲| 成人免费视频视频在| 手机在线免费看av| 欧美v亚洲v综合ⅴ国产v| 免费在线视频观看| www.欧美日韩国产在线| 春日野结衣av| 久久99免费视频| 国产精品色视频| 一本一道波多野毛片中文在线| 精品视频资源站| 99热在线观看精品| 国产精品综合网| 欧美大黑帍在线播放| 成人18夜夜网深夜福利网| 97在线观看视频| 日本ー区在线视频| 欧美三级在线播放| 欧美日韩一级大片| a亚洲天堂av| 密臀av一区二区三区| 第一会所亚洲原创| 亚洲一区二区在线| 波多野结衣乳巨码无在线观看| 亚洲激情视频网| 成人免费毛片男人用品| 国产精品污www在线观看| 手机精品视频在线| 一本色道久久综合亚洲精品不卡| 欧美日韩一区在线观看视频| 久久精品国产精品亚洲毛片| 欧美精品在线播放| 午夜在线视频免费| 欧美三级一区二区| 亚洲国产精品午夜在线观看| 久久久久久久久岛国免费| 国产色视频在线播放| 国产精品大片| 日韩欧美视频第二区| 免费一区二区三区在线视频| 欧美亚洲伦理www| 蜜桃视频在线观看www社区| 亚洲白拍色综合图区| 在线视频精品免费| 亚洲激情图片一区| 久久久久久国产免费a片| 国产一区999| 成年人视频网站免费观看| 午夜免费一区| 麻豆精品传媒视频| 日本一区二区三区电影免费观看| 国产91免费看片| 天堂8中文在线| 色婷婷av一区二区三区久久| 手机av免费在线观看| 欧美日韩久久一区| 91porny在线| 亚洲精品v日韩精品| 最新中文字幕av| www.在线欧美| 久久久国产精品久久久| 看片网站欧美日韩| 精品视频一区二区在线| 国产精品vip| 一区二区三区三区在线| 国产一区二区三区探花| 国产精品久久精品国产| 精品入口麻豆88视频| 国产精品久久二区| 永久免费毛片在线播放| 欧美韩国理论所午夜片917电影| 91caoporn在线| 亚洲天堂男人的天堂| 欧美一区二区黄片| 精品久久久久久久久久久久久久久久久| 国产成人av免费| 色婷婷香蕉在线一区二区| 国产成人精品a视频一区| 一区二区在线观看不卡| 欧美日韩国产一二三区| 欧美国产欧美综合| 国精产品一区二区三区| 91丨九色丨黑人外教| 日韩免费高清一区二区| 成人网在线播放| 久久久久国产免费| 高清在线成人网| 波多野结衣电影免费观看| 国产在线不卡视频| www.色就是色.com| 久久99精品国产麻豆不卡| 性欧美videossex精品| 日韩精品一二三四| 能看的毛片网站| 肉丝袜脚交视频一区二区| 91看片就是不一样| 快she精品国产999| 日韩av手机版| 美女视频黄 久久| 一级做a免费视频| 精品一区二区免费| 久久久久久久久久毛片| 国产麻豆欧美日韩一区| 日本人dh亚洲人ⅹxx| 国产iv一区二区三区| 精品无码av一区二区三区| 成人禁用看黄a在线| 成人免费毛片日本片视频| 91在线播放网址| 午夜时刻免费入口| 中文字幕在线观看一区| 人人澡人人澡人人看| 亚洲精品国产精华液| 久久久久久久久久综合| 激情久久av一区av二区av三区| 97久久久久久久| 在线观看视频91| 国产精品无码免费播放| 精品国产乱子伦一区| 日韩精品一二| 三级精品视频久久久久| 污污视频在线| 亲子乱一区二区三区电影| 福利一区视频| 国产高清在线一区二区| 亚洲美女久久| 一区二区三区偷拍| 黄色在线成人| 黄色一级大片在线观看| 久久99深爱久久99精品| 国产免费a级片| 久久亚洲精品小早川怜子| 女人裸体性做爰全过| 亚洲国产美国国产综合一区二区| 无码人妻黑人中文字幕| 欧美一区二区三区不卡| 日韩av成人| 久久亚洲国产精品成人av秋霞| av手机在线观看| 国产精品日韩在线一区| av在线亚洲色图| 亚洲精品国产精品国自产观看| 欧美日韩三级电影在线| 日韩免费高清在线| 国产精品亚洲专一区二区三区| 日韩乱码人妻无码中文字幕久久| 亚洲日本在线天堂| 亚洲第一在线播放| 日韩一区二区免费在线电影| 男女网站在线观看| 欧美成人h版在线观看| 色婷婷综合久久久中字幕精品久久| 亚洲qvod图片区电影| 亚洲人成网亚洲欧洲无码| 99热都是精品| 日韩高清电影一区| 艳妇乳肉豪妇荡乳xxx| 中文字幕欧美一| 日韩熟女一区二区| 精品黑人一区二区三区久久| 香蕉视频国产在线观看| 欧美一级电影久久| 豆花视频一区二区| 国产欧美综合一区| 麻豆国产精品一区二区三区 | 一区二区三区在线免费播放| 夜夜躁日日躁狠狠久久av| 精品国产麻豆免费人成网站| 麻豆最新免费在线视频| 国产精品久久久久77777| 老汉色老汉首页av亚洲| 欧美黑人在线观看| 麻豆国产精品777777在线| www.av天天| 狠狠躁夜夜躁久久躁别揉| 狠狠躁日日躁夜夜躁av| 久久久精品美女| 日韩毛片免费视频一级特黄| 日韩福利一区二区三区| 亚洲一区日韩| 黄色污在线观看| 亚洲成人av资源| 亚洲欧美强伦一区二区| 久国内精品在线| 久久影院一区二区三区| 国产又黄又爽免费视频| 久久精品99国产精品| 久久一级免费视频| 欧美色综合影院| 亚洲视频tv| 成人国产精品久久久久久亚洲| 日韩精品一区二区三区免费观看| 国产又粗又长又大的视频| 国产日韩综合av| 18国产免费视频| 中文字幕亚洲自拍| 日韩精品第二页| 成人免费看片视频在线观看| 国产一区日韩二区欧美三区| 卡通动漫亚洲综合| 日韩三级视频在线看| 日本成人不卡| 国产一区免费| 亚洲永久在线| 蜜乳av中文字幕| 欧美日韩高清一区| 国产91在线视频蝌蚪| www.久久久| 欧美一区=区| 69xxx免费| 91麻豆精品国产自产在线| 在线免费观看污| 久久99精品久久久久子伦| 久久久久久一区二区| 刘亦菲国产毛片bd| 欧美大片一区二区| av资源网在线播放| 日本在线观看一区二区| 另类综合日韩欧美亚洲| 免费人成在线观看| 亚洲精品白浆高清久久久久久| 欧美亚洲大片| 浴室偷拍美女洗澡456在线| 不卡视频一二三四| 亚洲中文一区二区| 久久精品亚洲精品| 国内精品国产成人国产三级粉色| 日韩av片在线看| 亚洲欧洲精品成人久久奇米网| 亚洲经典一区二区三区| 日韩免费在线观看视频| 91视频综合| 在线观看亚洲免费视频| 欧美中文字幕一二三区视频| h片在线免费观看| 免费在线观看一区二区| 久久99精品国产麻豆不卡| 国产成人自拍视频在线| 中文字幕欧美精品日韩中文字幕| 日韩激情欧美| 热久久精品免费视频| 一区二区三区免费网站| 国产无套粉嫩白浆在线2022年| 91精品久久久久久蜜桃| 快she精品国产999| 久久免费视频6| 有码中文亚洲精品| 国产精品17p| 污污的视频免费观看| 色老汉一区二区三区| 午夜小视频在线观看|