精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當世界模型被用于sim2real:機器人通過視覺想象和交互嘗試來學習

新聞 人工智能
當機器人被置于一個新環境時,它必須能夠利用其先前的知識來思考環境可能提供的潛在有用行為。

 本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

人類是如何掌握這么多技能的呢?好吧,最初我們并非如此,但從嬰兒時期開始,我們通過自監督發覺并練習越來越復雜的技能。但這種自監督并不是隨機的——兒童發展文獻表明,嬰兒利用他們先前的經驗,通過互動和感官反饋,對移動性、吸吮性、抓握性和消化性等可供性(affordance,也譯作功能可供性、承擔特質、直觀功能、預設用途、可操作暗示、示能性等,指事物能夠提示其可以幫助人們做什么的一種屬性或特征)進行定向探索。這種類型的定向探索允許嬰兒在既定環境中學習可以做什么以及如何做。那么,在機器人學習系統中,我們是否也可以實例一個類似于可供性定向探索的策略?

如下圖所示。在左側,我們先收集了由機器人完成各種任務的視頻,比如打開和關閉抽屜、抓取和移動物體。在右側,我們放置了一個機器人從未見過的蓋子。機器人被給予一小段時間來熟悉這個新物體,之后它將獲得一個目標圖像,并負責使場景匹配這個圖像。機器人如何在沒有任何外部監督的情況下迅速學會操控環境并抓住蓋子?

為此,我們面臨幾項挑戰。當機器人被置于一個新環境時,它必須能夠利用其先前的知識來思考環境可能提供的潛在有用行為。然后,機器人必須能夠實際地練習這些行為。為了在新的環境中改進自己,機器人必須能夠在沒有外部獎勵的情況下以某種方式評估自己的成功。

如果我們能可靠地戰勝這些挑戰,就能為一個強有力的循環打開大門。在這個循環中,我們的智能體使用先前的經驗來收集高質量的交互數據,然后進一步增長它們以往的經驗,不斷提高它們的潛在效用!

1、VAL:視覺運動可供性學習

我們的方法,視覺運動可供性學習(Visuomotor Affordance Learning,簡稱VAL),解決了這些挑戰。在VAL中,我們首先假設可以獲得機器人在各種環境中展示可供性的先驗數據集。至此,VAL進入了一個離線階段,該階段使用這些信息學習 1)想象新環境中有用的可供性生成模型,2) 用于有效探索這些可供性的強大離線策略,以及 3) 改進該策略的自我評估度量。最后,VAL已準備好進入在線階段。智能體被放置在一個新的環境中,現在可以使用這些學到的功能來進行自監督的微調。整個框架如下圖所示。隨后,我們將深入探討離線和在線階段的技術細節。

2、VAL:離線階段

給定一個展示各種環境可供性的先驗數據集,VAL在三個離線步驟中消化這些信息:用于處理高維真實世界數據的表示學習,在未知環境中實現自監督練習的可供性學習,用于獲得高性能的初始策略以加快在線學習效率的行為學習。

首先,VAL使用矢量量化變分自動編碼器(VQVAE)學習該數據的低維表示。這個過程將我們的48x48x3圖像壓縮到144維的潛在空間。

在這個潛在空間的距離是有意義的,為我們自我評價成功的關鍵機制鋪平了道路。給定當前圖像s和目標圖像g,我們將它們編碼進潛在空間,并設定它們可以獲得獎勵的距離閾值。

隨后,我們還將使用這個表示作為我們潛在空間的策略和Q函數。

接下來,VAL 通過在潛在空間中訓練 PixelCNN 來學習可供性模型,以學習以環境圖像為條件的可達狀態分布。這是通過最大化數據的似然 p(sn|s0) 來完成的。我們使用這種可供性模型進行定向探索和重新標記目標。

可供性模型如右圖所示。在該圖的左下方,我們看到條件圖像包含一個罐子,右上方解碼的潛在目標顯示了不同位置的蓋子。這些連貫的目標將允許機器人進行連貫的探索。

最后在離線階段,VAL必須從離線數據中學習行為,然后可以通過額外的在線交互式數據收集進行改進。

為了實現這一點,我們使用加權強化學習算法(Advantage Weighted Actor Critic)在先驗數據集上訓練目標條件策略,這是一種專為離線訓練和在線微調而設計的算法。

3、VAL:在線階段

現在,當VAL被放置在一個未見過的環境中時,它使用其先前的知識來想象有用可供性的視覺表示,通過嘗試實現這些可供性來收集有用的交互數據,使用其自我評估指標更新其參數,并一直重復整個過程。

在這個真實的例子中,在左側我們看到了環境的初始狀態,它提供了打開抽屜和其他任務的功能。

在步驟1中,可供性模型對潛在目標進行采樣。通過解碼目標(使用 VQVAE 解碼器,在RL期間從未實際使用過,因為我們完全在潛在空間中操作),我們可以看到可供性是打開抽屜。

在步驟2中,我們使用具有采樣目標的訓練策略。我們看到它成功打開了抽屜,實際上它拉太大力了,直接把抽屜拉了出來。但這為RL算法進一步微調和完善其策略提供了極其有用的交互。

在線微調完成后,我們現在可以評估機器人在每個環境中實現相應的未見過的目標圖像的能力。

4、真實環境評估

我們在五個真實的測試環境中評估我們的方法,并評估VAL在無監督微調之前和五分鐘之后完成環境提供的特定任務的能力。

每個測試環境至少包含一個未見過的交互對象和兩個隨機抽樣的干擾對象。例如,當訓練數據中有打開和關閉抽屜時,新的抽屜有沒見過的把手。

每個測試,我們都從離線訓練策略開始,它每次完成任務的方式都不一致。然后,我們使用我們的可供性模型收集更多經驗來采樣目標。最后,我們評估經過微調的策略,它能始終一致地完成任務。

我們發現,在這些環境中,VAL在離線訓練后始終顯示出有效的零樣本泛化,隨后通過其可供性導向的微調方案快速改進。與此同時,先前的自監督方法在這些新環境中幾乎沒有改善。這些令人興奮的結果表明,像VAL這樣的方法具有使機器人成功操縱的潛力,遠遠超出它們現在習慣的有限的出廠設置。

我們的2,500個高質量機器人交互軌跡數據集,涵蓋20個抽屜把手,20個鍋把手,60個玩具和60個干擾物,現已在我們的網站上公開發布。

數據集地址:https://sites.google.com/view/val-rl/datasets

5、模擬評估與代碼

為了進一步分析,我們在具有視覺和動態變化的程序生成的多任務環境中運行 VAL。場景中的對象以及它們的顏色和位置都是隨機的。媒介可以用把手打開抽屜、抓取物體并移動它們、按按鈕打開隔間等等。

給定機器人一個包含各種環境的先驗數據集,并根據其在以下測試環境中的微調能力進行評估。

同樣,給定一個單一的非策略數據集,我們的方法可以快速學習高級操作技能,包括抓取物體、打開抽屜、移動物體,以及對各種新對象使用工具。

環境和算法代碼均已公開,請查閱我我們的代碼庫。

代碼地址:https://github.com/anair13/rlkit/tree/master/examples/val

6、未來的工作

就像計算機視覺和自然語言處理等領域的深度學習是由大型數據集和泛化驅動的一樣,機器人可能需要從類似規模的數據中學習。正因為如此,離線強化學習的改進對于使機器人能夠利用大型先驗數據集至關重要。此外,這些離線策略要么需要快速的非自主微調,要么需要完全自主的微調,以便在現實世界中部署是可行的。最后,一旦機器人獨立運行,我們就能獲得源源不斷的新數據,這就強調了終身學習算法的重要性和價值。

 

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2021-05-14 13:42:45

機器人人工智能技術

2025-09-02 10:23:24

2025-10-28 09:13:58

2024-10-14 14:30:00

2025-10-03 00:40:00

2021-07-22 10:17:55

加密機器人加密貨幣機器人

2024-09-18 13:30:00

2025-09-17 18:03:37

2023-07-31 16:19:47

機器人人工智能

2020-09-14 14:32:06

AI機器人人工智能

2017-04-05 10:05:57

深度學習機器人

2022-07-26 14:11:50

機器人計算機視覺

2017-05-08 12:05:51

機器人智慧養老人工智能

2016-02-16 10:30:32

機器人

2024-06-04 14:16:00

機器人AI

2025-03-19 10:26:10

2024-12-27 11:52:25

GRAPEVLA 模型人工智能

2022-07-31 21:36:30

工業機器人機器人

2024-08-23 08:13:38

點贊
收藏

51CTO技術棧公眾號

亚洲一级免费在线观看| 欧美二区三区在线| 青娱乐国产在线视频| 亚洲va欧美va人人爽成人影院| 亚洲一区在线观看视频| 久久久久久国产精品mv| 日韩乱码一区二区三区| 欧美在线三区| 日韩精品欧美激情| 国产喷水theporn| 在线黄色网页| 久久久国产一区二区三区四区小说| 国产精品永久免费视频| 久久精品欧美一区二区| 欧美精品羞羞答答| 精品人在线二区三区| 国产三级三级三级看三级| 日本三级韩国三级欧美三级| 久久久久久久久免费| 亚洲尤物视频网| 亚洲图片欧美日韩| 激情亚洲成人| www国产精品com| 中文字幕av网址| 视频一区中文字幕精品| 欧美日韩在线精品一区二区三区激情| 久久av综合网| 精品黄色免费中文电影在线播放| 久久精品亚洲国产奇米99| 99精品国产高清一区二区| 精品国产www| 亚洲专区一区| 午夜精品美女自拍福到在线| 麻豆精品国产免费| 欧美理论视频| 亚洲欧美一区二区三区四区| 亚洲天堂美女视频| 久久久久久久久成人| 欧美日韩一区高清| 一本色道无码道dvd在线观看| 美女精品导航| 亚洲另类在线视频| 在线一区日本视频| 艹b视频在线观看| 国产人妻精品一区二区三| 日韩精品一二三区| 欧美一区第一页| 国产污污视频在线观看| 黄色av日韩| 欧美肥臀大乳一区二区免费视频| av在线免费播放网址| 欧美影院三区| 一区二区三区亚洲| 国产又黄又粗视频| 欧美色图在线播放| 在线精品视频视频中文字幕| 色一情一交一乱一区二区三区| 日韩高清成人在线| 日韩久久精品成人| 男人操女人动态图| 欧美日韩国产高清电影| 亚洲欧美日韩精品| 91精品人妻一区二区三区| 欧美欧美黄在线二区| 亚洲欧美精品suv| 国产视频三区四区| 四季av一区二区凹凸精品| 日韩在线视频网站| 国产女人18水真多毛片18精品| 91成人网在线观看| 欧美激情精品久久久久久大尺度| 日本a在线观看| 国产欧美不卡| 国产精品久久999| 中文在线字幕免费观| 久久er99精品| 99国产在线| 香港一级纯黄大片| 国产欧美日韩不卡| 亚洲美女自拍偷拍| 人人超在线公开视频| 午夜精品福利一区二区蜜股av| 日韩精品视频一区二区在线观看| 精品视频在线一区二区在线| 91精品国产综合久久婷婷香蕉 | 99鲁鲁精品一区二区三区| 亚洲色图网站| 91精品国产91| 亚洲特级黄色片| 高清av一区二区| 日韩电影大全在线观看| 99福利在线| 岛国av一区二区| 亚洲精品第三页| 国产精品久久久网站| 亚洲人成网站免费播放| 日韩精品123区| 在线亚洲伦理| 国产在线播放不卡| 天天射天天色天天干| 国产女人18水真多18精品一级做| 国产大尺度在线观看| 97超碰在线免费| 欧美日韩夫妻久久| 国模私拍在线观看| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 日韩精品一区二区三区中文| 精品一区二区三区三区| 国产精品丝袜一区二区| 久久影院亚洲| 懂色中文一区二区三区在线视频| yourporn在线观看视频| 夜夜精品视频一区二区| www.com操| 亚洲精品进入| 欧美日韩国产成人| 亚洲天堂网在线观看视频| 成人18精品视频| 青青草原国产免费| 蜜桃精品在线| 精品亚洲一区二区三区| 久久久久久久国产精品毛片| 免费观看日韩av| 久久偷窥视频| tube8在线hd| 91精品国产免费| 日本成人免费在线观看| 久久亚洲欧美| 国产精品亚洲一区| av片在线观看网站| 欧美日韩高清一区| xxxxx99| 日韩国产高清在线| 久久综合一区二区三区| www.超碰在线| 精品盗摄一区二区三区| 成人信息集中地| 久久99热这里只有精品| 日韩精品欧美在线| 欧美极品免费| 亚洲人成电影在线观看天堂色| 中文字幕亚洲精品一区| 成人97人人超碰人人99| 亚洲国产精品成人天堂| 97精品久久| 久久久久久久香蕉网| www.麻豆av| 亚洲人成影院在线观看| 日日干日日操日日射| 日韩理论在线| 成人福利视频在线观看| 免费av不卡| 欧美精选在线播放| 日本黄色录像视频| 国产综合久久久久影院| 伊人久久大香线蕉av一区| 欧美电影在线观看网站| 在线视频精品一| 亚洲色成人www永久在线观看| 色8久久久久| 久久av.com| www.综合色| 亚洲v精品v日韩v欧美v专区| 91九色蝌蚪porny| 一区在线免费| 久久伊人资源站| 日韩精品三区| 日韩视频在线免费| 国产aⅴ一区二区三区| 亚洲一区二区黄色| 日本一卡二卡在线| 久久久亚洲人| 一区二区三区|亚洲午夜| 国产精品色婷婷在线观看| 久热99视频在线观看| 国内爆初菊对白视频| 黄色一区二区在线| 毛片网站免费观看| 麻豆精品精品国产自在97香蕉| 在线国产伦理一区| 亚洲一区二区免费在线观看| 777777777亚洲妇女| 成人精品一区| 欧美va日韩va| 青青国产在线视频| 亚洲美女免费视频| 国产精品探花一区二区在线观看| 日本sm残虐另类| 国产精品88久久久久久妇女| 亚洲人成网亚洲欧洲无码| 国产精品天天狠天天看| 成人在线高清免费| 欧美无人高清视频在线观看| 视频国产一区二区| 97久久精品人人澡人人爽| 亚洲福利精品视频| 黄色日韩在线| 一区二区三区四区欧美| 国内露脸中年夫妇交换精品| 国产精品日本精品| 阿v视频在线观看| xxxxx成人.com| 亚洲欧美丝袜中文综合| 日韩一区二区三区电影 | 国产精品www994| 欧美一级二级三级| 大陆精大陆国产国语精品| 国产精品美腿一区在线看| 国产蜜臀在线| 久久精品一偷一偷国产| 黄色免费在线播放| 精品电影一区二区| aaa一区二区| 欧美优质美女网站| 成年人视频在线免费看| 亚洲综合一二区| 日本一级片免费| 欧美国产一区视频在线观看| 亚洲中文字幕无码av| 国产精品一区免费在线观看| 最新中文字幕免费视频| 国产精品日本欧美一区二区三区| 久久久久久久久久久久久国产| 成人激情诱惑| 欧美极品一区二区| 欧美电影在线观看免费| 国产高清一区二区三区| 99精品在线免费观看| 国产精品一久久香蕉国产线看观看| 性欧美又大又长又硬| 欧美黑人国产人伦爽爽爽| 免费在线观看黄| 最近2019年手机中文字幕| 日产精品久久久久久久性色| 精品国产一区二区在线观看| 精品黑人一区二区三区在线观看 | 色综合视频在线| 精品国产不卡一区二区三区| 国产精品羞羞答答在线| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 丁香六月婷婷综合| 欧美日韩精品在线观看| 在线看成人av| 黄色一区二区在线观看| 国产精品久久久久久久妇| 欧美日韩国产一区二区| 国产精品7777777| 精品久久久久久久久久| 精品美女久久久久| 欧美性猛交xxxx久久久| 午夜影院免费在线观看| 欧美视频在线观看免费网址| av图片在线观看| 在线看一区二区| 在线观看日韩一区二区| 欧美丰满少妇xxxxx高潮对白| 国产免费不卡av| 日韩美女视频在线| 亚洲女同志亚洲女同女播放| 亚洲韩国青草视频| 欧美色综合一区二区三区| 亚洲男人的天堂在线播放| 都市激情在线视频| 91久久精品国产91性色tv| 91午夜精品亚洲一区二区三区| 色一情一乱一乱一91av| 中文字幕乱码在线观看| 欧美剧情片在线观看| 成 人 免费 黄 色| 日韩激情视频在线| 国产高清在线| 久久国产精品久久国产精品| 黄色影院在线看| 琪琪亚洲精品午夜在线| 精品女同一区二区三区在线观看| 91亚洲精品一区二区| jazzjazz国产精品麻豆| 欧美日韩精品免费看| 日本一区二区免费高清| 免费极品av一视觉盛宴| 六月丁香综合| 亚洲综合中文网| 91麻豆免费观看| 亚洲一级二级片| 偷窥国产亚洲免费视频| 在线观看中文字幕码| 日韩美女视频在线| 高清av在线| 欧美激情精品久久久久久黑人| 色婷婷综合久久久中字幕精品久久 | 午夜视频久久久| 午夜精品av| 日韩av片网站| 成人激情文学综合网| 黄大色黄女片18免费| 午夜视频在线观看一区| 在线中文字幕网站| 亚洲精品按摩视频| 91xxx在线观看| 欧美亚洲视频在线观看| av在线精品| 日本一区二区三不卡| 国产在线成人| 一级黄色特级片| 久久―日本道色综合久久| 丁香花五月激情| 欧美天堂一区二区三区| 天堂在线资源库| 不卡av电影在线观看| 国产v综合v| 好看的日韩精品| 午夜精品亚洲| 玖玖爱视频在线| 久久久噜噜噜久久人人看 | 国产精品99免费看| 五月天av在线播放| 久久久久久久国产精品影院| 国产在线成人精品午夜| 91精品国产91热久久久做人人| 国产乱视频在线观看| 91豆花精品一区| youjizz欧美| 免费的一级黄色片| 精品综合久久久久久8888| 自拍偷拍视频亚洲| 日韩欧美在线视频日韩欧美在线视频| 亚洲a视频在线| 欧美成人黑人xx视频免费观看| 国产极品嫩模在线观看91精品| 欧美成人综合一区| 中文亚洲免费| 一女三黑人理论片在线| 亚洲成人免费在线| 精品人妻一区二区三区麻豆91 | 日韩久久久久久久| 国产精品视频| 精品中文字幕在线播放| 亚洲成人777| 熟妇人妻一区二区三区四区| 久久久噜久噜久久综合| 日韩精品一区二区三区中文在线| 热这里只有精品| 国产呦精品一区二区三区网站| 99自拍偷拍视频| 欧美另类久久久品| 黄色网址视频在线观看| 成人激情视频网| 伊人情人综合网| 18禁一区二区三区| 亚洲一区中文在线| 人妻少妇精品无码专区久久| 国外成人免费在线播放| 精品亚洲免a| 久久综合九色综合88i| 91麻豆免费看| 波多野结衣视频观看| 自拍偷拍亚洲欧美| 先锋影音一区二区| 九一免费在线观看| 福利一区福利二区| 国产精品视频123| 伊人久久大香线蕉av一区二区| 六九午夜精品视频| 9l视频自拍9l视频自拍| 国产精品一区二区三区四区| 国产在线综合网| 国产视频久久久久久久| 91成人在线| 日本xxx免费| 不卡电影免费在线播放一区| 亚洲婷婷综合网| www.xxxx精品| 第一区第二区在线| 中文字幕无码不卡免费视频| 国产精品家庭影院| 午夜精品久久久久久久99热黄桃| 97国产精品视频| 日韩一区亚洲二区| 日本女人性视频| 欧美性生交xxxxxdddd| 午夜激情在线观看| 国产高清在线一区| 久久久噜噜噜| 美女的奶胸大爽爽大片| 亚洲国产精品人久久电影| 亚洲综合av一区二区三区| 亚洲欧美日韩不卡| 久久综合久久综合九色| 一级片视频播放| 亚州av一区二区| 欧美疯狂party性派对| 亚洲天堂av网站| 欧美日韩在线三区| 国产伦子伦对白在线播放观看| 亚洲成人午夜在线| 成人在线一区二区三区| 中文字幕一区二区三区免费看 | 中文字幕久精品免| a级精品国产片在线观看| 中文字幕久久久久|