精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

新聞 人工智能 算法
谷歌團隊在CoRL 2021上提出了一種隱式行為克隆 (Implicit BC) 算法,該方法在7項測試任務中的6項上優于此前最佳的離線強化學習方法(Conservative Q Learning)。

 [[440499]]

谷歌團隊在CoRL 2021上提出了一種隱式行為克隆 (Implicit BC) 算法,該方法在7項測試任務中的6項上優于此前最佳的離線強化學習方法(Conservative Q Learning)。Implicit BC在現實世界中表現也得特別好,比基線的顯式行為克隆(explicit BC)模型好10倍。

盡管過去幾年中,機器人學習取得了相當大的進步,但在模仿精確或復雜的行為時,機器人代理的一些策略仍難以果斷地選擇動作。

要讓機器人把桌子上的小滑塊精確地滑進一個插槽里。解決這個任務有很多方法,每種方法都需要精確的移動和修正。機器人只能采取這些策略選項中的一個,還必須在每次滑塊滑得比預期的更遠時及時改變策略。

人類可能認為這樣的任務很容易,但對于機器人來說,情況往往并非如此,它們經常會學習一些人類專家看來「優柔寡斷」或「不精確」的行為。

機器人需要在桌子上滑動滑塊,然后將其精確插入固定裝置,顯式行為克隆模型表現得很猶豫

為了讓機器人更加果斷,研究人員經常利用離散化的動作空間,迫使機器人進行明確的「二選一」,而不是在選項之間搖擺不定。

比如,離散化是近年來很多游戲agent著名模型的固有特征,比如AlphaGo、AlphaStar 和 OpenAI 打Dota的AI agent。

[[440501]]

但離散化有其自身的局限性——對于在空間連續的現實世界中運行的機器人來說,離散化至少有兩個缺點:

  1. 精度有限。
  2. 因計算維度導致成本過高,許多離散化不同的維度會顯著增加內存和計算需求。在 3D 計算機視覺任務中,近期的許多重要模型都是由連續,而非離散表示來驅動的。

為了學習沒有離散化特征缺陷的決定性策略,谷歌團隊提出了一種隱式行為克隆 (Implicit BC) 的開源算法,這是一種新的、簡單的模仿學習方法,已經在 CoRL 2021 上展示。

該方法在模擬基準任務和需要精確和果斷行為的現實世界機器人任務上都取得了很好的結果。在7項測試任務中,隱式 BC 的性能在其中6項上優于此前最佳的離線強化學習方法(Conservative Q Learning)。

有趣的是,隱式 BC 在不需要任何獎勵信息的情況下實現了這些結果,即可以使用相對簡單的監督學習,而不是更復雜的強化學習。

隱式行為克隆(Implicit BC)

這種方法是一種行為克隆,可以說是機器人從演示中學習新技能的最簡單的方法。在行為克隆中,agent會學習如何通過標準監督學習模仿專家的行為。傳統的行為克隆一般是訓練一個顯式神經網絡(如下圖左所示),接受觀察并輸出專家動作。

而隱式行為克隆背后的關鍵思想是,訓練一個神經網絡來接受觀察和動作,并輸出一個數字,該數字對專家動作來說很低,對非專家動作來說很高,將行為克隆變成一個基于能量的建模問題。

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

顯式(左)和隱式(右)策略之間差異的描述。在隱式策略中,「argmin」表示與特定觀察配對時最小化能量函數值的動作。

訓練后,隱式行為克隆策略會查找對給定觀察具有最低能量函數值的動作輸入,以此生成動作。

為了訓練隱式 BC 模型,研究人員使用InfoNCE損失,讓網絡為數據集中的專家動作輸出低能量,為所有其他動作輸出高能量。有趣的是,這種使用同時接受觀察和行動的模型的思想在強化學習中很常見,但在有監督的策略學習中則不然。

上圖所示為隱式模型如何適應不連續性的動畫——在這種情況下,訓練隱式模型來適應一個步長(Heaviside)函數。左:擬合黑色訓練點的2D圖,顏色代表能量值(藍色低,棕色高)。中間:訓練期間能量模型的3D圖。右圖:訓練損失曲線。

一旦經過訓練,Google AI發現隱式模型(implicit model)特別擅長精確地建模先前顯式模型(explicit model)難以解決的不連續性問題,從而產生新的策略,能夠在不同行為之間果斷切換。

為什么傳統的顯式模型(explicit model)在這個問題上表現不佳呢?

現代神經網絡幾乎總是使用連續激活函數——例如,Tensorflow、Jax和PyTorch都只提供連續激活函數。

在試圖擬合不連續數據時,用這些激活函數構建的顯式網絡無法準確表示,因此必須在數據點之間繪制連續曲線。隱式模型(implicit model)的一個關鍵優勢是,即使網絡本身僅由連續層組成,也能夠表示出尖銳的不連續性。

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

與顯式模型(底部)相比,隱式模型(頂部)擬合不連續函數的示例。紅色突出顯示的插圖顯示,隱式模型表示不連續性(a)和(b),而顯式模型必須在不連續性之間畫出連續的線(c)和(d)

Google AI在這個方面建立了理論基礎,提出了一個普遍近似的概念,證明了隱式神經網絡可以表示的函數類別,這將有助于證明和指導未來的研究。

Google AI最初嘗試這種方法時面臨的一個挑戰是「高動作維度」,這意味著機器人必須決定如何同時協調多個電機。為了擴展到高作用維度,Google AI使用自回歸模型或朗之萬動力學。

全新SOTA

在實驗中,Google AI發現Implicit BC在現實世界中表現得特別好,在毫米精度的滑塊滑動及插槽任務上比基線的顯式行為克隆(explicit BC)模型好10倍。

在此任務中,隱式模型(implicit model)在將滑塊滑動到位之前會進行幾次連續的精確調整。

將滑塊精確地插入插槽的示例任務。這些是隱式策略的自主行為,僅使用圖像(來自所示的攝像機)作為輸入

這項任務有多種決定性因素:由于塊的對稱性和推動動作的任意順序,有許多不同的可能解決方案。

機器人需要決定滑塊何時已經被推動足夠遠,然后需要切換到向不同方向滑動。這一過程是不連續的,所以,連續控制型機器人在這一任務上會表現得十分優柔寡斷。

完成這項任務的不同策略。這些是來自隱式策略的自主行為,僅使用圖像作為輸入

在另一個具有挑戰性的任務中,機器人需要按顏色對滑塊進行篩選,由于挑選順序是很隨意的,這就產生了大量可能的解決方案。

頗具挑戰性的連續篩選任務中顯式BC模型的表現(4倍速度)

在這項任務中,顯式模型(explicit model)還是表現得很拿不準,而隱式模型(implicit model)表現得更好。

頗具挑戰性的連續篩選任務中隱式BC模型表現(4倍速度)

而且在Google AI的測試中,Implicit BC在面臨干擾時,盡管模型從未見過人類的手,也依然可以表現出強大的適應能力。

機器人受到干擾時,隱式BC模型的穩健行為

總的來說,Google AI發現,與跨多個不同任務領域的最先進的離線強化學習方法相比,Implicit BC策略可以獲得更好的結果。

Implicit BC可以完成很多具有挑戰性的任務,比如演示次數少(少至19次),基于圖像的觀察具有高觀察維度,還有高達30維的高動作維度,這就需要機器人充分利用自身具有的大量致動器。

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

隱式策略學習結果與跨多個域的基線進行了比較

盡管Implicit BC目前還有其局限性,但使用監督學習的行為克隆仍然是機器人從人類行為例子中學習的最簡單方法之一。

該工作表明,在進行行為克隆時,用隱式策略替換顯式策略可以讓機器人克服「猶猶豫豫」,使它們能夠模仿更加復雜和精確的行為。

雖然Implicit BC取得的實驗結果來自機器人學習問題上,但是隱式函數對尖銳不連續性和多模態標簽建模的能力可能在機器學習的其他領域也有更廣泛的應用。

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-12-19 14:39:29

機器人論文

2021-06-03 12:16:18

騰訊云機器人Robotics X

2020-05-20 12:44:53

編程軟件開發JavaScript

2010-02-05 10:31:46

谷歌機器人

2019-03-27 09:27:06

機器人人工智能系統

2024-07-16 13:15:23

2025-09-26 09:15:40

2025-02-21 13:00:00

2024-01-05 19:44:48

谷歌機器人憲法AI

2021-09-30 18:03:37

AI

2021-12-26 23:04:34

機器人人工智能技術

2021-04-19 20:30:06

機器人AI人工智能

2017-03-15 19:03:22

人工智能人類半機器人

2019-10-11 12:47:54

機器學習人工智能計算機

2021-04-21 13:56:32

人工智能機器學習

2024-01-05 09:16:22

谷歌機器人人工智能

2018-11-13 09:19:48

機器人人工智能系統

2021-12-13 17:53:19

谷歌Transformer技術

2021-10-27 10:41:06

機器人人工智能AI
點贊
收藏

51CTO技術棧公眾號

精品国精品自拍自在线| 91网站在线播放| 日韩在线观看高清| 手机在线视频一区| 三级网站视频在在线播放| 成人久久视频在线观看| 欧美专区中文字幕| 中文字幕第二区| 久久久久久亚洲精品美女| 亚洲电影一区二区| 日产精品久久久一区二区| 一级特黄aaaaaa大片| 欧美视频导航| 亚洲午夜精品久久久久久性色 | 激情婷婷综合网| 视频一区二区在线播放| 日日摸夜夜添夜夜添国产精品| 亚洲精品美女久久久久| 日韩在线不卡一区| 成年网站在线视频网站| 欧美激情一区在线观看| 亚洲精品日产aⅴ| 天天操天天摸天天干| jvid福利在线一区二区| 欧美成人一区二区三区片免费| 妺妺窝人体色www在线小说| 欧美三级黄网| 99re66热这里只有精品3直播| 国产精品电影在线观看| 国产福利视频网站| 久久99蜜桃| 日韩视频在线一区二区| 激情网站五月天| 中文字幕在线三区| 中文字幕第一区| 久久99精品国产一区二区三区| 亚洲图片小说视频| 国产精品综合色区在线观看| 久久九九全国免费精品观看| 特大黑人巨人吊xxxx| 欧美专区一区| 欧美日韩电影一区| 国产男女激情视频| av资源在线| 亚洲精品大片www| 婷婷四月色综合| 无码精品视频一区二区三区| 美女视频黄 久久| 热99久久精品| 精品成人免费视频| 综合天天久久| 日韩视频在线免费| 久久久久亚洲AV成人无在| 91麻豆精品国产91久久久久推荐资源| 欧美日韩国产综合草草| 久久久久免费精品| 偷拍精品精品一区二区三区| 精品久久久久久久久国产字幕| 在线观看成人av| 午夜毛片在线| 国产精品久久久久精k8| 日本一区二区三区视频免费看| 秋霞av在线| 91色综合久久久久婷婷| 国产一区免费观看| 欧美特级特黄aaaaaa在线看| 国产中文字幕一区| 国产主播精品在线| 91一区二区视频| 精品一区二区三区在线播放视频 | 宅男在线精品国产免费观看| 成人动漫在线免费观看| 国产三级精品三级| 日韩中文一区二区三区| 成人h小游戏| 国产精品成人免费在线| 在线观看成人一级片| 黄网页在线观看| 一二三四社区欧美黄| 国产精品日韩三级| av美女在线观看| 黄网动漫久久久| 18禁裸男晨勃露j毛免费观看| 啦啦啦中文在线观看日本| 亚洲丰满少妇videoshd| 91视频最新入口| 在线看的毛片| 在线观看一区日韩| 性chinese极品按摩| 亚洲成人a级片| 日韩一卡二卡三卡四卡| 国产精品手机在线观看| 三级精品视频| 在线亚洲欧美视频| 五月天av网站| 日韩一级网站| 国产成人精品综合久久久| 国产又粗又猛又黄又爽| 国产经典欧美精品| 久久精品magnetxturnbtih| 日本在线丨区| 亚洲人成影院在线观看| 久久在线中文字幕| 成人开心激情| 日韩欧美国产一区二区三区 | 26uuu国产日韩综合| 日韩在线电影一区| 蜜臀av在线播放| 91黄色小视频| 亚洲精品成人无码毛片| 国产不卡一区| 欧美另类xxx| 日本黄色中文字幕| 成人在线综合网| 亚洲国产成人不卡| av丝袜在线| 欧美日韩专区在线| 人妻丰满熟妇av无码久久洗澡 | 99国产精品无码| 在线成人直播| 国产精品99久久久久久www| av小说天堂网| 欧美激情一区二区三区在线| 加勒比成人在线| 日韩电影精品| 亚洲人成免费电影| 久一区二区三区| 另类调教123区 | 日韩成年人视频| 麻豆精品一区二区三区| 久久久久久欧美精品色一二三四| 黄网站视频在线观看| 欧洲av在线精品| 精品福利一区二区三区免费视频| 久久久无码中文字幕久...| 午夜精品成人av| 亚洲精品99久久久久中文字幕| 日韩一区二区三区四区视频| 国产精品丝袜xxxxxxx| 成人在线免费观看视视频| 婷婷国产在线| 亚洲精品成人天堂一二三| 日韩福利视频在线| 欧美日韩导航| 久久久久久中文| 亚洲成人第一区| 亚洲色图清纯唯美| 国产xxxxx视频| 免费久久精品| 7777kkkk成人观看| 蜜臀久久精品久久久久| 亚洲欧美另类久久久精品2019| 成人午夜视频在线观看免费| 深夜福利一区二区三区| 日韩中文字幕国产精品| 亚洲高清视频免费观看| 久久精品欧美一区二区三区不卡 | 色综合色综合色综合色综合色综合| 亚洲欧洲日韩综合| 欧美日本不卡高清| 97自拍视频| 麻豆视频在线观看免费网站| 欧美三区在线视频| 日本猛少妇色xxxxx免费网站| 蜜桃伊人久久| 日产精品一线二线三线芒果| 九九九伊在线综合永久| 亚洲男人天堂久| 欧美日韩a v| 国产精品麻豆久久久| 亚洲视频一二三四| 综合在线视频| 高清视频一区| 日韩深夜视频| 日韩精品中文字幕有码专区 | 欧美码中文字幕在线| 国产精品黄色av| 免费观看在线午夜影视| 91精品欧美久久久久久动漫| 日日骚一区二区三区| 大美女一区二区三区| 日韩av综合在线观看| 少妇精品久久久一区二区三区| 午夜精品一区二区三区av| 牛牛澡牛牛爽一区二区| 欧美日韩一卡二卡| 精品视频第一页| 成人午夜激情视频| 国产精品涩涩涩视频网站| 久久人体视频| av一区二区三区四区电影| 538视频在线| 夜夜嗨av一区二区三区免费区 | 亚洲欧美日韩国产综合精品二区| 日本成人黄色| 国产一区二区三区黄网站| 国内成人精品一区| 成人jjav| 亚洲成色777777在线观看影院| 无码一区二区三区在线观看| 国产精品亲子乱子伦xxxx裸| 免费黄色a级片| 免费在线日韩av| 精品一区二区成人免费视频| 极品国产人妖chinesets亚洲人妖| 日韩av电影中文字幕| av免费在线免费| 国产亚洲精品一区二区| 精品国产九九九| 一本色道久久加勒比精品| 艳妇荡乳欲伦69影片| 2023国产一二三区日本精品2022| 天天干天天av| 国产亚洲精品bv在线观看| 五月天婷亚洲天综合网鲁鲁鲁| 天堂av一区| 26uuu国产精品视频| a视频在线观看| 亚洲精品自拍第一页| jlzzjlzz亚洲女人18| 欧美中文字幕一区| 日韩av无码中文字幕| 欧美国产精品一区二区三区| 稀缺小u女呦精品呦| 久久99精品国产麻豆不卡| 国产乱子伦农村叉叉叉| 国产精品分类| www成人免费| 欧美日韩国产在线一区| 99精品视频网站| 欧美xxxx中国| 一区二区不卡在线| 成人久久综合| 亚洲v国产v在线观看| 国产成人精品999在线观看| 久久精品国产一区二区三区日韩 | 成人一区二区三区在线观看| 欧美69精品久久久久久不卡| 国产一区二区剧情av在线| 粉色视频免费看| 国产综合成人久久大片91| www.久久av.com| 国产一区美女在线| 久久久精品视频国产| 国产很黄免费观看久久| 图片区偷拍区小说区| 国产成人8x视频一区二区| 国产免费无码一区二区| 福利91精品一区二区三区| 影音先锋资源av| 91在线视频免费观看| 中文字幕一二三四区| 久久精品一区二区三区不卡牛牛| 国产jk精品白丝av在线观看| 欧美国产成人精品| 美国一级片在线观看| 亚洲男人的天堂在线观看| 免费人成在线观看| 天天亚洲美女在线视频| 一本一道无码中文字幕精品热| 色综合久久天天综合网| 一区精品在线观看| 日韩一区二区免费电影| 日韩一级片免费在线观看| 日韩经典中文字幕在线观看| 国产在线电影| 久久伊人精品视频| 99色在线观看| 国产精品久久一区主播| 24小时成人在线视频| 国产精品成人一区二区三区| 日本精品影院| 亚洲aⅴ天堂av在线电影软件| 亚洲视频在线免费| 欧美啪啪免费视频| 日韩电影在线观看网站| 日本一二三区在线| caoporen国产精品视频| 摸摸摸bbb毛毛毛片| 亚洲精品国产第一综合99久久 | 日本午夜一本久久久综合| 午夜av中文字幕| 97精品久久久午夜一区二区三区 | 色噜噜狠狠成人网p站| 国产一区二区女内射| 亚洲国产成人精品一区二区| 国产人成在线观看| 欧美福利视频在线| 国产精品毛片久久久久久久久久99999999| 成人久久精品视频| 在线观看欧美理论a影院| 日本久久高清视频| 日韩和欧美一区二区| 波多野结衣电影免费观看| 久久久噜噜噜久噜久久综合| 免费一级肉体全黄毛片| 在线中文字幕一区二区| www.国产精品视频| 一级做a爰片久久毛片美女图片| 免费毛片在线看片免费丝瓜视频| 国产精品免费一区豆花| 蜜桃久久久久| 欧美日韩午夜爽爽| 三级精品在线观看| 国产女人18毛片水真多18| 日韩一区在线免费观看| 国产精品第5页| 亚洲国产第一页| 性xxxfreexxxx性欧美| 国产精品久久久久久婷婷天堂| 久久365资源| 国产一级片91| 激情图区综合网| 五月天婷婷丁香网| 色网综合在线观看| 欧美一区二区黄片| 九九热精品视频| 小说区图片区亚洲| 亚洲国产午夜伦理片大全在线观看网站| 亚洲美女少妇无套啪啪呻吟| 在线视频日韩欧美| 中文字幕一区二区在线观看| 午夜精品久久久久久久蜜桃| 亚洲激情在线观看| 波多野结依一区| 国产成人看片| 欧美精品网站| 亚洲女人在线观看| 亚洲色欲色欲www在线观看| 亚洲一级视频在线观看| 在线亚洲国产精品网| 中文.日本.精品| 日本在线成人一区二区| 久久国产精品99国产| 成人h动漫精品一区| 午夜亚洲福利老司机| 天天干在线观看| 91精品国产高清| 亚洲免费成人av在线| www黄色日本| 久久综合九色综合97婷婷女人| 青青操免费在线视频| 日韩av在线免播放器| 精品捆绑调教一区二区三区| 国内精品二区| 久久精品日产第一区二区 | 免费观看国产视频| 97国产在线视频| 婷婷成人综合| 男人天堂成人在线| 国产精品成人免费在线| 99久久精品国产成人一区二区| 久久伊人免费视频| 超碰精品在线观看| 免费国产a级片| 久久久久久久国产精品影院| 亚洲成人av影片| 中文字幕在线看视频国产欧美在线看完整| 日本中文字幕一区二区| 亚洲国产精品视频一区| 极品美女销魂一区二区三区| 欧美日韩人妻精品一区二区三区| 精品国产伦一区二区三区观看方式 | 东京干手机福利视频| 97国产一区二区精品久久呦 | 99久久综合99久久综合网站| 国产99久久久| 最新中文字幕亚洲| 色播一区二区| 成熟了的熟妇毛茸茸| 中文字幕av免费专区久久| 国产剧情精品在线| 国内精品久久久久影院 日本资源| 九一成人免费视频| 91欧美一区二区三区| 亚州成人在线电影| 国产精品视频一区二区久久| 91久久久精品| 香蕉久久夜色精品| 国产精品视频一区二区在线观看| 精品免费视频.| 欧美亚洲大片| 青草视频在线观看视频| 国产亚洲精品bt天堂精选| 国产三级小视频| 欧洲s码亚洲m码精品一区| 亚洲国产不卡| 国产精品亚洲无码| 日韩小视频在线观看专区| 成人性生活视频| 日本xxxxx18| 国产欧美一区二区三区在线看蜜臀| 国产女人18毛片水真多| 欧洲s码亚洲m码精品一区| 亚洲破处大片| www.黄色在线| 亚洲第一中文字幕| 国产成人免费视频网站视频社区 | 成人国产精品免费观看视频| 中文字幕+乱码+中文乱码www|