精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器人策略學習的Game Changer?伯克利提出Body Transformer

人工智能 新聞
過去幾年間,Transformer 架構已經(jīng)取得了巨大的成功,同時其也衍生出了大量變體,比如擅長處理視覺任務的 Vision Transformer(ViT)。本文要介紹的 Body Transformer(BoT) 則是非常適合機器人策略學習的 Transformer 變體。

我們知道,物理智能體在執(zhí)行動作的校正和穩(wěn)定時,往往會根據(jù)其感受到的外部刺激的位置給出空間上的響應。比如人類對這些刺激的響應回路位于脊髓神經(jīng)回路層面,它們專門負責單個執(zhí)行器的響應。起校正作用的局部執(zhí)行是高效運動的主要因素,這對機器人來說也尤為重要。

但之前的學習架構通常都沒有建立傳感器和執(zhí)行器之間的空間關聯(lián)。鑒于機器人策略使用的架構基本是為自然語言和計算機視覺開發(fā)的架構,它們常常無法有效地利用機器人機體的結構。

不過,Transformer 在這方面還是頗具潛力的,已有研究表明,Transformer 可以有效地處理長序列依賴關系,還能輕松地吸收大量數(shù)據(jù)。Transformer 架構原本是為非結構化自然語言處理(NLP)任務開發(fā)的。在這些任務中(比如語言翻譯),輸入序列通常會被映射到一個輸出序列。

基于這一觀察,加州大學伯克利分校 Pieter Abbeel 教授領導的團隊提出了 Body Transformer(BoT),增加了對機器人機體上的傳感器和執(zhí)行器的空間位置的關注。

圖片


  • 論文標題:Body Transformer: Leveraging Robot Embodiment for Policy Learning
  • 論文地址:https://arxiv.org/pdf/2408.06316v1
  • 項目網(wǎng)站:https://sferrazza.cc/bot_site
  • 代碼地址:https://github.com/carlosferrazza/BodyTransformer

具體來說,BoT 是將機器人機體建模成圖(graph),其中的節(jié)點即為其傳感器和執(zhí)行器。然后,其在注意力層上使用高度稀疏的掩碼,以防止每個節(jié)點關注其直接近鄰之外的部分。將多個結構相同的 BoT 層連接起來,就能匯集整個圖的信息,這樣便不會損害該架構的表征能力。BoT 在模仿學習和強化學習方面都表現(xiàn)不俗,甚至被一些人認為是策略學習的「Game Changer」。

Body Transformer

如果機器人學習策略使用原始 Transformer 架構為骨干,則通常會忽視機器人機體結構所提供的有用信息。但實際上,這些結構信息能為 Transformer 提供更強的歸納偏置。該團隊在利用這些信息的同時還保留了原始架構的表征能力。

Body Transformer(BoT)架構基于掩碼式注意力。在這個架構的每一層中,一個節(jié)點都只能看到其自身和其直接近鄰節(jié)點的信息。如此一來,信息就會依照圖的結構而流動,其中上游層會根據(jù)局部信息執(zhí)行推理,下游層則能匯集更多來自更遠節(jié)點的全局信息。

圖片

如圖 1 所示,BoT 架構包含以下組件:

1.tokenizer:將傳感器輸入投射成對應的節(jié)點嵌入;

2.Transformer 編碼器:處理輸入嵌入并生成同樣維度的輸出特征;

3.detokenizer:解除 token 化,即將特征解碼成動作(或用于強化學習批評訓練的價值)。

tokenizer

該團隊選擇將觀察向量映射成局部觀察構成的圖。

在實踐中,他們將全局量分配給機器人機體的根元素,將局部量分配給表示對應肢體的節(jié)點。這種分配方式與之前的 GNN 方法類似。

然后,使用一個線性層將局部狀態(tài)向量投射成嵌入向量。每個節(jié)點的狀態(tài)都會被饋送給其節(jié)點特定的可學習的線性投射,從而得到一個包含 n 個嵌入的序列,其中 n 表示節(jié)點的數(shù)量(或序列長度)。這不同于之前的研究成果,它們通常僅使用單個共享的可學習的線性投射來處理多任務強化學習中不同數(shù)量的節(jié)點。

BoT 編碼器

該團隊使用的骨干網(wǎng)絡是一個標準的多層 Transformer 編碼器,并且該架構有兩種變體版本:

  • BoT-Hard:使用一個反映該圖結構的二元掩碼來掩蔽每一層。具體來說,他們構建掩碼的方式是 M = I_n + A,其中 I_n 是 n 維單位矩陣,A 是對應于該圖的鄰接矩陣。圖 2 展示了一個示例。這讓每個節(jié)點僅能看到其自身和其直接近鄰,并且能為該問題引入相當可觀的稀疏性 —— 從計算成本角度看,這特別有吸引力。

圖片

  • BoT-Mix:將帶有掩碼式注意力的層(如 BoT-Hard 一樣)與帶有無掩碼式注意力的層交織在一起。

detokenizer

Transformer 編碼器輸出的特征會被饋送給線性層,然后被投射成與該節(jié)點的肢體關聯(lián)的動作;這些動作是根據(jù)相應執(zhí)行器與肢體的接近程度來分配的。同樣,每個節(jié)點的這些可學習的線性投射層是分開的。如果將 BoT 用作強化學習設置中的批評架構,則 detokenizer 輸出的就不再是動作,而是價值,然后在機體部位上取平均值。

實驗

團隊在模仿學習和強化學習設置中評估了 BoT 的性能。他們維持了與圖 1 相同的結構,只用各種基線架構替換 BoT 編碼器,以確定編碼器的效果。

這些實驗的目標是解答以下問題:

  • 掩碼式注意力是否能提升模仿學習的性能和泛化能力?
  • 相比于原始的 Transformer 架構,BoT 是否能表現(xiàn)出正面的規(guī)模擴展趨勢?
  • BoT 是否與強化學習框架兼容,有哪些合理設計選擇可以盡可能地提升性能?
  • BoT 策略是否可以應用于真實世界機器人任務?
  • 掩碼式注意力在計算方面有哪些優(yōu)勢?

模仿學習實驗

團隊在機體跟蹤任務上評估了 BoT 架構的模仿學習性能,該任務是通過 MoCapAct 數(shù)據(jù)集定義的。

結果如圖 3a 所示,可以看到 BoT 的表現(xiàn)總是優(yōu)于 MLP 和 Transformer 基線。值得注意的是,在未曾見過的驗證視頻片段上,BoT 相對于這些架構的優(yōu)勢還會進一步增大,這證明機體感知型歸納偏置能帶來泛化能力的提升。

圖片

而圖 3b 則表明 BoT-Hard 的規(guī)模擴展性很不錯,相較于 Transformer 基線,其在訓練和驗證視頻片段上的性能都會隨著可訓練參數(shù)量的增長而增長這進一步表明 BoT-Hard 傾向于不過擬合訓練數(shù)據(jù),而這種過擬合是由具身偏置引起的。下面展示了更多實驗示例,詳見原論文。

圖片


圖片

強化學習實驗

該團隊在 Isaac Gym 中的 4 個機器人控制任務上評估了 BoT 與使用 PPO 的基線的強化學習性能。這 4 個任務分別是:Humanoid-Mod、Humanoid-Board、Humanoid-Hill 和 A1-Walk。

圖 5 展示了 MLP、Transformer 和 BoT(Hard 和 Mix)在訓練期間的評估 rollout 的平均情節(jié)回報。其中,實線對應于平均值,陰影區(qū)域對應于五個種子的標準誤差。

圖片

圖片

結果表明,BoT-Mix 的性能在樣本效率和漸近性能方面始終優(yōu)于 MLP 和原始 Transformer 基線。這說明將來自機器人機體的偏置整合進策略網(wǎng)絡架構是有用的。

同時,BoT-Hard 在較簡單的任務(A1-Walk 和 Humanoid-Mod)上的表現(xiàn)優(yōu)于原始 Transformer,但在更困難的探索任務(Humanoid-Board 和 Humanoid-Hill)上表現(xiàn)卻更差??紤]到掩碼式注意力會妨礙來自遠處機體部分的信息傳播,BoT-Hard 在信息通信方面的強大限制可能會妨礙強化學習探索的效率。

真實世界實驗

Isaac Gym 模擬的運動環(huán)境常被用于將強化學習策略從虛擬遷移到真實環(huán)境,并且還不需要在真實世界中進行調整。為了驗證新提出的架構是否適用于真實世界應用,該團隊將上述訓練得到的一個 BoT 策略部署到了一臺 Unitree A1 機器人中。從如下視頻可以看出,新架構可以可靠地用于真實世界部署。

圖片

計算分析

該團隊也分析了新架構的計算成本,如圖 6 所示。這里給出了新提出的掩碼式注意力與常規(guī)注意力在不同序列長度(節(jié)點數(shù)量)上的規(guī)模擴展結果。

圖片

可以看到,當有 128 個節(jié)點時(相當于擁有靈巧雙臂的類人機器人),新注意力能將速度提升 206%。

總體而言,這表明 BoT 架構中的源自機體的偏置不僅能提高物理智能體的整體性能,而且還可受益于架構那自然稀疏的掩碼。該方法可通過充分的并行化來大幅減少學習算法的訓練時間。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-26 15:43:00

訓練數(shù)據(jù)機器人

2024-10-29 15:20:00

強化學習模型

2021-01-04 09:18:36

機器人人工智能系統(tǒng)

2025-05-21 08:53:00

2022-03-23 10:52:07

機器人神經(jīng)網(wǎng)絡系統(tǒng)

2025-05-09 08:50:00

機器人訓練AI

2018-10-09 14:00:41

SQL深度學習神經(jīng)網(wǎng)絡

2025-01-22 15:21:00

2022-06-30 17:53:56

機器狗智能

2019-01-15 13:14:03

機器人算法SAC

2021-07-12 13:02:50

機器人人工智能算法

2024-01-31 13:51:00

模型數(shù)據(jù)

2025-10-15 09:05:05

2024-02-21 12:20:00

AI訓練

2025-04-23 09:10:00

AI系統(tǒng)模型

2025-06-25 16:09:40

機器人AI訓練

2022-03-28 13:25:42

AI扶貧機器之心

2022-01-26 10:31:25

自動駕駛軟件架構

2022-06-09 15:35:48

深度學習AI

2018-12-20 11:12:44

機器人算法伯克利
點贊
收藏

51CTO技術棧公眾號

88xx成人免费观看视频库 | 在线播放国产一区| 成人嫩草影院| 91精品国产91久久久久久最新毛片 | 色综合色综合色综合色综合| 超碰国产在线| 国产精品一二三四| 欧美激情区在线播放| 中文字幕免费在线播放| 成人免费网站www网站高清| 中文字幕一区二区三区不卡在线| 国产久一一精品| 国产这里有精品| 国产精品免费大片| 欧美一区国产二区| 国产成人a亚洲精v品无码| 99精品老司机免费视频| 国产成a人无v码亚洲福利| 日韩av手机在线观看| 美女福利视频在线观看| 久久综合影院| 精品日产卡一卡二卡麻豆| 日韩一级在线免费观看| 影院在线观看全集免费观看| 国产婷婷精品av在线| av免费精品一区二区三区| 夜夜爽妓女8888视频免费观看| 欧美精品导航| 中文字幕在线日韩| 久久久国产精品无码| 另类视频一区二区三区| 欧美综合色免费| 免费成人在线视频网站| av网站在线看| 中文久久乱码一区二区| 久久久久国产精品视频| 亚洲免费一级片| 久久精品久久综合| 国产97在线观看| 日本五十路女优| 亚洲第一偷拍| 中文字幕精品—区二区| 亚洲精品乱码久久| 天堂av一区| 欧美精品九九99久久| 日韩精品一区二区三区色欲av| 色噜噜狠狠狠综合欧洲色8| 国产精品久久久久久久久免费桃花 | 性猛交ⅹxxx富婆video| 麻豆一区二区麻豆免费观看| 日韩欧美国产一二三区| 91网址在线观看精品| 日韩经典一区| 欧美日韩一区免费| 鲁一鲁一鲁一鲁一色| 超碰在线最新网址| 一二三区精品福利视频| 欧美激情亚洲天堂| 性国产高清在线观看| 亚洲精品综合在线| 日本黄xxxxxxxxx100| 国产日产一区二区三区| 亚洲免费视频中文字幕| 国产人妻互换一区二区| 精品国产丝袜高跟鞋| 中文字幕字幕中文在线中不卡视频| 小说区图片区图片区另类灬| 97视频在线观看网站| 中文字幕不卡的av| 制服诱惑一区| 91高清在线观看视频| 亚洲精选视频免费看| 69sex久久精品国产麻豆| 国产蜜臀在线| 精品二区三区线观看| 秋霞无码一区二区| 成人美女视频| 欧美色图天堂网| 美女网站色免费| 亚洲日本中文| 欧美成人aa大片| 性久久久久久久久久久| 国产真实有声精品录音| 久久国产一区二区三区| 2021亚洲天堂| 国产日韩一区| 国产精品极品美女在线观看免费 | 欧美精品一级二级| 国产成人精品综合久久久久99| 亚洲天堂av资源在线观看| 亚洲国产精品美女| 国产精品免费无码| 91精品一区二区三区综合| 国精产品一区一区三区有限在线| 亚洲男人的天堂在线视频| 日韩—二三区免费观看av| 成人午夜在线观看| 天堂av在线资源| 国产精品国产自产拍高清av | 激情综合丁香五月| 欧美日韩国产高清电影| 欧美成人合集magnet| 亚州国产精品视频| 麻豆专区一区二区三区四区五区| 91传媒免费看| 黄色在线播放| 亚洲一区二区三区在线看| 日韩av黄色网址| 成人午夜888| 亚洲精品视频在线播放| 午夜爱爱毛片xxxx视频免费看| 亚洲三级观看| 国产在线观看91精品一区| 日本美女一级视频| 国产精品国产三级国产aⅴ原创| 日韩a级黄色片| 欧美日韩视频免费观看| 精品日韩欧美在线| 欧美激情视频二区| 国产欧美一区二区色老头| 国产在线高清精品| 你懂的视频在线免费| 亚洲欧美偷拍三级| 欧美黑人又粗又大又爽免费| 国产96在线亚洲| 久久九九亚洲综合| 成年人晚上看的视频| 成人在线综合网| 日本黄色播放器| 激情都市亚洲| 亚洲国模精品私拍| 国产免费无码一区二区视频 | 日韩av片免费观看| 精品国产精品久久一区免费式| 久久久久久亚洲精品中文字幕| 亚洲午夜激情视频| 久久九九国产精品| 欧美色图色综合| 亚洲性视频在线| 久久综合色影院| 一级特黄色大片| 亚洲国产精品二十页| 久久久久久久激情| 神马久久影院| 国语自产精品视频在线看一大j8 | 欧美三级视频网站| 亚洲中午字幕| 久久久一本精品99久久精品| a级片在线免费观看| 日韩精品一区二区在线观看| 91嫩草丨国产丨精品| 久久国产精品99精品国产| 日本一区高清不卡| 国产精品高清乱码在线观看| 亚洲欧洲在线看| 国产精品久久久久久久久久久久久久久久久 | 视频在线观看一区二区三区| 51精品国产人成在线观看| 久草中文在线| 日韩亚洲欧美成人一区| 天天干中文字幕| 国产**成人网毛片九色| 免费看黄色a级片| 亚洲欧洲国产精品一区| 久久久久久久久久国产精品| 成人久久久精品国产乱码一区二区 | 国产精品久久久久三级| 日韩一级理论片| 欧洲视频一区| 国产精品一区二区三区久久| 高清av在线| 欧美日韩国产影片| 成人免费精品动漫网站| 高清在线不卡av| 超碰成人免费在线| 五月激激激综合网色播| 国产成人avxxxxx在线看| 99re热久久这里只有精品34| 欧美一区二视频| 午夜毛片在线观看| 久久精品免费在线观看| 四季av一区二区三区| 欧美成人一品| 欧美极品一区二区| 91精品麻豆| 91成人免费观看网站| 国产在线你懂得| 欧美一区在线视频| 欧美精品一二三四区| 亚洲国产精品t66y| 国产老头和老头xxxx×| 欧美亚洲一级| 男人日女人的bb| 亚洲精品**不卡在线播he| 91精品免费久久久久久久久| 蜜乳av一区| 在线播放国产一区中文字幕剧情欧美 | 在线观看免费视频高清游戏推荐| 久久精品高清| 精品999在线观看| 亚洲久草在线| 欧美一区二区.| 麻豆av在线导航| 亚洲国产一区自拍| 免费黄色片视频| 亚洲图片欧美一区| 一级特黄曰皮片视频| 国产成人久久精品77777最新版本| 国产极品美女高潮无套久久久| 爽成人777777婷婷| 国产自产精品| 黄色成人在线观看网站| 97超级碰碰碰| 久草中文在线观看| 亚洲奶大毛多的老太婆| 国产女人18毛片18精品| 色视频一区二区| 欧美大片xxxx| 久久综合成人精品亚洲另类欧美| 久久撸在线视频| 老牛嫩草一区二区三区日本| 9l视频自拍9l视频自拍| 狠狠色丁香婷婷综合影院| 国产精品电影网站| 日本а中文在线天堂| 久久视频免费观看| 飘雪影视在线观看免费观看 | 欧美精品在线观看| www.av在线播放| 亚洲精品久久久久久久久久久久久| 亚洲熟妇av乱码在线观看| 亚洲国产精品天堂| 天天综合天天做| 国产精品午夜免费| a视频免费观看| 懂色av一区二区三区免费观看| theporn国产精品| 日韩精品电影一区亚洲| 精品少妇一区二区三区在线| 一区二区三区在线| 久久天天东北熟女毛茸茸| 欧美综合一区| 欧美日韩亚洲一区二区三区四区| 亚洲一区网址| 91久色国产| 色综合视频一区二区三区44| 欧美主播福利视频| 中文字幕在线观看网站| 伦理中文字幕亚洲| 免费网站免费进入在线| 在线成人激情黄色| 成人午夜电影在线观看| 亚洲精品99久久久久中文字幕| 国产夫妻性生活视频| 337p亚洲精品色噜噜噜| 99久久精品国产色欲| 欧美日韩另类一区| 中文字幕无码乱码人妻日韩精品| 欧美午夜精品久久久久久久| 亚洲大片免费观看| 欧美性猛交xxxx免费看| 奇米影视第四色777| 亚洲无线码一区二区三区| 久热精品在线观看| 欧美亚视频在线中文字幕免费| 韩国精品久久久999| 涩涩视频在线免费看| 午夜精品久久久久久久白皮肤| 欧美78videosex性欧美| 久久久精品国产网站| 影院在线观看全集免费观看| 欧美久久精品一级黑人c片| 免费黄色网址在线观看| 欧美成人精品影院| 欧美78videosex性欧美| 午夜伦理精品一区| 成人性生交大片免费观看网站| 日本久久精品视频| 欧美日韩在线精品一区二区三区激情综合 | 国产一区二区免费| 国产午夜在线视频| 久久午夜a级毛片| 91麻豆免费在线视频| 九九九热精品免费视频观看网站| www视频在线观看免费| 久久国产精品免费视频| 国产白丝在线观看| 68精品国产免费久久久久久婷婷| 精品成人av| 成人国产在线激情| 66精品视频在线观看| 国产一区二区精品在线| 狠狠操综合网| av动漫在线免费观看| 亚洲伦理一区| 可以看污的网站| 岛国av在线一区| 国产手机在线观看| 久久亚洲影视婷婷| 紧身裙女教师波多野结衣| 亚洲va欧美va国产va天堂影院| 天堂中文在线网| 欧美一卡二卡在线| 天堂√在线中文官网在线| 自拍偷拍亚洲精品| 亚洲精品白浆| 国产精品观看在线亚洲人成网| 国产成人视屏| 久久五月天婷婷| 女生裸体视频一区二区三区| 欧美激情 国产精品| 日本成人中文字幕| 亚洲一区二区在线免费| 国产精品午夜在线观看| 97成人资源站| 色综合久久久久久久| 亚洲a视频在线观看| 国产亚洲在线播放| 黄色污污视频在线观看| 91香蕉亚洲精品| 九九久久婷婷| 免费看黄色a级片| 视频在线观看国产精品| 日本人妻一区二区三区| 国产欧美精品国产国产专区| 丰满少妇被猛烈进入一区二区| 欧美色播在线播放| 一级黄在线观看| 亚洲欧美在线免费| 欧美aaaaaaa| 91精品网站| 日韩一区亚洲二区| 那种视频在线观看| 成人精品国产一区二区4080| 日本中文在线视频| 欧美亚洲高清一区二区三区不卡| av免费观看网址| 久久中文字幕国产| 亚洲不卡系列| 精品日韩欧美| 亚洲精品激情| 午夜视频在线免费看| 国产蜜臀av在线一区二区三区| 免费视频久久久| 亚洲国产一区二区三区四区| 中日韩高清电影网| 99高清视频有精品视频| 亚洲第一偷拍| 久久6免费视频| 伊人夜夜躁av伊人久久| 在线免费观看中文字幕| 亚洲午夜精品久久久久久久久久久久| 激情黄产视频在线免费观看| 草莓视频一区| 68国产成人综合久久精品| 日本少妇高潮喷水xxxxxxx| 综合激情一区| 九九热免费在线观看| 国产亚洲欧美一区在线观看| 国产精品第九页| 亚洲国产日韩欧美在线图片| 青草在线视频| 电影午夜精品一区二区三区| 韩日成人在线| 国产91在线免费观看| 一区二区三区高清| 日韩中文字幕影院| 高清视频欧美一级| 国产另类在线| 无码人妻丰满熟妇区五十路百度| 99精品视频免费在线观看| 1级黄色大片儿| 国产一区二区三区网站| 日本精品在线中文字幕| 亚洲蜜桃av| 国产精品18久久久| 久久久久久久久久99| 91精品午夜视频| 欧美极品少妇videossex| 国产精品二区在线| 国产精品mv在线观看| 日韩一级视频在线观看| 色av综合在线| caoporn国产精品免费视频| 91高跟黑色丝袜呻吟在线观看| 亚洲影视一区| 黄色a一级视频| 欧美视频日韩视频| 黄网页免费在线观看| 精品久久久久久亚洲| 久久综合网络一区二区| 免费看的黄色录像| 精品美女在线播放| 午夜不卡影院| 欧美日韩日本网| 粉嫩蜜臀av国产精品网站| 国产69精品久久久久久久久久| 日韩精品在线电影| 国产亚洲人成a在线v网站| 日韩一级免费看|