精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

率先解決多類數據同時受損,中科大MIRA團隊TRACER入選NeurIPS 2024:強魯棒性的離線變分貝葉斯強化學習

人工智能 新聞
近日,中科大王杰教授團隊 (MIRA Lab) 針對離線強化學習數據集存在多類數據損壞這一復雜的實際問題,提出了一種魯棒的變分貝葉斯推斷方法,有效地提升了智能決策模型的魯棒性,為機器人控制、自動駕駛等領域的魯棒學習奠定了重要基礎。

本論文作者楊睿是中國科學技術大學 2019 級碩博連讀生,師從王杰教授、李斌教授,主要研究方向為強化學習、自動駕駛等。他曾以第一作者在 NeurIPS、KDD 等頂級期刊與會議上發表論文兩篇,曾獲滴滴精英實習生(16/1000+)。

近日,中科大王杰教授團隊 (MIRA Lab) 針對離線強化學習數據集存在多類數據損壞這一復雜的實際問題,提出了一種魯棒的變分貝葉斯推斷方法,有效地提升了智能決策模型的魯棒性,為機器人控制、自動駕駛等領域的魯棒學習奠定了重要基礎。論文發表在 CCF-A 類人工智能頂級會議 Neural Information Processing Systems(NeurIPS 2024)。

圖片

  • 論文地址:https://arxiv.org/abs/2411.00465
  • 代碼地址:https://github.com/MIRALab-USTC/RL-TRACER

引言

在機器人控制領域,離線強化學習正逐漸成為提升智能體決策和控制能力的關鍵技術。然而,在實際應用中,離線數據集常常由于傳感器故障、惡意攻擊等原因而遭受不同程度的損壞。這些損壞可能表現為隨機噪聲、對抗攻擊或其他形式的數據擾動,影響數據集中的狀態、動作、獎勵和轉移動態等關鍵元素。經典離線強化學習算法往往假設數據集是干凈、完好無損的,因此在面對數據損壞時,機器學習到的策略通常趨向于損壞數據中的策略,進而導致機器在干凈環境下的部署時性能顯著下降。

盡管研究者在魯棒離線強化學習領域已經取得了一些進展,如一些方法嘗試通過增強測試期間的魯棒性來緩解噪聲或對抗攻擊的影響,但它們大多在干凈數據集上訓練智能體模型,以防御測試環境中可能出現的噪聲和攻擊,缺乏對訓練用離線數據集存在損壞的應對方案。而針對離線數據損壞的魯棒強化學習方法則只關注某一特定類別的數據存在損壞,如狀態數據、或轉移動態數據存在部分損壞,他們無法有效應對數據集中多個元素同時受損的復雜情況。

為了針對性地解決這些現有算法的局限性,我們提出了一種魯棒的變分貝葉斯推斷方法(TRACER),有效地增強了離線強化學習算法在面臨各類數據損壞時的魯棒性。TRACER 的優勢如下所示:

1. 據我們所知,TRACER 首次將貝葉斯推斷引入到抗損壞的離線強化學習中。通過將所有離線數據作為觀測值,TRACER 捕捉了由各類損壞數據所導致的動作價值函數中的不確定性。

2. 通過引入基于熵的不確定性度量,TRACER 能夠區分損壞數據和干凈數據,從而調控并減弱損壞數據對智能體模型訓練的影響,以增強魯棒性。

3. 我們在機器人控制(MuJoCo)和自動駕駛(CARLA)仿真環境中進行了系統性地測試,驗證了 TRACER 在各類離線數據損壞、單類離線數據損壞的場景中均顯著提升了智能體的魯棒性,超出了多個現有的 SOTA 方法。

1. 方法介紹

1.1 動機

考慮到(1)多種類型的損毀會向數據集的所有元素引入較高的不確定性,(2)每個元素與累積獎勵(即動作值、Q 值)之間存在明確的相關性關系(見圖 1 中的虛線),因此使用多種受損數據估計累積獎勵函數(即動作值函數)會引入很高的不確定性。

圖片

圖 1. 決策過程的概率圖模型。實線連接的節點表示數據集中的數據,而虛線連接的 Q 值(即動作值、累積回報)不屬于數據集。

為了處理這類由多種數據損毀(即狀態、動作、獎勵、狀態轉移數據受損)導致的高不確定性問題,基于圖 2 所示的概率圖模型,我們提出利用數據集中的所有元素作為觀測數據。我們旨在利用這些觀測數據與累積獎勵之間的高度相關性,來準確地識別動作值函數的不確定性。

1.2 基于受損數據的貝葉斯推斷

我們提出使用離線數據集的所有元素作為觀測值,利用數據之間的相關性同時解決不確定性問題。具體地,基于離線數據集中動作價值與四個元素(即狀態、動作、獎勵、下一狀態)之間的關系,我們分別使用各個元素作為觀測數據,通過引入變分貝葉斯推理框架,我們最大化動作值函數的后驗分布,從而推導出各個元素對應的基于最大化證據下界 (ELBO) 的損失函數。基于對動作價值函數的后驗分布的擬合,我們能有效地將數據損壞建模為動作值函數中的不確定性。

1.3 基于熵的不確定性度量

為了進一步應對各類數據損壞帶來的挑戰,我們思考如何利用不確定性進一步增強魯棒性。鑒于我們的目標是提高在干凈環境中的智能體性能,我們提出減少損壞數據的影響,重點是使用干凈數據來訓練智能體。因此,我們提供了一個兩步計劃:(1)區分損壞數據和干凈數據;(2)調控與損壞數據相關的損失,減少其影響,從而提升在干凈環境中的表現。

對于(1),由于損壞數據通常會造成比干凈數據更高的不確定性和動作價值分布熵,因此我們提出通過估計動作值分布的熵,來量化損壞數據和干凈數據引入的不確定性。

對于 (2),我們使用分布熵指數的倒數來加權我們提出的 ELBO 損失函數。因此,在學習過程中,TRACER 能夠通過調控與損壞數據相關的損失來減弱其影響,并同時專注于最小化與干凈數據相關的損失,以增強在干凈環境中的魯棒性和性能。

1.4 算法架構

圖片

圖 2. TRACER 算法框架圖。

2. 實驗介紹

為了模擬數據受損的情形,我們對數據集的部分數據加入隨機噪聲或對抗攻擊來構建損壞數據。在我們的實驗中,我們對 30% 的單類數據進行損壞。因此,在所有類型的數據都有損壞時,整個離線數據集中,損壞數據占約圖片的規模。

各類數據均受損

所有類型數據元素均存在損壞的部分實驗結果見表 1,TRACER 在所有控制環境中均獲得了較為明顯的性能提升,提升幅度達 + 21.1%,這一結果展現了 TRACER 對大規模、各類數據損壞的強魯棒性。

圖片

表 1. 離線數據集的所有類型元素均存在隨機損壞(random)或對抗損壞(advers)時,我們的方法 TRACER 在所有環境中都獲得了最高的平均得分。

單類數據受損

單種類型數據元素存在損壞的部分實驗結果見表 2 和表 3。在單類數據損壞中,TRACER 于 24 個實驗設置里實現 16 組最優性能,可見 TRACER 面向小規模、單類數據損壞的問題也能有效地增強魯棒性。

圖片

表 2. 單類元素存在隨機損壞時,我們的方法 TRACER 在 8 個實驗設置中獲得了最高的平均得分。

圖片

表 3. 單類元素存在對抗損壞時,我們的方法 TRACER 在 8 個實驗設置中獲得了最高的平均得分。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-21 10:35:00

2025-04-01 09:32:00

模型訓練AI

2025-03-14 10:22:03

2021-05-07 09:34:20

量子芯片計算機

2025-10-27 09:15:00

2023-12-18 15:16:47

數據模型

2020-04-15 16:44:38

谷歌強化學習算法

2024-12-09 10:15:00

AI技術

2022-10-31 14:06:32

量子研究

2022-02-25 23:49:31

量子研究

2022-02-23 09:27:37

神經網絡人工智能模型

2024-11-11 17:27:26

2012-04-18 10:40:33

超級計算機大學生超算大賽

2013-06-19 11:32:32

計算性能ISCHPC

2024-06-17 07:10:00

2023-12-04 13:23:00

數據訓練

2024-11-04 13:30:00

模型AI

2024-04-07 09:00:00

數據模型

2020-05-06 16:07:05

百度飛槳
點贊
收藏

51CTO技術棧公眾號

日韩精品123| 天天插天天操天天干| 亚洲精品66| 一区二区三区国产| 你懂的网址一区二区三区| 中文字幕精品一区二| 午夜精品999| 亚洲天堂视频在线观看| 日韩在线不卡一区| 亚洲人体影院| 亚洲精品欧美激情| 日韩精品久久久毛片一区二区| www.97av.com| 热久久久久久久| 午夜精品在线视频| fc2ppv在线播放| 校园春色另类视频| 日韩视频免费观看高清完整版在线观看 | 手机av免费观看| 国精品一区二区| 日韩在线国产精品| 37p粉嫩大胆色噜噜噜| 玖玖玖电影综合影院| 91成人免费在线| 国产特级黄色大片| 精精国产xxxx视频在线中文版 | 99自拍视频在线| 日韩极品在线| 精品国产一区二区亚洲人成毛片 | 成人av资源网站| 亚洲精品欧美日韩专区| 日韩国产成人在线| 久久久久久久波多野高潮日日| 欧美黑人巨大精品一区二区| 日韩成人短视频| 日韩av免费大片| 亚洲欧美日韩区| 91精彩刺激对白露脸偷拍| 国产乱人伦精品一区| 日韩一区二区免费在线电影| 爱豆国产剧免费观看大全剧苏畅| 成人网ww555视频免费看| 一本在线高清不卡dvd| av7777777| 蜜桃视频动漫在线播放| 午夜久久福利影院| 国产无限制自拍| sqte在线播放| 亚洲福利国产精品| 我的公把我弄高潮了视频| 激情在线视频播放| 亚洲高清不卡在线| 成 年 人 黄 色 大 片大 全| 免费在线观看av电影| 有坂深雪av一区二区精品| 玖玖精品在线视频| 手机在线免费观看av| 亚洲成人自拍网| 加勒比成人在线| av资源新版天堂在线| 精品久久久久久久大神国产| 国产精品专区在线| 亚洲国产欧美日本视频| 欧美特黄级在线| 久久久久国产精品熟女影院| 天天综合网天天| 欧美日韩一区二区三区高清| 三日本三级少妇三级99| 超碰地址久久| 亚洲精品一区av在线播放| 中文字幕一区二区三区人妻电影| 欧美裸体在线版观看完整版| 视频直播国产精品| 青青草国产在线观看| 夜久久久久久| 国产精品日日做人人爱| 国产v片在线观看| av午夜精品一区二区三区| 欧美一区二视频在线免费观看| av电影在线网| 一区二区三区在线观看欧美 | 91吃瓜在线观看| 欧美日韩亚洲精品一区二区三区| 一级黄色香蕉视频| 欧州一区二区三区| 日韩成人av网| 999精品在线视频| 黄色亚洲在线| 国产a∨精品一区二区三区不卡| 亚洲一区二区视频在线播放| 成人精品免费网站| 亚洲国产日韩综合一区| 三级资源在线| 欧美色偷偷大香| 伦理片一区二区| 日本大胆欧美| 久久久综合av| 依依成人在线视频| 99久久婷婷国产综合精品电影| 亚洲一区二区三区精品动漫| free性护士videos欧美| 欧美日韩一卡二卡三卡| 精品国产av色一区二区深夜久久| 欧美hd在线| 欧美中文字幕第一页| 国产成人精品一区二区无码呦 | 手机在线观看av| 欧美日本国产一区| 中文字幕丰满孑伦无码专区| 欧美日韩中文| 国产综合久久久久久| 欧美套图亚洲一区| 亚洲午夜三级在线| 日本精品一区在线| 成人av动漫在线观看| 国内久久久精品| 国产日韩欧美视频在线观看| 国产亚洲综合色| 免费av观看网址| 91精品入口| 久久久国产精品亚洲一区| 午夜精品免费观看| 99精品久久只有精品| 奇米777四色影视在线看| 欧美视频在线视频精品| 亚洲人午夜精品| 一级片中文字幕| 成人性生交大片免费看中文| 国产亚洲精品久久久久久久| 91麻豆精品国产综合久久久| 在线观看视频亚洲| yjizz国产| 99久久久国产精品| 亚洲 自拍 另类小说综合图区| 日韩精品一区二区三区免费视频| 日韩在线视频中文字幕| 中日韩在线观看视频| 国产日产欧产精品推荐色 | 精品一区二区三区蜜桃| 五月天国产一区| 99久久er| 日韩中文字幕在线精品| 国产精品久久久午夜夜伦鲁鲁| 国产精品美女久久久久久久久久久| 50路60路老熟妇啪啪| 九九综合九九| 国产精品久久久久久久久久久不卡| 欧美扣逼视频| 在线免费观看成人短视频| 国产手机在线观看| 久久国产99| 日韩精品不卡| 日韩三区四区| 不卡av电影院| 午夜精品在线播放| 亚洲aaa精品| 日本一区二区三区网站| 久久成人免费| 一区二区精品在线| 国产亚洲字幕| 欧美黑人视频一区| 日漫免费在线观看网站| 色妞www精品视频| 毛片久久久久久| 国产在线精品免费| 人妻夜夜添夜夜无码av| 久久99精品久久久久久园产越南| 国产精品嫩草视频| wwwav在线| 亚洲精品福利免费在线观看| 久久久精品毛片| 亚洲欧洲日本在线| 欧洲成人午夜精品无码区久久| 国内视频精品| 欧美日韩国产精品一区二区| 欧美大片网站| 久久久久久国产| 国产精品久久一区二区三区不卡| 欧美精品777| 亚洲国产成人精品激情在线| 国产片一区二区三区| 奇米777在线视频| 亚洲激情av| 亚洲精品乱码久久久久久蜜桃91| 国产精选久久| 日本国产一区二区三区| 黄色av电影在线播放| 精品av综合导航| 亚洲系列第一页| 亚洲第一综合色| 国精产品视频一二二区| 成a人片亚洲日本久久| 依人在线免费视频| 亚洲永久视频| 男女h黄动漫啪啪无遮挡软件| 久本草在线中文字幕亚洲| 国产精品偷伦一区二区 | 亚洲va天堂va国产va久| 中国特黄一级片| 99久久国产综合精品女不卡| 亚洲怡红院在线| 麻豆九一精品爱看视频在线观看免费| 亚洲一区二区三区精品在线观看| 国产精品jk白丝蜜臀av小说| 国产日韩av在线| 中文字幕一区久| 欧美日韩国产二区| 精品麻豆一区二区三区| 国产一区二区三区精品久久久| 日韩一级免费毛片| 69精品人人人人| 国产精品免费无遮挡无码永久视频| 亚洲主播在线播放| www日韩在线| 中文在线一区二区| 受虐m奴xxx在线观看| av在线不卡电影| 国产裸体视频网站| 狠狠色2019综合网| 日日干夜夜操s8| 奶水喷射视频一区| 日本福利视频在线| 亚洲毛片网站| 一级性生活视频| 亚洲v在线看| 一区二区不卡视频| 日韩综合精品| 日韩亚洲一区在线播放| 一区二区小说| 久久精品美女| 欧美日韩一区二区三区在线电影| 国产伦精品一区二区三区| 欧美特黄不卡| 3d蒂法精品啪啪一区二区免费| 亚洲热av色在线播放| 成人午夜在线观看| 91九色成人| 91在线播放国产| 91国产一区| 亚洲精品欧美日韩专区| 欧洲一区在线| 99久久国产免费免费| 亚洲一区二区三区免费| 91中文字精品一区二区| baoyu135国产精品免费| 国产一区二区不卡视频在线观看| 99亚洲乱人伦aⅴ精品| 国产精品一区而去| 老司机精品视频在线播放| 久久草.com| 小说区图片区色综合区| 日本精品二区| 日本道不卡免费一区| 少妇熟女一区二区| 综合色一区二区| 日本一级黄视频| 亚洲黄页一区| 北条麻妃在线视频| 久久精品国产一区二区| 欧美激情第四页| 高清免费成人av| 最近日本中文字幕| 国产欧美精品区一区二区三区| 精品在线观看一区| 悠悠色在线精品| 成人毛片在线播放| 欧美日本韩国一区二区三区视频| 精品久久久中文字幕人妻| 精品国产一区二区亚洲人成毛片| 日本成人一区| 视频在线一区二区| 91超碰免费在线| 日韩美女主播视频| 成人污版视频| 精品久久蜜桃| 日本一区二区在线看| 国产91沈先生在线播放| 久久国产精品久久久久久电车| av中文字幕网址| 成人精品国产一区二区4080| 中文字幕av久久爽一区| 一区二区三区不卡在线观看| 男人午夜免费视频| 91精品国产高清一区二区三区| 人人妻人人澡人人爽久久av| 色吧影院999| 91av久久| 91精品视频免费| 亚洲免费观看高清完整版在线观| 中国成人亚色综合网站 | 一区二区三区精品在线观看| 特级毛片www| 日韩欧美aaaaaa| 成人精品一区二区三区免费 | 欧美日韩伦理一区二区| 国产一区免费视频| 91精品啪在线观看国产81旧版| 久久美女福利视频| 国产福利91精品| 欧美成人另类视频| 同产精品九九九| 国产jzjzjz丝袜老师水多 | 在线观看免费黄色网址| 欧美日韩国产精品一区二区不卡中文| 911美女片黄在线观看游戏| 日韩精品在线视频| 免费看电影在线| 成人激情电影一区二区| 禁果av一区二区三区| 免费人成在线观看视频播放| 久久国产乱子精品免费女| 泷泽萝拉在线播放| 亚洲国产一区二区在线播放| 国产精品久久久久久久久久久久久久久久久久 | 日本电影亚洲天堂| 国产欧美啪啪| 国产乱人伦精品一区二区三区| 精品亚洲欧美一区| 天天操天天舔天天射| 日本高清不卡一区| 日本中文字幕一区二区有码在线| 欧美精品久久久久| 视频二区欧美| 日日噜噜夜夜狠狠久久丁香五月| 日韩成人精品视频| 亚洲自拍偷拍图| 色伊人久久综合中文字幕| 亚洲欧美日韩免费| 欧美亚洲国产日本| 欧美久久精品| 成人网站免费观看入口| 成人福利电影精品一区二区在线观看 | 人体久久天天| 欧美视频免费看欧美视频| 福利一区二区在线观看| 久久久久99精品成人片毛片| 日韩精品综合一本久道在线视频| 成人毛片av在线| 亚洲一区二区在线| 欧美黄污视频| 黄色国产在线视频| 午夜久久久久久| 深夜福利视频在线观看| 日本午夜人人精品| 国产不卡一二三区| a在线观看免费视频| 国产精品丝袜一区| 97精品人妻一区二区三区| 精品国产欧美成人夜夜嗨| 国产区一区二| 777久久精品一区二区三区无码 | 精品孕妇一区二区三区| 亚洲已满18点击进入在线看片 | 欧美激情欧美激情| 极品国产人妖chinesets亚洲人妖| 无码熟妇人妻av在线电影| 成人免费福利片| 天天干天天干天天| 中文字幕精品www乱入免费视频| 欧美xxxx网站| 青青青在线观看视频| 不卡视频一二三| 久久久国产免费| 啊v视频在线一区二区三区 | 久久精品免费观看| 中文字幕人妻一区二| 精品福利在线导航| 日韩毛片免费观看| 懂色av一区二区三区四区五区| 国产一区二区三区av电影| 国产无遮挡裸体免费视频| 亚洲欧美综合精品久久成人| 欧美黄页在线免费观看| 99久久久精品视频| 久久亚洲精精品中文字幕早川悠里| 午夜精品免费观看| 欧美黑人视频一区| 精品久久久久久久| 色诱av手机版| 欧美在线不卡视频| 日韩欧美一起| 欧洲一区二区日韩在线视频观看免费| 久久精品国产99久久6| 久久免费精彩视频| 中文字幕免费精品一区高清| 香蕉免费一区二区三区在线观看 | 亚洲不卡系列| 国产 欧美 日本| 国产片一区二区三区| 成人免费观看在线视频| 国产精品欧美日韩| 亚洲精品韩国| 一起操在线播放| 亚洲香蕉在线观看| 加勒比久久高清| 国产一级免费大片| 在线精品亚洲一区二区不卡| 黄页网站在线| 黑人巨大国产9丨视频| 国产视频亚洲色图|