精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器人學會轉筆、盤核桃了!GPT-4加持,任務越復雜,表現越優秀

人工智能
家人們,繼人工智能(AI)攻占象棋、圍棋、Dota之后,轉筆這一技能也被 AI 機器人學會了。

大數據文摘出品

家人們,繼人工智能(AI)攻占象棋、圍棋、Dota之后,轉筆這一技能也被 AI 機器人學會了。

上面這個筆轉的賊溜的機器人,得益于名叫Eureka的智能體(Agent),是來自英偉達、賓夕法尼亞大學、加州理工學院和得克薩斯大學奧斯汀分校的一項研究。

得Eureka“指點”后的機器人還可以打開抽屜和柜子、扔球和接球,或者使用剪刀。據英偉達介紹,Eureka有10種不同的類型,可執行29種不同的任務。

要知道在之前,單就轉筆這一功能,僅靠人類專家手工編程,是無法如此順滑的實現的。

機器人盤核桃

而Eureka 能夠自主編寫獎勵算法來訓練機器人,且碼力強勁:自編的獎勵程序在 83% 的任務中超越了人類專家,能使機器人的性能平均提升52%。

Eureka開創了一種從人類反饋中無梯度學習的新途徑,它能夠輕松吸收人類提供的獎勵和文字反饋,從而進一步完善自己的獎勵生成機制。

具體而言,Eureka 利用了 OpenAI 的 GPT-4 來編寫用于機器人的試錯學習的獎勵程序。這意味著該系統并不依賴于人類特定任務的提示或預設的獎勵模式。

Eureka 通過在 Isaac Gym 中使用 GPU 加速的仿真,能夠快速評估大量候選獎勵的優劣,從而實現更有效率的訓練。接著,Eureka 會生成訓練結果的關鍵統計信息摘要,并指導 LLM(Language Model,語言模型)改進獎勵函數的生成。通過這種方式,AI 智能體能夠獨立地改善對機器人的指令。

Eureka的框架

研究人員還發現,任務越復雜,GPT-4 的指令就越能優于所謂的"獎勵工程師"的人類指令。參與該研究的研究員甚至稱 Eureka 為“超人類獎勵工程師”。

Eureka 成功地彌補了高層推理(編碼)和低層運動控制之間的鴻溝。其采用了一種被稱為 "混合梯度架構":一個純推理的黑盒子 LLM(Language Model,語言模型)引導一個可學習的神經網絡。在這個架構中,外層循環運行 GPT-4 來優化獎勵函數(無梯度),而內層循環則運行強化學習以訓練機器人的控制器(基于梯度)。

——NVIDIA的高級研究科學家Linxi "Jim" Fan

Eureka 可以整合人類的反饋,以便更好地調整獎勵,使其更符合開發者的期望。Nvidia 把這個過程稱為"in-context RLHF"(從人類反饋中進行上下文學習)

值得注意的是,Nvidia 的研究團隊已經開源了 Eureka 的 AI 算法庫。這將使得個人和機構能夠通過 Nvidia Isaac Gym 來探索和實驗這些算法。Isaac Gym 是建立在 Nvidia Omniverse 平臺上的,這是一個基于 Open USD 框架用于創建 3D 工具和應用程序的開發框架。

  • 論文鏈接:https://arxiv.org/pdf/2310.12931.pdf
  • 項目鏈接:https://eureka-research.github.io/
  • 代碼鏈接:https://github.com/eureka-research/Eureka

如何評價?

在過去的十年中,強化學習取得了巨大的成功,但我們必須承認其中仍存在持續的挑戰。之前雖然有嘗試引入類似的技術,但與使用語言模型(LLM)來輔助獎勵設計的 L2R(Learning to Reward)相比,Eureka 更為突出,因為它消除了特定任務提示的需要。Eureka 之所以能比 L2R 更出色,是因為它能夠創建自由表達的獎勵算法,并利用環境源代碼作為背景信息。

英偉達的研究團隊進行了一項調查,以探索在使用人類獎勵函數啟動時,是否能提供一些優勢。實驗的目的是想看看是否你們能順利地用初始 Eureka 迭代的輸出替代原始的人類獎勵函數。

在測試中,英偉達的研究團隊在每個任務的情境下,使用相同的強化學習算法和相同的超參數對所有最終獎勵函數進行了優化。為了測試這些特定任務的超參數是否經過良好調整以確保人工設計的獎勵的有效性,他們采用了經過充分調整的近端策略優化(PPO)實現,這個實現基于之前的工作,沒有進行任何修改。對于每個獎勵,研究人員進行了五次獨立的 PPO 訓練運行,并報告了策略檢查點達到的最大任務指標值的平均值,作為獎勵性能的度量。

結果顯示:人類設計者通常對相關狀態變量有很好的理解,但在設計有效獎勵方面可能缺乏一定的熟練度。

Nvidia 的這項開創性研究在強化學習和獎勵設計領域開辟了新的疆界。他們的通用獎勵設計算法 Eureka 利用了大型語言模型和上下文進化搜索的力量,能夠在廣泛的機器人任務領域生成人類水平的獎勵,而無需特定任務提示或人工干預,這在很大程度上改變了我們對 AI 和機器學習的理解。

責任編輯:趙寧寧 來源: 大數據文摘
相關推薦

2023-10-21 21:14:00

AI模型

2019-12-24 09:31:55

機器人人工智能編程

2022-10-28 13:16:07

四足機器人機器人人工智能

2017-03-27 09:59:25

機器人自創語言交流

2023-10-29 18:14:08

GPT4機器人算法

2025-06-11 14:45:26

機器人訓練數據

2025-09-08 09:12:00

2025-09-15 14:50:03

AI機器人開發

2012-10-09 10:12:12

2021-01-04 09:18:36

機器人人工智能系統

2023-07-29 13:14:40

谷歌人工智能

2018-07-06 08:58:53

機器人人工智能系統

2020-04-28 10:20:23

5G窄帶物聯網運營商

2023-03-16 19:17:57

2022-02-13 00:03:06

AndroidAndroid 13安卓

2025-10-09 13:19:47

2024-05-28 13:03:50

2023-06-19 08:19:50

2020-09-02 10:36:52

機器人人工智能系統

2022-06-07 14:35:53

機器人人工智能
點贊
收藏

51CTO技術棧公眾號

中文字幕av免费在线观看| 韩国无码av片在线观看网站| 久久精品国产成人av| 欧美码中文字幕在线| 欧美精品高清视频| 日韩av高清在线看片| www.视频在线.com| 国产jizzjizz一区二区| 国产suv精品一区二区| 波多野结衣亚洲一区二区| 久久悠悠精品综合网| 欧美日本视频在线| 国产二区视频在线播放| а√中文在线8| 国产午夜精品福利| 动漫美女被爆操久久久| 正在播放木下凛凛xv99| 亚洲国产日本| 色偷偷888欧美精品久久久| 久久人妻一区二区| 亚洲免费一区三区| 欧美日本韩国一区| 免费欧美一级视频| 日本天码aⅴ片在线电影网站| 久久久综合精品| 91传媒在线免费观看| 成人黄色激情视频| 香蕉视频成人在线观看| 欧美精品久久久久久久久| 亚洲色图100p| 欧美日韩久久精品| 亚洲精品小视频| 国产高潮失禁喷水爽到抽搐 | 国产精品久久久久桃色tv| 国产一区二区三区四区五区加勒比| 国产又粗又黄又爽的视频| 久久福利精品| 欧美一级视频免费在线观看| 精品一区二区三区四| 外国成人激情视频| 色哟哟网站入口亚洲精品| 欧美做受xxxxxⅹ性视频| 日韩精品社区| 亚洲精品久久久久久久久久久 | 亚洲av无码不卡| 99视频一区| 久久露脸国产精品| 国产在线视频你懂的| 欧美成人有码| 欧美大片欧美激情性色a∨久久| 三级黄色片在线观看| 精品国产一区二区三区久久久樱花| 日韩精品亚洲元码| 在线免费观看成年人视频| 婷婷综合一区| 亚洲免费视频在线观看| 日韩人妻无码一区二区三区| 欧美人妖视频| 亚洲欧美日韩一区二区在线| 男生草女生视频| 精品国产一区二区三区| 日韩中文字幕第一页| 亚洲怡红院在线观看| 久久久久亚洲| 欧美老女人xx| 日本少妇xxxx动漫| 欧美亚洲视频| 国产精品一区二区三区久久久| 在线观看免费中文字幕| 国模一区二区三区白浆| www久久99| 桃花色综合影院| 亚洲国产高清在线观看视频| 一区中文字幕在线观看| 色av手机在线| 色婷婷综合久久| 亚洲天堂av一区二区| 亚洲日本va午夜在线电影| 亚洲国产成人久久| 人妻视频一区二区| 欧美在线日韩| 欧美性受xxx| 亚洲天堂中文网| 国产不卡高清在线观看视频| 久久久久久久久一区| 91大神在线网站| 一区二区三区在线看| 日本成年人网址| 日韩毛片免费视频一级特黄| 欧美精品一区在线观看| mm131美女视频| 日韩电影二区| 午夜美女久久久久爽久久| 在线观看中文字幕视频| 国内一区二区在线| 久久精品99久久| 久久bbxx| 五月激情丁香一区二区三区| 91高清国产视频| 丝袜av一区| 美女av一区二区三区| 日本一区二区三区精品| 国产一级精品在线| 免费成人看片网址| 在线播放免费av| 在线观看一区二区视频| 久久久久亚洲AV成人网人人小说| 成人aaaa| 2019中文字幕在线| 精品黑人一区二区三区国语馆| 久久久久国产精品免费免费搜索| www国产免费| 精品无人乱码一区二区三区| 亚洲白虎美女被爆操| 久草手机视频在线观看| 麻豆精品网站| 国产精品国色综合久久| 久久日韩视频| 欧美日韩国产一级| 一级黄色性视频| 亚洲毛片网站| 国产精品视频入口| 亚洲欧美成人影院| 欧美一区在线视频| 五月婷婷六月香| 久久字幕精品一区| 玖玖玖精品中文字幕| 色婷婷视频在线观看| 欧美一区二区在线播放| 一级片黄色录像| 人人超碰91尤物精品国产| 麻豆av一区二区| 国产在线天堂www网在线观看| 日韩视频123| 97成人资源站| 精品一区二区在线免费观看| 亚洲精品国产系列| 国产成人精品一区二区三区在线| 亚洲日韩第一页| 亚洲自拍一区在线观看| 91丝袜高跟美女视频| 男人的天堂狠狠干| 岛国精品一区| 久久久免费在线观看| 亚洲欧美另类日韩| 午夜精品久久久久影视| 日本黄色动态图| 一本色道精品久久一区二区三区 | 欧美亚洲国产激情| 国产精品高潮呻吟久久av野狼| 蜜桃视频在线入口www| 色噜噜偷拍精品综合在线| 国产精品亚洲无码| 日韩av电影天堂| 亚洲欧美日韩精品在线| 伊人久久大香| 久久91亚洲精品中文字幕奶水| av中文字幕免费在线观看| 曰韩精品一区二区| 99riav国产精品视频| 99香蕉国产精品偷在线观看 | 偷拍与自拍一区| 亚洲男人在线天堂| 三级在线观看一区二区| 亚洲7777| 免费一区二区三区在线视频| 久久久久久久97| 午夜影院免费视频| 欧美在线观看18| 人人澡人人澡人人看| 国产91精品在线观看| 成人一区二区免费视频| 少妇精品久久久一区二区| 国产精品久久久久久久一区探花| 黄网站在线免费| 欧美精品一区二区精品网| 精品人妻一区二区三区免费看| 国产日韩v精品一区二区| 手机版av在线| 国产欧美午夜| 亚洲免费久久| 国产成人澳门| 国产精品久久久久久中文字| 四虎影院观看视频在线观看| 日韩av网址在线观看| 中文字幕乱码视频| 亚洲午夜日本在线观看| 美女100%露胸无遮挡| 国产成人亚洲综合色影视| 成人av一级片| 亚洲欧美伊人| 日本不卡免费新一二三区| 亚洲我射av| 欧美亚洲视频在线看网址| 精品欧美色视频网站在线观看| 精品福利二区三区| 一级黄色大片免费观看| 午夜伦理一区二区| 波多野结衣久久久久| 91免费观看在线| 国产伦精品一区二区三区妓女下载| 久久不射网站| 久久久久久av无码免费网站下载| 国产一区2区| 国产在线精品一区二区中文| 日韩综合av| 日本aⅴ大伊香蕉精品视频| 1024在线播放| 中文字幕在线亚洲| 欧美18xxxxx| 欧美va在线播放| 97人妻精品一区二区三区视频 | 色综合久久中文字幕综合网小说| 国产区高清在线| 精品99一区二区三区| 国产欧美久久久精品免费| 在线观看亚洲精品| 国产成人无码精品| 亚洲精品乱码久久久久久久久| 日本一卡二卡在线播放| 久久综合九色欧美综合狠狠| 日本xxxx免费| 国产一区二区三区精品欧美日韩一区二区三区 | 亚洲日本无吗高清不卡| 狠狠综合久久av一区二区蜜桃 | 日本韩国在线不卡| 51精品视频| 国产最新精品视频| 青青草视频在线免费直播| 欧美成人四级hd版| 国产鲁鲁视频在线观看特色| 少妇精69xxtheporn| 国产日韩精品在线看| 亚洲人成伊人成综合网久久久| 天堂中文网在线| 亚洲国产精品字幕| 色婷婷av一区二区三区之红樱桃 | 91人人爽人人爽人人精88v| 99riav视频一区二区| 国产精品第二页| 色天使综合视频| 国产精品久久久久久久久久| 日日夜夜天天综合| 国产精品高潮呻吟久久av野狼| 欧美xxxx做受欧美护士| 国产精品第二页| 国产成人久久精品麻豆二区| 91精品国产综合久久香蕉922| 欧美黄页免费| 91成人伦理在线电影| 中文字幕一区二区三区中文字幕| 97超碰资源| 给我免费播放日韩视频| 久草一区二区| 国产成人3p视频免费观看| 日本欧美色综合网站免费| 国产一区二区三区不卡视频网站| 神马一区二区影院| 97精品国产福利一区二区三区| 在线国产伦理一区| 欧美一区二区三区久久精品| 人人妻人人澡人人爽欧美一区| 国产一区激情| avav在线看| 美女在线观看视频一区二区| 超碰在线超碰在线| 不卡av在线网| 亚洲精品国产91| 自拍视频在线观看一区二区| 黄色一级片在线免费观看| 天天色综合成人网| 国产一区二区视频免费| 欧美精品乱人伦久久久久久| 99热精品在线播放| 日韩电影中文字幕在线| 北条麻妃在线| 欧美高跟鞋交xxxxhd| 亚洲美女久久精品| 国产综合福利在线| 麻豆一区二区麻豆免费观看| 神马欧美一区二区| 国内视频精品| 久久精品免费网站| 国产电影精品久久禁18| 一区二区不卡免费视频| 国产精品国产自产拍在线| 精品视频久久久久| 欧美性生活影院| 人妻va精品va欧美va| 色偷偷综合社区| 91资源在线观看| 国产一区二区色| 全国精品免费看| 精品国产一区二区三区在线| 国产精品一卡| 亚洲一区二区三区三州| 久久久久久久久久久久久久久99| 国产三级国产精品国产国在线观看| 姬川优奈aav一区二区| 国产精品永久久久久久久久久| 日韩成人中文字幕在线观看| 成码无人av片在线观看网站| 日韩免费精品视频| 国产精品18hdxxxⅹ在线| 亚洲人成网站在线播放2019| 亚洲一级在线| 日批视频免费看| 一区在线播放视频| 国产情侣小视频| 亚洲国产精品字幕| 日本在线观看高清完整版| 国产欧美精品xxxx另类| 亚洲精品中文字幕99999| 国产激情在线看| 久久99精品久久久久久动态图| 国产色视频一区二区三区qq号| 亚洲成av人片在线观看| 国产av无码专区亚洲a∨毛片| 少妇av一区二区三区| 亚洲综合电影| 国产一区自拍视频| 亚洲国产午夜| 色综合久久久无码中文字幕波多| 国产精品青草综合久久久久99| 中文字幕免费观看| 亚洲精品美女在线观看| hd国产人妖ts另类视频| 91九色蝌蚪成人| 亚洲精品一区二区在线看| 天天干天天操天天做| 国产欧美日本一区二区三区| 欧美一级淫片免费视频黄| 日韩成人久久久| 亚洲人体影院| 久久久一本精品99久久精品| 一本色道久久综合亚洲精品高清 | 草草久久久无码国产专区| 成人免费看的视频| 久久久国产精品黄毛片| 日韩精品中文字幕一区| 欧美黄色视屏| 国产嫩草一区二区三区在线观看| 精品电影一区| 国产xxxx视频| 狠狠躁夜夜躁久久躁别揉| 天堂中文资源在线| 欧美在线视频观看免费网站| 一区二区小说| 青青草av网站| 国产精品成人网| 国产手机av在线| 欧美国产日本高清在线 | 亚洲成人性视频| 999av小视频在线| 精品日韩电影| 老**午夜毛片一区二区三区| 18精品爽国产三级网站| 91精品国产综合久久福利| 羞羞视频在线免费国产| 国产精品视频免费一区二区三区| 一本久久综合| 国产农村妇女精品一区| 欧美一区二区三区免费| 久久久久黄久久免费漫画| 久久精品国产理论片免费| 日日夜夜一区二区| 日韩一卡二卡在线观看| 欧美成人猛片aaaaaaa| 超碰在线cao| 日韩一区国产在线观看| 国产一区在线观看麻豆| 国产无套内射又大又猛又粗又爽| 日韩精品有码在线观看| 欧美成人黄色| 欧美一级免费播放| 久久精品欧美日韩精品| 国产精品一区二区人人爽| 91国内揄拍国内精品对白| 欧美视频免费| 伊人久久一区二区三区| 91久久精品一区二区二区| 国内精品不卡| 欧美亚洲免费在线| 国产一区二区三区免费播放| 久久久久久久久影院| 久久夜精品香蕉| 天堂网av成人| 三级av免费看| 欧美性少妇18aaaa视频| 欧美成人二区| 久久婷婷人人澡人人喊人人爽| 美女尤物国产一区| 在线观看黄网站| 美女黄色丝袜一区| 精品一区欧美| 无码人妻一区二区三区一| 欧美综合久久久| www中文字幕在线观看| 亚洲午夜久久久影院伊人| 从欧美一区二区三区|