精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LeCun新作:分層世界模型,數(shù)據(jù)驅(qū)動(dòng)的人型機(jī)器人控制

人工智能 新聞
在復(fù)雜的物理世界中,人型機(jī)器人的全身控制一直是個(gè)難題,現(xiàn)有的強(qiáng)化學(xué)習(xí)做出的效果有時(shí)會(huì)比較抽象。近日,LeCun參與的一項(xiàng)工作給出了基于數(shù)據(jù)驅(qū)動(dòng)的全新解決方案。

有了大模型作為智能上的加持,人型機(jī)器人已然成為新的風(fēng)口。

科幻電影中「安能辨我不是人」的機(jī)器人似乎已經(jīng)越來(lái)越近了。

不過(guò),要想像人類(lèi)一樣思考和行動(dòng),對(duì)于機(jī)器人,特別是人型機(jī)器人來(lái)說(shuō),仍是個(gè)艱巨的工程問(wèn)題。

就拿簡(jiǎn)單的學(xué)走路來(lái)說(shuō),利用強(qiáng)化學(xué)習(xí)來(lái)訓(xùn)練可能會(huì)演變成下面這樣:

道理上沒(méi)什么問(wèn)題(遵循獎(jiǎng)勵(lì)機(jī)制),上樓梯的目標(biāo)也達(dá)到了,除了過(guò)程比較抽象,跟大部分人類(lèi)的行為模式可能不太一樣。

機(jī)器人之所以很難像人一樣「自然」行動(dòng),原因在于觀察和行動(dòng)空間的高維性質(zhì),以及雙足動(dòng)物形態(tài)固有的不穩(wěn)定性。

對(duì)此,LeCun參與的一項(xiàng)工作給出了基于數(shù)據(jù)驅(qū)動(dòng)的全新解決方案。

論文地址:https://arxiv.org/pdf/2405.18418

項(xiàng)目介紹:https://nicklashansen.com/rlpuppeteer

先看療效:

對(duì)比右邊的效果,新的方法訓(xùn)練出了更接近于人類(lèi)的行為,雖然有點(diǎn)「喪尸」的意味,但抽象度降低了不少,至少在大部分人類(lèi)的能力范圍之內(nèi)。

當(dāng)然了,也有來(lái)?yè)v亂的網(wǎng)友表示,「還是之前那個(gè)看著更有意思」。

圖片

在這項(xiàng)工作中,研究人員探索了基于強(qiáng)化學(xué)習(xí)的、高度數(shù)據(jù)驅(qū)動(dòng)的、視覺(jué)全身人形控制方法,沒(méi)有任何簡(jiǎn)化的假設(shè)、獎(jiǎng)勵(lì)設(shè)計(jì)或技能原語(yǔ)。

作者提出了一個(gè)分層世界模型,訓(xùn)練高級(jí)和低級(jí)兩個(gè)智能體,高級(jí)智能體根據(jù)視覺(jué)觀察生成命令,供低級(jí)智能體執(zhí)行。

開(kāi)源代碼:https://github.com/nicklashansen/puppeteer

這個(gè)模型被命名為Puppeteer,利用一個(gè)模擬的56-DoF人形機(jī)器人,在8個(gè)任務(wù)中生成了高性能的控制策略,同時(shí)合成了自然的類(lèi)似人類(lèi)的動(dòng)作,并具有穿越挑戰(zhàn)性地形的能力。

高維控制的分層世界模型

在物理世界中學(xué)習(xí)訓(xùn)練出通用的智能體,一直是AI領(lǐng)域研究的目標(biāo)之一。

而人形機(jī)器人通過(guò)集成全身控制和感知,能夠執(zhí)行各種任務(wù),于是作為多功能平臺(tái)脫穎而出。

不過(guò)要模仿咱們這種高級(jí)動(dòng)物,代價(jià)還是很大的。

比如下圖中,人型機(jī)器人為了不踩坑,就需要準(zhǔn)確地感知迎面而來(lái)的地板縫隙的位置和長(zhǎng)度,同時(shí)仔細(xì)協(xié)調(diào)全身運(yùn)動(dòng),使其有足夠的動(dòng)量和范圍來(lái)跨越每個(gè)縫隙。

Puppeteer基于LeCun在2022年提出的分層JEPA世界模型,是一種數(shù)據(jù)驅(qū)動(dòng)的RL方法。

它由兩個(gè)不同的智能體組成:一個(gè)負(fù)責(zé)感知和跟蹤,通過(guò)關(guān)節(jié)級(jí)控制跟蹤參考運(yùn)動(dòng);另一個(gè)「視覺(jué)木偶」(puppeteer),通過(guò)合成低維參考運(yùn)動(dòng)來(lái)學(xué)習(xí)執(zhí)行下游任務(wù),為前者的跟蹤提供支持。

Puppeteer使用基于模型的RL算法——TD-MPC2,在兩個(gè)不同的階段獨(dú)立訓(xùn)練兩個(gè)智能體。

(ps:這個(gè)TD-MPC2就是文章開(kāi)篇用來(lái)比較的那個(gè)動(dòng)圖,別看有點(diǎn)抽象,那實(shí)際上是之前的SOTA,發(fā)表在今年的ICLR,一作同樣也是本文的一作。)

第一階段,首先對(duì)用于跟蹤的世界模型進(jìn)行預(yù)訓(xùn)練,使用預(yù)先存在的人類(lèi)動(dòng)作捕捉數(shù)據(jù)作為參考,將運(yùn)動(dòng)轉(zhuǎn)換為物理上可執(zhí)行的動(dòng)作。這個(gè)智能體可以保存起來(lái),在所有下游任務(wù)中重復(fù)使用。

在第二階段,訓(xùn)練一個(gè)木偶世界模型,該模型以視覺(jué)觀察為輸入,并根據(jù)指定的下游任務(wù),整合另一個(gè)智能體提供的參考運(yùn)動(dòng)作為輸出。

這個(gè)框架看上去大道至簡(jiǎn):兩個(gè)世界模型在算法上是相同的,只是在輸入/輸出上不同,并且使用RL進(jìn)行訓(xùn)練,無(wú)需其他任何花里胡哨的東西。

與傳統(tǒng)的分層RL設(shè)置不同的是,「木偶」輸出的是末端執(zhí)行器關(guān)節(jié)的幾何位置,而不是目標(biāo)的嵌入。

這使得負(fù)責(zé)跟蹤的智能體易于在任務(wù)之間共享和泛化,節(jié)省整體計(jì)算占用的空間。

研究方法

研究人員將視覺(jué)全身人形控制,建模為一個(gè)由馬爾可夫決策過(guò)程(MDP)控制的強(qiáng)化學(xué)習(xí)問(wèn)題,該過(guò)程以元組(S,A,T,R,γ,?)為特征,

其中S是狀態(tài),A是動(dòng)作,T是環(huán)境轉(zhuǎn)換函數(shù), R是標(biāo)量獎(jiǎng)勵(lì)函數(shù), γ是折扣因子,?是終止條件。

如上圖所示,研究人員使用RL在人類(lèi)MoCap數(shù)據(jù)上預(yù)訓(xùn)練跟蹤智能體,用于獲取本體感覺(jué)信息和抽象參考運(yùn)動(dòng)輸入,并合成跟蹤參考運(yùn)動(dòng)的低級(jí)動(dòng)作。

然后通過(guò)在線互動(dòng),對(duì)負(fù)責(zé)下游任務(wù)的高級(jí)木偶智能體進(jìn)行訓(xùn)練,木偶接受狀態(tài)和視覺(jué)信息輸入,并輸出命令供跟蹤智能體執(zhí)行。

TD-MPC2

TD-MPC2從環(huán)境交互中學(xué)習(xí)一個(gè)潛在的無(wú)解碼器世界模型,并使用學(xué)習(xí)到的模型進(jìn)行規(guī)劃。

圖片

世界模型的所有組件都是使用聯(lián)合嵌入預(yù)測(cè)、獎(jiǎng)勵(lì)預(yù)測(cè)和時(shí)間差異 損失的組合端到端學(xué)習(xí)的,而無(wú)需解碼原始觀察結(jié)果。

在推理過(guò)程中,TD-MPC2遵循模型預(yù)測(cè)控制(MPC)框架,使用模型預(yù)測(cè)路徑積分(MPPI)作為無(wú)導(dǎo)數(shù)(基于采樣)的優(yōu)化器進(jìn)行局部軌跡優(yōu)化。

為了加快規(guī)劃速度,TD-MPC2還事先學(xué)習(xí)了一個(gè)無(wú)模型策略,用于預(yù)啟動(dòng)采樣程序。

兩個(gè)智能體在算法上是相同的,都由以下6個(gè)組件組成:

實(shí)驗(yàn)

為了評(píng)估方法的有效性,研究人員提出了一種新的任務(wù)套件,使用模擬的56自由度人形機(jī)器人進(jìn)行視覺(jué)全身控制,總共包含8個(gè)具有挑戰(zhàn)性的任務(wù),用于對(duì)比的方法包括SAC、DreamerV3以及TD-MPC2。

8個(gè)任務(wù)如下圖所示,包括5個(gè)視覺(jué)條件全身運(yùn)動(dòng)任務(wù),以及另外3個(gè)沒(méi)有視覺(jué)輸入的任務(wù)。

任務(wù)的設(shè)計(jì)具有高度的隨機(jī)性,包括沿著走廊奔跑、跳過(guò)障礙物和縫隙、走上樓梯以及繞過(guò)墻壁。

5個(gè)視覺(jué)控制任務(wù)都使用與線性前進(jìn)速度成正比的獎(jiǎng)勵(lì)函數(shù),而非視覺(jué)任務(wù)則獎(jiǎng)勵(lì)任何方向的位移。

上圖繪制了學(xué)習(xí)曲線。結(jié)果表明,SAC和DreamerV3在這些任務(wù)上無(wú)法實(shí)現(xiàn)有意義的性能。

TD-MPC2在獎(jiǎng)勵(lì)方面的性能與本文的方法相當(dāng),但會(huì)產(chǎn)生不自然的行為(參見(jiàn)下圖中的抽象動(dòng)作)。

圖片

此外,為了證明Puppeteer生成的動(dòng)作確實(shí)更「自然」,本文還進(jìn)行了人類(lèi)偏好的實(shí)驗(yàn),對(duì)46名參與者的測(cè)試表明,人類(lèi)普遍喜歡本文方法生成的運(yùn)動(dòng)。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2024-12-09 07:15:00

世界模型AILLM

2020-04-10 21:36:46

協(xié)作機(jī)器人物聯(lián)網(wǎng)機(jī)器人

2024-09-18 13:30:00

2025-07-22 12:37:16

2025-09-17 18:03:37

2025-06-13 00:03:00

2025-06-13 09:10:00

2025-10-28 09:13:58

2025-03-19 10:26:10

2023-05-22 19:16:09

人工智能機(jī)器人

2017-08-24 13:14:38

AI人工智能機(jī)器人

2024-04-28 14:54:09

機(jī)器人代碼

2020-10-15 15:42:00

人工智能

2025-10-28 01:22:00

2025-09-16 12:53:54

2023-07-29 13:43:26

機(jī)器人模型

2022-07-24 19:24:32

機(jī)器學(xué)習(xí)預(yù)訓(xùn)練模型機(jī)器人

2021-07-22 10:17:55

加密機(jī)器人加密貨幣機(jī)器人

2025-11-17 08:46:00

AI模型技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日本成人三级电影| 亚洲一区在线观| 青青视频一区二区| 91福利在线看| 国产又粗又爽又黄的视频| 天天爱天天干天天操| 日韩在线播放一区二区| 久久中文字幕在线| 超碰97人人干| 国语精品视频| 91福利资源站| 缅甸午夜性猛交xxxx| 亚洲1卡2卡3卡4卡乱码精品| 国产一区二区三区黄视频| 51色欧美片视频在线观看| 国产日产精品一区二区三区的介绍| 9l亚洲国产成人精品一区二三| 91国产成人在线| 久久人人爽人人爽人人av| av在线1区2区| hitomi一区二区三区精品| 国产女人18毛片水18精品| 日干夜干天天干| 99热国内精品| 亚洲人精选亚洲人成在线| 中文字幕乱妇无码av在线| 日韩免费小视频| 午夜欧美视频在线观看| 最新av网址在线观看| 电影在线一区| 久久亚洲精精品中文字幕早川悠里| 91香蕉电影院| 91国内精品视频| 肉肉av福利一精品导航| 97精品在线视频| 久久99久久久| 欧美伊人影院| 久久久99免费视频| 国产在视频线精品视频| 精品国产91久久久久久浪潮蜜月| 亚洲精品成人久久| av电影在线播放| 天堂久久av| 日韩免费在线观看| 久久久久99人妻一区二区三区| 欧美日韩破处视频| 欧美三级日韩在线| 黄色片在线免费| 欧美性xxx| 精品欧美激情精品一区| 欧美亚洲精品一区二区| 91桃色在线| 亚洲高清免费观看高清完整版在线观看| 手机看片日韩国产| 五月花成人网| 亚洲国产精品一区二区久久恐怖片| 粉嫩av一区二区三区天美传媒| gogo在线高清视频| 一区二区三区加勒比av| 2018日日夜夜| 黄色在线观看www| 欧美日韩国产精品| 亚洲色成人一区二区三区小说| 自由日本语热亚洲人| 日韩欧美视频一区二区三区| 日本黄网站免费| 澳门av一区二区三区| 欧美影院午夜播放| 亚洲自拍第三页| 视频成人永久免费视频| 亚洲第一视频在线观看| 亚洲午夜久久久久久久久红桃 | 清纯唯美一区二区三区| 成人精品一区二区三区免费 | 亚洲欧美日本精品| 免费看91的网站| 911久久香蕉国产线看观看| 欧美精品免费看| 三级黄色在线视频| 日本成人在线电影网| 91美女高潮出水| 天堂网在线观看视频| 成人h动漫精品一区二区| 乱色588欧美| 久操视频在线播放| 午夜精品福利在线| 超碰在线播放91| 香蕉成人app| 亚洲精品视频中文字幕| 中文字幕观看av| 亚洲精品1区| 国产精品久久久久久久久久久久| 国产毛片在线视频| 26uuu久久天堂性欧美| 一区二区三区国| av在线不卡免费| 欧美色窝79yyyycom| 欧美图片自拍偷拍| 精品美女久久| 性欧美激情精品| 亚洲图片欧美在线| 99re这里只有精品视频首页| 中文字幕一区二区三区四区五区 | 成人免费黄色网页| 亚洲国产精品视频| jizz欧美性11| 色老板在线视频一区二区| 中文字幕视频在线免费欧美日韩综合在线看 | 五月婷婷亚洲| 国产精品白嫩初高中害羞小美女 | 澳门久久精品| 日日摸夜夜添一区| 特级西西444www大精品视频免费看| 另类中文字幕网| 精品日韩美女| 国产高清在线a视频大全| 欧美日韩专区在线| 国产三级视频网站| 精品9999| 99www免费人成精品| 中文字幕在线播放| 色综合久久久网| 逼特逼视频在线观看| 正在播放日韩欧美一页| 国产精品久久久久久网站| 好吊视频一区二区三区| 亚洲欧洲日韩一区二区三区| 99福利在线观看| 精品久久ai| 欧美区二区三区| 91激情在线观看| 国产精品免费aⅴ片在线观看| 国产91在线视频观看| 国产成人一二| 欧美激情在线观看| www.黄色片| 亚洲精品成人精品456| 日本特黄a级片| 精品久久电影| 国产成人在线播放| 男男电影完整版在线观看| 丰满岳妇乱一区二区三区| 亚洲一区二区在线免费| 在线高清一区| 精品在线一区| 在线人成日本视频| 日韩精品极品视频| 亚洲另类欧美日韩| 久久蜜桃av一区精品变态类天堂 | 国产精品第一国产精品| 亚洲美腿欧美激情另类| 青草视频在线观看免费| 国产亚洲污的网站| www.天天射.com| 日韩www.| 96pao国产成视频永久免费| 国产美女av在线| 欧美大片免费久久精品三p| 欧美国产精品一二三| 国产a精品视频| www.av片| 加勒比久久综合| 国产日韩视频在线观看| 国产欧美黑人| 亚洲国产精品悠悠久久琪琪| 一级免费在线观看| 久久久国际精品| 亚洲精品手机在线观看| 国产一区二区中文| 久久99精品久久久久久久青青日本 | 亚洲精品国偷拍自产在线观看蜜桃| 亚洲一区自拍偷拍| 亚洲av无码成人精品国产| 日本在线不卡视频| av电影一区二区三区| 加勒比色综合久久久久久久久 | 亚洲高清影院| 欧美激情免费观看| 青草久久伊人| 91.麻豆视频| 日韩欧美亚洲视频| 国产欧美一区二区三区在线老狼| 黄色一级片免费的| 亚洲国产91| 色姑娘综合网| 99香蕉久久| 国产精品电影观看| 午夜在线激情影院| 亚洲人成在线观看| 亚洲第一精品网站| 日本高清不卡视频| 久草视频在线资源站| 久久色在线视频| 亚洲天堂一区二区在线观看| 亚洲一区视频| 日韩video| 伊人久久综合影院| 91视频在线免费观看| 欧美色网一区| 韩国国内大量揄拍精品视频| 在线观看免费黄色| 亚洲精品电影网| 国产美女主播在线观看| 色视频一区二区| 精品视频一区二区在线观看| 国产精品色噜噜| 成人无码www在线看免费| 狠狠狠色丁香婷婷综合激情| 欧美日韩在线成人| 亚洲福利电影| 日韩一级免费看| 国产精品国内免费一区二区三区| 精品免费国产| 99国产精品免费网站| 国产欧美在线看| 另类图片综合电影| 午夜精品久久久久久久99热浪潮| 黄网站在线播放| 丝袜美腿亚洲一区二区| 国产大学生校花援交在线播放| 亚洲成人精品视频在线观看| 99精品在线视频观看| 欧美吞精做爰啪啪高潮| 欧美一区二区三区网站| 午夜欧美大尺度福利影院在线看| 中文字幕手机在线观看| 亚洲日本成人在线观看| 国精品人伦一区二区三区蜜桃| 国产午夜精品一区二区三区视频| 中文字幕在线播放视频| 成人黄色大片在线观看| 97中文字幕在线观看| 国产一区二区三区四区在线观看 | 国产精品传媒麻豆hd| 国产精品成人品| 欧美精选视频一区二区| 国产精品18久久久久久麻辣| 岛国av在线网站| 97碰碰碰免费色视频| xxxx在线视频| 国外成人在线视频| av免费在线视| 91高潮精品免费porn| 亚洲黄色网址| 日韩av色综合| 国产精品字幕| 国产精品久久久| 欧洲精品久久久久毛片完整版| 国产免费一区二区三区香蕉精| 欧美黄色成人| 91久久精品国产91性色| 国产精品亚洲一区二区在线观看| 91香蕉嫩草影院入口| 亚洲小说春色综合另类电影| 国产精品视频免费一区| 免费萌白酱国产一区二区三区| 精品一区久久久久久| 国产一区二区观看| 亚洲一区二区三区欧美| 91精品天堂福利在线观看| 日韩一级特黄毛片| 在线成人黄色| 无码内射中文字幕岛国片| 日本va欧美va精品发布| 一区二区三区国产好的精华液| 国产精品一区在线观看乱码| 欧美图片自拍偷拍| 国产网红主播福利一区二区| 久久久久久成人网| 亚洲综合999| 国产精品suv一区二区三区| 色婷婷精品大视频在线蜜桃视频| 日本欧美www| 日韩欧美精品三级| 日韩二区三区| 麻豆成人在线看| av在线加勒比| 国产精品人成电影在线观看| 欧美一区一区| 久久精品国产第一区二区三区最新章节| 国产毛片一区二区三区| 日韩欧美一级在线| 性一交一乱一区二区洋洋av| 午夜剧场高清版免费观看| 成人激情校园春色| 内射毛片内射国产夫妻| 亚洲成在人线在线播放| 日韩国产亚洲欧美| 欧美岛国在线观看| 国产黄在线播放| 欧美福利视频网站| av久久网站| 精品产品国产在线不卡| 久久国产成人午夜av影院宅| av动漫在线看| 国产一区二三区| 在线免费看黄视频| 亚洲一卡二卡三卡四卡| 国产精品成人久久久| 亚洲国产成人久久综合| 日本高清中文字幕在线| 欧美中文在线免费| 日韩中文字幕一区二区高清99| 日日噜噜噜噜夜夜爽亚洲精品| 狠狠入ady亚洲精品| 香港日本韩国三级网站| 2014亚洲片线观看视频免费| 久草成人在线视频| 欧美日韩国产精品成人| 国产免费av高清在线| 久久久久久久久爱| 精品欧美视频| 亚洲成人在线视频网站| 亚洲尤物影院| 国产精品久久久久久久无码| 亚洲欧美激情插 | 亚洲成人中文字幕| 成人在线观看亚洲| 国产精品日日摸夜夜添夜夜av| 欧美人妖在线观看| a级免费在线观看| 国产精品一区二区在线看| 国产在线免费av| 日本乱码高清不卡字幕| 深夜影院在线观看| 午夜精品久久17c| 国产精品一线| 美女黄色免费看| 成人性生交大片免费| 国产这里有精品| 日韩视频免费观看高清完整版 | 日本三级韩国三级久久| 韩国女主播一区二区三区| 97在线国产视频| 国产99久久久国产精品免费看| 久久精品亚洲a| 91精品欧美综合在线观看最新| 日韩子在线观看| 国产精品自产拍在线观看中文| 精品免费av| jizz欧美性11| 综合在线观看色| 国产剧情久久久| 欧美成人国产va精品日本一级| 亚洲人成网站在线在线观看| 在线天堂一区av电影| 韩国欧美一区二区| 人人澡人人澡人人看| 欧美一区日本一区韩国一区| av免费在线观看网址| 91久久大香伊蕉在人线| 欧美午夜不卡| 国产白袜脚足j棉袜在线观看| 亚洲成在线观看| 日韩福利一区二区| 国产美女扒开尿口久久久| 99久久综合| 在线播放av网址| 岛国av一区二区在线在线观看| 激情小说 在线视频| 亚洲日本一区二区| 欧美黑人在线观看| 国产精品99久久久久久似苏梦涵| 日本a级片视频| 精品精品国产高清a毛片牛牛| 91福利区在线观看| 蜜桃狠狠色伊人亚洲综合网站| 老司机亚洲精品| 少妇高潮一区二区三区喷水| 欧美mv日韩mv国产网站| 日本在线啊啊| 亚洲一卡二卡| 国产精品123区| 日本一区二区三区精品| 日韩在线观看免费高清完整版| 美女高潮在线观看| 亚洲福利av| 国产成人免费视频网站高清观看视频 | 91av在线免费观看视频| 国产一区二区在线| 久久久久亚洲av片无码v| 精品国产精品自拍| 日本视频在线播放| 精品国产二区在线| 美女网站在线免费欧美精品| 国产一级中文字幕| 在线精品国产欧美| 综合视频一区| 国产高潮免费视频| 有坂深雪av一区二区精品| 肉丝一区二区| 亚洲一区二区三区视频| 久久一区亚洲| 久久99久久久| 日韩在线视频观看正片免费网站| 超碰97久久| 久久久精品高清| 欧美午夜无遮挡| 日本精品600av| 亚洲精品视频一二三|