精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Dynalang——一種使用語言學習世界模型的AI新技術(shù)

譯文 精選
人工智能
人工智能夢寐以求的目標之一是創(chuàng)造出能夠通過遵循自然語言指令在現(xiàn)實世界中有效完成任務的智能體。大型語言模型(LLM)在實現(xiàn)這一目標方面取得了重大進展,展示了處理定義明確的任務的令人印象深刻的能力。

譯者 | 朱先忠

審校 | 重樓

簡介

這篇文章是我們對人工智能最新研究報道的一部分。

人工智能夢寐以求的目標之一是創(chuàng)造出能夠通過遵循自然語言指令在現(xiàn)實世界中有效完成任務的智能體。大型語言模型(LLM)在實現(xiàn)這一目標方面取得了重大進展,展示了處理定義明確的任務的令人印象深刻的能力。然而,它們的能力目前還是有限的——在面臨需要更廣泛了解世界的任務時往往達不到要求。

加州大學伯克利分校科學家的一篇新研究論文提出了應對這一挑戰(zhàn)的創(chuàng)新方法。本文介紹了一種名為Dynalang的新技術(shù),旨在設(shè)計能夠借助自然語言學習世界模型的強化學習代理。這種方法不僅僅是教人工智能執(zhí)行任務;而且還使得人工智能能夠理解其所在環(huán)境的上下文,并更有力、更高效地執(zhí)行任務。

物理世界中的大型語言模型

PaLM-SayCan使用大型語言模型(LLM)使機器人能夠用自然語言執(zhí)行指令(來源:谷歌博客,地址:https://ai.googleblog.com/2023/02/google-research-2022-beyond-robotics.html)。

LLM的最新進展在各個領(lǐng)域引發(fā)了一波熱潮,包括機器人和現(xiàn)實世界中的任務執(zhí)行代理。LLM的一個非常有前景的方面是它們能夠彌合語言和視覺數(shù)據(jù)之間的差距,從而產(chǎn)生視覺語言模型(VLM)。

VLM能夠?qū)⑽谋居成涞揭曈X數(shù)據(jù);反之亦然,這一功能已在不同的應用領(lǐng)域中得到利用,包括文本到圖像模型和AI圖像搜索領(lǐng)域。這項技術(shù)的一個更先進的應用是將自然語言命令映射到現(xiàn)實世界中的動作。這有時被稱為“具身語言模型”(Embodied Language Models)。

如今,已經(jīng)出現(xiàn)一些技術(shù),其將強化學習與VLM相結(jié)合,以訓練能夠執(zhí)行特定指令的代理。

然而,當前的模型有它們明顯的局限性,例如,它們擅長執(zhí)行非常特定的任務的命令,例如“拿起藍盒子”。不過,最近的進一步研究成果能夠為這些命令添加上一層抽象,使VLM驅(qū)動的代理能夠理解和執(zhí)行更復雜的指令,例如“撿起代表滅絕動物的玩具”。

但在現(xiàn)實世界中,命令和話語往往與上下文有關(guān)。例如,如果是洗碗或上菜,“我把碗收起來了”這句話對代理來說可能意味著不同的事情。加州大學伯克利分校的研究人員指出,“當語言不談論任務時,它只與代理應該采取的最佳行動弱相關(guān)。”

最近,研究人員提出了一種不同的方法。他們建議,與其訓練代理立即完成任務,不如先訓練他們在語言指令的幫助下學習世界模型來預測未來。研究人員寫道:“與下一個表征預測如何允許語言模型形成世界知識的內(nèi)部表征類似,我們假設(shè)預測未來表征為主體理解語言及其與世界的關(guān)系提供了豐富的學習信號。”

這種方法可以幫助人工智能代理了解其環(huán)境的上下文,從而更有力、更高效地執(zhí)行任務。

Dynalang

Dynalang使用語言更好地學習世界模型(來源:GitHub)Dynalang使用語言更好地學習世界模型(來源:GitHub)

加州大學伯克利分校的研究人員提出了一種名為Dynalang的技術(shù),他們將其描述為“一種從在線體驗中學習語言和圖像世界模型并使用該模型學習如何行動的代理。”這項技術(shù)的方法獨特,并提供了兩種不同的訓練模式。

首先,Dynalang學習通過文本和視覺觀察來對世界進行建模。研究人員解釋說,“我們訓練世界模型,當代理在環(huán)境中行動時,利用在線收集的經(jīng)驗來預測未來的潛在表征。”這種方法反映了人類用來將環(huán)境中的觀察結(jié)果映射到語言的一種自我監(jiān)督學習形式。研究人員稱之為“語言條件世界模型”。值得注意的是,Dynalang是多模態(tài)的,這意味著它不僅預測文本,還支持預測未來的視覺表現(xiàn)。

其次,Dynalang通過對世界模型和任務表征的強化學習來學習其行動策略。研究人員寫道:“我們訓練政策采取行動,最大限度地提高任務回報,將世界模型的潛在代表性作為輸入。”。

從本質(zhì)上講,Dynalang旨在通過語言和視覺觀察來學習一個世界模型,然后使用這個模型來學習如何在各種環(huán)境中有效地行動。這種方法可能會在不同的環(huán)境中增強人工智能代理的穩(wěn)健性和效率。

Dynalang的工作原理

加州大學伯克利分校的研究人員利用不同機器學習技術(shù)的巧妙組合開發(fā)了Dynalang。Dynalang的核心是一個旨在執(zhí)行動作的人工智能系統(tǒng),其結(jié)構(gòu)基于強化學習循環(huán)。這個循環(huán)由代理、環(huán)境、操作、狀態(tài)和獎勵組成。Dynalang的根本目標是培養(yǎng)一個能夠最大限度地提高回報的代理。

Dynalang是一個基于模型的強化學習系統(tǒng),這意味著它可以根據(jù)世界模型預測動作和狀態(tài)。同時,使用過去動作的回放緩沖區(qū)作為監(jiān)督學習流來訓練世界模型。根據(jù)環(huán)境的不同,動作空間可以由電機命令、文本生成和其他類型的動作組成。

Dynalang的一個有趣的特性是,它能夠以令牌流形式接收文本指令和描述,同時還可以一起傳遞圖像幀信息。這與在一組任務的開頭提供完整的指令文本的其他技術(shù)形成了鮮明對比。研究人員解釋道,“對于人類來說,閱讀、聽力和口語會隨著時間的推移而延長,在此期間,我們會接收新的視覺輸入,并可以執(zhí)行運動動作。類似地,我們在每個時間步長為我們的代理提供一個視頻幀和一個語言令牌,代理產(chǎn)生一個運動動作,在適用的環(huán)境中,每個時間步長產(chǎn)生一個語言標記。”

與語言模型的許多應用程序一樣,Dynalang可以在原始數(shù)據(jù)(文本和圖像)上進行預訓練,在那里它可以學習每個模型的潛在表示。然后,它可以在較小的傳感器和動作數(shù)據(jù)集上進行微調(diào)。然而,正如研究人員所指出的,有一點需要注意:“與典型的語言建模目標不同,該模型沒有明確地訓練為從前綴預測下一個令牌,除非通過在下一時間步長時的預測表示。”

Dynalang的效果如何?

Dynalang支持在不同類型的環(huán)境中工作——使用語言提示和指令來更好地學習世界模型(來源:GitHub)。

Dynalang的研究論文目前尚未正式印刷出版,這意味著它還沒有經(jīng)過嚴格的同行評審。然而,該論文的作者包括人工智能研究領(lǐng)域備受尊敬的人物,例如伯克利機器人學習實驗室主任兼伯克利人工智能研究實驗室聯(lián)合主任Pieter Abeel。這為論文中的成果發(fā)現(xiàn)提供了一定程度的可信度。

研究人員讓Dynalang在各種環(huán)境中進行測試,每種環(huán)境都有獨特的設(shè)置和挑戰(zhàn)。在可能的情況下,他們將Dynalang的性能與在相同環(huán)境中運行的基線強化學習模型進行了比較。

HomeGrid就是這樣一個環(huán)境,它是一個多任務網(wǎng)格世界,代理在其中接收語言形式的任務規(guī)范以及語言提示,這些提示包括對對象的描述,環(huán)境中的動力信息以及相關(guān)動作的糾正。

研究人員指出,“值得注意的是,代理在HomeGrid中從未接受過關(guān)于提示含義的直接監(jiān)督,而且提示通常與他們所指的對象或觀察結(jié)果相去甚遠。”這意味著,代理必須通過將提示與世界模型觀察到的狀態(tài)相關(guān)聯(lián)來學習提示的含義。實驗表明,Dynalang善于利用這些提示,而RL模型則必須通過試錯來學習動作分布。

在另一個環(huán)境VLN-CE(Vision-and-Language Navigation in Continuous Environments:連續(xù)環(huán)境中的視覺和語言導航)中,需要代理在3D環(huán)境中導航以到達指定的目的地。每一組任務都包括一個環(huán)境和自然語言說明,說明如何到達目的地。

實驗表明,Dynalang在實現(xiàn)目標方面明顯比純RL方法更有效,因為它學會了將文本指令與環(huán)境觀察和行動聯(lián)系起來。

然而,作者警告說,“[Dynalang]還不能與最先進的VLN方法(其中許多方法使用專家演示或?qū)I(yè)架構(gòu))競爭。”這意味著,雖然Dynalang不如SOTA技術(shù)有效,但它也需要更少的手動注釋,并且可以從接近原始的數(shù)據(jù)中學習。

本論文還探討了另外兩個有趣的環(huán)境:Messenger游戲環(huán)境和LangRoom包含的問答挑戰(zhàn)。如果您要想詳細分析Dynalang在這些環(huán)境中的表現(xiàn),我建議閱讀全文。

本論文的一個關(guān)鍵發(fā)現(xiàn)是,在純文本數(shù)據(jù)集上對模型進行預訓練可以顯著提高模型在最終任務中的性能。這表明,模型從文本中學習的能力是其整體有效性的關(guān)鍵因素。

然而,研究人員承認,Dynalang還有相當大的改進空間。他們認為,更好的語言建模技術(shù)和架構(gòu)能夠支持長期的操作,可以提高模型的性能。我個人很感興趣的是,如果它與更先進的轉(zhuǎn)換器模型相結(jié)合的話它將如何改進。

此外,這些技術(shù)在現(xiàn)實世界中的表現(xiàn)如何還有待觀察,而現(xiàn)實世界往往比受控環(huán)境更不可預測和復雜。但研究人員對Dynalang的潛力持樂觀態(tài)度,尤其是在利用網(wǎng)上大量未標記數(shù)據(jù)方面。研究人員寫道,“在沒有動作或獎勵的情況下對視頻和文本進行預訓練的能力表明,Dynalang可以擴展到大型網(wǎng)絡(luò)數(shù)據(jù)集,為實現(xiàn)與世界上的人類交互的自我改進的多模式代理鋪平了道路。”

譯者介紹

朱先忠,51CTO社區(qū)編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:New AI technique uses language to learn world models,作者:Ben Dickson



責任編輯:華軒 來源: 51CTO
相關(guān)推薦

2023-08-05 13:45:46

模型AI

2025-06-03 08:40:00

2020-06-17 09:59:17

人工智能

2010-01-21 16:24:02

C++語言

2015-08-31 09:27:21

語言界面UI

2015-08-03 09:36:01

賽迪翻譯

2022-06-22 09:44:41

Python文件代碼

2022-07-07 10:33:27

Python姿勢代碼

2020-12-23 10:10:23

Pythonweb代碼

2020-12-09 10:15:34

Pythonweb代碼

2022-11-21 14:33:53

大數(shù)據(jù)數(shù)據(jù)存儲機器學習

2017-11-15 19:00:49

深度學習SoftmaxRNN語言模型

2024-01-30 09:00:28

框架BMRL模型

2010-01-25 15:09:17

C++語言

2021-04-08 10:19:39

人工智能機器學習知識圖譜

2025-05-22 04:00:00

PARSCALE大型語言模型LLM

2023-07-18 18:10:04

2020-10-20 09:45:28

Facebook AI翻譯

2009-09-04 08:51:33

Java語言

2012-11-01 13:41:25

編程語言BasicPerl
點贊
收藏

51CTO技術(shù)棧公眾號

国产乱人伦偷精品视频不卡| 免费精品一区二区三区在线观看| 久久综合狠狠综合| 日产日韩在线亚洲欧美| 无码少妇一区二区| 999精品嫩草久久久久久99| 亚洲精品午夜久久久| 国产精品初高中精品久久| 久久97人妻无码一区二区三区| 欧美黑白配在线| 欧洲国内综合视频| 福利网在线观看| 朝桐光av在线一区二区三区| 国产欧美另类| 日韩在线视频播放| www.日本高清| 欧美网站免费| 午夜久久久久久久久久一区二区| 欧洲亚洲一区| av网站在线观看免费| 国产手机视频一区二区| 深夜福利日韩在线看| 老司机午夜免费福利| 欧美性片在线观看| 一区二区国产视频| 日韩欧美精品一区二区| 超碰在线观看99| 日韩电影在线看| 久久久亚洲天堂| 午夜国产福利视频| 自拍偷拍精品| 精品国产凹凸成av人网站| 成人免费在线观看视频网站| 黄视频网站在线观看| 日本一区二区成人| 国产青春久久久国产毛片| 在线视频 91| 一区二区三区福利| 欧美成人亚洲成人| 亚洲无人区码一码二码三码的含义| 免费欧美网站| 欧美精品乱码久久久久久 | 成人免费观看在线视频| 欧美96一区二区免费视频| 57pao精品| 国产精品99精品无码视| 久久久久国产精品| 色系列之999| 在线观看福利片| 国产成人一二片| 日韩欧美一区在线观看| 波多野结衣国产精品| 99久久伊人| 日韩欧美中文第一页| 国产色一区二区三区| 日韩另类在线| 亚洲最大成人综合| 神马午夜伦理影院| 国产不卡在线| 亚洲天堂成人在线观看| 一级做a爰片久久| 91在线观看| 国产亚洲短视频| 欧美12av| 麻豆国产在线播放| 久久蜜桃香蕉精品一区二区三区| 久久青青草综合| 亚洲av电影一区| 91在线视频在线| 久久综合久久久| 色视频在线看| 久久综合五月天婷婷伊人| 快播亚洲色图| 美丽的姑娘在线观看免费动漫| xf在线a精品一区二区视频网站| 精品伊人久久大线蕉色首页| 亚洲色图21p| 久久综合资源网| 日韩欧美手机在线| av在线电影免费观看| 国产精品狼人久久影院观看方式| 艳色歌舞团一区二区三区| 日韩子在线观看| 亚洲日本在线天堂| 亚洲色成人www永久在线观看| 色婷婷在线播放| 午夜欧美在线一二页| 99精品视频在线看| 亚洲精品555| 91精品国产综合久久小美女 | 成人福利电影精品一区二区在线观看 | 日韩欧美视频一区二区| 免费在线午夜视频| 亚洲尤物在线视频观看| 777久久久精品一区二区三区| 黑人巨大亚洲一区二区久| 在线观看日韩电影| 宇都宫紫苑在线播放| 国产成人福利av| 尤物精品国产第一福利三区| 国产精品视频一区二区在线观看| 欧美网站在线| 日本欧美一二三区| 国产伦子伦对白视频| 波多野结衣中文字幕一区| 欧洲亚洲一区二区| 羞羞污视频在线观看| 黑人巨大精品欧美一区二区免费| 欧美大尺度做爰床戏| 国产麻豆一区二区三区| 日韩av中文字幕在线免费观看| 久久国产柳州莫菁门| 自拍欧美日韩| 国产91精品在线播放| hs视频在线观看| 久久青草欧美一区二区三区| 国产高清免费在线| 中文不卡1区2区3区| 欧美一区二区三区公司| 亚洲一区二区三区综合| 天天影视欧美综合在线观看| 91精品国产777在线观看| 夜夜嗨aⅴ一区二区三区| www.欧美色图| 国产av第一区| 成人在线视频播放| 欧美不卡一区二区三区四区| 夜夜春很很躁夜夜躁| 亚洲高清资源| 成人看片人aa| 国产精品影院在线| 天天色综合成人网| 超碰在线超碰在线| 成人羞羞网站入口| 欧美一区视频在线| 空姐吹箫视频大全| 亚洲精品欧美在线| 亚洲激情在线观看视频| 亚洲人成亚洲精品| 韩国视频理论视频久久| 精品人妻无码一区二区| 国产精品家庭影院| 又色又爽又高潮免费视频国产| 国内精品免费| 欧美激情高清视频| 99在线小视频| 国产精品久久久久影视| 在线播放国产一区中文字幕剧情欧美 | 日本中文字幕免费| 国产一区二区按摩在线观看| 午夜免费电影一区在线观看| 国产高清不卡| 亚洲欧美国产高清va在线播| 天天操天天射天天爽| 成人综合激情网| 日本国产中文字幕| 国产精品久久久久久久99| 免费成人在线电影| 日韩精品影音先锋| 日本a级片视频| 激情六月婷婷久久| 中文精品视频一区二区在线观看| 国产精品一区二区免费福利视频| 亚洲网站在线看| 一级成人黄色片| 久久久久九九视频| 看欧美ab黄色大片视频免费| 国产一区二区电影在线观看| 国产精品7m视频| 福利小视频在线观看| 欧美午夜精品电影| 天美传媒免费在线观看| 久久aⅴ国产欧美74aaa| 国产免费xxx| 涩爱av色老久久精品偷偷鲁 | 91精品国产自产在线| 欧美成人二区| 日韩午夜精品视频| 国产亚洲欧美精品久久久www| 成人性生交大片免费| 波多野结衣乳巨码无在线| 免费av一区| 国产欧美日韩中文字幕在线| 二区三区在线观看| 精品国产乱码久久久久久久久 | 国产一级片在线| 欧美日韩国产精品自在自线| 亚洲av鲁丝一区二区三区| 成人国产亚洲欧美成人综合网| 无码人妻精品一区二区三区在线| 视频一区在线观看| 成人看片人aa| 国产传媒在线观看| 中文字幕精品一区二区精品| 国产人妻精品一区二区三| 亚洲成人你懂的| 中文字幕免费高清| 国产剧情一区二区三区| 日韩免费一级视频| 日韩一级毛片| 国产精品国产精品| 精品欧美一区二区三区在线观看| 久久躁狠狠躁夜夜爽| 视频午夜在线| 777久久久精品| 日韩女优在线观看| 国产精品九色蝌蚪自拍| 玖玖爱在线精品视频| 麻豆精品久久精品色综合| 黄色a级片免费看| 精品理论电影在线| 成人3d动漫一区二区三区91| 三上悠亚激情av一区二区三区| 欧美成人剧情片在线观看| 深夜福利免费在线观看| 欧美一级片在线| 国产suv精品一区二区33| 一区二区三区在线高清| 成年人在线免费看片| 99久久精品费精品国产一区二区 | 国产精品996| 日韩av一二三四| 欧美体内she精视频在线观看| 特级西西444www大精品视频| 老牛影视av一区二区在线观看| 国产精品亚洲综合天堂夜夜| 伊人久久精品一区二区三区| 欧美高清视频在线观看| 超碰97在线免费观看| 亚洲精品xxxx| www.亚洲黄色| 欧美剧情电影在线观看完整版免费励志电影 | 日韩在线视频网站| 天堂在线免费av| 亚洲精品一区二区在线观看| 国产肥老妇视频| 欧美日韩高清一区二区不卡| 69亚洲精品久久久蜜桃小说| 精品久久久香蕉免费精品视频| 麻豆亚洲av熟女国产一区二| 中文字幕日韩一区| 五月婷婷六月香| 亚洲国产成人自拍| 中文字幕第24页| 国产午夜精品一区二区三区嫩草| 好吊一区二区三区视频| 成人激情校园春色| 国产日韩视频一区| 成人精品一区二区三区中文字幕| 亚洲精品鲁一鲁一区二区三区| 国产精品一区二区果冻传媒| 国产毛片久久久久久| 国产一区二区三区在线观看免费视频| 亚洲色图 在线视频| 免费xxxx性欧美18vr| 韩国中文字幕av| 青青青伊人色综合久久| 色乱码一区二区三区在线| 毛片一区二区三区| 日本r级电影在线观看| 国产一区二区免费视频| 18禁一区二区三区| 不卡视频在线观看| 熟女人妻在线视频| 久久久久亚洲蜜桃| 九九九视频在线观看| 中国色在线观看另类| 国产免费嫩草影院| 1区2区3区精品视频| 日本精品在线免费观看| 一区二区中文视频| 暗呦丨小u女国产精品| 亚洲男人的天堂在线aⅴ视频| 99久久99久久精品国产| 亚洲精品乱码久久久久久久久| 国产亚洲欧美精品久久久www| 一区二区三区在线视频观看58| 国产女人被狂躁到高潮小说| 五月天中文字幕一区二区| 日韩欧美亚洲一区二区三区| 午夜视频一区二区| 波多野结衣毛片| 欧美亚洲国产bt| 在线观看亚洲一区二区| 日韩女优毛片在线| 日韩永久免费视频| 日韩福利视频在线观看| аⅴ资源新版在线天堂| 北条麻妃一区二区三区中文字幕| 久久精品视频免费看| 久久久久久久久久国产| 末成年女av片一区二区下载| 国产成人精品一区二区| 成人污版视频| av噜噜色噜噜久久| 精品素人av| 亚洲午夜精品久久久久久浪潮| 婷婷综合伊人| 成人av在线不卡| 日韩中文字幕av电影| 最新国产黄色网址| 国产盗摄女厕一区二区三区 | 国产成人一区二区在线观看| 亚洲精品国产无天堂网2021 | 男女超爽视频免费播放| 奇米影视一区二区三区小说| 国产探花在线观看视频| 久久久www成人免费毛片麻豆 | 精品久久久免费视频| 亚洲电影免费观看高清完整版在线观看 | 欧美激情啪啪| 亚洲直播在线一区| 九九视频免费观看视频精品| 国产精品国三级国产av| 久久久久久穴| 第四色婷婷基地| av亚洲精华国产精华精| av在线播放中文字幕| 国产精品99久久久久久久久久久久 | 二区三区在线观看| 国内精品视频久久| 日本欧美日韩| 国产精品日韩欧美一区二区| 真实原创一区二区影院| 只有这里有精品| 日韩在线一二三区| 最新国产精品自拍| 亚洲人妻一区二区三区| 精品成人一区二区三区四区| 日韩在线免费播放| 美女扒开尿口让男人操亚洲视频网站| av2020不卡| 亚洲综合大片69999| 经典一区二区| 国产主播自拍av| 国产成人综合自拍| 五月天免费网站| 精品国产31久久久久久| 亚洲精品一级片| 少妇久久久久久| av日韩电影| 精品在线一区| 亚洲视频中文| 9久久婷婷国产综合精品性色 | 精品国产日韩欧美| 一卡二卡三卡视频| 成人一道本在线| 亚洲精品天堂网| 日韩欧美精品中文字幕| 亚洲欧美丝袜中文综合| 欧美大尺度激情区在线播放| 日韩av电影资源网| 免费在线观看91| 一本久道久久综合狠狠爱| 中文字幕a在线观看| 亚洲精品国产品国语在线app| 伊人网中文字幕| 日韩少妇与小伙激情| 色是在线视频| 国产精品久久7| 99riav1国产精品视频| 日本中文字幕精品| 久久久九九九九| 中文字幕视频一区二区| 亚洲午夜小视频| 成人国产一区| 亚洲欧美精品在线观看| 日韩av一区二| 亚洲一区电影在线观看| 欧美日韩三级一区| 国产在线一在线二| 国产精品小说在线| 日韩三级在线| 中文字幕1区2区| 亚洲国产中文字幕| 人成网站在线观看| 日本三级韩国三级久久| 色综合综合色| 免费观看成人在线视频| 国产欧美视频一区二区| japanese国产在线观看| 久久精品福利视频| 日韩在线观看中文字幕| 一区二区三区日韩视频| 成人午夜视频在线观看| 日产电影一区二区三区| 亚洲欧美一区二区三区久久| 日韩成人亚洲| 一区二区三区四区免费视频| 国产成人一级电影| 日本三级片在线观看| 日韩av网址在线| 性感美女一区二区在线观看| 午夜精品区一区二区三| 国产sm精品调教视频网站| 日韩欧美激情视频| 亚洲精品自拍第一页| 日韩国产大片| a天堂资源在线观看| 国产原创视频在线|