精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用多模態(tài)世界模型預(yù)測(cè)未來!UC伯克利全新AI智能體,精確理解人類語(yǔ)言,刷新SOTA

人工智能 新聞
智能體如何從不同的語(yǔ)言中理解世界?近日,來自UC伯克利的研究人員提出了一種全新的AI智能體,可以通過對(duì)未來進(jìn)行多模態(tài)世界建模來學(xué)習(xí)理解語(yǔ)言。

現(xiàn)在,基于強(qiáng)化學(xué)習(xí)的智能體已經(jīng)可以輕松地執(zhí)行諸如「撿起藍(lán)色積木」這類的指令。

但人類大部分時(shí)間的語(yǔ)言表達(dá),卻遠(yuǎn)遠(yuǎn)超出了指令的范圍。比如:「我們好像沒有牛奶了」......

而智能體想要學(xué)習(xí)這類語(yǔ)言在世界中的含義,是非常困難的。

對(duì)此,來自UC伯克利的研究團(tuán)隊(duì)認(rèn)為,我們實(shí)際上可以利用這些語(yǔ)言,來幫助智能體更好地對(duì)未來進(jìn)行預(yù)測(cè)。

論文地址:https://arxiv.org/pdf/2308.01399.pdf

具體來說,研究人員提出了一種全新的智能體——Dynalang。

與僅用語(yǔ)言預(yù)測(cè)動(dòng)作的傳統(tǒng)智能體不同,Dynalang通過使用過去的語(yǔ)言來預(yù)測(cè)未來的語(yǔ)言、視頻和獎(jiǎng)勵(lì),從而獲得豐富的語(yǔ)言理解。

除了在環(huán)境中的在線交互中學(xué)習(xí)外,Dynalang還可以在沒有動(dòng)作或獎(jiǎng)勵(lì)的情況下在文本、視頻或兩者的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練。

也就是說,新的智能體這時(shí)再聽到「我們沒有牛奶了」,就能get到這句話意思是「冰箱里的牛奶喝完了」。

工作原理

使用語(yǔ)言來理解世界自然而然地適合于世界建模范式。

Dynalang以基于模型的RL智能體DreamerV3為基礎(chǔ),并可利用其在環(huán)境中動(dòng)作時(shí)所收集到的經(jīng)驗(yàn)數(shù)據(jù),不斷地進(jìn)行學(xué)習(xí)。

左:世界模型在每個(gè)時(shí)間步將文本和圖像壓縮為潛在表征。在這個(gè)表征中,模型被訓(xùn)練以重構(gòu)原始觀察結(jié)果,預(yù)測(cè)獎(jiǎng)勵(lì),并預(yù)測(cè)下一個(gè)時(shí)間步的表征。直觀地說,世界模型學(xué)會(huì)了在給定文本中所讀內(nèi)容的情況下,應(yīng)該期望在世界中看到什么。

右:Dynalang通過在壓縮的世界模型表征基礎(chǔ)上訓(xùn)練策略網(wǎng)絡(luò)來選擇動(dòng)作。它在世界模型的想象中反復(fù)進(jìn)行訓(xùn)練,從而學(xué)會(huì)采取最大化預(yù)測(cè)獎(jiǎng)勵(lì)的動(dòng)作。

與之前一次處理一個(gè)句子或段落的多模態(tài)模型不同,Dynalang將視頻和文本作為一個(gè)統(tǒng)一的序列進(jìn)行建模,一次處理一個(gè)圖像幀和一個(gè)文本token。

直觀地說,這更像是人類在現(xiàn)實(shí)世界中接收輸入的方式。

將所有內(nèi)容都建模為一個(gè)序列,就可以像語(yǔ)言模型一樣在文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,從而提高強(qiáng)化學(xué)習(xí)的性能。

語(yǔ)言提示

為了評(píng)估智能體在環(huán)境中的表現(xiàn),研究人員引入了HomeGrid。其中,智能體除了任務(wù)指令外,還會(huì)收到語(yǔ)言提示。

HomeGrid中的提示,不僅模擬了智能體可能從人類那里學(xué)到的知識(shí)或從文本中讀到的信息,而且還提供了有用但不是解決任務(wù)所必需的信息:

- 「未來觀察」:描述智能體在未來可能觀察到的情況,例如「盤子在廚房里」。

- 「糾正」:根據(jù)智能體正在執(zhí)行的任務(wù)的提供交互式反饋,例如「轉(zhuǎn)過身去」。

- 「動(dòng)態(tài)」:描述環(huán)境的動(dòng)態(tài),例如「踩踏板打開堆肥箱」。

雖然智能體并未接受過明確的指導(dǎo)來分辨觀察結(jié)果和文本的對(duì)應(yīng)關(guān)系。但Dynalang仍能通過未來的預(yù)測(cè)目標(biāo),學(xué)會(huì)將各種類型的語(yǔ)言與環(huán)境聯(lián)系起來。

結(jié)果顯示,Dynalang要明顯優(yōu)于以語(yǔ)言為條件的IMPALA和R2D2。

后者不僅在使用不同類型的語(yǔ)言時(shí)非常吃力,而且在使用指令以外的語(yǔ)言時(shí)表現(xiàn)得更差。

游戲評(píng)估

在Messenger游戲環(huán)境中,研究人員測(cè)試了智能體是如何從較長(zhǎng)且更復(fù)雜的文本中學(xué)習(xí)的,這需要在文本和視覺觀察之間進(jìn)行多跳推理。

智能體必須對(duì)描述每個(gè)情節(jié)動(dòng)態(tài)的文本說明進(jìn)行推理,并將其與環(huán)境中的實(shí)體觀察結(jié)合起來,以確定從哪些實(shí)體獲取消息和避開哪些實(shí)體。

結(jié)果顯示,Dynalang的表現(xiàn)要明顯優(yōu)于IMPALA和R2D2,以及使用專門架構(gòu)對(duì)文本和觀察結(jié)果進(jìn)行推理任務(wù)優(yōu)化的EMMA基準(zhǔn),尤其是在最困難的第3階段。

指令跟隨

Habitat的測(cè)試結(jié)果表明,Dynalang能夠處理逼真的視覺觀察并執(zhí)行指令。

也就是,智能體需要按照自然語(yǔ)言的指令,導(dǎo)航到家中的目標(biāo)位置。

在Dynalang中,指令跟隨可以通過將其視為未來獎(jiǎng)勵(lì)預(yù)測(cè),來在相同的預(yù)測(cè)框架中統(tǒng)一處理。

圖片

語(yǔ)言生成

就像語(yǔ)言會(huì)影響智能體對(duì)所見事物的預(yù)測(cè)一樣,智能體觀察到的事物也會(huì)影響它期望聽到的語(yǔ)言(例如,關(guān)于所見事物的真實(shí)陳述)。

通過在LangRoom中將語(yǔ)言輸出到動(dòng)作空間中,Dynalang可以生成與環(huán)境相關(guān)聯(lián)的語(yǔ)言,從而執(zhí)行具體的問題回答。

圖片

文本預(yù)訓(xùn)練

由于使用語(yǔ)言建立世界模型與使用世界模型學(xué)習(xí)動(dòng)作是分開的,因此Dynalang可以在沒有動(dòng)作或獎(jiǎng)勵(lì)標(biāo)簽的情況下使用離線數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。

這種能力使Dynalang能夠從大規(guī)模的離線數(shù)據(jù)集中受益,所有這些數(shù)據(jù)集都在單一模型架構(gòu)內(nèi)。

研究人員使用純文本數(shù)據(jù)對(duì)Dynalang進(jìn)行預(yù)訓(xùn)練,并從頭開始學(xué)習(xí)token嵌入。

模型在通用文本數(shù)據(jù)(TinyStories,200萬個(gè)短故事)上進(jìn)行預(yù)訓(xùn)練之后,可以提高M(jìn)essenger下游RL任務(wù)的表現(xiàn),甚至超過了使用預(yù)訓(xùn)練的T5嵌入。

盡管這項(xiàng)工作的重點(diǎn)是讓智能體能夠理解語(yǔ)言并采取行動(dòng),但其實(shí)也可以像純文本語(yǔ)言模型一樣生成文本。

研究人員在潛空間中對(duì)預(yù)訓(xùn)練的TinyStories模型進(jìn)行了抽樣推演,并在每個(gè)時(shí)間步驟從表征中解碼出token觀察。

結(jié)果顯示,模型生成的結(jié)果具有令人驚訝的一致性,不過在質(zhì)量上仍然低于SOTA的語(yǔ)言模型。

不過由此也可以看出,將語(yǔ)言生成和行動(dòng)統(tǒng)一到單一的智能體架構(gòu)中,是一個(gè)很有趣的研究方向。

作者介紹

Jessy Lin

圖片

論文一作Jessy Lin,是加州大學(xué)伯克利分校人工智能研究院(Berkeley AI Research)的三年級(jí)博士生,由Anca Dragan和Dan Klein指導(dǎo)。

她的研究方向是構(gòu)建能與人類合作和互動(dòng)并以語(yǔ)言為媒介的智能體。此外,她還對(duì)對(duì)話以及語(yǔ)言+強(qiáng)化學(xué)習(xí)非常感興趣。目前,她的研究得到了蘋果人工智能獎(jiǎng)學(xué)金的支持。

她在麻省理工學(xué)院獲得了計(jì)算機(jī)科學(xué)和哲學(xué)雙學(xué)位。在那里,她與計(jì)算認(rèn)知科學(xué)小組合作,在Kelsey Allen和Josh Tenenbaum的指導(dǎo)下進(jìn)行人類啟發(fā)式人工智能研究,同時(shí)作為labsix的創(chuàng)始成員從事機(jī)器學(xué)習(xí)安全研究。

此外,她還曾在Lilt從事人機(jī)協(xié)作機(jī)器翻譯/專家翻譯的Copilot研究和產(chǎn)品開發(fā)。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-08-05 13:45:46

模型AI

2025-07-02 08:40:00

智能體AI模型

2024-12-02 08:20:00

2024-03-04 08:15:00

2023-05-04 14:55:02

模型AI

2021-03-05 15:03:36

算法強(qiáng)化學(xué)習(xí)技術(shù)

2025-02-14 09:20:00

模型數(shù)據(jù)訓(xùn)練

2025-01-22 15:21:00

2025-10-11 15:55:08

AI模型數(shù)據(jù)

2024-04-07 00:45:00

開源模型

2023-12-16 09:49:18

2023-04-07 09:28:31

模型訓(xùn)練

2025-05-15 09:10:00

2025-04-18 08:42:52

模型推理AI

2025-07-14 13:47:29

2024-09-11 13:04:53

2025-05-06 15:31:55

智能模型AI

2024-07-31 15:38:00

2024-09-23 14:46:27

2025-10-13 09:03:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

天堂网av在线播放| 日本系列第一页| 日韩欧乱色一区二区三区在线| 久久这里只有精品6| 国产精品视频资源| 青娱乐国产在线视频| 麻豆精品少妇| 欧美亚洲动漫精品| 欧美视频在线第一页| 视频福利在线| 久久99久久99小草精品免视看| 久久6精品影院| 中日韩精品一区二区三区| 日日夜夜亚洲| 第一福利永久视频精品| 一区二区免费在线视频| 刘亦菲久久免费一区二区| 日韩高清不卡在线| 欧美黑人巨大精品一区二区| 中文字幕网站在线观看| 深夜福利一区| 欧美影院午夜播放| 免费看又黄又无码的网站| 91伦理视频在线观看| 99视频精品全部免费在线| 国产原创欧美精品| 久久久久久91亚洲精品中文字幕| 四虎国产精品免费观看| 精品亚洲一区二区三区| 中国特级黄色片| 免费成人黄色网| 疯狂蹂躏欧美一区二区精品| 成人免费看片视频在线观看| 超碰国产在线| 99re免费视频精品全部| 99国产精品久久久久老师| 日本一区二区三区久久| 亚洲一区日本| 久久久久久久久中文字幕| 国产在视频线精品视频| 免费一区二区三区视频导航| 欧美精品一区二区在线播放| 国产精欧美一区二区三区白种人| 欧美自拍电影| 欧美色道久久88综合亚洲精品| 男人草女人视频| 久久77777| 一区在线播放视频| 亚洲国产精品久久久久久女王| 五月婷中文字幕| 成人福利视频网站| 成人精品一二区| 国产免费高清av| 狠狠色综合播放一区二区| 国产精品v片在线观看不卡| 国产精品777777| 国产精品免费看| 97在线看福利| 好看的av在线| 国产精品永久| 国产成人精品久久| 69亚洲精品久久久蜜桃小说| 美女诱惑黄网站一区| 欧美一区二区视频97| 探花视频在线观看| 免费日韩av片| 国产精品海角社区在线观看| 高潮无码精品色欲av午夜福利| 久久国产日本精品| 日本中文字幕成人| 国产精品51麻豆cm传媒| 蜜桃精品视频在线观看| 成人精品久久一区二区三区| 国产乱淫片视频| 国产经典欧美精品| 国产伦精品一区二区三区视频黑人| 亚洲av色香蕉一区二区三区| 国产suv精品一区二区883| 99精品99久久久久久宅男| 丰满少妇在线观看bd| av激情综合网| 日韩精品伦理第一区| 尤物视频在线免费观看| 亚洲男人天堂av| 丁香六月激情婷婷| 成人欧美大片| 欧美剧在线免费观看网站| 日韩欧美中文视频| 美女一区二区在线观看| 亚洲一级免费视频| 欧美风情第一页| 亚洲大片av| 国产成人亚洲综合青青| 国产精品无码天天爽视频| 国产v综合v亚洲欧| 香蕉久久免费影视| 手机在线免费观看av| 欧美性xxxxx极品娇小| 天天影视综合色| 18国产精品| 亚洲图片在线综合| 欧美日韩激情在线观看| 久久国产精品久久w女人spa| 国产免费一区二区三区在线能观看| 午夜美女福利视频| 久久精品一区八戒影视| 欧美另类videosbestsex日本| 在线看片福利| 欧美一区在线视频| 人妻少妇无码精品视频区| 午夜欧美在线| 日本久久久久亚洲中字幕| 国产黄频在线观看| 久久久久久久久久久电影| 国产在线视频综合| 99久久er| 日韩精品在线视频观看| 一起操在线播放| 日韩电影在线免费看| 国产精品久久7| 免费在线观看黄| 欧美性感美女h网站在线观看免费| 亚洲一二区在线观看| 女人丝袜激情亚洲| 九九久久国产精品| 一级全黄裸体免费视频| 久久一留热品黄| 日韩视频免费播放| japansex久久高清精品| 国产亚洲欧美日韩美女| 日本在线视频免费观看| 国产精品自拍一区| 在线不卡视频一区二区| 亚洲成人av观看| 亚洲精品久久久久中文字幕欢迎你 | 欧美高清视频一二三区| 国产免费无遮挡吸奶头视频| 国产一级久久| 精品一区二区三区免费毛片| 久草成色在线| 日韩欧美国产麻豆| 黄色片在线观看网站| 久久黄色级2电影| 亚洲蜜桃在线| 久久久视频免费观看| 99成人在线观看| 丝袜a∨在线一区二区三区不卡| 国产精品免费看一区二区三区| 国产精品扒开做爽爽爽的视频 | 上原亚衣av一区二区三区| 日本免费在线观看视频| 26uuu精品一区二区| 欧美三级在线观看视频| 欧美男男freegayvideosroom| 欧美激情乱人伦一区| 亚洲产国偷v产偷v自拍涩爱| 一区二区三区四区中文字幕| 日本在线视频播放| 欧美不卡一区| 高清日韩一区| 国产v日韩v欧美v| 亚洲精品国产精品国产自| 三级黄色在线视频| 久久只精品国产| 日本新janpanese乱熟| 欧美日韩在线网站| 91丝袜美腿美女视频网站| 1769免费视频在线观看| 欧美大片在线观看| 天天操天天干视频| 久久人人爽爽爽人久久久| www.欧美日本| 午夜精品毛片| 国外成人在线视频网站| 日韩激情电影| 中文字幕精品在线视频| av网站在线免费看| 亚洲成av人片在www色猫咪| 野外性满足hd| 日本vs亚洲vs韩国一区三区二区| 亚洲永久激情精品| 亚洲网址在线观看| 欧美在线亚洲一区| 日本在线天堂| 亚洲精品在线观| 天天干天天操天天操| 亚洲欧洲国产专区| 日本性生活一级片| 丝袜国产日韩另类美女| 大片在线观看网站免费收看| 日韩高清一级| 成人在线视频网| 蜜桃视频m3u8在线观看| 色妞在线综合亚洲欧美| 欧美自拍偷拍第一页| 欧美午夜精品免费| 亚洲国产精一区二区三区性色| 久久毛片高清国产| 超碰人人cao| 日本欧美一区二区三区| 日本福利视频一区| 99久久夜色精品国产亚洲96| 国产精品日韩高清| 999精品嫩草久久久久久99| 91精品国产91久久久久久久久| 在线观看黄色av| 亚洲精品久久久久久久久| 99精品免费观看| 欧美视频在线不卡| 国产精品久久久久久久妇| 亚洲精品五月天| 久久婷婷五月综合| heyzo一本久久综合| 国产成人美女视频| 首页国产欧美久久| 无罩大乳的熟妇正在播放| 91精品国产91久久久久久黑人| 久久国产精品久久| 亚洲精品黑牛一区二区三区| 国产精品美女无圣光视频| 女人让男人操自己视频在线观看| 久久人人爽人人爽爽久久| 国产午夜在线观看| 日韩成人在线播放| 欧美 日韩 国产 在线| 正在播放一区二区| 91在线视频国产| 欧美色爱综合网| 国产91精品看黄网站在线观看| 亚洲成人免费观看| 久久成人在线观看| 亚洲视频网在线直播| 国产三级精品三级观看| 日本一区二区三区免费乱视频| 久久久久9999| 97久久精品人人做人人爽50路| 国产av一区二区三区传媒| 激情伊人五月天久久综合| 色婷婷.com| 麻豆国产欧美日韩综合精品二区| 国产精品人人妻人人爽人人牛| 欧美一级久久| av免费在线播放网站| 男女精品视频| 免费黄色日本网站| 日日噜噜夜夜狠狠视频欧美人| 波多野结衣家庭教师视频| 国产精品人人爽人人做我的可爱| 欧美爱爱视频免费看| 国产亚洲一级| 成人亚洲视频在线观看| 青青青伊人色综合久久| 91欧美视频在线| 狠狠色狠狠色综合日日91app| www.久久av.com| 国产乱一区二区| 欧美性猛交乱大交| 本田岬高潮一区二区三区| 亚洲色图14p| 久久综合九色欧美综合狠狠| 麻豆av免费观看| 中文字幕第一区二区| 国产传媒在线看| 亚洲欧美电影一区二区| 久草网在线观看| 精品久久久中文| 波多野结衣一本一道| 欧美日韩在线观看一区二区 | 成人在线视频观看| 成人精品视频久久久久| 亚洲国产中文在线| 精品国产一区二区三区四区精华| 欧美精品momsxxx| 亚洲欧美日韩精品综合在线观看| 婷婷综合五月| 水蜜桃色314在线观看| 久久久久久婷| 中文字幕亚洲影院| 成人性生交大片免费| 亚洲综合网在线观看| 国产精品久久久久一区| 国产免费无码一区二区视频 | 中文字幕 欧美激情| 欧美日韩一区不卡| 精品人妻一区二区三区麻豆91 | 亚洲va欧美va国产va天堂影院| 毛片视频网站在线观看| 欧美午夜寂寞影院| 国产77777| 在线精品国产欧美| 麻豆福利在线观看| 国产精品久久久久久亚洲影视| 精品亚洲二区| 欧美一区二区三区精美影视| 99精品在线观看| www.中文字幕在线| 国产中文字幕一区| 国产激情在线免费观看| 亚洲欧美视频一区| 香蕉影院在线观看| 欧美成人高清电影在线| 成人亚洲综合天堂| 性欧美办公室18xxxxhd| 综合欧美精品| 欧美日韩一区综合| 亚洲免费黄色| 红桃视频一区二区三区免费| 26uuu色噜噜精品一区| 欧美极品aaaaabbbbb| 欧洲精品一区二区三区在线观看| 亚洲精品911| 久久精品国产电影| 成人mm视频在线观看| 精品国产乱码久久久久久久软件| 91精品综合久久久久久久久久久| 日韩av黄色网址| 国产精品99久久久| 亚洲综合久久av一区二区三区| 欧美视频第一页| 国产18精品乱码免费看| 久久精品99久久久香蕉| 韩日一区二区| 免费观看成人高| 亚洲高清激情| 日本中文字幕精品| 国产精品久久久久三级| 波多野结衣爱爱| 精品视频中文字幕| 国产拍在线视频| 99re视频| 欧美淫片网站| 永久看看免费大片| 亚洲日本在线天堂| 97精品人妻一区二区三区在线| 夜夜嗨av一区二区三区免费区| 欧美sm一区| 精品国产综合区久久久久久| 亚洲午夜一级| 国产又粗又猛大又黄又爽| 亚洲欧美国产77777| va视频在线观看| 色综合男人天堂| 7777精品| 亚洲熟妇无码一区二区三区导航| 成人一级片在线观看| 久久精品国产亚洲av香蕉| 亚洲精品一线二线三线无人区| 特级毛片在线| 精品亚洲第一| 久久大逼视频| 亚洲av毛片基地| 欧美精品久久99久久在免费线| 五月香视频在线观看| 成人午夜高潮视频| 欧美黄色大片网站| 午夜不卡久久精品无码免费| 午夜av区久久| 精品美女视频在线观看免费软件 | 国产日韩欧美一区二区三区| 久久美女福利视频| 国产免费观看久久| 一级爱爱免费视频| 欧美大奶子在线| 免费福利视频一区| 日韩一级片播放| 中文字幕一区二区三区四区不卡| 国产又粗又猛又爽| 久久久久女教师免费一区| 欧洲亚洲成人| 国产一级做a爰片久久| 亚洲日本va在线观看| 亚洲精品久久久蜜桃动漫| 2018中文字幕一区二区三区| 精品大片一区二区| 五月天六月丁香| 日韩欧美国产一区二区| 天堂中文8资源在线8| 国产精品成人一区二区三区| 9色国产精品| 中文字幕第二区| 精品国产乱码久久久久久闺蜜| 国产色播av在线| 一级二级三级欧美| 成人av电影免费在线播放| 免费黄色网址在线| 久久精品国产综合| 久草精品视频| 三级视频中文字幕| 夜夜精品浪潮av一区二区三区 | 久久最新资源网| 三级小说欧洲区亚洲区| 日本77777| 色欧美片视频在线观看在线视频| 成人免费看片| 欧美一区视久久| 国产成人在线观看| 人人妻人人爽人人澡人人精品| 九九精品在线观看| 欧美freesextv| 在线看黄色的网站|