精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌大腦新研究:強化學習如何學會用聲音來觀察?

新聞 人工智能
近日,來自谷歌大腦的一篇題為 “The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning” 的論文證明了 強化學習擁有這種“感官替代”的能力。

 

人類已經證明,大腦中的神經系統擁有為不斷適應外界環境的變化而改變自身結構的能力。大腦內部的突觸、神經元之間的連接可以由于學習和經驗的影響建立新的連接。

相應的,感官替代(sensory substitution)這一天賦也存在人類技能樹之中,例如有些天生失明的人能夠通過將圖像轉換成聲音學會感知人體輪廓形狀的能力。

如果讓AI擁有這種能力,它也能像蝙蝠和海豚一樣,能夠利用其耳朵通過聲音和回聲來‘看’周圍的世界一樣。

近日,來自谷歌大腦的一篇題為 “The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning” 的論文證明了 強化學習擁有這種“感官替代”的能力。

論文地址:https://arxiv.org/pdf/2109.02869.pdf

具體而言, 作者在論文中設計了一系列強化學習系統,其能夠將來自環境的每種感覺輸入(sensory inputs)到不相同,卻具有一定聯系的神經網絡中,值得一提的是,這些神經網絡之間沒有固定的關系。 研究表明,這些感覺網絡可以通過訓練來整合本地收到的信息,并且通過注意機制的交流,可以集體達成一個全局一致的方案。

此外,即使在一個事件中,輸入順序被隨機地排列多次,該系統仍然可以執行其任務。

1. 證明過程

現代深度學習系統通常無法適應感覺輸入的隨機重新排序,除非對模型進行重新訓練或者用戶為模型糾正輸入的順序。然而,meta-learning這項技術,可以幫助模型適應這種變化。例如adaptive weights、Hebbian-learning和model-based等方法。

在論文中,作者研究的agents都有一個共同的特點: 在執行任務時被用來處理感覺輸入,并將輸入突然隨機重新進行排序。 受到與細胞自動機相關的自組織神經網絡的最新發展的啟發,作者在實驗中將每個感覺輸入(可以是連續控制環境中的單個狀態,或者是視覺環境中的一塊像素)輸入一個單獨的神經網絡模塊,該模塊在一段時間內只整合來自這個特定感覺輸入通道的信息。

在本地接收信息的同時,這些單獨的感覺神經網絡模塊也不斷地廣播輸出信息。參考Set Transformer架構,一個注意力機制將這些信息結合起來,形成一個全局的潛代碼(global latent code),然后將其轉換為agent的行動空間。注意力機制可以被看作是神經網絡適應性加權的一種形式,在這種情況下,允許任意數量的感覺輸入以任何隨機順序被處理。

實驗中,作者發現每個單獨的感覺神經網絡模塊,雖然只能接收到局部信息,但仍能共同產生一個全局一致的策略,而且這樣的系統可以被訓練來執行幾個流行的強化學習(RL)環境中的任務。此外,作者設計的系統能夠以任何隨機排列的順序利用不同數量的感覺輸入通道,即使在一個episode中順序再次被重新排列。

如上圖pong agent,即使在給它一個小的屏幕子集(30%),以一個重新排列的順序,也能繼續工作。

另一方面,鼓勵系統學習的置換不變的觀測空間的連貫性表示,會使 policies更加穩健,泛化性更強。研究表明,在沒有額外訓練的情況下,即使加入含有噪聲或冗余信息的其它輸入通道,系統也能繼續運作。在視覺環境中,即使只給它一小部分從屏幕上隨機選擇的區塊,而在測試時,如果給它更多的區塊,系統可以利用額外的信息來表現得更好。

作者還證明, 盡管在單一的固定背景上進行訓練,系統還是能夠推廣到具有不同背景圖像的視覺環境。 最后,為了使訓練更加實用,作者提出了一個行為克隆(behavioral cloning)方案,將用現有方法訓練的策略轉換成具有理想特性的置換不變的策略。

圖注:方法概述

上圖的AttentionNeuron 是一個獨立的層,其中每個感覺神經元只能訪問“無序觀察(unordered observations)”的一部分。結合agent的前一步動作,每個神經元使用共享函數,然后獨立生成信息。

圖注:符號列表

在上述表格中,作者還提供了我們的模型中用于不同強化學習環境的維度,以使讀者了解系統中每一部分。

圖注:CartPoleSwingUpHarder中的置換不變agent

在上述演示中,用戶可以隨時重新排列5個輸入的順序,并觀察agent如何適應輸入的新順序。

演示地址:https://attentionneuron.github.io/

圖注:車桿測試

作者報告了每個實驗的1000個測試事件的平均得分和標準偏差。agent只在有5個感覺輸入的環境中進行訓練。

圖注:置換不變的輸出

當作者按原樣輸入傳感器陣列(頂部)或隨機重新排列陣列(底部)時,Attention Neuron層的輸出(16維全局潛代碼)不會改變。黃色代表較高的數值,而藍色代表較低的數值。

圖注:處理未指定數量的額外噪聲通道

在沒有額外訓練的情況下,agent接收15個按重新排列后順序排列的輸入信號,其中10個是純高斯噪聲(σ=0.1),另外5個是來自環境的實際觀察結果。像先前的演示一樣,用戶可以對15個輸入的順序進行重新排列,并觀察agent如何適應新的輸入順序。

圖注:注意力神經元層的輸出在測試情節中的二維嵌入

作者在圖中突出了幾個有代表性的組,并展示了它們的抽樣輸入。每個組我們顯示3個相應的輸入(行),并對每個輸入進行解堆以顯示時間維度(列)。

CarRacing的基本任務(左),修改后的洗屏任務(右)。

作者的agent只在這個環境中訓練。如上圖所示,右邊的屏幕是agent觀察到的,左邊的是人類的視覺觀察到的。人類會發現用重新排列觀察的方式駕駛是非常困難的,因為人類沒有經常接觸到這樣的任務,就像前面提到的 "倒騎自行車 "的例子。

2. 討論以及未來

在這項工作中,作者研究了深度學習agents的特性,這些agents可以把它們的觀察作為一個任意排序的、可變長度的感覺輸入列表。通過獨立地處理每個輸入流,并使用注意力整合處理后的信息。即使觀測的順序在一個episode中被隨機地改變了多次,而且沒有進行訓練,agents仍然可以執行任務。我們在下表中報告了每個環境的性能對比結果。

在展開的工作中重新梳理觀測結果

在每個episode中,作者每隔t step重新打亂順序觀察。CartPole任務差異較大,因此對它測試了1000次。其他任務,報告了100次測試的平均值和標準偏差。除了Atari Pong,所有環境都有每集1000 step的硬性限制。在Atari Pong中,雖然不存在一集的最大長度,但觀察到,每個episode通常持續2500 step左右。

通過打亂agent排序,甚至是不完整的觀測信息,可以驅動它解釋每個局部感覺輸入的意義以及它們與全局的關系,這在目前的許多應用中都有實際用途。例如,當被應用于機器人時,可以避免由于交叉布線或復雜的動態輸入-輸出映射而產生的錯誤。類似于CartPole實驗的設置,加上額外的噪聲通道,可以使一個收到成千上萬的噪聲輸入通道的系統識別出具有相關信息的小的通道子集。

局限性在于, 對于視覺環境,patch size的選擇會影響性能和計算的復雜性。作者發現6x6像素的patch size在任務中很有效,4x4像素的patch size在某種程度上也可發揮效用,但單個像素的觀察卻不能發揮作用。小的patch size也會產生一個大的注意力矩陣,除非使用近似值,否則計算成本可能會過高。

另一個限制是 ,排列組合不變的特性只適用于輸入,而不適用于輸出。雖然觀測結果的排序可以以再次打亂,但行動的排序卻不能。為了使置換不變的輸出發揮作用,每個環節都需要來自環境的反饋以便學習自身和環境之間的關系,包括獎勵信息。

一個頗為有趣的未來研究 方向是使行動層也具有相同的屬性,并將每個運動神經元建模為一個使用注意力連接的模塊。有了作者的方法, 就有可能訓練一個具有任意數量的agent,或者用一個單一的被提供了一個獎勵信號作為反饋的policy控制具有不同形態的機器人 。此外 ,在這項工作中,作者設計的方法接受以前的行動作為反饋信號。然而,反饋信號并不局限于行動。作者表示,其期待看到未來的工作包括環境獎勵等信號,不僅能適應觀察到的環境變化,還能適應自身的變化,以訓練置換不變的 meta-learning agents。

責任編輯:張燕妮 來源: 人工智能學家
相關推薦

2020-01-16 15:57:36

AI 數據人工智能

2025-10-11 04:00:00

2023-09-21 10:29:01

AI模型

2021-01-11 10:23:22

谷歌神經網絡機器學習

2021-11-29 10:09:50

AI 強化學習人工智能

2021-08-18 10:20:41

人工智能強化學習技術

2021-04-29 14:53:14

谷歌強化學習開發

2018-08-29 08:13:22

Google 學習框架技術

2022-12-01 08:00:00

2020-04-15 16:44:38

谷歌強化學習算法

2017-02-20 16:35:10

人工智能算法強化學習

2025-08-01 09:05:00

2025-03-06 08:19:01

2021-07-27 15:55:01

人工智能機器學習技術

2020-08-10 06:36:21

強化學習代碼深度學習

2023-03-09 08:00:00

強化學習機器學習圍棋

2025-06-27 10:10:43

AI模型技術

2020-10-28 13:51:45

機器學習化學研發AI

2023-10-04 09:17:03

機器人AI

2025-07-01 09:05:28

點贊
收藏

51CTO技術棧公眾號

91制片厂毛片| 国产精品h视频| 欧美一区二区三区不卡视频| 日韩欧美综合| 日韩电影在线观看网站| 欧美色成人综合| 在线播放豆国产99亚洲| 亚洲国产成人一区二区| 久久综合九色| 欧美成人精品一区二区| 日韩一级视频在线观看| 亚洲精品三区| 国产女人18水真多18精品一级做 | 小黄鸭精品aⅴ导航网站入口| 亚洲国产成人一区二区三区| 999国产在线| 国产91在线播放九色| 亚洲欧洲国产精品一区| 色94色欧美sute亚洲线路一久| 这里只有精品66| 免费在线黄色影片| 国产激情91久久精品导航 | 国产乱码精品1区2区3区| 97碰碰碰免费色视频| 国产又色又爽又高潮免费| 天天躁日日躁狠狠躁欧美巨大小说| 欧美久久一区二区| 国产福利视频在线播放| 欧洲一区二区三区| 国产精品国产自产拍高清av王其| 久久久福利视频| 国产99久久九九精品无码免费| 四虎成人av| 亚洲国产精久久久久久| 国产精品嫩草影视| 成人深夜福利| 色综合婷婷久久| 国产成人艳妇aa视频在线| 香蕉视频免费在线播放| 久久久久国产成人精品亚洲午夜| 国产精品初高中精品久久| 亚洲无码精品在线观看| 中国色在线日|韩| 激情五月五月婷婷| 黄网在线观看视频| 亚洲激情中文在线| 一区在线观看| 中文天堂在线一区| 欧美日韩国产一二| 色wwwwww| 高清shemale亚洲人妖| 成人av在线亚洲| 日韩 欧美 综合| 日韩精品一区二区久久| 亚洲人成在线播放| 魔女鞋交玉足榨精调教| 亚洲第一论坛sis| 日韩电影中文字幕| 亚洲最大成人网站| 影视先锋久久| 国产香蕉97碰碰久久人人| 日韩中字在线观看| 污污影院在线观看| 亚洲精品欧美激情| 成人在线视频一区二区三区| 香蕉成人app免费看片| 一区二区欧美精品| 丁香六月激情婷婷| 蜜桃麻豆影像在线观看| 91久久国产综合| 午夜欧美理论片| 欧美极品少妇全裸体| 国产91av视频| 免费日韩精品中文字幕视频在线| 欧美性视频网站| 成人公开免费视频| 蜜臀av性久久久久av蜜臀妖精| 国产精品免费一区豆花| 国产精品久久久久久69| 国产亚洲精品bv在线观看| 国内精品视频久久| 久久精品视频5| 日本免费在线视频不卡一不卡二 | 日韩欧美在线电影| 欧美日本一道| 亚洲国产中文字幕在线视频综合 | 成人毛片在线| 中文字幕日韩欧美精品在线观看| 亚洲人与黑人屁股眼交| 欧美午夜电影在线观看 | 日韩精品三区| 亚洲激情在线激情| 久激情内射婷内射蜜桃| 欧美freesex| 欧美绝品在线观看成人午夜影视| 国内精品免费视频| 欧美日韩激情| 毛片精品免费在线观看| 日韩成人免费在线观看| 青青草国产精品97视觉盛宴| 亚洲综合小说区| 国产又爽又黄网站亚洲视频123| 国产区在线观看成人精品| 日本一二三区视频在线| 98在线视频| 一区二区三区国产豹纹内裤在线 | 日韩福利视频导航| 亚洲综合中文字幕在线| 日韩国产福利| 亚洲精品视频在线看| 久久久久久久久久久视频| 中文在线字幕免费观看| 黑人巨大精品欧美一区二区免费| 午夜免费看毛片| 欧美三级电影在线| 久久亚洲精品一区二区| 国产美女激情视频| 国产伦精一区二区三区| 视频在线一区二区三区| 99thz桃花论族在线播放| 欧美精品亚洲二区| 亚洲久久久久久久| 99国产精品99久久久久久粉嫩| 成人xxxx视频| 成人综合影院| 欧美性猛交xxxxx水多| 日韩高清一二三区| 五月天久久777| 国产精品igao视频| 欧美视频一二区| 国产91精品露脸国语对白| 日本不卡一区二区三区视频| 免费在线观看的电影网站| 在线成人免费观看| 欧美三级视频网站| 麻豆久久婷婷| 精品久久蜜桃| 黄网av在线| 欧美成人a在线| 国产高潮国产高潮久久久91| 激情文学综合插| 天堂资源在线亚洲资源| 亚洲天堂一区二区| 日韩精品免费观看| 天天操天天摸天天干| 波多野结衣精品在线| 国产aaa免费视频| 亚洲综合影院| 欧美高清视频在线播放| 性一交一乱一伧老太| 一区二区三区四区不卡视频 | 欧美一二三区视频| 99久久99久久精品免费观看| 日韩av在线播放不卡| jizzjizzjizz欧美| 欧美精品videos性欧美| 亚洲毛片在线播放| 久久久.com| 干日本少妇首页| 夜夜春成人影院| 国产a级全部精品| 福利在线播放| 在线成人av影院| 国产一级一片免费播放放a| 粉嫩嫩av羞羞动漫久久久| 91午夜在线观看| 久久丁香四色| 午夜精品久久久99热福利| 少妇精品视频一区二区| 欧美视频在线视频| 日韩不卡av在线| 精品无码三级在线观看视频| 国产三级中文字幕| 成人黄色av网址| 欧美中文字幕在线| 青青影院在线观看| 日韩一二三区不卡| 日本一区二区欧美| 久久精品在线免费观看| 天天爽天天爽夜夜爽| 999精品一区| 国产精华一区二区三区| 国产高清不卡| 精品国产亚洲一区二区三区在线观看| 国产亚洲自拍av| 国产在线播放一区| 日本中文字幕一级片| 欧美国产日韩电影| 日韩视频在线观看免费| 欧美 日韩 人妻 高清 中文| 在线视频亚洲一区| 男的操女的网站| 91视频观看视频| 亚洲人辣妹窥探嘘嘘| 欧美激情综合| 欧美一区二区三区四区五区六区| 四虎精品永久免费| 91av在线网站| 黄a在线观看| 欧美精品一二三区| 91看片在线播放| 中文字幕第一区综合| 美女被艹视频网站| 乱码第一页成人| 免费观看中文字幕| 亚洲人成精品久久久| 亚洲xxxxx| 色豆豆成人网| 高清在线视频日韩欧美| 永久免费av片在线观看全网站| 精品毛片乱码1区2区3区| 自拍偷拍精品视频| 欧美日韩国产一区二区| 精品人妻伦九区久久aaa片| 久久综合九色综合欧美98| 国产真人做爰毛片视频直播| 国产一区二区三区电影在线观看| 92福利视频午夜1000合集在线观看| 亚洲深夜视频| 欧美疯狂xxxx大交乱88av| av资源网在线观看| 亚洲国内精品在线| 99国产在线播放| 欧美视频一二三区| 一级黄色免费网站| 亚洲成人综合网站| 91在线播放观看| 中文字幕一区二区三中文字幕| 巨胸大乳www视频免费观看| 国产不卡一区视频| 日本成人xxx| 麻豆精品一区二区综合av| 欧美精品色婷婷五月综合| 一区久久精品| 日本福利视频在线观看| 91精品综合| 亚洲综合欧美日韩| 日韩成人三级| 日韩成人av电影在线| 伊人久久大香线蕉av不卡| 久久99国产精品99久久| 欧美日韩看看2015永久免费 | 中文字幕av一区二区三区人| 久久综合福利| 欧美日韩精品一区二区三区视频| 韩国一区二区电影| а√天堂资源官网在线资源| 欧美激情亚洲另类| 日本高清成人vr专区| 欧美成人全部免费| 尤物在线网址| 欧美极品少妇与黑人| 欧美色图天堂| 97久久精品在线| 精品捆绑调教一区二区三区| 68精品国产免费久久久久久婷婷| 91www在线| 欧亚精品中文字幕| 欧美一级大黄| 国产精品日韩av| 色综合视频一区二区三区日韩 | 久久国产精品网| 99在线热播精品免费99热| 无码人妻丰满熟妇区96| 久久高清国产| 九色porny自拍| 国产一区二区三区免费在线观看| 日本55丰满熟妇厨房伦| 不卡一二三区首页| 亚洲自拍偷拍一区二区| 国产精品视频线看| 91视频青青草| 亚洲一区二区三区四区五区黄 | 欧美亚洲综合另类| 国产精品欧美久久久久天天影视| 日韩欧美色综合网站| 日韩一卡二卡在线| 亚洲无限av看| fc2ppv国产精品久久| 一区二区三区高清国产| 日韩在线观看www| 久久6免费高清热精品| 美女扒开腿让男人桶爽久久软| 国产成人精品最新| 国产美女亚洲精品7777| 精品一区二区日本| 成人在线免费视频观看| 久久av高潮av| 久久亚洲欧美| 成人高清在线观看视频| 99精品在线观看视频| 污污视频网站在线免费观看| 亚洲在线免费播放| 国产男人搡女人免费视频| 日韩一区二区在线看| 青青草免费观看免费视频在线| 北条麻妃一区二区三区中文字幕| 国产精品一区hongkong| 国产精品久久久久秋霞鲁丝| 视频二区欧美| 亚洲福利av在线| 欧美日韩免费观看一区=区三区| www.av中文字幕| 久久99国产精品麻豆| 最近中文字幕无免费| zzijzzij亚洲日本少妇熟睡| 无码一区二区三区在线| 亚洲最色的网站| 中文字幕一二区| 欧美网站大全在线观看| 国产黄a三级三级看三级| 亚洲视频第一页| 国产丝袜精品丝袜| 国产精品一区二区三区毛片淫片| 精品综合久久88少妇激情| 亚洲欧美日韩精品综合在线观看| 在线日本成人| 18深夜在线观看免费视频| 国产欧美一区二区三区在线老狼| 精品一区在线视频| 欧美一区二区人人喊爽| 91在线高清| 国产成人精品一区二区在线| 538任你躁精品视频网免费| 一区二区不卡在线视频 午夜欧美不卡'| 亚洲区国产区| 免费观看黄网站| 国产精品久久免费看| 国产精品熟女视频| 日韩av在线直播| 毛片在线网址| 99视频免费观看| 99精品一区| 制服丝袜综合网| 国产日韩欧美在线一区| 久久精品视频1| 日韩成人网免费视频| 福利在线导航136| 91国产在线播放| 91精品一区二区三区综合| 99re6在线观看| 成人午夜在线视频| 国产成人无码一区二区在线观看| 亚洲激情第一区| 国产99999| 欧美高清在线观看| www.神马久久| 久久99中文字幕| 99免费精品在线观看| 99热只有这里有精品| 精品亚洲一区二区三区| 擼擼色在线看观看免费| 精品日本一区二区| 久久成人免费| youjizz亚洲女人| 欧美精品免费视频| 黄网站app在线观看| 亚洲一区二区三区乱码aⅴ蜜桃女| 91精品综合| 怡红院一区二区| 精品久久久久久久久久久久| 日本天堂影院在线视频| 国产91在线播放| 日韩激情免费| 成人三级做爰av| 亚洲福利国产精品| 天堂av电影在线观看| 国产成人精品国内自产拍免费看| 成人影院在线| 中文字幕第66页| 香蕉影视欧美成人| 精彩国产在线| 国产色婷婷国产综合在线理论片a| 欧美 亚欧 日韩视频在线 | 波多野结衣小视频| zzjj国产精品一区二区| 成人18夜夜网深夜福利网| 国产免费一区二区三区视频| 国产欧美精品一区二区色综合 | 久久久无码一区二区三区| 亚洲二区在线播放视频| 韩日精品一区二区| 亚洲砖区区免费| 成人av片在线观看| 日本精品入口免费视频| 久久久极品av| 欧美91在线|欧美| 色婷婷777777仙踪林| 91视视频在线观看入口直接观看www| 一级特黄免费视频| 久久中文字幕国产| 网红女主播少妇精品视频| 中文字幕成人免费视频| 亚洲高清免费视频| www.成人.com| 国产三区精品| 激情久久五月天| 西西44rtwww国产精品| www亚洲精品| 天堂日韩电影|