精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

適應多形態多任務,最強開源機器人學習系統「八爪魚」誕生

人工智能 新聞
一位優秀的相聲演員需要吹拉彈唱樣樣在行,類似地,一個優秀的機器人模型也應能適應多樣化的機器人形態和不同的任務,但目前大多數機器人模型都只能控制一種形態的機器人執行一類任務。現在 Octo(八爪魚)來了!

在機器人學習方面,一種常用方法是收集針對特定機器人和任務的數據集,然后用其來訓練策略。但是,如果使用這種方法來從頭開始學習,每一個任務都需要收集足夠數據,并且所得策略的泛化能力通常也不佳。

原理上講,從其它機器人和任務收集的經驗能提供可能的解決方案,能讓模型看到多種多樣的機器人控制問題,而這些問題也許能提升機器人在下游任務上的泛化能力和性能。但是,即便現在已經出現了能處理多種自然語言和計算機視覺任務的通用模型,構建「通用機器人模型」依然困難重重。

要為機器人訓練一個統一的控制策略非常困難,其中涉及諸多難點,包括操作不同的機器人機體、傳感器配置、動作空間、任務規范、環境和計算預算。

為了實現這一目標,已經出現了一些「機器人基礎模型」相關研究成果;它們的做法是直接將機器人觀察映射成動作,然后通過零樣本或少樣本方式泛化至新領域或新機器人。這些模型通常被稱為「通才機器人策略(generalist robot policy)」,簡稱 GRP,這強調了機器人跨多種任務、環境和機器人系統執行低階視覺運動控制的能力。

舉些例子:GNM(General Navigation Model,通用導航模型) 適用于多種不同的機器人導航場景,RoboCat 可針對任務目標操作不同的機器人機體,RT-X 能通過語言操控五種不同的機器人機體。盡管這些模型確實是重要進展,但它們也存在多方面的局限:它們的輸入觀察通常是預定義的且通常很有限(比如單相機輸入視頻流);它們難以有效地微調至新領域;這些模型中最大型的版本都沒有提供人們使用(這一點很重要)。

近日,加州大學伯克利分校、斯坦福大學、卡內基梅隆大學和谷歌 DeepMind 的 18 位研究者組成的 Octo Model Team 發布了他們的開創性研究成果:Octo 模型。該項目有效地克服了上述局限。

圖片

  • 論文標題:Octo: An Open-Source Generalist Robot Policy
  • 論文地址:https://arxiv.org/pdf/2405.12213
  • 開源項目:https://octo-models.github.io/

他們設計了一個系統,能讓 GRP 更輕松地應對下游機器人應用的接口多樣化問題。

該模型的核心是 Transformer 架構,其可將任意輸入 token(根據觀察和任務創建)映射成輸出 token(然后編碼成動作),而且該架構可使用多樣化的機器人和任務數據集進行訓練。該策略無需額外訓練就能接受不同的相機配置,也能控制不同的機器人,還能通過語言命令或目標圖像進行引導 —— 所有這些只需通過改變輸入模型的 token 即可實現。

最重要的是,該模型還能適應傳感器輸入、動作空間或機器人形態不同的新機器人配置,所需的只是采用適當的適配器(adapter)并使用一個小的目標領域數據集和少量計算預算進行微調。

不僅如此,Octo 還已經在迄今為止最大的機器人操控數據集上完成了預訓練 —— 該數據集包含來自 Open X-Embodiment 數據集的 80 萬個機器人演示。Octo 不僅是首個可有效微調至新觀察和動作空間的 GRP,也是首個完全開源(訓練工作流程、模型檢查點和數據)的通才機器人操控策略。該團隊也在論文中強調了其組合 Octo 各組件的獨特創新性。

圖片

Octo 模型

下面我們來看看 Octo 這個開源的通才機器人策略是如何構建的。總體而言,Octo 的設計目標是讓其成為一個靈活且廣泛適用的通才機器人策略,可被大量不同的下游機器人應用和研究項目使用。

架構

Octo 的核心是基于 Transformer 的策略 π。其包含三個關鍵部分:輸入 token 化器、Transformer 骨干網絡和讀出頭。

如圖 2 所示,其中輸入 token 化器的作用是將語言指令、目標和觀察序列轉換成 token,Transformer 骨干會把這些 token 處理成嵌入,讀出頭則是得出所需的輸出,即動作。

圖片

任務和觀察 token 化器

為了將任務定義(比如語言指令和目標圖像)與觀察(比如相機視頻流)轉換成常用的已 token 化的格式,該團隊針對不同模態使用了不同的 token 化器:

對于語言輸入,先 token 化,然后通過一個預訓練的 Transformer 將其處理成一個語言嵌入 token 序列。具體而言,他們使用的模型是 t5-base (111M)。

對于圖像觀察和目標,則是通過一個較淺的卷積堆棧來處理,然后再拆分成平展后圖塊構成的序列。

最后,通過向任務和觀察 token 添加可學習的位置嵌入并按一定順序排列它們來構建 Transformer 的輸入序列。

Transformer 骨干和讀出頭

將輸入處理成一種統一化的 token 序列之后,就能交給 Transformer 處理了。這與之前的研究工作類似:基于觀察和動作系列來訓練基于 Transformer 的策略。

Octo 的注意力模式是逐塊掩碼式:觀察 token 只能按照因果關系關注來自同一或之前時間步驟的 token 以及任務 token。對應于不存在觀察的 token 會被完全掩蔽掉(比如沒有語言指令的數據集)。這種模塊化設計很方便,可在微調階段添加或移除觀察或任務。

除了這些輸入 token 模塊,該團隊還插入了已學習完成的讀出 token。讀出 token 會關注其之前的觀察和任務 token,但不會被任何觀察或任務 token 關注。因此,讀出 token 只能讀取和處理內部嵌入,而無法影響內部嵌入。讀出 token 的作用類似于 BERT 中的 [CLS] token,充當截至目前的觀察序列的緊湊向量嵌入。針對讀出 token 的嵌入,會使用一個輕量的實現擴散過程的「動作頭」。這個動作頭會預測多個連續動作構成的一個「塊(chunk)」。

這樣的設計可讓用戶在下游微調時向模型靈活地添加新的任務和觀察輸入或動作輸出頭。當在下游添加新的任務、觀察或損失函數時,可以在整體上保留 Transformer 的預訓練權重,僅添加新的位置嵌入、一個新的輕量編碼器、或由于規范變化而必需的新頭的參數。這不同于之前的架構 —— 對于之前的架構,如果添加或移除圖像輸入或改變任務規范,就需要重新初始化或重新訓練預訓練模型的大量組件。

要讓 Octo 成為真正的「通才」模型,這種靈活性至關重要:由于我們不可能在預訓練階段覆蓋所有可能的機器人傳感器和動作配置,因此,如果能在微調階段調整 Octo 的輸入和輸出,便能讓其成為機器人社區的一種多功能工具。另外,之前使用標準 Transformer 骨干或融合使用視覺編碼器與 MLP 輸出頭的模型設計固定了模型輸入的類型和順序。相較之下,切換 Octo 的觀察或任務并不需要對大部分模型進行重新初始化。

訓練數據

該團隊從 Open X-Embodiment 中取用了包含 25 個數據集的混合數據集。圖 3 給出了數據集的組成。

圖片

有關訓練目標和訓練硬件配置等更多細節請參閱原論文。

模型檢查點和代碼

重點來了!該團隊不僅發了 Octo 的論文,還完全開源了所有資源,其中包括:

  • 預訓練完成的 Octo 檢查點,包括 2700 萬參數的 Octo-Small 和 9300 萬參數的 Octo-Base。
  • 用于 Octo 模型的微調腳本,基于 JAX。
  • 用于在 Open X-Embodiment 數據集上預訓練 Octo 的模型預訓練工作流程,基于 JAX。用于 Open X-Embodiment 數據的數據加載器,兼容 JAX 和 PyTorch。

實驗

該團隊也通過實驗對 Octo 進行了實證分析,在多個維度上評估了其作為機器人基礎模型的性能:

  1. 能否直接使用 Octo 控制多臺機器人機體并解決語言和目標任務?
  2. Octo 權重可否作為優質的初始化基礎,支持面向新任務和機器人的數據高效型微調,以及它是否優于從頭開始訓練的方法和常用的預訓練表征?
  3. 在構建通才機器人策略方面,Octo 中的哪種設計決策最重要?

圖 4 展示了評估 Octo 的 9 種任務。

圖片

直接使用 Octo 控制多臺機器人

該團隊比較了 Octo、RT-1-X、RT-2-X 的零樣本操控能力,結果見圖 5。

圖片

可以看到,Octo 的成功率比 RT-1-X(3500 萬參數)高 29%。而在 WidowX 和 RT-1 Robot 評估上,Octo 與 550 億參數的 RT-2-X 性能相當。

此外,RT-1-X 和 RT-2-X 僅支持語言指令,而 Octo 還支持以目標圖像為條件。該團隊還發現,在 WidowX 任務上,如果使用目標圖像為條件,成功率比使用語言為條件高 25%。這可能是因為目標圖像能提供更多有關任務完成的信息。

Octo 能高效地使用數據來適應新領域

表 1 給出了數據高效型微調的實驗結果。

圖片

可以看到,相比于從頭開始訓練或使用預訓練的 VC-1 權重進行預訓練,微調 Octo 得到的結果更好。在 6 種評估設置上,Octo 相較于第二名基準的平均優勢為 52%!

并且不得不提的是:針對所有這些評估任務,微調 Octo 時使用的配方和超參數全都一樣,由此可見該團隊找到了一個非常好的默認配置。

通才機器人策略訓練的設計決策

上面的結果表明 Octo 確實能作為零樣本多機器人控制器,也能作為策略微調的初始化基礎。接下來,該團隊分析了不同設計決策對 Octo 策略性能的影響。具體而言,他們關注的重點是以下方面:模型架構、訓練數據、訓練目標、模型規模。為此,他們進行了消融研究。

表 2 給出了在模型架構、訓練數據和訓練目標的消融研究結果。

圖片

圖 6 則展現了模型規模對零樣本成功率的影響,可以看出來更大的模型有更好的視覺場景感知能力。

圖片

整體而言,Octo 各組件的有效性得到了證明。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-15 14:50:03

AI機器人開發

2020-09-02 10:36:52

機器人人工智能系統

2022-10-28 13:16:07

四足機器人機器人人工智能

2025-06-11 14:45:26

機器人訓練數據

2018-07-06 08:58:53

機器人人工智能系統

2019-12-24 09:31:55

機器人人工智能編程

2017-03-27 09:59:25

機器人自創語言交流

2017-12-01 08:53:28

機器學習大數據物聯網

2025-10-27 09:02:00

2025-09-08 09:12:00

2022-08-27 15:10:36

Ameca機器人模仿

2023-10-22 20:14:08

人工智能GPT-4

2025-07-25 09:42:47

2021-01-04 09:18:36

機器人人工智能系統

2022-06-07 14:35:53

機器人人工智能

2024-02-01 13:03:00

AI模型

2023-07-29 13:14:40

谷歌人工智能

2025-01-07 20:54:34

2025-10-09 13:19:47

點贊
收藏

51CTO技術棧公眾號

岛国精品在线播放| 99免费视频观看| 免费网站在线观看黄| 亚洲AV无码精品色毛片浪潮| 午夜先锋成人动漫在线| 成人免费在线视频观看| 91极品女神在线| 视频一区视频二区视频| 久久久精品91| 成人国产在线| 99视频精品在线| 北条麻妃在线一区二区| 免费欧美一级视频| 亚洲男人第一天堂| 一个色综合网| 欧美日韩久久不卡| 欧美人xxxxx| 久久精品免费在线| 日韩在线成人| 中文字幕亚洲在| 国产精品女人久久久久久| 精品国产一区在线| 性xxxxfjsxxxxx欧美| 国产成人久久| 欧美视频在线观看 亚洲欧| 成人9ⅰ免费影视网站| 亚洲不卡的av| 欧美不卡高清一区二区三区| 成人永久免费视频| 国产免费成人av| gv天堂gv无码男同在线观看| av激情成人网| 国产精品嫩草影院com| 国产精品成人播放| 国产伦理片在线观看| 欧美a级在线观看| 粉嫩aⅴ一区二区三区四区| 最近2019年日本中文免费字幕| 成人亚洲视频在线观看| 国内高清免费在线视频| 成人黄色网址在线观看| 欧美精品久久久久| 久草视频福利在线| xxxx另类黑人| 亚洲人成人一区二区在线观看| 91手机视频在线观看| www色aa色aawww| 玖玖玖视频精品| 亚洲一区二区视频| 九九九九精品九九九九| 色一情一乱一伦| 国产一区二区三区四区| 亚洲激情在线观看视频免费| 欧美丰满熟妇bbbbbb百度| 毛片网站在线| 麻豆久久久久久久| 搡老女人一区二区三区视频tv| theav精尽人亡av| 91tv亚洲精品香蕉国产一区| 日韩欧美国产激情| 午夜精品久久久内射近拍高清| a√在线中文网新版址在线| 免费人成在线不卡| 欧美激情视频给我| 97超碰在线资源| 国产麻豆一区二区三区| 午夜精品一区二区三区免费视频| 日本一区视频在线播放| 精品久久久中文字幕人妻| 在线一区免费观看| 中文字幕欧美亚洲| 国产精品无码自拍| 欧美大胆成人| 亚洲男人的天堂在线aⅴ视频| 国产福利久久| 欧美日韩 一区二区三区| 国产精品国内免费一区二区三区| 精品国产1区二区| 男女男精品视频站| a在线免费观看| 久久先锋影音av鲁色资源网| 国产精品视频网| 亚洲天堂网在线视频| 国模一区二区三区| 一本大道久久加勒比香蕉| 999热精品视频| 国产私拍福利精品视频二区| 欧美三区在线视频| 久久久一本二本三本| 在线亚洲人成| 亚洲国产精品久久艾草纯爱| 亚洲欧美久久234| 天堂中文在线资源| 国产在线看一区| 国产不卡视频在线| 日本一本高清视频| 一区二区中文| 久久久久久久久爱| 波多野结衣家庭主妇| 国产一区二区在线视频| 久久大香伊蕉在人线观看热2| 国产系列在线观看| 久久蜜臀精品av| 中文字幕免费视频| 国产+高潮+白浆+无码| 嫩草国产精品入口| 欧美一级理论片| 日韩中文字幕第一页| 国产精品嫩草69影院| 亚洲春色h网| 欧美大黄免费观看| 天天色天天综合网| 国产欧美三级电影| 欧美一区二区三区在线看| 污网站免费在线| 一区二区三区四区高清视频| 欧美军同video69gay| 亚洲色图38p| 91成人午夜| 中文字幕在线日韩 | 国产精品99re| 蜜桃视频免费观看一区| 精品一区二区三区日本| www视频在线| 国产调教视频一区| 欧美精品一区在线发布| 最新黄网在线观看| 亚洲精品大片www| 四虎精品欧美一区二区免费| 蜜桃视频在线观看www社区| 中文字幕在线一区二区三区| 欧美a v在线播放| 一区二区日韩| 成人97在线观看视频| 婷婷激情四射网| 免费看的黄色欧美网站| 欧美最猛性xxxxx免费| 青青草免费观看视频| 首页欧美精品中文字幕| 国产精品成人aaaaa网站| 蜜桃视频久久一区免费观看入口| caoporen国产精品视频| 一本色道久久88亚洲精品综合| 免费污视频在线一区| 亚洲人成免费电影| 懂色av蜜臀av粉嫩av永久| 国产精品久久久久久久久久10秀| 日韩av手机在线观看| 中文字幕一区二区三区四区免费看| 免费日本视频一区| 日本一区精品| 91精品久久| 欧美精品在线一区二区| 婷婷国产成人精品视频| 另类综合日韩欧美亚洲| 亚洲精品日韩精品| 精品国产美女a久久9999| 欧美一区二区三区四区在线观看| 91香蕉视频污在线观看| 精品亚洲国内自在自线福利| 国产精品二区在线观看| 国产91绿帽单男绿奴| 亚洲夂夂婷婷色拍ww47| 精品一区二区中文字幕| 天堂在线精品| 国产福利精品视频| 日本最黄一级片免费在线| 香蕉久久一区二区不卡无毒影院| 制服丝袜在线第一页| 91久久午夜| 91久久精品一区| 中文字幕有码在线观看| 日韩精品在线网站| 日本一二三区视频| 久久久久久久久久久久久久久99| 国产又黄又爽免费视频| 国产免费拔擦拔擦8x高清在线人| 欧美亚洲愉拍一区二区| 性活交片大全免费看| 欧美成人自拍| 日韩av成人在线观看| 国产中文在线视频| 亚洲成a人片综合在线| 国产一级伦理片| 久久深夜福利| 中文字幕一区二区三区四区五区六区 | 免费日韩电影| 日韩中文字幕视频在线| 午夜精品一区二区三| 日韩欧美大尺度| 国产美女福利视频| 国产成人免费视频一区| 亚洲国产一区二区三区在线播| 欧美美女被草| 国内成人精品视频| 国产精品玖玖玖| 久久美女艺术照精彩视频福利播放 | 色综合一区二区| 精品伦一区二区三区| 亚洲免费在线| 91制片厂免费观看| 奇米777国产一区国产二区| 国产日韩中文字幕在线| 免费福利在线观看| 欧美一区二区在线免费观看| 欧美一区二区三区四| 波多野结衣91| 日韩高清第一页| 欧美一区三区| 日韩av手机在线| 啦啦啦中文在线观看日本| 91精品视频网| 粉嫩精品久久99综合一区| 成人黄色一级视频| 亚洲综合在线一区二区| 丝瓜av网站精品一区二区| 成人毛片100部免费看| 欧美激情三级| 国产精品露脸av在线| 国产va在线视频| 九九精品视频在线观看| 国产激情视频在线播放| 亚洲欧洲日产国码二区| free性中国hd国语露脸| 国产成人精品免费网站| 蜜臀一区二区三区精品免费视频| 国产亚洲欧洲| 日本在线观看一区二区| 国产成人在线中文字幕| 91日韩在线视频| 欧洲亚洲精品久久久久| 久久精品国产清自在天天线| 国产精品视频第一页| 色综合咪咪久久| www.日本精品| 亚洲国产精品人人做人人爽| 一区二区成人免费视频| 岛国精品在线播放| 伊人成人免费视频| 伊人激情综合| 免费在线观看一区二区| jvid一区二区三区| 青草青草久热精品视频在线网站 | 一区二区三区日韩精品视频| 日韩一卡二卡在线观看| 国产精品区一区二区三区 | 亚洲精品第一国产综合野| 特一级黄色录像| 亚洲三级理论片| 久久国产精品国语对白| 自拍偷拍国产精品| 四虎精品免费视频| 亚洲免费在线视频一区 二区| 中日韩一级黄色片| 懂色av一区二区三区免费看| 午夜免费福利网站| 国产一区二区三区在线观看免费视频 | 国产一区免费视频| jk漫画禁漫成人入口| 68精品国产免费久久久久久婷婷| xxxx成人| 4p变态网欧美系列| 国产黄色在线免费观看| 日韩专区在线观看| 成人在线观看免费网站| 九九热这里只有在线精品视| 久久亚洲导航| 日本三级久久久| 日本成人福利| 成人天堂噜噜噜| 亚洲男人av| 精品自拍视频在线观看| 欧美女同一区| 欧美一区在线直播| av亚洲一区| 91国产在线播放| 韩日精品一区| 91久久精品国产91久久| 亚洲性视频在线| 精品一区二区日本| 日韩1区2区| 免费国产在线精品一区二区三区| 国产欧美一区| 中文字幕一区二区三区精彩视频| 黄色av日韩| 日本三区在线观看| 在线一区免费观看| 久久久精品麻豆| 老鸭窝91久久精品色噜噜导演| www婷婷av久久久影片| 亚洲国产网站| 一区二区三区入口| 国产成人av资源| 亚洲成人黄色av| 亚洲精品久久7777| 水蜜桃av无码| 在线日本制服中文欧美| 日本视频一区二区在线观看| 99视频精品全国免费| 2018国产在线| 天天做天天爱天天综合网| 日韩欧美精品免费| 欧美.日韩.国产.一区.二区| 一区二区欧美日韩| 精品免费一区二区| 久久精精品视频| 国产精品国产一区| 黑森林福利视频导航| 国产iv一区二区三区| 美国一级黄色录像| 污片在线观看一区二区| 久久久全国免费视频| 在线区一区二视频| 中文字幕天堂在线| 精品国产三级a在线观看| aaa在线免费观看| 57pao成人永久免费视频| 玖玖玖电影综合影院| 亚洲aⅴ天堂av在线电影软件| 136国产福利精品导航网址| 成人不卡免费视频| 国产日产欧美一区| 中文字幕第15页| 日韩欧美成人午夜| 好吊日视频在线观看| 久久手机免费视频| 日韩精品第一| 欧美精品尤物在线| 99re国产精品| 亚洲成人av免费观看| 国产精品免费aⅴ片在线观看| wwwxxx亚洲| 亚洲第一偷拍网| 蜜桃免费在线| 97视频在线播放| 亚洲四虎影院| 欧美日韩国产高清视频| 99精品国产一区二区青青牛奶| 伦伦影院午夜理论片| 亚洲丝袜精品丝袜在线| 91丨九色丨丰满| 欧美一级爆毛片| 精品麻豆一区二区三区| 91精品久久久久久久| 日韩专区精品| 亚洲精品久久久久久宅男| 国产精品―色哟哟| 中文字幕观看在线| 视频在线观看一区二区| 丁香久久综合| 正在播放91九色| 激情成人午夜视频| 欧美日韩综合一区二区| 欧美网站在线观看| 日本一级在线观看| www日韩欧美| 欧美大片网站| 正在播放91九色| 国产盗摄精品一区二区三区在线| 国产黄色片在线免费观看| 日韩欧美中文字幕一区| 青青草视频在线免费直播| 国产精品午夜av在线| 宅男噜噜噜66一区二区 | 久久青草国产手机看片福利盒子 | 中文字幕伦理片| 免费短视频成人日韩| 欧美激情一区不卡| 在线视频一二三区| 亚洲电影av| 五月天丁香社区| 亚洲成人av资源| 青青草视频在线观看| 国产精品高清在线| 国产精品福利在线观看播放| 好吊操视频这里只有精品| 婷婷六月综合网| 国产黄在线观看| 成人亚洲综合色就1024| 影音先锋久久久| 免费在线观看你懂的| 国产精品成人一区二区艾草 | 欧美精品久久99久久在免费线| 二区三区在线观看| 狠狠色综合一区二区| 日韩电影在线免费看| 成人在线观看一区二区| 狠狠躁18三区二区一区| 亚洲风情第一页| 欧日韩在线观看| **女人18毛片一区二区| 成人精品视频一区二区| 国产精品护士白丝一区av| 亚洲av无码一区二区乱子伦| 欧美有码在线视频| 亚洲精品小说| 香蕉视频久久久| 精品国产三级电影在线观看| ww久久综合久中文字幕| 天堂8在线天堂资源bt|