機器人高層指揮低層做,“坐標系轉移接口”一次演示實現泛化學習 | ICML2025
如何讓AI像人一樣,僅憑少量演示,就能穩健適應復雜多變的真實場景?
美國東北大學和波士頓動力RAI提出了HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首創“坐標系轉移接口”,讓機器人學習更高效、泛化更靈活。

總的來說,HEP框架具有以下亮點:
- 極簡高效的分層結構高層負責全局目標設定,低層自主在本地坐標下優化動作,顯著提升操作的靈活性與效率;
- 空間對稱性自然泛化模型自動適應目標平移、旋轉等變化,極大降低泛化對數據量的依賴;
- 創新型體素編碼器三維視覺信息高效表達,兼顧細節還原與計算速度。

論文已被ICML2025收錄。
核心創新
在機器人智能操作領域,數據稀缺和泛化難題長期困擾著AI的落地應用。大多數方法或依賴大量數據,或在環境稍有變化時表現失靈。
而HEP框架使用了一種用于層級策略學習的框架轉換接口,該接口使用高級代理的輸出作為低級代理的坐標系,能夠在保持靈活性的同時提供強大的歸納偏差。

簡單地說,HEP 基于兩個核心思想:分層策略結構和“坐標系轉移接口”,高層策略僅需給出任務的“參考坐標”,低層策略在此基礎上自主優化執行細節。
- 高層策略:負責通過預測一個“關鍵姿態”(即一個目標 3D 平移)來進行全局、長時程規劃,該關鍵姿態作為子目標。
- 低層策略:在以關鍵姿態為錨點的局部坐標系中生成細粒度的運動軌跡。

而“坐標系轉移接口”具有以下特點:
- 傳遞泛化能力:高層的泛化能力可以傳遞到低層。
- 軟約束:局部軌跡優化。
- 歸納偏差:自然泛化到新姿態。
這樣的設計不僅釋放了低層的靈活性,也將高層的泛化能力、抗干擾性自洽地傳遞到底層,實現了“泛化性與魯棒性”的一體式提升。
效果展示
為驗證HEP框架的有效性,研究團隊在RLBench上的30個模擬任務中進行了測試——包括高精度任務、長時程任務和關節物體操作——并在真實機器人上通過3個真實世界操作任務進一步驗證。

結果顯示:
分層策略在復雜長程任務上優勢顯著
在真實機器人上,HEP分層框架僅用30條演示數據,就學會了包括移鍋蓋、加清潔劑、擦洗等多步協作的魯棒“洗鍋”任務,明顯優于非分層方法。

坐標系轉移接口:泛化性與魯棒性的傳遞橋梁
在Pick&Place任務上,HEP僅憑一次演示,低層擴散模型即可實現1-shot泛化學習,顯著提升了數據效率。
證明了坐標系轉移接口能將高層對空間變化的適應能力無損傳遞至低層,策略整體更易擴展至新場景。

并且,在環境變化和引入無關物體的擾動測試下,HEP成功率較傳統方法提升高達60%。

接口設計帶來未來擴展可能
坐標系轉移接口對低層策略僅施加軟約束,這不僅保證了靈活性,也為未來引入VLM或Cross-embodiment等多模態、跨平臺高層策略作為決策規劃器提供了天然接口。一句話結論:坐標系轉移接口不僅實現了高層泛化性和魯棒性的無損傳遞,還為多模態智能體的開放性集成與泛化部署打開了新路徑。






























