概要: エンドツーエンド学習はロボット操作の強力なパラダイムとして浮上していますが、その有効性はデータ不足とロボットの具現化間の行動空間の異質性によって制限されます。特に、異なるエンドエフェクター間での多様な行動空間は、跨る具現化間の学習とスキル移転に障害を生じさせます。私たちは、さまざまなエンドエフェクターの動作を統合する潜在的な行動空間で学習された拡散ポリシーを用いることでこの課題に対処します。まず、対照損失で訓練されたエンコーダを用いて、意味論的に整列した潜在行動空間を、類人型ロボットハンド、人の手、そして平行顎グリッパーのために学習できることを示します。次に、異なるエンドエフェクターからの操作データを共訓練するために提案する潜在行動空間を用いることで、単一のポリシーを用いてマルチロボット制御を行い、最大で25.3%の操作成功率の改善を達成できることを示します。これは著しい具現化ギャップにもかかわらず、スキル移転が成功したことを示しています。我々の潜在的な跨具現化ポリシーを用いたアプローチは、具現化を跨ぐ異なる行動空間を統一する新しい方法を提示し、ロボット設置間での効率的なマルチロボット制御とデータ共有を可能にします。この統一表現は、新しいロボット形態ごとに大量のデータ収集を必要とする度合いを大幅に減らし、具現化間の一般化を加速し、最終的にはよりスケーラブルで効率的なロボット学習を促進します。
異なるエンボディメント間の操作のための潜在アクション拡散
arXiv cs.RO / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は潜在アクション空間で学習した拡散ポリシーを導入し、エンドエフェクタの多様な操作を異なるエンボディメント間で統一する。
- エンコーダをコントラスト損失で訓練し、ヒト型ハンド、実手(人間の手)、および並列顎グリッパーに対して意味的に整合した潜在アクション空間を作るようにする。
- この潜在空間を跨ってエンドエフェクタを共訓練することにより、単一のポリシーが複数のロボットを制御し、操作の成功率を最大25.3%向上させる。
- このアプローチは新しいロボット形状に対するデータ収集の必要性を低減し、エンボディメント間の一般化を加速させ、スケーラブルなマルチロボット学習を実現する。
- ロボット設定間でアクション空間を統一する新しい手法を提案し、データ共有を促進する。
広告
