要旨: 実世界のロボットに対して多様な操作スキルを学習することは、高価でスケールしにくい遠隔操作によるデモンストレーションへの依存によって深刻にボトルネック化されています。人間の動画はスケーラブルな代替手段を提供しますが、操作知識の効果的な転移は、本質的に、人間とロボットの実体(embodiment)の間に存在する大きな形態(モルフォロジー)のギャップによって妨げられています。この課題に対処し、人間からロボットへのスキル転送を促進するために、我々はTraj2Actionという新規フレームワークを提案します。Traj2Actionは、操作端点の3D軌道(3D trajectory)を統一された中間表現として用い、実体ギャップを橋渡しすることで、人間の軌道に埋め込まれた操作知識をロボットの行動へと転送します。我々の方策はまず、人間データとロボットデータの両方を活用することで、高レベルの運動計画を形成する粗い軌道の生成を学習します。次に、この計画を、共同デノイジング(co-denoising)フレームワークの中で、正確でロボット固有の行動(例:姿勢やグリッパ状態)の合成を条件付けるために用います。本研究は2つの主要な目的に焦点を当てています。第一に、Traj2Actionフレームワークの有効性を、アーキテクチャ設計にまたがる体系的な検証(architectural design)、タスク間の汎化(cross-task generalization)、およびデータ効率(data efficiency)によって行うこと。第二に、人間のハンドデモンストレーションデータを統合する際に、ロボット方策学習を支配する主要な法則を明らかにすることです。この研究の焦点により、形態ギャップをまたいだ人間からロボットへのスキル転送に特化したスケーラブルなパラダイムを提供できるようになります。Frankaロボットでの広範な実世界実験により、Traj2Actionは短期および長期の実世界タスクにおいて、pi_0ベースラインに対して最大27%および22.25%の性能向上をもたらし、さらにロボット方策学習において人間データがスケールするにつれて顕著なゲインを達成することが示されます。
Traj2Action:軌道(トラジェクトリ)ガイドによる人からロボットへの技能移転のための共同(コ)デノージング・フレームワーク
arXiv cs.RO / 2026/4/13
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- Traj2Actionは、ヒトの動画/遠隔操作からの知識移転をターゲットにしつつ、大きなヒト—ロボットの身体的形態(モルフォロジー)ギャップを緩和することで、スケーラブルなロボット操作技能を獲得する際のボトルネックに取り組む。
