InCoM:意図に基づく知覚とモバイル操作のための構造化された協調
arXiv cs.RO / 2026/4/28
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、変化する視点下でのロバストな知覚と、ベースとアームの協調制御の必要性に対応するための「InCoM」を提案しています。
- InCoMは潜在的なモーション意図を推定し、マルチスケールの知覚特徴に動的な重み付けを行うことで、操作の各段階に応じて注意配分を適応させます。
- モダリティ間のロバスト性を高めるため、幾何学的意味論に基づく構造化アラインメント機構を導入し、複数のセンサ入力間の対応関係を強化します。
- 制御側では、協調されたベース・アーム行動生成を明示的にモデル化するデカップルされた協調フローマッチングのアクションデコーダを用い、強い制御結合による最適化の難しさを緩和します。
- 実験では、InCoMが最先端手法を大きく上回り、特権情報なしでManiSkill-HABの3つのシナリオにおいて成功率をそれぞれ28.2%、26.1%、23.6%改善し、実環境のモバイル操作タスクでも既存ベースラインより高い成功率を維持したと示されています。