力強い操作のためのマルチモーダル拡散フォーシング
arXiv cs.RO / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、標準的な模倣学習がしばしばモダリティ(観測、行動、報酬/力信号)の相互作用を無視しており、それが接触の多いロボット挙動のモデリングを制限していると主張する。
- ランダムな部分マスキングと再構成を用い、単一の固定された観測から行動への写像を学習するのではなく、拡散ベースの学習フレームワークであるMultimodal Diffusion Forcing(MDF)を提案する。
- MDFは、時間的およびモーダリティ間の依存関係を捉えるよう設計されており、行動が力信号にどう影響するかを予測したり、不完全な観測から潜在状態を推論したりする能力を可能にする。
- シミュレーションおよび実世界の力強い操作タスクに対する実験では、高い性能と、ノイズのある観測に対する頑健性が示され、不確実性下での操作における実用的価値が示唆される。
- 本研究は、MDFを、マルチモーダルな専門家デモンストレーションからより豊かな軌道構造を学習することで、行動生成を超えた統一的なアプローチとして位置づける。




