DreamControl-v2:訓練可能なガイド付き拡散事前分布による、より単純でスケーラブルな自律ヒューマノイド技能

arXiv cs.RO / 2026/4/2

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、DreamControl-v2を提案し、RL学習を人間の運動拡散モデルで誘導するという元のDreamControlフレームワークを改良することで、ヒューマノイドロボットの自律的な移動・操作(ロコモーション+マニピュレーション)技能をより頑健にすることを目指す。
  • DreamControl-v2は、市販の人間の運動事前分布に依存するのではなく、複数の人間・ロボットのデータセットから構築した統一の身体化(エンボディメント)空間を用いて、ヒューマノイドロボット自身の運動空間上でガイド付き拡散モデルを直接訓練する。
  • より大規模で混合された学習データセットを活用することで学習される技能の多様性が増し、さらにパイプライン中の手動フィルタリング手順をなくすことで、人による介入を削減する。
  • 著者らは、より頑健な下流のRLポリシーを得るには、参照軌道生成のスケーリングが重要であることを見出している。
  • シミュレーションおよび実機のUnitree-G1ヒューマノイドプラットフォームで広範な実験を行い、改良した訓練手法の実用的な実現可能性を検証している。