R3D:3Dポリシー学習の見直し

arXiv cs.CV / 2026/4/17

📰 ニュースModels & Research

要点

  • 本論文は、学習の不安定化や深刻な過学習によって進んでいない3Dポリシー学習を再検討し、より強い汎化やクロスボディ(身体)移行を実現することを目指しています。
  • 著者らは失敗の主因を体系的に切り分け、3Dデータ拡張の欠落とBatch Normalizationの悪影響が重要な要因だと結論づけています。
  • スケーラブルなトランスフォーマー型3Dエンコーダと拡散(ディフュージョン)デコーダを組み合わせた新アーキテクチャを提案し、大規模での安定性を重視した設計と大規模事前学習の活用を可能にしています。
  • 難度の高いマニピュレーションのベンチマークで既存の3Dベースラインを大幅に上回る結果が示され、スケーラブルな3D模倣学習の堅牢な基盤が確立されたとしています。