CRAFT:両腕ロボットのデータ生成のためのビデオ拡散
arXiv cs.RO / 2026/4/7
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- CRAFT は、訓練用の関連するアクションラベルを伴いながら、スケーラブルで時間的に一貫した両腕ロボットのデモンストレーション動画を生成する、拡散ベースのフレームワークを提案する。
- 本手法は、シミュレータの軌道から得られる Canny/エッジベースの構造的手がかりによりビデオ拡散を条件付けし、物理的にもっともらしい軌道の変動と、統一されたデータ拡張パイプラインを可能にする。
- オブジェクトの姿勢変更、カメラの視点/照明/背景の変化、異胴体(cross-embodiment)への転移、多視点合成など、多様な合成バリエーションに対応する。
- ほんの少数の現実世界のデモンストレーションから開始し、実機ロボットのリプレイを避けることで、高コストかつ多様性に乏しい現実データの制約に対処し、Sim2Real 訓練の改善を目指す。
- シミュレーションおよび実世界の両方の両腕タスクに関する実験により、既存の拡張手法や単純なデータ規模拡大ベースラインよりも高い成功率が示され、デュアルアーム操作に対するより良い汎化が示唆される。


