巧みなマニピュレーションにおけるSim-to-Real汎化の定着:視覚言語行動モデルを用いた実証研究

arXiv cs.RO / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、高価な実環境での収集ではなく合成データを用いる場合に、巧みなマニピュレーションにおいてSim-to-Realの汎化性能をより高める方法を研究する。
  • 主要な4つの決定要因――マルチレベル・ドメインランダム化、フォトリアルなレンダリング、物理現実的なモデリング、強化学習の更新戦略――を実証的に評価し、どの要素が転移性能に最も影響するかを特定する。
  • 著者らは、背景、照明、気をそらす要素、物体タイプ、空間的特徴を体系的に変化させながら実環境でのタスク性能を測定する、包括的な評価プロトコルを提示する。
  • 10,000回以上の実環境試行にわたる実験により、より強い汎用ポリシーの転移を導くシミュレーション要素についての実行可能な洞察が得られており、特にVision-Language-Action(VLA)モデルに明確に関連している。
  • 再現性と標準化されたベンチマークを可能にするため、本研究ではロボットプラットフォームと評価プロトコルを一般公開して提供する。