Sim2Real-AD:VLM誘導強化学習を実世界の自動運転車へ展開するための、モジュール型Sim-to-Realフレームワーク

arXiv cs.RO / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • Sim2Real-ADは、CARLAで訓練したVLM誘導強化学習ポリシーを、実世界でのRL訓練データなしに、実フルスケール車両へ展開するためのモジュール型Sim-to-Realフレームワークを提案する。
  • この手法では、転移(transfer)を4つのコンポーネントに分解する:幾何学的観測ブリッジ(単眼画像からBEV互換の観測へ)、物理を考慮したアクション・マッピング(ポリシー出力からプラットフォーム非依存の物理コマンドへ)、2相の段階的訓練戦略(アクション空間と観測空間の適応を分離)、およびリアルタイム展開パイプライン(安全監視付きのエンドツーエンド閉ループ実行)。
  • 実験により、このフレームワークが異なるRL報酬パラダイム間で相対的な性能順位を維持できることが示されるとともに、各モジュールの寄与も検証される。
  • 実機のFord E-Transitに対するゼロショットの閉ループ展開では、車間走行(90%)、障害物回避(80%)、停止標識の扱い(75%)の各シナリオで高い成功率が報告される。
  • 著者らは、フルスケール車両に対して、ゼロショットでCARLA訓練済みVLM誘導RLポリシーを展開した最初期のデモの一つであると位置づけており、デモ資料およびコードをオンラインで提供している。