SimScale:大規模な実世界シミュレーションによる学習で運転を実現する

arXiv cs.RO / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • SimScaleは、既存の実走行ログを起点に未観測の大量な状態を合成できる、スケーラブルなリアルワールド向けシミュレーション学習フレームワークを提案しています。
  • 進行中のego軌道の摂動に連動して反応的環境を生成し、高忠実な多視点観測をニューラルレンダリングで作ることで、OODや安全クリティカル領域のデータ多様性を補完します。
  • 新しく合成した状態に対して擬似エキスパートの軌道生成を行い、行動の教師信号(action supervision)を得る仕組みが組み込まれています。
  • 実走+合成データを単純に共学習(co-training)することで、複数の計画手法の堅牢性と汎化性能が向上し、navhardで+8.6 EPDMS、navtestで+2.9の改善が報告されています。
  • 改善はシミュレーションデータ量を増やすだけで滑らかにスケールし、追加の実データ投入なしでも性能向上が続くことや、擬似エキスパート設計・スケーリングが異なるポリシー構成に与える知見も示されています。

Abstract

完全自律運転システムを実現するには、安全性が極めて重要なケースや分布外のケースを含む幅広いシナリオにおいて、合理的な意思決定を学習する必要があります。しかし、そのようなケースは、人間の専門家によって収集された実世界コーパスでは十分に表現されていません。データ多様性の不足を補うために、既存の運転ログから大量の未見状態を合成できる、新規かつスケーラブルなシミュレーション・フレームワークを提案します。我々のパイプラインは、摂動されたエゴ軌道によって制御された高精細なマルチビュー観測を生成するために、反応的な環境と高度なニューラルレンダリングを活用します。さらに、これらの新たにシミュレートされた状態に対して、行動の教師信号を与えるための疑似エキスパート軌道生成メカニズムも開発します。合成データにおいて、実世界サンプルとシミュレーション・サンプルの両方に対して単純な共同学習(co-training)戦略を行うことで、困難な実世界ベンチマーク上のさまざまな計画手法において、堅牢性と汎化性能の両方が大幅に向上することを見出しました。navhardで最大+8.6 EPDMS、navtestで+2.9です。さらに重要なのは、追加の実世界データのストリーミングなしでも、シミュレーションデータを増やすだけで政策改善が滑らかにスケールすることです。我々は、このようなシムリアル学習システム(SimScale)に関して、疑似エキスパートの設計や異なる政策アーキテクチャにおけるスケーリング特性を含む、いくつかの重要な発見も明らかにします。シミュレーションデータとコードは https://github.com/OpenDriveLab/SimScale で公開しています。