ReSim:自動運転のための信頼性ある世界シミュレーション

arXiv cs.CV / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • ReSimは、従来の運転ワールドモデルが主に安全なエキスパート軌跡で学習されてきたために苦手としてきた、危険な挙動や非エキスパートの挙動でも再現できる「信頼性の高い」運転シミュレーションを目指す。
  • CARLAなどのドライビングシミュレータで収集した多様な非エキスパートデータを、人間の実データデモンストレーションに追加して学習データの異種混合化を行い、条件付け戦略を工夫した拡散トランスフォーマ系の動画生成モデルを通じて制御可能なワールドモデルを構築する。
  • 高精細なシミュレーションと、異なる行動を評価するための報酬(reward)信号を必要とする応用とのギャップを埋めるために、ReSimはVideo2Rewardモジュールでシミュレーション未来から報酬を推定する。
  • 結果として、視覚的忠実度が最大44%向上し、エキスパート/非エキスパート双方の行動で制御性が50%以上改善され、NAVSIMで計画(2%)とポリシー選択(25%)の性能も向上したと報告している。

要旨: 幅広い自車(ego)の運転挙動のもとで、将来の運転シナリオを確実にシミュレートするにはどうすればよいのでしょうか。近年の運転ワールドモデルは、主に安全なエキスパートの軌跡から成る実世界の運転データだけで開発されているため、危険な挙動や非エキスパートの挙動の追従が難しいという課題があります。これらの挙動は、そのようなデータでは稀であるためです。この制約は、ポリシー評価のようなタスクへの適用可能性を制限します。本研究では、この課題に対して、運転シミュレータ(例: CARLA)から収集した多様な非エキスパートデータで、実世界の人間デモを補強し、異種混合コーパスで学習した制御可能なワールドモデルを構築します。拡散トランスフォーマーのアーキテクチャを備えたビデオジェネレータから出発し、条件付け信号を効果的に統合し、予測の制御可能性と忠実性を高めるためのいくつかの戦略を考案します。得られたモデルである ReSim は、危険な非エキスパート挙動を含む、さまざまな行動のもとで多様なオープンワールドの運転シナリオを確実にシミュレートできるようにします。高忠実度なシミュレーションと、異なる行動を判断するために報酬信号を必要とするアプリケーションとのギャップを埋めるために、ReSim のシミュレートした将来から報酬を推定する Video2Reward モジュールを導入します。この ReSim のパラダイムは、視覚的忠実性を最大 44% 向上させ、エキスパートおよび非エキスパートの両方の行動に対して制御可能性を 50% 以上改善し、NAVSIM における計画とポリシー選択の性能を、それぞれ 2% と 25% 引き上げます。