オープンループ指標はクローズドループ走行を予測できるか?NAVSIMとBench2Driveのクロスベンチ相関研究

arXiv cs.RO / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、従来のADE/FDEのようなオープンループ指標がクローズドループのDriving Scoreと信頼性の高い相関を示さなかったことを踏まえ、NAVSIM v2のより新しい安全配慮型オープンループ指標が予測力を改善できるかを検証する。
  • 15手法に対するクロスベンチの相関分析の結果、NAVSIMの集約PDM ScoreはBench2DriveのDriving Scoreと強い正の相関を持つが単調ではなく、ランキングの逆転が明確に観測される。
  • NAVSIMの個別サブ指標のうち、Ego Progress(EP)がクローズドループ成功の最良の予測因子であり、安全に直結する衝突系指標NCを大きく上回る。
  • 安全と進捗のトレードオフはオープンループとクローズドループで異なる形で現れ、安全を進捗より優先してもNAVSIMでは高評価でも、クローズドループではタイムアウトや低速走行ペナルティにより不利になり得ることが示され、残差ギャップの機構として「スノーボール効果(小さな逸脱が失敗へ積み重なる)」が候補として挙げられる。