Fail2Drive:クローズドループ運転の一般化性能をベンチマークする

arXiv cs.RO / 2026/4/10

📰 ニュースTools & Practical UsageModels & Research

要点

  • Fail2Driveは、CARLA上で「学習時と異なる条件(分布シフト)」に対するクローズドループ自動運転の一般化を、訓練シナリオの再利用ではない形で定量評価するためのベンチマークである。
  • 200ルートと17の新規シナリオクラス(見た目・レイアウト・挙動・ロバスト性のシフト)を備え、シフト後のルートを同一対応するインディストリビューション側と対にして、差分の影響を切り分ける。
  • 複数の最先端モデルを評価した結果、成功率が平均22.8%低下するなど、一般化性能の一貫した劣化が観測された。
  • 分析では、LiDARで明確に見えている物体を無視するといった問題や、自由/占有空間といった基本概念を学べないなど、想定外の故障モードが明らかになった。
  • 新規シナリオ生成や「専門家ポリシーによる解けるか(solvability)」の検証を支援するオープンソースのツールボックスを提供し、コード/データ/ツールを公開して再現可能な研究基盤を目指している。