Fail2Drive:クローズドループ運転の一般化性能をベンチマークする
arXiv cs.RO / 2026/4/10
📰 ニュースTools & Practical UsageModels & Research
要点
- Fail2Driveは、CARLA上で「学習時と異なる条件(分布シフト)」に対するクローズドループ自動運転の一般化を、訓練シナリオの再利用ではない形で定量評価するためのベンチマークである。
- 200ルートと17の新規シナリオクラス(見た目・レイアウト・挙動・ロバスト性のシフト)を備え、シフト後のルートを同一対応するインディストリビューション側と対にして、差分の影響を切り分ける。
- 複数の最先端モデルを評価した結果、成功率が平均22.8%低下するなど、一般化性能の一貫した劣化が観測された。
- 分析では、LiDARで明確に見えている物体を無視するといった問題や、自由/占有空間といった基本概念を学べないなど、想定外の故障モードが明らかになった。
- 新規シナリオ生成や「専門家ポリシーによる解けるか(solvability)」の検証を支援するオープンソースのツールボックスを提供し、コード/データ/ツールを公開して再現可能な研究基盤を目指している。




