フォトリアルなクローズドループ環境におけるエンドツーエンド自動運転のための擬似エキスパート正則化オフライン強化学習
arXiv cs.RO / 2026/4/10
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自動運転のためのカメラのみのエンドツーエンドオフラインRL手法を提案し、追加の探索を行わずに固定されたシミュレータのデータセットから学習することで、模倣学習の失敗モードを回避することを目指す。
- 分布外の行動に対する過大評価によって生じるオフラインRLの不安定性を低減するため、本手法はエキスパートログから導出した擬似の正解軌道を用いて学習を正則化する。
- 実験は、公開されているnuScenesデータセットから学習した神経レンダリングのクローズドループ環境で実施され、安全性と効率に関する指標に焦点を当てる。
- 著者らは、模倣学習ベースラインに比べて大幅な改善を報告しており、衝突率の低下と経路完了率の向上が含まれる。
- オープンソースの実装が提供されており、提案手法である擬似エキスパート正則化オフラインRLフレームワークを他者が再現し、その上で発展させられるようになっている。



