フォトリアルなクローズドループ環境におけるエンドツーエンド自動運転のための擬似エキスパート正則化オフライン強化学習

arXiv cs.RO / 2026/4/10

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、自動運転のためのカメラのみのエンドツーエンドオフラインRL手法を提案し、追加の探索を行わずに固定されたシミュレータのデータセットから学習することで、模倣学習の失敗モードを回避することを目指す。
分布外の行動に対する過大評価によって生じるオフラインRLの不安定性を低減するため、本手法はエキスパートログから導出した擬似の正解軌道を用いて学習を正則化する。
実験は、公開されているnuScenesデータセットから学習した神経レンダリングのクローズドループ環境で実施され、安全性と効率に関する指標に焦点を当てる。
著者らは、模倣学習ベースラインに比べて大幅な改善を報告しており、衝突率の低下と経路完了率の向上が含まれる。
オープンソースの実装が提供されており、提案手法である擬似エキスパート正則化オフラインRLフレームワークを他者が再現し、その上で発展させられるようになっている。

日経XTECH

Reddit r/artificial

ITmedia AI+

Dev.to

Dev.to