要旨: グローバルなナビゲーション情報とローカルなシーン理解は、自動運転システムにおける2つの重要な構成要素です。しかし、私たちの実験結果によれば、多くのエンドツーエンド自動運転システムはローカルなシーン理解に過度に依存する一方で、グローバルなナビゲーション情報を活用できない傾向があります。これらのシステムは、計画能力とナビゲーション入力の間に弱い相関しか示さず、複雑なシナリオでのナビゲーション追従の実行に苦戦します。この制約を克服するために、実世界のナビゲーションパターンに基づいてグローバルなナビゲーション情報を効率的に表現する枠組み「Sequential Navigation Guidance(SNG)」を提案します。SNGは、長期的な軌道を制約するためのナビゲーション経路と、リアルタイムの意思決定ロジックのためのターンバイターン(TBT)情報の両方を含みます。さらに、SNGに基づく視覚質問応答(VQA)データセットである「SNG-QA」を構築し、グローバルとローカルの計画を整合させます。加えて、ローカル計画とグローバル計画を融合する効率的なモデル「SNG-VLA」も導入します。SNG-VLAは、知覚タスクからの補助損失関数を必要とせずに、正確なナビゲーション情報のモデリングによって最先端の性能を達成します。プロジェクトページ: SNG-VLA
エンドツーエンド自動運転におけるナビゲーション理解の驚くべき有効性を明らかにする
arXiv cs.RO / 2026/4/15
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、多くのエンドツーエンド自動運転システムがグローバルなナビゲーション情報を十分に活用せず、局所的なシーン理解に過度に依存しているため、計画性能とナビゲーション入力の間の結びつきが弱くなっていると主張する。
- 実世界のナビゲーションパターンを用いてグローバルなナビゲーションを表現する Sequential Navigation Guidance(SNG)フレームワークを提案し、長期の軌道のための経路制約と、リアルタイムの判断のためのターンバイターンの手がかりを組み合わせる。
- 著者らは、SNG をベースに構築した VQA データセットである SNG-QA を導入し、グローバルなナビゲーションの手がかりと局所的な計画との整合性をより高める。
- さらに、ナビゲーションモデリングによって局所計画とグローバル計画を統合する SNG-VLA モデルを提示し、副次的な知覚損失関数に依存せずに、最先端の性能を報告する。




