エンドツーエンド自動運転におけるナビゲーション理解の驚くべき有効性を明らかにする

arXiv cs.RO / 2026/4/15

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、多くのエンドツーエンド自動運転システムがグローバルなナビゲーション情報を十分に活用せず、局所的なシーン理解に過度に依存しているため、計画性能とナビゲーション入力の間の結びつきが弱くなっていると主張する。
実世界のナビゲーションパターンを用いてグローバルなナビゲーションを表現する Sequential Navigation Guidance（SNG）フレームワークを提案し、長期の軌道のための経路制約と、リアルタイムの判断のためのターンバイターンの手がかりを組み合わせる。
著者らは、SNG をベースに構築した VQA データセットである SNG-QA を導入し、グローバルなナビゲーションの手がかりと局所的な計画との整合性をより高める。
さらに、ナビゲーションモデリングによって局所計画とグローバル計画を統合する SNG-VLA モデルを提示し、副次的な知覚損失関数に依存せずに、最先端の性能を報告する。

要旨: グローバルなナビゲーション情報とローカルなシーン理解は、自動運転システムにおける2つの重要な構成要素です。しかし、私たちの実験結果によれば、多くのエンドツーエンド自動運転システムはローカルなシーン理解に過度に依存する一方で、グローバルなナビゲーション情報を活用できない傾向があります。これらのシステムは、計画能力とナビゲーション入力の間に弱い相関しか示さず、複雑なシナリオでのナビゲーション追従の実行に苦戦します。この制約を克服するために、実世界のナビゲーションパターンに基づいてグローバルなナビゲーション情報を効率的に表現する枠組み「Sequential Navigation Guidance（SNG）」を提案します。SNGは、長期的な軌道を制約するためのナビゲーション経路と、リアルタイムの意思決定ロジックのためのターンバイターン（TBT）情報の両方を含みます。さらに、SNGに基づく視覚質問応答（VQA）データセットである「SNG-QA」を構築し、グローバルとローカルの計画を整合させます。加えて、ローカル計画とグローバル計画を融合する効率的なモデル「SNG-VLA」も導入します。SNG-VLAは、知覚タスクからの補助損失関数を必要とせずに、正確なナビゲーション情報のモデリングによって最先端の性能を達成します。プロジェクトページ: SNG-VLA

Black Hat Asia

AI Business

26年の世界半導体売上高、64％増の1.3兆ドル米ガートナー予測

日経XTECH

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵

日経XTECH

SBGの特許が2年連続1万件超公開、AIが変えた「発明」のつくり方

日経XTECH

新卒ビジネス職を1カ月で技術者へ転換、TOKIUM AI時代は皆「越境人材」

日経XTECH

エンドツーエンド自動運転におけるナビゲーション理解の驚くべき有効性を明らかにする

要点

関連記事

Black Hat Asia

26年の世界半導体売上高、64％増の1.3兆ドル米ガートナー予測

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵

SBGの特許が2年連続1万件超公開、AIが変えた「発明」のつくり方

新卒ビジネス職を1カ月で技術者へ転換、TOKIUM AI時代は皆「越境人材」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat Asia

26年の世界半導体売上高、64％増の1.3兆ドル 米ガートナー予測

ソフトバンクなど3社、フィジカルAIへの通信 ロボとMECの連係が鍵

SBGの特許が2年連続1万件超公開、AIが変えた「発明」のつくり方

新卒ビジネス職を1カ月で技術者へ転換、TOKIUM AI時代は皆「越境人材」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

26年の世界半導体売上高、64％増の1.3兆ドル米ガートナー予測

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵