エンドツーエンド自動運転におけるゼロショットの都市横断一般化: 自己教師付き表現と教師付き表現
arXiv cs.CV / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、エンドツーエンドの軌道計画におけるゼロショットの都市横断一般化を調査し、自己教師付き表現と教師付き表現を比較している。
- 自己教師付きバックボーン(I-JEPA、DINOv2、MAE)を計画フレームワークに組込み、厳密な地理的分割でnuScenesとNAVSIMを評価している。
- オープンループの結果は、ボストンからシンガポールへの転送時に教師付きバックボーンで大きな一般化ギャップが生じることを示している(L2変位比9.77倍、衝突比19.43倍)。これに対して自己教師付き事前学習はそれぞれ1.20倍、0.75倍へと低減する。
- クローズドループの結果は、単一の訓練都市全体で自己教師付き事前学習がPDMSを最大4%改善することを示し、都市横断の堅牢性が向上していることを示唆している。
- 著者らは、表現学習が都市横断の計画の堅牢性に強く影響すると結論づけ、ゼロショット地理転送をエンドツーエンド自動運転システムの標準的な評価テストとすべきだと主張している。
要旨:エンドツーエンドの自動運転モデルは通常、複数都市のデータセット上で、教師ありのImageNet事前学習済みバックボーンを用いて訓練されるが、未知の都市へ一般化する能力はほとんど検討されてこなかった。訓練データと評価データが地理的に混在する場合、モデルは都市固有の手がかりに暗黙的に依存する可能性があり、新しい場所へ一般化したときに生じる真のドメインシフトによる失敗モードを覆い隠してしまう。本研究では、エンドツーエンドの軌道計画におけるゼロショットの都市横断一般化を調査し、自己教師付き視覚表現が都市間の転移を改善するかを検証する。自己教師付きバックボーン(I-JEPA、DINOv2、MAE)を計画フレームワークに組み込み、総合的な研究を実施した。厳密な地理的分割の下でnuScenesをオープンループ設定で、NAVSIMをクローズドループ評価プロトコルで評価する。我々の実験は、従来の教師付きバックボーンに依存するモデルを異なる道路トポロジーと運転規範を持つ都市で転送すると、特に右側通行環境から左側通行環境へ転送する場合に、顕著な一般化ギャップが生じることを示している。自己教師付き表現学習はこのギャップを縮小する。オープンループ評価では、教師付きバックボーンはボストンからシンガポールへの転送時に著しい過大評価を示す(L2変位比9.77倍、衝突比19.43倍)、一方でドメイン特化の自己教師付き事前学習はそれぞれ1.20倍と0.75倍へと低減する。クローズドループ評価では、自己教師付き事前学習は、すべての単一都市訓練都市に対してPDMSを最大4パーセント改善する。これらの結果は、表現学習が都市横断の計画の堅牢性に強く影響することを示しており、ゼロショット地理転送をエンドツーエンド自動運転システムを評価するための必須テストとして確立するものである。