MVAdapt:エンドツーエンド自動運転のためのゼロショット・マルチビークル適応

arXiv cs.AI / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • E2E 自動運転モデルは評価時の固定車両に強く依存し、車両サイズ・質量・駆動系の違いによって性能が落ちる「vehicle-domain gap」が問題になると指摘しています。
  • MVAdapt は TransFuser++ のシーンエンコーダを凍結し、車両物理特性を取り込む軽量な physics encoder と cross-attention でシーン特徴を車両特性に条件付けしてウェイポイントをデコードする適応フレームワークです。
  • CARLA Leaderboard 1.0 で、単純な転移や multi-embodiment のベースラインよりも in-distribution と未見車両の両方で改善し、複数の車両での強いゼロショット転移と、厳しい物理外れ値に対する少データの few-shot キャリブレーションの両方を示しています。
  • 物理に明示的に条件付けることが、自動運転 E2E モデルの転移性向上に有効だという結論で、コードも公開されています。

要旨: エンドツーエンド(E2E)の自律走行モデルは、運転方策が車両ダイナミクスに暗黙的に結び付いているにもかかわらず、通常は固定の自車両(ego-vehicle)で学習・評価されます。しかし、こうしたモデルをサイズ、質量、または駆動系の特性が異なる車両に搭載すると、その性能が大きく劣化する可能性があります。私たちはこの問題を「車両ドメインギャップ」と呼びます。これに対処するために、複数車両のE2E走行のための物理条件付き適応フレームワークであるMVAdaptを提案します。MVAdaptは、凍結したTransFuser++のシーンエンコーダと、軽量な物理エンコーダ、そしてクロスアテンションモジュールを組み合わせます。クロスアテンションモジュールは、ウェイポイント復号の前に、車両特性に基づいてシーン特徴を条件付けます。CARLA Leaderboard 1.0のベンチマークでは、MVAdaptは、単純な転移および多種身体化(multi-embodiment)適応のベースラインの両方に対して、分布内および未観測の車両の両方で改善を示します。さらに、補完的な2つの振る舞いも示します。多くの未観測車両に対する強力なゼロショット転移、ならびに、深刻な物理的外れ値に対するデータ効率の高い少数ショット・キャリブレーションです。これらの結果は、E2Eの走行方策を車両の物理に明示的に条件付けることが、より転移可能な自律走行モデルに向けた有効な一歩であることを示唆しています。すべてのコードは https://github.com/hae-sung-oh/MVAdapt で公開されています