MeanFuser:MeanFlowによる平均フローを用いた、エンドツーエンド自動運転のための高速なワンステップマルチモーダル軌道生成と適応的再構成

arXiv cs.RO / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 提案手法MeanFuserは、エンドツーエンド自動運転の軌道生成における効率と頑健性の両立を目指し、3つの設計(GMN・MeanFlow Identity・ARM)で課題を解決する。
  • 従来のアンカー語彙に依存していた離散的な表現の限界を、Gaussian Mixture Noise(GMN)による連続表現に置き換えることで緩和し、語彙サイズと性能のトレードオフを回避する。
  • MeanFlow Identityにより、軌道の分布間で「平均速度場」を学習して流れマッチングを行い、ODEソルバ由来の数値誤差を抑えつつ推論を大幅に高速化する。
  • 軽量なAdaptive Reconstruction Module(ARM)を導入し、生成された複数提案から適切なものを注意重みで暗黙に選ぶか、不適切な場合は新規軌道を再構成できる仕組みを与える。
  • NAVSIMのクローズドループベンチマークで、PDM Scoreの教師なしでも高性能を示し、さらに推論効率も高いことを報告している。

Abstract

生成モデルは軌道計画において大きな可能性を示している。近年の研究では、アンカー誘導型の生成モデルが、運転行動の不確実性のモデリングや全体的な性能の向上に有効であることが示されている。 しかし、これらの手法は離散的なアンカー語彙に依存しており、ロバスト性を確保するためには、テスト時に軌道分布を十分にカバーしている必要がある。その結果、語彙サイズとモデル性能の間に本質的なトレードオフが生じる。 この制約を克服するために、3つの主要な設計によって効率とロバスト性の両方を高める、エンドツーエンドの自動運転手法であるMeanFuserを提案する。 (1) 生成サンプリングを導くためにガウス混合ノイズ(GMN)を導入し、軌道空間の連続表現を可能にすることで、離散的なアンカー語彙への依存を排除する。 (2) 「MeanFlow Identity」をエンドツーエンド計画へ適用する。これは、バニラのフローマッチング手法で用いられる瞬間的な速度場ではなく、GMNと軌道分布の間の平均速度場をモデリングする。これにより、ODEソルバに起因する数値誤差を効果的に排除し、推論を大幅に高速化する。 (3) 軽量な適応再構成モジュール(ARM)を設計し、注意(attention)重みによって、すべてのサンプル提案から暗黙に選択するか、満足できるものがない場合には新しい軌道を再構成できるようにする。 NAVSIMクローズドループのベンチマークに関する実験により、MeanFuserはPDM Scoreの監督なしで卓越した性能を達成し、さらに推論効率も非常に高いことが示された。これは、エンドツーエンド自動運転に対する、堅牢で効率的な解決策を提供するものである。私たちのコードとモデルは https://github.com/wjl2244/MeanFuser で利用可能である。