MISTY:Mixerベースのシングルステップ・ドリフティングによる高スループットなモーションプランニング

arXiv cs.RO / 2026/4/24

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • MISTYは、自動運転向けの新しいシングルステップかつ高スループットな生成型モーションプランナーであり、拡散ベースのプランナーで問題となる反復的な推論(ニューラル評価)による高レイテンシを回避します。
  • 本手法は、環境コンテキストを捉えるベクトル化Sub-Graphエンコーダ、専門家軌跡を32次元の潜在マニフォールドに圧縮するVAE、そして注意機構の二次計算量を排除するMLP-Mixerデコーダを組み合わせています。
  • MISTYは潜在空間でのドリフティング損失を導入し、複雑な分布の進化の大部分を学習フェーズに移すことで、推論の高速化と汎化性能の向上を両立します。
  • 潜在空間上で明示的な引力・斥力(フォース)を設計することで、能動的追い越しのような先回りの操縦を生成でき、これは元の専門家デモにほとんど見られないとされています。
  • nuPlanベンチマークのTest14-hardで、非リアクティブ80.32、リアクティブ82.21という形でクローズドループの最先端性能を示し、99FPS超・エンドツーエンド10.1msで動作するため、反復拡散プランナーに対し約1桁の高速化を実現しています。

概要: マルチモーダルな軌道生成は安全な自動運転に不可欠である一方、既存の拡散ベースのプランナーは反復的なニューラル関数評価による高い推論レイテンシに悩まされている。本論文では、MISTY(Mixer-based Inference for Single-step Trajectory-drifting Yield)を提案する。これは、高スループットな生成型モーションプランナーであり、純粋な単一ステップ推論のみで最先端のクローズドループ性能を達成する。MISTYは、環境コンテキストを捉えるベクトル化されたサブグラフエンコーダ、専門家軌道をコンパクトな32次元の潜在マニフォールドに構造化する変分オートエンコーダ、そして二次的な注意の計算複雑性を排除する超軽量なMLP-Mixerデコーダを統合する。重要な点として、複雑な分布の進化をまるごと訓練フェーズに移す潜在空間ドリフト損失を導入する。明示的に引力と斥力を定式化することで、この仕組みにより、能動的追い越しのような新規で主導的な操舵(マヌーバ)を合成できるようになり、そのようなものは生の専門家デモンストレーションにはほとんど存在しない。nuPlanベンチマークでの大規模な評価により、MISTYが難易度の高いTest14-hard分割において最先端の結果を達成することが示されている。非反応設定および反応設定それぞれで、総合スコアは80.32と82.21である。MISTYはエンドツーエンドのレイテンシ10.1 msで99 FPS超で動作し、反復的な拡散プランナーに比べてオーダー桁の速度向上を提供しつつ、生成の頑健性も大きく高い。