自動運転のための時間的にデカップルした拡散計画法

arXiv cs.RO / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、都市部の動的環境における自動運転向けモーション計画において、既存の拡散モデルが軌道を「単一の存在」として扱いがちであり、近未来と遠未来で異なる時間依存関係を捉えられていない点を指摘しています。
提案手法TDDMは「noise-as-mask（ノイズをマスクとして扱う）」という発想により軌道を時間的セグメントに分割し、セグメントごとに異なるノイズ水準を与えて再構成させることで、近未来は瞬間的ダイナミクス、遠未来はナビゲーション目標という異質な制約を自然に学習・分離します。
専用アーキテクチャとして、セグメント固有のタイムステップを注入するTemporally Decoupled Adaptive Layer Normalization（TD-AdaLN）を導入し、さらに推論ではAsymmetric Temporal Classifier-Free Guidanceにより、遠未来の弱いノイズ事前を即時の経路生成へと誘導します。
nuPlanベンチマークでの評価の結果、TDDMは既存のSOTAに並ぶ、または上回る性能を示し、とくにTest14-hardサブセットの難所で優れた性能を示したと報告しています。

要旨: 動的な都市環境におけるモーションプランニングでは、即時の安全性と長期目標の両立が求められます。拡散モデルは多峰性の意思決定を効果的に捉えますが、既存の手法では軌道を単一の実体として扱うため、近い将来の計画が瞬間的なダイナミクスに制約され、遠い将来の計画がナビゲーション目標に制約されるような、異種の時間的依存関係を見落としています。これに対処するために、我々はTemporally Decoupled Diffusion Model（TDDM）を提案します。これは、ノイズをマスクとみなすパラダイムによって軌道生成を再定式化するものです。軌道を独立したノイズレベルを持つセグメントに分割することで、暗黙的に高いノイズを情報の空白として、低いノイズを文脈上の手掛かりとして扱います。これにより、より保存された時間文脈との内部相関を活用して、損なわれた近未来の状態を再構成することがモデルに強制されます。アーキテクチャとしては、セグメント固有のタイムステップを注入するTemporally Decoupled Adaptive Layer Normalization（TD-AdaLN）を導入します。推論時には、非対称のTemporal Classifier-Free Guidanceを用い、弱くノイズ化された遠未来の事前情報を利用して、即時の経路生成を導きます。nuPlanベンチマークでの評価では、TDDMは最先端のベースラインに匹敵するかそれを上回る性能を示し、とりわけ難しいTest14-hardサブセットで顕著な優れた成績を収めています。