閉ループ軌道予測のための目標指向型リアクティブ・シミュレーション

arXiv cs.RO / 2026/3/26

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、オープンループ設定で訓練された軌道予測モデルは、実際の閉ループ展開で共変量シフト(covariate shift)と誤差の累積(compounding errors)により性能が低下すると主張している。
  • モデルの振る舞いにより生成されるシミュレーション状態(自己誘発状態を含む)を用いて、シミュレーションを本質的にリアクティブにするための、トランスフォーマー型のシーンデコーダを備えたオンポリシーで目標指向の閉ループ学習パラダイムを提案する。
  • 提案手法は、モデルの挙動から生成したシミュレート状態を用いたものと、オープンループデータを混合することで、エゴ予測器が自身の実行誤差から回復できるように学習する。
  • 実験では、高い再計画頻度における衝突回避が大幅に改善したと報告されており、nuScenesでの相対衝突率低減は最大27.0%、高密度のDeepScenario交差点では79.5%となっている(オープンループのベースライン比)。
  • さらに、リアクティブ型と非リアクティブ型の周辺アジェントを組み合わせたハイブリッド・シミュレータにより、短期的なインタラクティビティと、より長期的な行動の安定性のバランスを取れることを示している。