広告

SHARP:モーションフォーキャスティングにおける正確で頑健な予測のための短時間ウィンドウ・ストリーミング

arXiv cs.RO / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、観測長が不均一で変化しても軌道予測の精度を維持することを目的とした、ストリーミングベースのモーションフォーキャスティングフレームワークであるSHARPを提案する。
  • SHARPは、到来する観測ウィンドウを逐次的に処理し、推論ステップ全体でエージェントの潜在表現を更新するための、インスタンスに応じたコンテキスト・ストリーミング機構を用いる。
  • 観測ホライゾンの幅広い範囲にわたって予測精度の一貫性を保つことを意図した二重の学習目的を採用する。
  • Argoverse 2、nuScenes、Argoverse 1での実験により、単一エージェントのベンチマークを含む、変化するシーン条件下での頑健性の向上が示される。
  • Argoverse 2のマルチエージェント・ストリーミング推論において、SHARPは最先端の性能を報告しつつ、最小限のレイテンシを維持しており、実運用での導入可能性を高めている。

Abstract

動的な交通環境において、モーション予測モデルは将来の軌跡を継続的に正確に推定できなければなりません。ストリーミングベースの手法は有望な解決策ですが、近年の進展にもかかわらず、観測長が異なる状況にさらされると、その性能がしばしば低下します。これに対処するために、本稿では変化するシーンに明示的に焦点を当てた、新しいストリーミングベースのモーション予測フレームワークを提案します。提案手法は、到来する観測ウィンドウを段階的に処理し、推論ステップ間で潜在エージェント表現を維持・更新するための、インスタンスに応じた文脈ストリーミングを活用します。さらに、デュアルな学習目的により、多様な観測ホライズンにわたって一貫した予測精度を実現します。Argoverse 2、nuScenes、Argoverse 1 に関する大規模な実験により、変化するシーン条件下および単一エージェントのベンチマークでも、提案手法が堅牢であることが示されます。さらに当社のモデルは、Argoverse 2 のマルチエージェントベンチマークにおけるストリーミング推論で最先端の性能を達成しつつ、最小限のレイテンシを維持しており、実世界での導入に適していることを強調しています。

広告