StreetForward: フィードフォワード型因果注意機構で動的な街路を知覚する

arXiv cs.CV / 2026/3/23

📰 ニュースModels & Research

要点

  • StreetForward は、自動運転における動的な街路の再構成を可能にする、ポーズフリー・トラッカー不要のフィードフォワードフレームワークを導入し、シーンごとの最適化を要せずに迅速なシーン再構成を実現します。
  • Visual Geometry Grounded Transformer に、画像シーケンスから動き情報を抽出し、動きに敏感な潜在表現を生成する時間的マスク注意モジュールを追加します。
  • 静的な内容と動的インスタンスは、3D ガウシアン・スプラッティングを用いて表現され、時空的一貫性を備えたフレーム間レンダリングを通じて共同最適化され、ピクセル単位の速度推定と新しい姿勢・時間での高忠実度の新規ビュー合成を可能にします。
  • Waymo Open Dataset 上で訓練された StreetForward は、新規ビュー合成と深度推定において既存手法と比較して優れた性能を示し、CARLA や他のデータセットでゼロショット一般化を示します。