BEVPredFormer:自動運転におけるBEVインスタンス予測のための空間—時間注意
arXiv cs.CV / 2026/4/6
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自動運転のために、現在および将来フレームにまたがって鳥瞰図(BEV)セグメンテーションとモーション推定を同時に行う、カメラのみのアーキテクチャであるBEVPredFormerを提案する。
- 注目ベースの時間処理による注意機構を用いて、高密度な空間—時間情報を効率的にモデル化するという課題に取り組む。具体的には、リカレントフリー設計、ゲート付きトランスフォーマ層、分割された空間—時間注意メカニズムを採用する。
- 本モデルは、カメラ情報に対する注意ベースの3D投影と、時間表現を強化する差分ガイド付き特徴抽出モジュールを用いる。
- nuScenesデータセットでの実験により、BEVPredFormerは既存の最先端手法と同等、またはそれ以上の性能を示すことが確認されており、アブレーション研究により各アーキテクチャ構成要素の効果が検証されている。




