要旨:
効果的な環境モデリングは自動運転の基盤であり、知覚から計画に至るタスクを支える。
しかし現在のパラダイムはしばしば自車の運動が観察へ及ぼすフィードバックを十分に考慮しておらず、それが運転プロセスの理解を不完全にし、結果として計画能力を制限してしまう。
この問題に対処するため、私たちは新しい自車視点とシーンの相互作用モデリングパラダイムを導入する。
人間の認識に触発され、このパラダイムは自車視点を基準としたシーンフローとして自車視点とシーンの相互作用を表現する。
この概念化は、特徴学習の枠内で自車運動のフィードバックをモデル化することを可能にし、シナリオシミュレーションに頼るのではなく、既存のログリプレイデータセットを有効活用する。
私たちは特に FlowAD を提案する。自動運転のための一般的なフローに基づくフレームワークである。
その中で、エゴ導向のシーン分割は、まずシーンフローを定量化する基本的なフロー単位を構築する。
自車の前方方向とステアリング速度は分割を直接形成し、それが自車モーションを反映する。
次に、フロー単位に基づいて、空間的変位と時間的変動の両方を含むシーンフローのダイナミクスをモデル化するために、空間フローと時間フローの予測を行う。
最終的なタスク指向の強化は、学習された時空間フローのダイナミクスを活用して、オブジェクトレベルおよび領域レベルの戦略を通じて多様なタスクに利益をもたらす。
さらに、シーン理解能力を評価する新しい指標「Frames before Correct Planning(FCP)」を提案する。
オープンループとクローズドループの評価の両方における実験は、知覚、エンドツーエンドの計画、VLM解析において FlowAD の汎用性と有効性を示している。
特に、FlowAD は SparseDrive に対して衝突率を 19% 減少させ、nuScenes で FCP を 1.39 フレーム(60%)改善し、Bench2Drive で印象的なドライビングスコア 51.77 を達成して優位性を証明する。
コード、モデル、設定はここで公開される予定です。
FlowAD: 自車-シーン対話型モデリングによる自動運転
arXiv cs.CV / 2026/3/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- FlowADは、学習過程における自車運動のフィードバックを考慮するため、自車を基準としたシーンフローとして自車-シーンの相互作用を表現する自車-シーン対話モデリングのパラダイムを提案します。
- 本フレームワークは、自車の前方方向とステアリング速度によって形作られる自車誘導のシーン分割を通じて基本的なフローユニットを構築し、空間的および時間的フローを予測してシーンフローのダイナミクスをモデル化します。
- 学習した時空間的フローのダイナミクスを活用することで、知覚、エンドツーエンド計画、視覚言語モデル分析などのタスク認識的強化を実現します。
- nuScenesとBench2Driveの実験により、FlowADはSparseDriveに対して衝突率を19%低減し、nuScenesでFCPを1.39フレーム(60%)向上させ、Bench2Driveでドライビングスコアを51.77とする成果を示しました。
- 本研究では、コード、モデル、設定が公開される予定であると記し、将来的な再現性と利用の可能性を示唆しています。