GHOST:観測された構造・運動(Structure-from-Motion)軌跡から得られる地面投影仮説
arXiv cs.RO / 2026/3/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、「GHOST」という、大規模化可能な自己教師あり手法を提案し、ダッシュカム由来の自車運動(ego-motion)を暗黙の教師信号として用いて、単眼画像から車両の実現可能な軌跡を分割する。
- 単眼の構造・運動(モノキュラーSfM)によってカメラ運動を復元し、軌跡を地面平面へ投影して、手作業による注釈なしで通過領域の空間マスクを作成した後、自動生成ラベルに基づいて深層のセグメンテーションネットワークを学習させる。
- 推論時には、単一のRGB画像から運動条件付きの経路提案をネットワークが予測し、道路や車線標示への明示的な依存を避けつつ、多様なインターネットデータからシーンのレイアウト、車線のトポロジ、交差点構造を学習する。
- NuScenesでの実験により、信頼性の高い軌跡予測が示されており、軽微なファインチューニングで電動スクータープラットフォームへ転用可能である。
- 著者らは、大規模な自車運動の蒸留により、実演された軌跡分割を超えて、より一般的な「軌跡仮説推定(trajectory hypothesis estimation)」が可能になると主張する。