PoseFM: Relative Camera Pose Estimation Through Flow Matching
arXiv cs.CV / 4/27/2026
📰 NewsIdeas & Deep AnalysisModels & Research
Key Points
- PoseFMは、単眼のフレーム間ビジュアルオドメトリ(VO)を「生成タスク」として捉え直し、Flow Matching(FM)でカメラ姿勢推定を行う新しい枠組みを提案します。
- 決定論的な回帰ではなく、カメラモーションを分布として扱い、連続時間のODEを用いてノイズから現実的な姿勢予測へ変換することで、不確実性を原理的に推定できるようにしています。
- TartanAir、KITTI、TUM-RGBDといった主要ベンチマークで評価し、軌跡推定誤差(ATE)で一部の軌跡において最良の結果を含むなど、既存の最先端フレーム間単眼VOと競争力のある性能を示したと報告されています。
- コードとモデルチェックポイントはGitHubで公開予定で、公開URLも提示されています。
Related Articles

Legal Insight Transformation: 7 Mistakes to Avoid When Adopting AI Tools
Dev.to

Legal Insight Transformation: Traditional vs. AI-Driven Research Compared
Dev.to

Legal Insight Transformation: A Beginner's Guide to Modern Research
Dev.to
I tested the same prompt across multiple AI models… the differences surprised me
Reddit r/artificial

The five loops between AI coding and AI engineering
Dev.to