Pano360: 幾何学的一貫性を備えたパノラマ視覚へのアプローチ
arXiv cs.CV / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 既存のパノラマステッチング手法は対となる特徴対応に依存しており、複数のビュー間で幾何学的整合性を確保することが難しく、弱いテクスチャや大きなパララックスを伴う難易度の高いシーンで歪みを生じさせる。
- 本論文は、3Dマルチビュー対応を活用し、カメラ姿勢を意識したトランスフォーマー型アーキテクチャを用いて、全視点に跨るグローバル3D整列を導くための画像ワーピングを可能にする。
- シーム計算のためのマルチフィーチャ結合最適化戦略を導入し、手法の訓練・評価用の大規模実世界データセットを構築した。
- 実験により、既存手法に対して整列精度と知覚品質が大幅に改善され、VR/ARや広基線のパノラマ応用に有望な恩恵が示される。
本論の要旨は、従来のパノラマステッチング手法は主にペアワイズ特徴対応に大きく依存しており、複数ビュー間での幾何学的一貫性を活用できず、特にテクスチャが乏しい、視差が大きい、繰り返しパターンを含む難しいシーンで歪みや不整合が生じる。マルチビュー幾何学的対応は3D空間で直接構築できるため、精度が高くグローバルに一貫させることが可能である。そこで、我々は2Dの整列タスクを3Dフォトグラメトリック空間へ拡張する。3D認識を実現する新規のトランスフォーマー型アーキテクチャを採用し、全視点を横断するグローバル情報を統合する。カメラ姿勢を直接利用して3D空間でのグローバル整列を導く画像ワーピングを実現し、シーム計算のためのマルチフィーチャ結合最適化戦略を用いる。さらに、評価ベンチマークを設定しネットワークを訓練するため、実世界シーンの大規模データセットを構築した。広範な実験により、提案手法は整列精度と知覚品質の点で既存の代替手法を大幅に上回ることが示された。




