Abstract
拡散モデルは2Dのアウトペインティングに優れていますが、未調整(未ポーズ)の視点画像から360^のパノラマ補完へ拡張するのは、透視投影と球面パノラマの間に幾何学的および位相的な不一致があるため、困難です。本論文では、観測される透視画像と球面パノラマを明示的に橋渡しする、原理に基づく枠組みであるGimbal360を提案します。両領域の間の一貫した中間表現を提供しつつ、射影幾何を正則化するCanonical Viewing Space(規準視の空間)を導入します。この空間に、実環境(in-the-wild)の入力を定着させるために、推論時にカメラパラメータを不要としながら特徴の向きを安定化するDifferentiable Auto-Levelingモジュールを提案します。
また、パノラマ生成は位相的な課題も引き起こします。標準的な生成アーキテクチャは、有界なユークリッド画像平面を前提としていますが、等距円筒図法(Equirectangular Projection; ERP)のパノラマは固有のS^1周期性を持ちます。そのため、ユークリッド的な操作は境界の連続性を損ないます。本論文では、この不一致に対処するために、潜在空間において位相同変性(topological equivariance)を強制し、途切れのない周期構造を保持します。本定式化を支えるために、重力に整列したパノラマ環境から成る、厳選された大規模データセットHorizon360を導入します。大規模な実験により、幾何学的・位相的な事前知識を明示的に標準化することで、Gimbal360が構造的に整合した360^シーン補完において最先端の性能を達成できることを示します。



