広告

ProDiG:空中から地上への再構成のための進行的な拡散ガイド付きガウシアン・スプラッティング

arXiv cs.CV / 2026/4/3

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • ProDiGは、空撮(aerial)画像のみから地上(ground-level)の視点と整合的な3Dサイトモデルを生成する課題に対し、広い視点ギャップでも幾何学的に破綻しにくい進行的な復元手法を提案しています。
  • 従来の“後処理でのレンダリング改良”や“複数高度の地上正解”に依存せず、ProDiGは中間高度の表現を合成しながら段階的にGaussian表現を拡散モデルで洗練します。
  • 幾何構造(エピポラ構造)を参照ビューの拡散推論へ注入するgeometry-aware causal attentionモジュールと、カメラ距離に応じてGaussianのスケール/不透明度を動的調整するdistance-adaptiveモジュールにより、広い距離変化でも安定した再構成を実現します。
  • 合成データと実データの実験で、見た目の自然さ、3D幾何の整合性、極端な視点変化への頑健性の面で既存手法を大きく上回ると報告されています。

広告