非定型環境におけるスパースビュー3Dガウシアンスプラッティング

arXiv cs.CV / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、攪乱要素を含む非定型の実環境に向けた「Sparse-View 3D Gaussian Splatting in the Wild」を提案し、スパースビューからの3D合成を目指している。
  • 拡散モデルと一時(トランジェント)領域のマスク、参照画像を用いたreference-guided view refinementにより、3D表現の質を高め、レンダリング時のアーティファクトを軽減する。
  • ガウス場の疎な領域に対しては、擬似ビュー生成と疎性を考慮したガウシアン複製戦略を導入し、疎領域でのガウシアンを増強する。
  • 公開データセットでの実験では、既存手法に対して一貫した改善が示され、PSNR(+17.2%)、SSIM(+10.8%)、LPIPS(-4.0%)などの指標で成果が報告されている。
  • 労力の大きいデータ取得を要さずに、実環境で高品質な3D表現を実現することにつながるとしており、プロジェクトページも公開されている。

要旨: 本論文では、注意対象を惑わせる要素(ディストラクタ)を含む、制約のない現実世界のシナリオに対して3Dの新しい疎視点合成(sparse-view synthesis)フレームワークを提案する。既存手法が主に、過渡的な要素を含まない制約された画像の疎集合から新規視点合成を行うこと、または制約のない密な画像コレクションを活用して現実世界のシナリオにおける3D表現を強化することのいずれかに重点を置いているのに対し、提案手法は、制約のない疎な画像コレクションを効果的に扱うだけでなく、高品質な3Dレンダリング結果も示す。これを実現するために、過渡マスクと参照画像を用いた拡散モデルによる参照ガイド付き視点洗練(view refinement)を導入し、3D表現を強化するとともに、レンダリングされた視点におけるアーティファクトを低減する。さらに、ガウス場(Gaussian field)における疎な領域に対しては、疑似視点生成を行い、疎性を意識したガウス複製戦略により疎領域でのガウスを増幅する。公開されているデータセットに対する広範な実験により、我々の手法が既存手法を一貫して上回ることを示す(例: PSNR - 17.2%、SSIM - 10.8%、LPIPS - 4.0%)。また、高い忠実度の3Dレンダリング結果を提供する。この進歩により、労力の大きいデータ取得を要さずに、制約のない現実世界のシナリオを実現する道が開ける。プロジェクトページは
\href{https://robotic-vision-lab.github.io/SaveWildGS/}{こちら}
である。