GaussianGrow:テキストによるガイダンス付き3Dポイントクラウドからのジオメトリを考慮したGaussianの生成拡張

arXiv cs.CV / 2026/4/8

📰 ニュースSignals & Early TrendsModels & Research

要点

  • GaussianGrowは、既存手法におけるジオメトリ・プライアが不足している点を克服することを目的として、3Dポイントクラウドから直接3Dガウシアン・スプラッティングのプリミティブを生成する新しい手法である。
  • 本アプローチは、マルチビューの拡散モデルを用いたテキスト誘導のGaussian成長スキームにより、整合的な外観を合成し、入力ポイントクラウドからの教師信号の質を向上させる。
  • 隣接するビューを統合する際のアーティファクトを低減するために、GaussianGrowは、複数ビュー間で重なり領域から選択したカメラ姿勢において新規ビュー生成を制約する。
  • 観測が難しい領域では、最大の未成長領域を見つけることでカメラ姿勢を反復的に検出し、事前学習済みの2D拡散モデルを用いたレンダリングビューのインペインティングによりそれらを補完する。
  • 合成および実際にスキャンされたポイントクラウドの両方に対して大規模な実験を行い、テキスト誘導によるGaussian生成を評価し、実運用のポイントクラウド条件下でも有効であることを示す。

要旨: 3Dガウススプラッティングは、レンダリング効率と品質において優れた性能を示してきましたが、3Dガウスの生成は、適切な幾何学的事前知識(priors)がない場合には依然として課題です。既存手法では、ガウスプリミティブを推論するための幾何学的参照として、点マップを予測することが検討されてきました。一方で、推定された幾何学が信頼できないと、生成結果が不十分になる可能性があります。本研究では、GaussianGrowという新しい手法を提案します。これは、容易に取得できる3D点群から、それらを「成長させる」ことを学習することで3Dガウスを生成し、ガウス生成において幾何学的な正確さを自然に強制します。具体的には、入力点群から一貫した外観を合成して教師信号とするために、多視点拡散モデルを活用する、テキスト誘導のガウス成長スキームを設計します。異なる近傍視点を融合することによって生じるアーティファクトを軽減するために、視点間の重なり領域で特定された、プリセット済みのカメラ姿勢ではない姿勢で生成される新規視点を制約します。観測が難しい領域を補完するために、点群中で最大の未成長領域を観測することでカメラ姿勢を反復的に検出し、事前学習済みの2D拡散モデルを用いてレンダリング済み視点をインペイントすることを提案します。このプロセスは、完全なガウスが生成されるまで続きます。合成および、さらには実際にスキャンした点群を用いたテキスト誘導ガウス生成に対して、GaussianGrowを徹底的に評価します。プロジェクトページ: https://weiqi-zhang.github.io/GaussianGrow

GaussianGrow:テキストによるガイダンス付き3Dポイントクラウドからのジオメトリを考慮したGaussianの生成拡張 | AI Navigate