テクスチャ構造を考慮した3Dガウススプラッティングの高速収束化:密度増大(デンシフィケーション)手法

arXiv cs.CV / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 3Dガウススプラッティングの標準的な適応的デンシフィケーションでは、幾何学的な誤配置と周波数エイリアシングを区別できず、過度なぼかしや非効率な過密化につながりがちです。
  • 本論文では、ガウスの投影後の画面上の広がりと、表現したい局所テクスチャ構造を明示的に比較して、分割すべきかを判断する「構造を考慮したデンシフィケーション」枠組みを提案します。
  • さらに、構造テンソルとラプラシアンスケールスペース解析を組み合わせたマルチスケール周波数解析により、各ピクセルの支配的周波数を推定し、その結果としてガウスごと・軸ごとの「周波数違反指標」(η)を定義します。
  • 等方的な分割(例:形状を一様にして2つに分ける)ではなく、ηが高い軸に応じて異方的に分割し、加えて複数視点でη観測を集約する多視点整合性基準も導入します。
  • より早く、かつ適切にデンシフィケーションを行うことで、ベースライン手法の長い反復的デンシフィケーション工程を回避でき、収束の高速化と、特に高周波領域での再構成品質向上を同時に達成します。

アブストラクト: 3D Gaussian Splatting は、リアルタイムな新規視点合成のための強力なシーン表現として登場してきました。しかし、その標準的な適応密度制御はスクリーンスペース上の位置勾配に依存しており、幾何学的な配置の誤りと周波数エイリアシングを区別できないため、しばしば高周波テクスチャが過度にぼけるか、あるいは非効率な過密化のどちらかを招きます。私たちは構造を考慮した densification(密度増強)の枠組みを提案します。重要な洞察は、ガウシアンを分割するかどうかの判断を、そのガウシアンが表現しようとするテクスチャの局所的な構造と、投影後のスクリーンスペース上の広がりとの明示的な比較によって駆動すべきだ、という点です。私たちは、構造テンソルとラプラシアンのスケール空間解析を組み合わせたマルチスケールの周波数解析を導入し、各ピクセルで支配的な周波数を推定します。これにより、さまざまなテクスチャスケールに対して頑健な教師信号を可能にします。この解析に基づいて、各ガウシアン、各軸ごとの周波数違反の指標である \eta を定義します。これは、あるプリミティブが局所的なテクスチャ詳細を十分に解像できていない可能性があるときに値が示されます。等方的な分割を行う手法(たとえば、各ガウシアンを一様な形状で2つの小さなガウシアンに分割するような方法)とは異なり、私たちの手法は異方的な分割を行います。\eta が高い各軸について、局所の周波数内容をより適切に解像するための split factor を計算します。さらに、複数の視点にわたって観測された \eta を集約する多視点の整合性基準も導入します。密度増強をより早く、より高速に実行することで、ベースライン手法が必要とする長い反復的な densification フェーズをスキップし、大幅に速い収束を達成します。標準ベンチマークでの実験により、私たちの手法が再構成品質においても優れており、とりわけ高周波領域で顕著であることが示されます。