信頼できる単眼深度監督:ガウススプラッティングのための信頼性の高い単眼深度スーパービジョン

arXiv cs.CV / 2026/4/8

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、単眼深度の事前知識を用いて3Dガウススプラッティング(GS)のレンダリングを改善する、信頼性の高い手法を提案する。スケールの曖昧さ、多視点間の不整合、単眼深度モデル由来の局所的な幾何誤差といった問題に対処する。
  • 学習フレームワークとして、スケールが曖昧でノイズを含む深度事前知識を幾何学的スーパービジョンに組み込み、弱く整合した深度変動から学習することを重視する。
  • 単眼深度の正則化を選択的に適用するために、解が不適切(ill-posed)な幾何を同定するアプローチを含める。これにより、深度の不正確さが十分に再構成できている3D領域へ広がることを制限する。
  • 複数のデータセットにわたる実験により、異なるGSのバリアントや異なる単眼深度バックボーンにおいて、幾何精度の一貫した向上とレンダリング品質の改善が報告されている。

要旨: 3Dガウススプラッティングにおいて正確な深度事前知識を用いることは、疎な学習データやテクスチャのない表面によって生じるアーティファクトを軽減するのに役立ちます。しかし、正確な深度マップを取得するには専用の取得システムが必要です。基盤となるモノキュラ深度推定モデルは、費用対効果の高い代替手段を提供しますが、スケールの曖昧さ、マルチビュー間の不整合、局所的な幾何の不正確さに悩まされます。これらは、単純に適用した場合にレンダリング性能を低下させ得ます。本論文は、モノキュラ深度事前知識をガウススプラッティング(GS)のレンダリング強化に確実に活用するという課題に取り組みます。そのために本研究では、スケールが曖昧でノイズを含む深度事前知識を幾何学的な監督に統合する学習フレームワークを提案します。弱く整合された深度の変化から学習することの重要性を示します。さらに、問題設定が不適切になり得る幾何を分離し、選択的なモノキュラ深度正則化を行う方法を導入します。これにより、深度の不正確さが、十分に再構成された3D構造へ伝播することを制限します。多様なデータセットにわたる大規模な実験の結果、幾何学的精度が一貫して向上し、より忠実な深度推定と、テストした異なるGSバリアントおよびモノキュラ深度バックボーン間での高いレンダリング品質が得られることを示します。

信頼できる単眼深度監督:ガウススプラッティングのための信頼性の高い単眼深度スーパービジョン | AI Navigate