セマンティック・フォーム:空間と意味のシーン分解を統一する

arXiv cs.CV / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、「Semantic Foam」を提案し、Radiant Foam表現を拡張して、3Dガウシアン・スプラッティングのようなフォトリアルな再構成に対するセマンティックなシーン分解を行うことを目指す。
  • Semantic Foamは、体積Voronoiメッシュの空間構造と、セル単位で定義した明示的なセマンティック特徴フィールドを組み合わせ、空間的な正則化によってビュー間の整合性を高める。
  • Occlusion(遮蔽)や監督の不整合に起因するアーティファクトなど、ポイントベース表現でよく起こる課題や、セグメンテーション品質の低さに対処する。
  • 実験では、Gaussian GroupingやSAGAといった従来の最先端手法よりもオブジェクトレベルのセグメンテーション性能が向上したことを示す。

Abstract

3D Gaussian Splatting のような現代のシーン再構成手法は、実時間の速度でフォトリアルな新規視点合成を可能にします。しかし、これらの表現を従来の人手によって作られた3Dアセットと同様に対話的に扱うことは難しいため、インタラクティブなグラフィックスアプリケーションでの採用は依然として限られています。先行研究ではこれらのモデルに意味的な分解を強制しようと試みられてきましたが、セグメンテーションの品質やビュー間一貫性の面で、依然として大きな課題が残っています。これらの制約に対処するために、我々は Semantic Foam を提案します。これは、近年提案された Radiant Foam 表現を意味的分解タスクへ拡張したものです。我々の手法は、Radiant Foam の体積 Voronoi メッシュが持つ内在的な空間構造を活用し、さらにセル(セル単位)で定義された明示的な意味特徴フィールドを追加します。この設計により、直接的な空間正則化が可能となり、ビュー間の整合性が向上するとともに、ポイントベース表現において一般的な問題である、遮蔽や一貫しない教師信号によって生じるアーティファクトを軽減できます。実験結果は、我々の手法が Gaussian Grouping や SAGA のような最先端手法と比較して、オブジェクトレベルのセグメンテーション性能でより優れた結果を達成することを示しています。プロジェクトページ: http://semanticfoam.github.io/