ArtifactWorld: ビデオ生成モデルによる3Dガウススプラッティングのアーティファクト復元のスケーリング

arXiv cs.CV / 2026/4/15

📰 ニュースSignals & Early TrendsModels & Research

要点

  • ArtifactWorldは、時間的整合性、空間的制約、限られた学習データに対処することで、疎視点条件下で劣化した3Dガウススプラッティング(3DGS)結果を復元するための研究フレームワークである。
  • 本研究では、3DGSアーティファクトのきめ細かな分類体系を導入し、実世界におけるアーティファクト分布に対する頑健性と汎化性能を高めるため、大規模な学習セットとして対応するビデオクリップ107.5Kペアを構築する。
  • 3DGS復元を、ビデオ拡散バックボーンと同型(isomorphic)予測器によって生成されるアーティファクト・ヒートマップの統合により実現し、構造的欠陥の位置特定を行う。
  • その後、Artifact-Aware Triplet Fusion(アーティファクト対応トリプレット融合)機構が、ネイティブの自己注意(self-attention)内で強度指向の時空間的修復を導き、多視点間の不整合や幾何学的な幻覚を低減する。
  • 実験により、疎な新規視点合成およびより頑健な3D再構成において最先端の性能が報告されており、コードとデータセットの公開計画もある。

概要: 3Dガウススプラッティング(3DGS)は高忠実度のリアルタイムレンダリングを実現しますが、疎ビュー条件下では幾何学的およびフォトメトリックな劣化が生じます。現在の生成的復元アプローチは、多くの場合、十分な時間的コヒーレンスの欠如、明示的な空間制約の不足、大規模な学習データの不足によって制約され、その結果として、複数ビュー間の不整合、誤った幾何学的ハルシネーション、そして多様な実世界のアーティファクト分布への汎化性能の限界が生じます。本論文では、体系的なデータ拡張と均質なデュアルモデルのパラダイムにより、3DGSのアーティファクト修復を解決するフレームワーク「ArtifactWorld」を提案します。データのボトルネックに対処するために、3DGSアーティファクトの微細な現象論的分類法を確立し、モデルの頑健性を高めるために、多様なペア動画クリップ107.5K件からなる包括的な学習セットを構築します。アーキテクチャ的には、動画拡散バックボーン内で復元プロセスを統合し、同型(isomorphic)な予測器を用いてアーティファクトヒートマップにより構造上の欠陥を局所化します。このヒートマップは、Artifact-Aware Triplet Fusion(アーティファクトを考慮したトリプレット融合)メカニズムによって復元を導き、ネイティブな自己注意内で強度に導かれた精密なスパティオ・テンポラル修復を可能にします。大規模な実験により、ArtifactWorldが疎な新規ビュー合成および頑健な3D再構成において最先端の性能を達成することを示します。コードとデータセットは公開予定です。