AnchorSplat:3D幾何学的プリオリを用いたフィードフォワード3Dガウス・スプラッティング

arXiv cs.CV / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • AnchorSplatは、入力画像と表現の結びつきが生じるピクセル整列型のガウスではなく、アンカー整列型のガウスによって3D空間上にシーンを直接表現する、フィードフォワード型の3Dガウス・スプラッティングの枠組みを提案する。
  • この手法では、疎な点群、ボクセルグリッド、またはRGB-D点群などの3D幾何学的プリオリを取り入れることで、より幾何学を意識したレンダリング可能な3Dガウスを生成する。
  • アンカー整列型の表現は、必要なガウスプリミティブの数を削減し、計算効率を向上させつつ、再構成の忠実性を維持、または向上させることを目指す。
  • 追加されたGaussian Refiner(ガウス・リファイナー)は、重い反復処理を行わずに、少数のフォワードパスだけで中間ガウスを洗練し、表現をより適切に調整する。
  • ScanNet++ v2のNVSベンチマークにおける実験では、最先端の性能が報告されており、視点の一貫性がより良く、先行手法よりも大幅に少ないガウスプリミティブで達成している。

Abstract

近年のフィードフォワード型ガウス再構成モデルは、各2Dピクセルを3Dガウスへと写像するピクセル整合型の定式化を採用しており、ガウス表現が入力画像と密に結び付けられています。本論文では、シーンレベルの再構成のための新しいフィードフォワード3DGSフレームワークであるAnchorSplatを提案します。AnchorSplatは、シーンを3D空間に直接表現することで実現されます。AnchorSplatは、3D幾何学的事前知識(例:疎な点群、ボクセル、またはRGB-D点群)によって導かれるアンカー整合型ガウス表現を導入し、画像解像度や視点数に依存しない、より幾何学を意識したレンダリング可能な3Dガウスを実現します。この設計により、必要なガウス数が大幅に削減され、計算効率が向上すると同時に再構成の忠実度も高められます。アンカー整合型の設計に加えて、Gaussian Refinerを用いて、わずか数回のフォワードパスだけで中間ガウスyを調整します。ScanNet++ v2 NVSベンチマークでの実験により、SOTA性能が示されます。従来手法よりも視点整合性が高く、さらにガウスプリミティブ数も大幅に少ない状態で上回ります。