UniQueR: 統一的なクエリベース・フィードフォワードによる3D再構成

arXiv cs.CV / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • UniQueRは、未整列(未ポーズ)の画像から効率的かつ高精度に3D再構成を行うための統一的なクエリベースのフィードフォワードフレームワークを提案する。ここでは再構成を、密なピクセルごとの予測ではなく、疎な3Dクエリ推論として扱う。
  • 本手法は、明示的な幾何学的クエリとして機能するコンパクトな3Dアンカーポイント集合を学習し、単一のフォワードパスで遮蔽領域におけるシーングラフの推定を可能にする。
  • UniQueRは、空間および外観の事前知識をフレームごとのカメラ空間ではなくグローバルな3D空間に符号化し、微分可能レンダリングのために3Dガウスを生成する。
  • 分離(デカップル)されたクロスアテンション設計と、複数視点の特徴にまたがる統一的なクエリ相互作用により、メモリおよび計算コストを削減しつつ、幾何学的な表現力を向上させる。
  • Mip-NeRF 360およびVR-NeRFでの実験では、密な代替手法と比べて原始(プリミティブ)の数が1桁少ないにもかかわらず、最先端のレンダリング品質と幾何学的精度が報告されている。