疎なクエリによる画像から3D生成の再考:効率性、容量、入力ビューのバイアス
arXiv cs.CV / 2026/4/16
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、密な3D表現を、学習された3Dアンカー・クエリのコンパクトな集合と学習された拡張オペレータで置き換える、新しい画像から3D生成フレームワーク「SparseGen」を提案する。
- SparseGenは、各アンカー・クエリを小さな局所的な3Dガウス・プリミティブの集合へと変換し、体積グリッド、トライプレーン、あるいはピクセル整列プリミティブ手法よりも高速な推論と低いメモリ使用を可能にする。
- 3Dの教師データなしで、整流フロー再構成目的により学習され、疎な条件付けからの汎化性能の向上を目指す。
- 著者らは、入力ビューのバイアスの低減と容量利用の改善を報告し、疎なクエリ機構が、特定の条件付けビューへの過学習を回避しつつ多視点の忠実度を維持するのに役立つと主張する。
- 本研究は、入力ビュー・バイアスと表現利用(representation utilization)を定量的に測る指標を提案し、疎な集合潜在の拡張が、効率的な3D生成モデリングに対する実用的な代替であることを裏付ける。

