投影ガイド付き構造対応と意味的連続性によるデュアルパスでのビュー整合3Dシーン編集
arXiv cs.CV / 2026/4/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、テキスト駆動の3Dシーン編集で重要な制約となっている「ビュー間の一貫性」を扱い、複数視点画像のレンダリング、2D編集、3D最適化の流れにおける破綻を主要ボトルネックとして示しています。
- 一貫した3D編集を、視点間の共同分布をモデル化する問題として捉え直し、編集プロセスに明示的に視点間の依存関係を組み込みます。
- デュアルパスの一貫性メカニズムとして、投影ガイドによる構造的ガイダンスと、パッチ単位の意味伝播を導入し、幾何学的な整合と意味的連続性の両方をビュー間で強化します。
- 編集中のシーンにおけるビュー間一貫性を学習するための信頼できる監督信号として、対となる多視点編集データセットを構築し、複雑なシーンでより正確で一貫したビューを実現できると実験で示しています。




