ボクセルを超えた3D編集:3Dマスクと自己構築データから学ぶ

arXiv cs.CV / 2026/4/16

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、プロンプト駆動の編集においてセマンティクスの一貫性を保ちながら、ローカル不変性を維持して未編集領域が元のアセットと一致するようにするという、重要な3D編集の課題に取り組む。
  • マルチビューのパイプラインにおける射影損失に関する既存手法、およびボクセルベースの制約が編集可能な領域や編集の大きさをどのように制限してしまうか、を批判的に検討する。
  • データセット不足を克服するため、著者らは Beyond Voxel 3D Editing(BVE)フレームワークと、自己構築による大規模な3D編集データセットを提案する。
  • BVEは、軽量で学習可能なモジュールによってテキストのセマンティクスを効率よく注入することで、コストのかかる基盤モデル全体の再学習を回避しつつ、画像から3Dへの生成基盤モデルを拡張する。
  • さらに、このフレームワークは注釈不要の3Dマスキング戦略を導入し、編集中に変化させない領域を保護することで、実験におけるテキストとの整合性に加えて忠実性を向上させる。