SDesc3D:短い説明文からレイアウトを考慮した3D屋内シーン生成へ

arXiv cs.CV / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、詳細なレイアウト指定を必要とせずに、短いテキスト記述から物理的に妥当な3D屋内シーンを生成するための枠組みSDesc3Dを提案する。
  • 明示的な物体間関係の手がかりが欠ける場合に空間構成をより適切に推定するため、多視点の構造プライヤ(事前知識)を導入し、従来のセマンティック圧縮における制約に対処する。
  • 本手法は機能に応じたレイアウトのグラウンディングを追加し、領域ごとの機能的な示唆を暗黙の空間アンカーとして用い、階層的なレイアウト推論を行うことで妥当性を高める。
  • 反映(reflection)—修正(rectification)を反復的に行う仕組みにより、自己修正を通じて構造的な妥当性を段階的に洗練する。
  • 実験により、SDesc3Dは既存の短文テキスト条件付き3D屋内シーン生成手法よりも性能が高いことが示されており、コードは公開予定である。