CasLayout:暗黙の関係モデリングを用いたカスケード型3Dレイアウト拡散による屋内シーン合成
arXiv cs.CV / 2026/5/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- CasLayoutは、データ不足の課題を抱えつつ、建築全体の制約と局所的な意味整合性を同時に満たすためのカスケード型3D屋内シーン合成拡散フレームワークです。
- 提案手法は生成を4つの条件付きサブステージ(家具の数量・カテゴリ、物体のサイズ/特徴埋め込み、潜在空間での空間関係、OBB〈指向性バウンディングボックス〉)に分解し、完全結合の関係グラフで起きやすい冗長な生成エラーを抑えます。
- 壁・ドア・窓などの建築要素を条件制約として明示的にモデル化することで、複雑な間取りに対して物理的な妥当性を維持します。
- 関係グラフの高エントロピー問題に対処するため、人の空間記述に合わせたスパースな関係グラフを用い、双方向VAEでコンパクトな潜在空間に符号化して、制御性を高めます。
- 論文の実験では、忠実度と多様性で最先端の性能を示し、さらに機能的な配置の制御性も向上することが報告されており、LLM/VLMの柔軟な統合により画像からシーン生成のようなゼロショットにも対応します。


