生成的観点からの空間インテリジェンスの探究
arXiv cs.CV / 2026/4/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、現代の生成型/統一型マルチモーダルモデルが、画像生成中に3Dの空間制約を尊重し操作できる「生成的空間インテリジェンス(GSI)」を持つかを検証しています。
- GSIを測定するために、空間に根ざした画像編集を通じてGSIを評価する初のベンチマーク「GSI-Bench」を提案しています。
- GSI-Benchは、実世界データセット(GSI-Real)と合成ベンチマーク(GSI-Syn)の2つの補完的要素で構成されます。
- GSI-Realは3Dプライオリ誘導の生成とフィルタリングのパイプラインで作られ、GSI-Synは制御可能な空間操作と自動ラベリングを備えています。
- 実験の結果、GSI-Synで統一マルチモーダルモデルを微調整すると合成・実データの両方で大きな改善が得られ、さらに下流の空間理解も向上することから、生成的学習が空間推論を強化しうる初の明確な証拠が示されています。




