デザイン・コンポジティングに向けて
arXiv cs.CV / 2026/4/17
📰 ニュースTools & Practical UsageModels & Research
要点
- この論文は、グラフィックデザイン生成の多くが、提示された画像やテキスト、ロゴなどの入力要素はすでにスタイル的に調和しているという暗黙の前提に依存しており、異なる出所から集めた素材では破綻しやすいと指摘しています。
- その上で、レイアウト予測とタイポグラフィ(文章生成)との間に組み込める、学習不要のアイデンティティ保持型画像コンポジタとしてGISTを提案します。
- GISTは、既存のcomponents-to-designパイプラインやデザイン改善パイプラインに対して、変更なしでそのまま差し込めることを狙い、入力要素を単に保持するのではなく、スタイル付けして合成することで調和を高めます。
- GISTをLaDeCoとDesign-o-meterという性質の大きく異なる2つの既存手法に統合した実験では、LLaVA-OVとGPT-4Vによる観点別評価や二者択一の好み評価により、単純な貼り付けよりも視覚的な調和と美的品質が有意に向上したことが示されています。



