AI Navigate

LICA: グラフィックデザイン研究のための階層化画像構成アノテーション

arXiv cs.CV / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • LICAは、1,550,244件の多層グラフィックデザイン構成と971,850件のユニークなテンプレートを含む大規模データセットと、レンダリング済みPNG、および要素ごとの階層データを公開します。
  • 設計は、型付きコンポーネント(テキスト、画像、ベクター、グループ)を備えた階層構造として表現され、ジオメトリ、タイポグラフィ、不透明度、表示/非表示などの詳細なメタデータが含まれます。
  • データセットには、部品ごとのキーフレームとモーションパラメータを備えた27,261のアニメーションレイアウトが含まれており、デザインタスクの時間的なモデリングを可能にします。
  • レイヤー対応のインペインティング、構造化レイアウト生成、統制されたデザイン編集、時間的に意識した生成モデリングといった、ピクセルではなくデザイン構造に焦点を当てる新しい研究方向を提案します。
  • 20のデザインカテゴリにわたるLICAは、実世界のデザインのカバー範囲を広げ、ピクセルデータだけでなく構造に基づくモデルの運用を支援します。

要旨: LICA(Layered Image Composition Annotations)を紹介します。これは、構造化された理解とグラフィックレイアウトの生成を進化させることを目的として設計された、1,550,244の多層グラフィックデザイン構成の大規模データセットです1。レンダリングされたPNG画像に加えて、LICAは各デザインを、テキスト、画像、ベクター、グループ要素を含む型付けされたコンポーネントの階層的構成として表現し、各要素には空間ジオメトリ、タイポグラフィ属性、不透明度、可視性などの豊富な要素メタデータが付随します。データセットは20のデザインカテゴリと971,850のユニークなテンプレートをカバーしており、実世界のデザイン構造を広くカバーしています。さらに、27,261のアニメーションレイアウトを通じて、現在のビジョン-言語モデルにとって新しく、ほとんど未開拓の課題としてグラフィックデザインビデオを紹介します。27,261のアニメーションレイアウトには、各コンポーネントのキーフレームとモーションパラメータが注釈として付与されています。規模を超えて、LICAはグラフィックデザインの新しい研究タスクのパラダイムを確立し、レイヤー対応のインペインティング、構造化レイアウト生成、制御されたデザイン編集、時系列を意識した生成モデリングといった問題への構造化された調査を可能にします。設計を、構成レイヤーと関係のシステムとして表現することにより、データセットはピクセルだけでなくデザイン構造そのものに直接作用するモデルの研究を支援します。