CPT:言語モデルによる制御可能で編集可能なデザインバリエーション

arXiv cs.LG / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この論文は、言語モデルを用いてデザインテンプレートの「編集可能な」バリエーションを生成するCreative Pre-trained Transformer(CPT)を提案している。
  • デザインの内容とスタイルを機械学習向けに扱うための新しい表現形式Creative Markup Language(CML)を導入し、キャンバス構造、レイアウト、要素(テキスト/画像/ベクター)を含めて表現する。
  • CPTはプロのデザイナーが作成した多数のデザインテンプレートで微調整され、色やフォントなどのスタイル属性を文脈に依存して予測できるようにしている。
  • 生成物はピクセル画像ではなく、内部の意味的構造とスタイルの整合性を保った「編集可能なデザインドキュメント」として出力され、デザインエディタで反復・パーソナライズできる。
  • 実験では、既存テンプレートの文脈に基づくカラーバリエーションやフォント変更に加え、レイアウト調整でも設計原則を維持できる可能性が示されている。