構造整合とパーソナライズされた拡散による生成的フォトモザイク

arXiv cs.CV / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、タイルごとの色合わせによるフォトモザイク作成を、拡散ベースの合成へ置き換えることで、フォトモザイク生成における最初の生成的アプローチであると主張する手法を提案している。
  • 低周波のメカニズムを用いたリファレンス画像の条件付けにより、大域的な構造を整合させつつ、プロンプトに基づく詳細の変化も可能にしている。
  • この手法は、多数のタイル画像を必要とする従来のマッチングベースのフォトモザイクと比べて、意味的な表現力と構造的な一貫性の両方を向上させることを目的としている。
  • 大量の画像コレクションを用意せずに、スタイル的に一貫した、またはユーザー固有のタイルを生成できる「少数ショットのパーソナライズされた拡散」を導入している。