Colorful-Noise:色ベースの条件付き画像生成のための学習不要・低周波ノイズ操作

arXiv cs.CV / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、テキストから画像を生成する拡散モデルにおける入力ノイズの周波数成分が、グローバルな構造や色の構成、細部に与える影響を分析します。
  • ホワイトガウスノイズは多様な出力を生む一方で、人間が解釈できる構造がないため視覚属性の制御性や予測可能性が制限されると主張しています。
  • 著者らは、低周波成分が主にグローバルな構造と色を決め、高周波成分が細部を担うことを示します。
  • 低周波の画像事前(low-frequency image priors)を用いて低周波ノイズを操作する、学習不要で最小のオーバーヘッドによる手法を提案しています。
  • 低周波操作で全体の構造や色の手がかりを誘導しつつ、高周波成分は自然に出現させることで、条件付き生成を改善しつつ出力の多様性も維持します。