Diffusion Crossover:ノイズ系列の補間によって拡散モデルで進化的組換え(crossover)を定義する

arXiv cs.AI / 2026/4/17

📰 ニュースModels & Research

要点

  • 本論文は、Interactive Evolutionary Computation における「crossover」を拡散モデルで具体的に定義し、高次元の生成表現での意味整合的な組換えが難しいという課題に取り組みます。
  • 提案手法「Diffusion crossover」は、DDPM の逆過程で親画像に対応するノイズ系列を段階的に補間し、そこで Slerp を用いてオフスプリングを生成します。
  • 補間する時刻ステップの範囲を制御することで、探索(多様性)と収束(活用)のバランスを原理的に調整できるとします。
  • PCA 分析や知覚類似度指標(LPIPS)による実験結果から、親画像間の遷移が知覚的に滑らかで意味的に一貫していることが示されます。
  • ヒューマン・イン・ザ・ループの対話型進化実験により、拡散モデルが再結合を明示的かつ制御可能な構造化探索空間として機能し、主観的な画像探索を効果的に支えられることが示唆されます。

概要: インタラクティブ進化的計算(IEC)は、人間の嗜好や美的感覚のような主観的基準を最適化するための強力な枠組みを提供しますが、根本的な制約があります。高次元の生成表現においては、意味的に一貫した形で交叉(crossover)を定義することが難しく、結果として突然変異に支配された探索になりがちです。本研究では、拡散モデルにおける交叉を明示的に定義します。提案手法「Diffusion crossover(拡散交叉)」は、生成過程における進化的組換えを、Denoising Diffusion Probabilistic Models(DDPMs)の逆過程におけるノイズ列の段階的な補間として定式化します。選択した親画像に対応するノイズ列に対して球面線形補間(Slerp)を適用することで、提案手法は、拡散プロセスの幾何学的構造を保持しつつ、両親の特徴を併せ持つ子(offspring)を生成します。さらに、補間の時間ステップ範囲を制御することで、多様性(探索)と収束(活用)の間の原理に基づくトレードオフを可能にします。PCA解析と知覚類似度指標(LPIPS)を用いた実験結果から、Diffusion crossoverは親画像間の知覚的に滑らかで意味的に一貫した遷移を生成することが示されます。加えて、人間が介在する形の定性的なインタラクティブ進化実験により、本手法が人間をループに含む画像探索を効果的に支援できることが確認されます。これらの発見は新しい視点を示唆します。すなわち、拡散モデルは単なる強力な生成器であるだけでなく、組換えを明示的に定義し制御できるような、構造化された進化的探索空間でもあるのです。