広告

モデル合成のためのスコアベース拡散モデルに対するMCMC補正

arXiv stat.ML / 2026/4/2

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、拡散モデルをサンプリングする方法として、エネルギーベースのパラメータ化(Metropolis–Hastings補正を可能にする)と、スコアベースのパラメータ化(通常は明示的なエネルギー関数を持たない)を比較・検討する。
  • 明示的なエネルギーモデリングを不要にするため、スコア関数の線積分に基づいて導出したMH風の受理判定規則を導入し、スコアベース拡散モデルに対するMCMC補正手法を提案する。
  • 本手法は、アニーリングされたMCMCの一例として位置づけられ、事前学習済みのスコアベース拡散モデルを合成して新たな目的分布からサンプルを生成できるようにする。
  • 合成データセットと実世界データセットの両方での実験により、エネルギーベースのモデルで達成されるのと同程度の大きさの、相対的なサンプリング改善が示されるとともに、既存のスコアモデル・エコシステムを再利用できる特性が維持される。

Abstract

拡散モデルは、スコア関数またはエネルギー関数のいずれかの形でパラメータ化できる。エネルギーのパラメータ化は魅力的であり、提案されたサンプル間のエネルギー差に基づくメトロポリス–ヘイスティングス(MH)補正ステップを組み込む、マルコフ連鎖モンテカルロ(MCMC)などのサンプリング手順を可能にする。こうした補正は、特にモデル合成の文脈、すなわち事前学習済みモデルを組み合わせて新しい分布からのサンプルを生成する場合において、サンプリング品質を大幅に向上させ得る。一方で、スコアベースの拡散モデルはより広く採用されており、豊富な事前学習済みモデルのエコシステムを備えている。しかし一般には、基礎となるエネルギー関数を定義しないため、MHに基づくサンプリングは適用できない。本研究では、スコアのパラメータ化を保持したまま、スコア関数の線積分に基づく新しいMHライクな受容規則を導入することで、この制限に対処する。これにより、既存の拡散モデルを再利用しつつ、逆過程をさまざまなMCMC技術と組み合わせることができる。これは、アニールされたMCMCの一例とみなせる。合成データおよび実世界データに関する実験を通じて、我々のMHライクなサンプラーが、明示的なエネルギーのパラメータ化を必要とせずに、エネルギーベースのモデルで観測されるものと同程度の大きさの相対的改善をもたらすことを示す。

広告