モデル合成のためのスコアベース拡散モデルに対するMCMC補正

arXiv stat.ML / 2026/4/2

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、拡散モデルをサンプリングする方法として、エネルギーベースのパラメータ化（Metropolis–Hastings補正を可能にする）と、スコアベースのパラメータ化（通常は明示的なエネルギー関数を持たない）を比較・検討する。
明示的なエネルギーモデリングを不要にするため、スコア関数の線積分に基づいて導出したMH風の受理判定規則を導入し、スコアベース拡散モデルに対するMCMC補正手法を提案する。
本手法は、アニーリングされたMCMCの一例として位置づけられ、事前学習済みのスコアベース拡散モデルを合成して新たな目的分布からサンプルを生成できるようにする。
合成データセットと実世界データセットの両方での実験により、エネルギーベースのモデルで達成されるのと同程度の大きさの、相対的なサンプリング改善が示されるとともに、既存のスコアモデル・エコシステムを再利用できる特性が維持される。

Abstract

拡散モデルは、スコア関数またはエネルギー関数のいずれかの形でパラメータ化できる。エネルギーのパラメータ化は魅力的であり、提案されたサンプル間のエネルギー差に基づくメトロポリス–ヘイスティングス（MH）補正ステップを組み込む、マルコフ連鎖モンテカルロ（MCMC）などのサンプリング手順を可能にする。こうした補正は、特にモデル合成の文脈、すなわち事前学習済みモデルを組み合わせて新しい分布からのサンプルを生成する場合において、サンプリング品質を大幅に向上させ得る。一方で、スコアベースの拡散モデルはより広く採用されており、豊富な事前学習済みモデルのエコシステムを備えている。しかし一般には、基礎となるエネルギー関数を定義しないため、MHに基づくサンプリングは適用できない。本研究では、スコアのパラメータ化を保持したまま、スコア関数の線積分に基づく新しいMHライクな受容規則を導入することで、この制限に対処する。これにより、既存の拡散モデルを再利用しつつ、逆過程をさまざまなMCMC技術と組み合わせることができる。これは、アニールされたMCMCの一例とみなせる。合成データおよび実世界データに関する実験を通じて、我々のMHライクなサンプラーが、明示的なエネルギーのパラメータ化を必要とせずに、エネルギーベースのモデルで観測されるものと同程度の大きさの相対的改善をもたらすことを示す。

Bonsai（PrismMLのQwen3 8B/4B/1.7Bの1ビット版）はエイプリルフールの冗談ではなかった

Reddit r/LocalLLaMA

大手テック企業はAI投資と統合を加速している一方、規制当局と企業は安全性と責任ある導入に注目している

Dev.to

推論エンジン――LLMの層を視覚的に深掘りする

Dev.to

エージェント型フローにおけるQwen3.5 9Bの能力の高さに驚かされた（CodeMode）

Reddit r/LocalLLaMA

企業コンプライアンスにおけるAI幻覚：CISOはリスクをどう封じ込めるか

Dev.to

モデル合成のためのスコアベース拡散モデルに対するMCMC補正

要点

Abstract

関連記事

Bonsai（PrismMLのQwen3 8B/4B/1.7Bの1ビット版）はエイプリルフールの冗談ではなかった

大手テック企業はAI投資と統合を加速している一方、規制当局と企業は安全性と責任ある導入に注目している

推論エンジン――LLMの層を視覚的に深掘りする

エージェント型フローにおけるQwen3.5 9Bの能力の高さに驚かされた（CodeMode）

企業コンプライアンスにおけるAI幻覚：CISOはリスクをどう封じ込めるか

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer