概要: ガイダンスは、生成プロセスを所望の分布へと導くことで、事後サンプリングのためのシンプルで効果的な枠組みを提供します。離散データをモデル化する際、既存のアプローチは主に、サンプリング効率を改善するために一次近似によるガイダンスに焦点を当てています。しかし、このような近似は離散状態空間では不適切です。近似誤差が大きくなり得るためです。この問題に対処するため、離散データ向けの新しいガイダンス枠組みを提案します。学習済みの離散フローマッチングモデルに基づいて、所望の分布に対する厳密な遷移率を導出し、その結果、各サンプリングステップで必要となるのは単一の順伝播パスのみとなり、効率が大幅に向上します。この統一的で新規な枠組みは十分に一般的であり、既存のガイダンス手法を特殊な場合として包含します。さらに、マスク付き拡散モデルにもシームレスに適用できます。提案するガイダンスの有効性を、エネルギー誘導シミュレーションおよび、テキストから画像生成とマルチモーダル理解タスクにおける嗜好整合で実証します。コードは https://github.com/WanZhengyan/Discrete-Guidance-Matching で公開されています。
離散ガイダンス・マッチング:離散フローマッチングにおける正確なガイダンス
arXiv stat.ML / 2026/4/16
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、一般的に用いられる離散ガイダンス手法が一次の近似に依存しており、離散状態空間では不正確になり得るため、大きな誤差を引き起こす可能性があると主張する。
- それに対し、「離散ガイダンス・マッチング」を提案し、学習した離散フローマッチングモデルから、目標(望ましい)分布へ向かう遷移率を厳密に導出する。
- 得られるガイダンス機構は、各サンプリング手順につき前向き1回のパスだけを要求しながら、近似ではなく厳密なガイダンスを提供することで、サンプリング効率を改善する。
- この枠組みは一般的であり、既存のガイダンス手法を特殊な場合として回復でき、マスク付き拡散モデルとも互換である。
- 実験により、エネルギー誘導シミュレーションおよびテキストから画像生成とマルチモーダル理解における嗜好整合で性能が向上し、コードはGitHubで公開されている。


