単一トークンを超えて:離散MMDによる離散拡散モデルの蒸留

arXiv cs.LG / 2026/3/23

📰 ニュースModels & Research

要点

  • 離散モーメントマッチング蒸留(D-MMD)を提案し、離散拡散モデルの蒸留という課題に対処する。
  • 本手法は、連続拡散蒸留の成功例を取り入れ、十分なステップ数でサンプリングする際に高品質と多様性を維持するよう適応させている。
  • テキストおよび画像データセットで実証され、蒸留された新たな生成モデルは教師モデルを上回る性能を示している。
  • 本研究は、離散拡散モデルの蒸留に新しいアプローチをもたらし、arXiv のプレプリント(2603.20155v1)として公開された。

Abstract

現在、離散拡散モデルを蒸留することは困難です。対照的に、連続拡散の文献には、サンプリングステップをいくつかに抑えることができる多くの蒸留アプローチがあります。私たちの手法、Discrete Moment Matching Distillation (D-MMD)、は連続領域で非常に成功してきたアイデアを活用します。従来の離散蒸留法が崩壊する一方で、D-MMDは十分なサンプリングステップが与えられれば高品質と多様性を維持します。これはテキストデータセットと画像データセットの両方で示されています。さらに、新たに蒸留された生成モデルは教師を上回る可能性があります。