制御可能なリサンプリングによる離散拡散モデルの補間

arXiv cs.LG / 2026/4/21

📰 ニュースModels & Research

共有:

要点

本論文はIDDM（補間型離散拡散モデル）を提案し、既存の離散拡散手法（マスク拡散・一様拡散など）が抱える品質劣化や誤差蓄積の問題を改善します。
IDDMでは、確率質量を周辺分布（マージナル分布）へ部分的にリセットする「制御可能なリサンプリング」機構を用いることで、中間潜在状態への依存を下げます。
提案手法では、現在の状態に留まること、事前分布からリサンプリングすること、目標状態へ向けて反転（フリップ）すること、の間を補間する生成遷移を設計します。
周辺整合性を課し、訓練と推論を完全に切り離すことを主張しており、運用面での単純化や頑健性向上が期待されます。
分子グラフ生成とテキスト生成の実験で、IDDMは最先端の離散拡散モデルに対して競争力のある性能を示します。

Abstract

離散拡散モデルは、テキストやグラフなど多様な領域にわたって、強力な生成モデルの一群を形成している。しかし、既存の手法には根本的な制約がある。マスク付き拡散モデルは、早期のアンマスクによる不可逆的な誤りに悩まされる。一方で一様拡散モデルは自己修正を可能にするものの、中間潜在状態への強い依存によって、生成サンプルの品質が低くなりがちである。私たちは、中間潜在状態への依存を低減することで拡散を改善する、IDDM（Interpolating Discrete Diffusion Model）を提案する。IDDMの中核には、確率質量を周辺分布に部分的にリセットする制御可能な再サンプリング機構があり、誤りの蓄積を緩和し、より効果的なトークン修正を可能にする。IDDMは、現在の状態にとどまること、事前分布から再サンプリングすること、そして目標状態へ反転することの間で遷移が補間される生成過程を定義し、周辺整合性（marginal consistency）を強制しつつ、学習から推論を完全に切り離す。私たちは、分子グラフ生成およびテキスト生成のタスクにおいて、最先端の離散拡散モデルと比較してベンチマークを行い、競争力のある性能を示す。

NVIDIA DGX SparkフルスタックAIハッカソンで作ったものが総合1位に—『Starfire』から『Molecules AI』へ

Dev.to

進捗を失わない：VS Codeでプロ仕様のJupyterワークフローをセットアップする（Colabのタイムアウトともおさらば！）

Dev.to

AgentOSを作る：保険請求の「AWS Lambda」を目指している理由

Dev.to

状況はここまで来た——1年で何もかも変わった：Kimi、Minimax、Qwen、Gemma、GLM

Reddit r/LocalLLaMA

Grok-2 Mini と Grok-3（mini）はどこにあるのか？

Reddit r/LocalLLaMA

制御可能なリサンプリングによる離散拡散モデルの補間

要点

Abstract

関連記事

NVIDIA DGX SparkフルスタックAIハッカソンで作ったものが総合1位に—『Starfire』から『Molecules AI』へ

進捗を失わない：VS Codeでプロ仕様のJupyterワークフローをセットアップする（Colabのタイムアウトともおさらば！）

AgentOSを作る：保険請求の「AWS Lambda」を目指している理由

状況はここまで来た——1年で何もかも変わった：Kimi、Minimax、Qwen、Gemma、GLM

Grok-2 Mini と Grok-3（mini）はどこにあるのか？

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer