最適損失値の推定による拡散モデルの診断と改善
arXiv stat.ML / 2026/4/17
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、拡散モデルの損失は絶対的なデータ適合度の指標としては不十分であり得ると主張します。なぜなら、損失の最適値は通常ゼロではなく、かつ未知であるためです。
- 研究では、統一的な拡散モデルの定式化のもとで最適損失を閉形式で導出し、大規模データセットにも適用できる確率的バリアントを含む実用的な推定器(分散とバイアスを制御)を提案します。
- 推定した最適損失を用いて、主要な拡散モデルのバリアントに対する学習品質の診断における内在的な指標として活用できることを示します。
- また、最適損失に基づく考え方でトレーニングスケジュールをより性能良く設計できることを提案し、120M〜1.5Bパラメータのモデルでは「観測損失から最適損失を差し引くとべき乗則がより明確に現れる」ことを報告します。
- 結果として、単なる損失値以上の観点から、拡散モデルの学習進捗をより原理的に評価・比較する枠組みを提供します。



