拡散確率モデルにおけるSNR-tバイアスの解明

arXiv cs.CV / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、拡散確率モデルにSignal-to-Noise Ratio（SNR）とタイムステップの不整合（SNR-tバイアス）があることを示し、推論時における復元対象のSNRが対応するタイムステップとずれてしまう問題を指摘しています。
学習ではサンプルのSNRがタイムステップに厳密に結び付けられている一方、推論でその対応が崩れることで誤差が蓄積し、生成品質が低下すると説明しています。
著者らはこの現象について、実験的証拠と理論的分析の両面から裏付けを行い、SNR-tバイアスを抑えるためのシンプルかつ有効な差分補正手法を提案しています。
サンプルを周波数成分に分解し、拡散モデルが逆過程で低周波を先に復元し高周波へ進むという性質を踏まえて各成分に個別に補正を適用することで、IDDPM、ADM、DDIMなど多数の拡散モデルで生成品質が大幅に改善されると示しています。
さらに、提案手法は計算オーバーヘッドがほぼ無視できるとされ、コードは https://github.com/AMAP-ML/DCW で公開されています。

Dev.to

Dev.to

Dev.to

Reddit r/artificial

Qiita