反復的デノイジングによる正規化フローの正規化

arXiv cs.CV / 2026/4/23

📰 ニュースModels & Research

共有:

要点

本論文は、TARFlowの反復版であるiTARFlowを提案し、画像向けの生成モデルとしての正規化フロー（NF）をさらに発展させます。
iTARFlowは拡散モデルとは異なり、学習中ずっと完全にエンドツーエンドの尤度ベースの目的関数を維持します。
サンプリングでは、自己回帰的生成に加えて、拡散スタイルの手法に触発された反復的デノイジング手順を組み合わせます。
実験の結果、iTARFlowはImageNetの64・128・256ピクセル解像度で競争力のある性能を示し、他の生成手法に対する有力な代替になり得ることが示唆されます。
著者らはiTARFlowが生み出すアーティファクトも分析し、将来の改善につながる洞察を提供し、コードはGitHubで公開されています。

概要: 正規化フロー（Normalizing Flows; NFs）は、尤度ベースの手法の古典的なファミリーであり、近年再び注目を集めています。TARFlowのような最近の取り組みにより、NFsが画像モデリング課題で有望な性能を達成できることが示され、拡散モデルなどの他の手法に対する実行可能な代替となっています。本研究では、反復型TARFlow（iterative TARFlow; iTARFlow）を導入することで、正規化フロ―の生成モデルの最新の到達点をさらに前進させます。拡散モデルとは異なり、iTARFlowは学習中に、完全にエンドツーエンドの尤度ベースの目的関数を維持します。サンプリング時には、自己回帰的な生成を行った後、拡散スタイルの手法に着想を得た反復的な除ノイズ手順を実行します。大規模な実験を通じて、iTARFlowがImageNetの64、128、256ピクセルという各解像度において競争力のある性能を達成することを示し、強力な生成モデルとしての可能性を示すとともに、正規化フローのフロンティアを押し広げます。さらに、iTARFlowによって生成される特徴的なアーティファクトを解析し、今後の改善につながる可能性のある洞察を提供します。コードは https://github.com/apple/ml-itarflow で公開されています。