MFSR:ワンステップの実環境画像超解像のための平均フロウ蒸留(MeanFlow Distillation)

arXiv cs.CV / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、MFSR(MeanFlow Distillation for One Step Real-World Image Super-Resolution)を提案し、多段のサンプリングを1回の推論ステップに削減することで、拡散/フローベースのReal-ISRを高速化しつつ、画質の大きな低下を抑えます。
  • MFSRは、軌道の明示的なロールアウトを避けながら、確率フロウODE(PF-ODE)の状態間における平均速度を近似する学習目標としてMeanFlowを用い、学生モデルを学習させます。
  • 実用的な画像復元を改善するために、教師-CFG蒸留戦略により分類器フリーガイダンス(CFG)を強化し、微細なディテールのより良い復元と、復元能力の強化を目指します。
  • 合成および実環境のベンチマーク双方での実験により、MFSRは、計算コストを大幅に抑えながら、多段の教師モデルと同等、またはそれ以上の効率的で柔軟かつフォトリアルな超解像結果を達成できることが示されます。さらに、任意の少数ステップによるリファインメント経路も提供します。

Abstract

拡散ベースおよびフロー(流れ)ベースのモデルは、現実世界の画像超解像(Real-ISR)を大きく前進させてきましたが、マルチステップのサンプリングにより推論が遅く、デプロイが難しいという課題があります。ワンステップ蒸留はコストを軽減しますが、多くの場合、復元品質を低下させ、さらに多くのステップで改良するための選択肢を失います。私たちは、単一ステップでフォトリアルな結果を生成しつつ、さらなる改善のための任意の少数ステップ経路も許容する、新しい蒸留フレームワークである Mean Flows for Super-Resolution(MFSR)を提案します。私たちのアプローチでは学習目標として MeanFlow を用い、任意の状態間における確率フローODE(PF-ODE)の平均速度を生徒モデルが近似できるようにします。これにより、明示的なロールアウト(展開)なしで教師のダイナミクスを効果的に捉えられます。さらに、事前学習済みの生成的事前知識(プリオリ)をより活用するために、元の MeanFlow の Classifier-Free Guidance(CFG)表現を、教師CFG蒸留戦略とともに改善します。これにより、復元能力が向上し、微細なディテールも維持されます。合成データおよび現実世界のベンチマークの両方での実験により、MFSR は効率的で柔軟性が高く、かつ高品質な超解像を達成し、マルチステップの教師と同等、あるいはそれ以上の結果を、計算コストを大幅に低くして実現することが示されています。