Abstract
現実世界の画像超解像(Real-SR)は、大規模拡散およびフローベースのモデルが持つ強力な生成的事前知識を活用することで革新されてきました。しかし、限られたLR-HRペアに対してこれらのモデルを微調整すると、多くの場合「prior collapse(事前知識の崩壊)」が起こり、モデルは固有の生成的な豊かさを犠牲にして、特定の学習劣化に過適合してしまいます。この問題は、複数ステップの精緻化が存在しないために、軌道のドリフトとアーティファクト生成が大きくなる1ステップ生成においてさらに悪化します。本論文では、1ステップSRの軌道を異形(allomorphic)な生成フローによって矯正し、高い忠実度の生成的リアリズムを維持する新しい枠組みAllo{SR}^2を提案します。具体的には、Signal-to-Noise Ratio(SNR)に基づく軌道初期化(SNR Guided Trajectory Initialization)を用いて、LR潜在特徴の劣化レベルを、事前学習済みフローの最適なアンカリング・タイムステップに整合させることで、物理的に根拠づけられた開始状態を確立します。1ステップ推論において安定で、曲率のない経路を保証するために、中間状態にわたって速度レベルの教師あり学習を課すFlow-Anchored Trajectory Consistency(FATC)を提案します。さらに、SRフローと生成フローの間の分布の不一致を、統一されたベクトル場のもとで最小化する自己対向的アラインメント戦略であるAllomorphic Trajectory Matching(ATM)を開発します。合成ベンチマークおよび現実世界ベンチマークの双方での大規模な実験により、Allo{SR}^2は1ステップReal-SRにおいて最先端の性能を達成することが示されます。これにより、復元の忠実度と生成的リアリズムの間の優れたバランスを提供しつつ、極めて高い効率性も維持します。