Allo{SR}$^2$：オートモルフィックな生成フローで“現実らしさ”を保つための1ステップ超解像の軌道補正

arXiv cs.CV / 2026/4/22

📰 ニュースModels & Research

共有:

要点

本論文は、限られたLR-HRペアでの微調整による過学習ではなく、拡散/フローベースの生成プリヤを維持することを目的にした、1ステップの実世界超解像（Real-SR）フレームワーク「Allo{SR}$^2$」を提案する。
「prior collapse」と1ステップ生成に伴う軌道ドリフトを、SNRガイド付きの軌道初期化によって解決し、LR劣化レベルを事前学習済みフローの最適タイムステップへ対応付ける。
さらに、Flow-Anchored Trajectory Consistency（FATC）として、1ステップ推論の安定性を保つために中間状態に対して速度レベルの教師信号を課す手法を導入する。
Allomorphic Trajectory Matching（ATM）では、自己敵対的な整合化により、超解像フローと生成フローの分布不一致を、統一されたベクトル場の中で低減する。
合成および実世界ベンチマークでの実験により、復元の忠実度と生成の“現実らしさ”を両立しつつ、推論効率も非常に高い1ステップReal-SRで最先端の性能が示される。

Abstract

現実世界の画像超解像（Real-SR）は、大規模拡散およびフローベースのモデルが持つ強力な生成的事前知識を活用することで革新されてきました。しかし、限られたLR-HRペアに対してこれらのモデルを微調整すると、多くの場合「prior collapse（事前知識の崩壊）」が起こり、モデルは固有の生成的な豊かさを犠牲にして、特定の学習劣化に過適合してしまいます。この問題は、複数ステップの精緻化が存在しないために、軌道のドリフトとアーティファクト生成が大きくなる1ステップ生成においてさらに悪化します。本論文では、1ステップSRの軌道を異形（allomorphic）な生成フローによって矯正し、高い忠実度の生成的リアリズムを維持する新しい枠組みAllo{SR}

^2

を提案します。具体的には、Signal-to-Noise Ratio（SNR）に基づく軌道初期化（SNR Guided Trajectory Initialization）を用いて、LR潜在特徴の劣化レベルを、事前学習済みフローの最適なアンカリング・タイムステップに整合させることで、物理的に根拠づけられた開始状態を確立します。1ステップ推論において安定で、曲率のない経路を保証するために、中間状態にわたって速度レベルの教師あり学習を課すFlow-Anchored Trajectory Consistency（FATC）を提案します。さらに、SRフローと生成フローの間の分布の不一致を、統一されたベクトル場のもとで最小化する自己対向的アラインメント戦略であるAllomorphic Trajectory Matching（ATM）を開発します。合成ベンチマークおよび現実世界ベンチマークの双方での大規模な実験により、Allo{SR}

^2

は1ステップReal-SRにおいて最先端の性能を達成することが示されます。これにより、復元の忠実度と生成的リアリズムの間の優れたバランスを提供しつつ、極めて高い効率性も維持します。

GPT-5.5が登場、DeepSeek V4も。正直、バージョン番号にもううんざりだ

Dev.to

GPT Image 2.0でAI画像ワークフローを構築（最大の欠点も修正）

Dev.to

Max-and-Omnis/Nemotron-3-Super-64B-A12B-Math-REAPのGGUFファイルを公開

Reddit r/LocalLLaMA

視覚インフラ層の構築：Eコマースの「ビジュアル・トラスト・ギャップ」を解決する方法

Dev.to

DeepSeek-V4、HuaweiのAscendチップで稼働率85%——AIインフラと価格にとって意味すること

Dev.to

Allo{SR}$^2$：オートモルフィックな生成フローで“現実らしさ”を保つための1ステップ超解像の軌道補正

要点

Abstract

関連記事

GPT-5.5が登場、DeepSeek V4も。正直、バージョン番号にもううんざりだ

GPT Image 2.0でAI画像ワークフローを構築（最大の欠点も修正）

Max-and-Omnis/Nemotron-3-Super-64B-A12B-Math-REAPのGGUFファイルを公開

視覚インフラ層の構築：Eコマースの「ビジュアル・トラスト・ギャップ」を解決する方法

DeepSeek-V4、HuaweiのAscendチップで稼働率85%——AIインフラと価格にとって意味すること

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer