AI Navigate

OARS: 生成系実世界画像超解像のプロセス認識オンライン整合フレームワーク

arXiv cs.CV / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • OARSは、未知の劣化条件下で知覚と忠実度のトレードオフに対処する、生成系実世界画像超解像のプロセス認識オンライン整合フレームワークです。
  • COMPASSという、忠実度の保持と知覚的ゲインを同時にモデル化し、入力品質適応型のトレードオフを備えたMLLMベースの報酬を用います。
  • 著者らは、合成と実世界の劣化を網羅するCOMPASS-20Kを編成し、校正済みで細粒度の訓練ラベルを生み出す3段階の知覚アノテーション・パイプラインを導入します。
  • OARSは、初期段階のコールドスタートのフロー整合からフルリファレンスへ、最終的には参照フリーの強化学習へと段階的にオンライン整合を実施し、オンポリシー探索のために浅いLoRA最適化を利用します。
  • 実験とユーザ研究は、忠実度を維持しつつ一貫した知覚的改善を示し、Real-ISRベンチマークで最先端の性能を達成することを示しています。

要旨: 人間の視覚的嗜好と整合する生成系の現実世界画像超解像モデルは、知覚と忠実度のトレードオフと多様で未知の劣化のため、難しい。
従来のアプローチはオフラインの嗜好最適化と静的な指標集約に依存しており、解釈不能で強い条件付けの下で疑似多様性を招くことが多い。
我々はOARS、COMPASS上に構築されたプロセス認識型オンライン整列フレームワークを提案する。これはMLLMベースの報酬であるCOMPASSを用い、忠実度保持と知覚的利得を入力品質適応トレードオフと共に結合的にモデル化して、LRからSRへの遷移を評価する。
COMPASSを訓練するために、合成と実デグレードを含むCOMPASS-20Kを厳選し、較正済みで細粒度の訓練ラベルを生み出す3段階の知覚アノテーションパイプラインを導入する。
COMPASSに導かれて、OARSはコールドスタートフローのマッチングから完全参照へ、最終的には参照なしRLへと段階的なオンライン整列を行い、オンポリシー探索のために浅いLoRA最適化を用いる。
広範な実験とユーザー調査により、忠実度を維持しつつ一貫した知覚的改善を示し、Real-ISRベンチマークで最先端の性能を達成する。