InstanceRSR:インスタンス認識表現アラインメントによる実世界超解像
arXiv cs.CV / 2026/3/26
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、現在の実世界超解像(RSR)手法の重要な弱点を指摘する。すなわち、MSEのようなノイズ除去損失はグローバルな一貫性を促す一方で、複雑なシーンにおける微細な、インスタンス単位の情報を十分に復元できない。
- そこでInstanceRSRは、低解像度入力から得られるグローバルな一貫性のガイダンスと、サンプリング中にセマンティックセグメンテーションマップを用いて意味的な関連性を強制する仕組みを組み合わせる。
- InstanceRSRはさらに、拡散潜在空間をインスタンス潜在特徴と整合させるインスタンス表現学習モジュールを追加し、インスタンス認識の特徴アラインメントを実現する。
- さらに、微細な知覚とディテール復元の向上を目的としたスケール整合メカニズムを導入する。
- 複数の実世界ベンチマークでの実験により、本手法が新たな最先端性能を達成し、量的指標と視覚的品質の両方が向上することが示される。加えて、インスタンスレベルでの意味的一貫性も維持される。