要旨: 単一画像超解像(SISR)は、低解像度(LR)観測から高解像度(HR)画像を復元することを目的とします。これは本質的に逆問題であり、大きな拡大率において高周波の詳細が深刻に劣化します。近年の進展は、トランスフォーマーに基づくアーキテクチャや拡散モデルによって牽引されてきました。これらは、計算量の増大を伴う代わりに、グローバルな文脈モデリングと知覚品質を改善します。対照的に、本研究は、最小のリソースのもとで局所演算子の表現力を高めることに焦点を当てます。本研究では、畳み込みコルモゴロフ—アーノルドネットワーク(CKAN)を敵対的学習の枠組みに統合し、畳み込みを非線形のパッチベース変換として再定式化するハイブリッド超解像フレームワーク「SRGAN--CKAN」を提案します。提案された演算子は、線形の局所写像を、スプラインベースの関数表現へ置き換えます。これにより、最小限のハードウェア資源で複雑な局所構造や高周波テクスチャを、より表現力豊かにモデリングできるようになります。実験結果は、提案手法が復元の忠実度を維持しつつ知覚品質を向上させ、歪みに基づく指標と知覚に基づく指標の間で好ましいバランスを達成することを示しています。これらの結果は、計算が制約された条件の下で得られており、提案定式化の効率性を強調しています。全体として、本研究は、局所変換の表現力を高めることで、既存手法に対する補完的な方向性を提示し、グローバルに強く計算集約的なアーキテクチャに対する、効率的でスケーラブルな代替案を提供します。
SRGAN-CKAN:最小限のリソースでの非線形関数オペレータによる表現力のある超解像
arXiv cs.CV / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、単一画像超解像(SISR)に取り組み、拡大率が大きいほど高周波の細部が大きく劣化する本質的に不適切な逆問題に対処します。
- SRGAN-CKANとして、Convolutional Kolmogorov–Arnold Networks(CKAN)を敵対的学習に組み込み、畳み込みを非線形のパッチベース変換として再定式化するハイブリッド手法を提案しています。
- 線形の局所写像の代わりに、スプラインベースの関数表現を用いることで、限られた計算資源のもとで複雑な局所構造や高周波テクスチャをより効果的にモデリングできます。
- 実験では、歪み(再構成誤差)に基づく指標と知覚(知覚品質)に基づく指標の間で良好なトレードオフを実現しつつ、知覚品質の向上と再構成忠実度の維持が報告されています。
- 本手法は、トランスフォーマや拡散モデルのような大域的に計算集約的なアーキテクチャに依存する代わりに、局所オペレータの表現力を高める補完的な方向性として位置づけています。



