要旨: パンシャープニングは、低解像度マルチスペクトル(LRMS)画像と高解像度パン(PAN)画像を融合することで、スペクトル情報と空間情報の両方を保持しつつ、高解像度マルチスペクトル(HRMS)画像を生成することを目的としています。深層学習(DL)に基づくパンシャープニング手法は目覚ましい性能を達成していますが、高い学習コストと大規模なデータセットを必要とし、さらにテスト分布が学習時と異なる場合には劣化することが多く、汎化性が制限されます。近年のゼロショット手法は、単一のPAN/LRMSペアで学習することで強い汎化を実現する一方、融合品質が限定的であること、計算オーバーヘッドが大きいこと、収束が遅いことが課題です。これらの問題に対処するため、実環境のパンシャープニングに向けた、高速かつ汎化可能なモデルガイド付きインスタンス単位適応フレームワークであるFMG-Panを提案します。これにより、センサーをまたぐ汎用性と、迅速な学習・推論の両方を実現します。このフレームワークは、事前学習済みモデルを活用して軽量な適応ネットワークを導き、スペクトル的忠実性と物理的忠実性の制約を組み合わせた共同最適化を通じて学習します。さらに、空間的な詳細の保持を強化するための新しい物理的忠実性項を設計します。実世界のデータセットに対して、同一センサー内およびセンサー間の両設定で行った大規模な実験により、最先端の性能が示されました。WorldView-3データセットでは、FMG-Panは512x512x8の画像についてRTX 3090 GPU上で3秒以内に学習と推論を完了し、既存のゼロショット手法よりも大幅に高速であるため、実運用の展開に適しています。
忠実度制約付きの実世界向けパンシャープニングに対する高速なモデル誘導インスタンス別適応フレームワーク
arXiv cs.CV / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- FMG-Pan(FMG-Pan)は、多くのDL手法で見られる分布間の汎化性能の低さを対象とした、実世界向けパンシャープニングのための高速で汎用的なモデル誘導インスタンス別適応フレームワークとして提案される。
- 本手法は、事前学習済みモデルを用いて軽量な適応ネットワークを誘導し、スペクトル的および物理的な忠実度制約を同時に最適化することで、スペクトル情報と空間情報の両方を保持する。
- 空間的な詳細の保持を改善するための新しい物理的忠実度項を導入し、しばしば融合品質が弱くなりがちな従来のゼロショット手法の限界に対処する。
- 実世界データセット(同一センサ内および異なるセンサ間)での実験により、最先端の性能が報告されており、RTX 3090上で512×512×8のトレーニング+推論が約3秒で完了するWorldView-3のランタイムも報告されている。
- 急速な収束・推論とセンサ間の汎用性を組み合わせることで、FMG-Panは、オーバーヘッドが高い既存のゼロショット・パンシャープニング手法よりも、実運用により適している位置付けとなる。

