概要: 高解像度の衛星画像の取得は、多くの場合、衛星センサーの空間的・時間的な制約や、頻繁な観測に伴う高いコストによって制限されます。これらの課題は、環境モニタリング、災害対応、農業管理といった、きめ細かく高解像度なデータを必要とする応用を妨げています。本論文では、これらの課題に対処するために、潜在拡散モデルとウェーブレット変換を組み合わせた、衛星画像超解像(SR)のための革新的な枠組みであるMWT-Diffを提案します。枠組みの中核には、新しいメタデータ、ウェーブレット、時間を考慮したエンコーダ(MWT-Encoder)があり、メタデータ属性、多尺度の周波数情報、時間的な関係を捉える埋め込みを生成します。この埋め込み特徴表現は階層的な拡散ダイナミクスを導き、それによってモデルは低解像度入力から高解像度衛星画像を段階的に再構成します。この過程では、質感パターン、境界の不連続、詳細なリモートセンシング解析に不可欠な高周波スペクトル成分など、重要な空間的特性が保持されます。複数のデータセットにわたるMWT-Diffの比較分析では、FIDやLPIPSを含む標準的な知覚品質指標によって測定したところ、近年の手法と比べて良好な性能が示されました。コードは https://github.com/LuigiSigillo/MWT-Diff で公開されています。
メタデータ、ウェーブレット、時間を考慮した拡散モデルによる衛星画像の超解像
arXiv cs.CV / 2026/5/6
💬 オピニオンTools & Practical UsageModels & Research
要点
- この論文は、潜在拡散モデルとウェーブレット変換を組み合わせた衛星画像の超解像フレームワーク「MWT-Diff」を提案し、センサーの空間・時間的制約や高い観測頻度コストといった課題に対処します。
- 中核となるのはメタデータ・ウェーブレット・時間を考慮したエンコーダ(MWT-Encoder)で、メタデータ属性、多スケールの周波数情報、時間的関係を捉える埋め込み表現を生成します。
- これらの埋め込みは階層的な拡散ダイナミクスを導き、低解像度入力から高解像度画像を段階的に復元しつつ、テクスチャ、境界の不連続、高周波スペクトル成分などの重要な特徴を保持します。
- 複数データセットでの比較実験により、FIDやLPIPSといった知覚品質メトリクスで、最近の手法より良好な性能が示されています。
- 著者は、提示されたGitHubリンクに実装コードを公開しています。




