高解像度化モデルを大規模リモートセンシング画像で評価するための「下流タスク統合」ベンチマーク:Beyond Visual Fidelity
arXiv cs.AI / 2026/5/4
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、PSNRやSSIMのような画質(fidelity)指標に基づく超解像(SR)ベンチマークは、地球観測の下流タスクに対する実用性を必ずしも反映しないと主張しています。
- 空間的に対応し、時間的に整合し、品質管理された画像ペアを約3.6万地点の多様な土地被覆にわたって集めた、下流タスク統合型のSRベンチマーク「GeoSR-Bench」を提案します。
- GeoSR-Benchは解像度500m〜0.6mの範囲をカバーし、土地被覆のセグメンテーション、インフラのマッピング、生物物理量の推定など複数の監視タスクを支えます。
- GAN、トランスフォーマー、ニューラルオペレーター、拡散ベースのSRモデルを、クロスプラットフォームSRタスクや複数の下流モデル/タスクを組み合わせた270の実験設定で比較ベンチマークします。
- 伝統的なSR指標の改善が下流タスク性能の向上と結びつかないだけでなく、負の相関すら起こり得ることが示され、SRの開発・評価に下流タスクを組み込む必要性が明らかになります。



