MapSR:ビジョン基盤モデルによるプロンプト駆動の土地被覆マップ超解像

arXiv cs.CV / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • MapSRは、高コストな高解像度(HR)土地被覆アノテーションの問題に対し、弱い教師(低解像度・粗いラベル)を何度も使って密な予測器を再学習するのではなく、地図の超解像として粗い低解像度(LR)製品を高解像度へ高めます。
  • 本手法は「教師(supervision)と学習(model training)を分離」し、LRラベルを一度だけ用いて、凍結したビジョン基盤モデル特徴から軽量な線形プローブを通じてクラス・プロンプトを抽出します。
  • その後、HR推定は学習なしで、コサイン類似度によるプロンプト照合を行い、さらにグラフに基づく予測伝播で空間的に整合した結果へ洗練します。
  • Chesapeake Bayデータセットで、MapSRはHRラベルなしで59.64% mIoUを達成し、最強の弱教師ありベースラインに競り合うとともに、完全教師ありベースラインを上回ります。
  • MapSRは計算コストを大幅に削減し、学習可能パラメータを4桁減らし、学習時間を数時間から数分へ短縮することで、アノテーションと計算資源が限られた状況での大規模なHRマッピングを可能にします。