SAR海氷分類のためのデータ中心型ビジョントランスフォーマー基線

arXiv cs.CV / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、海氷分類のための信頼性あるSARのみのVision Transformer基線を提案し、完全に検証済みのマルチモーダルシステムであるという主張は明確に避けている。
  • ViT-BaseおよびViT-Largeモデルを、AI4Arctic/ASIP Sea Ice Dataset(v2)で学習する。入力はSentinel-1のExtra Wideのフル解像度とし、漏洩に配慮した層化パッチ分割、SIGRID-3の開発ラベル、学習セットの正規化を用いる。
  • 実験では、ViT-Baseに対して交差エントロピーと重み付き交差エントロピーを比較し、ViT-Largeに対してはフォーカル損失を用いる。形態的に類似した氷種の間で極めて大きいクラス不均衡に対処することが目的である。
  • フォーカル損失を用いたViT-Largeは、ホールドアウト精度69.6%、重み付きF1スコア68.8%を達成し、Multi-Year Iceに対して高い性能(適合率83.9%)を示す。重み付き交差エントロピーと比べて、精度–再現率のトレードオフが改善されている。
  • 著者らは、フォーカル損失を用いたViTの結果を、SARに加えて光学、熱、気象データを組み合わせる将来の融合(fusion)研究のための、よりクリーンな参照点として位置付けている。