DINOが飛躍:リモートセンシング画像のオープンボキャブラリ意味セグメンテーションに向けたDINOv3
arXiv cs.CV / 2026/5/6
📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research
要点
- 本論文は、リモートセンシング画像のオープンボキャブラリ意味セグメンテーション向けに、RS固有の高コストな教師あり微調整を避けることを目的としたCAFe-DINOを提案します。
- CAFe-DINOは、RSデータで事前学習を行わずにGEO-benchセグメンテーションでSOTAを上回ったDINOv3の性能と、DINO.txtによるオープンボキャブラリセグメンテーション機能を活用します。
- コスト集約と学習不要(training-free)の特徴アップサンプリングにより、DINOv3のテキスト-画像類似度を強化し、微調整はRSを意識したCOCO-Stuffのサブセットに限定します。
- 実験では主要なRSセグメンテーションデータセットで最先端性能を達成し、RSデータで微調整したOVSS手法よりも良い結果を示します。
- 著者は再現性のために、指定されたGitHubリポジトリでコードとデータを公開しています。




