現実的なオープンボキャブラリー遠隔検知セグメンテーションに向けて:ベンチマークとベースライン
arXiv cs.CV / 2026/4/20
📰 ニュースSignals & Early TrendsModels & Research
要点
- 本論文では、オープンワールドの地理空間ニーズをより反映した形でオープンボキャブラリー遠隔検知画像セグメンテーションを評価するための、大規模でアプリケーション指向のベンチマークOVRSISBenchV2を提案しています。
- OVRSIS95K(約9.5万の画像–マスクペア、35のセマンティックカテゴリ)を導入し、さらに10のダウンストリームデータセットで拡張することで、評価規模を17万枚の画像・128カテゴリへ増やし、多様性と難易度を高めています。
- OVRSISBenchV2は一般的なオープンボキャブラリーセグメンテーションにとどまらず、建物抽出、道路抽出、洪水検出のためのダウンストリーム手順も含め、実運用に近い要求を反映しています。
- 著者らはPi-Segというベースラインを提案し、「ポジティブ・インセンティブ・ノイズ」メカニズムを用いて、学習可能で意味に導かれた摂動により学習中の視覚-テキスト特徴空間を広げ、転移性を高めています。
- OVRSISBenchV1、OVRSISBenchV2、ダウンストリームタスクにまたがる実験の結果、Pi-Segは特に難易度の高いOVRSISBenchV2で強力かつ一貫した性能を示し、コードとデータセットは公開されています。


