Decouple and Rectify:オープンボキャブラリー・リモートセンシング分割に対する意味保存的構造強調
arXiv cs.CV / 2026/4/3
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、CLIPのグローバルで言語に整列した視覚特徴が、細かな構造境界の描定ではしばしば性能が低下することを指摘し、オープンボキャブラリー・リモートセンシング分割に取り組む。
- それに対し、DR-Segというデカップル&リクト(分離して整流する)枠組みを提案する。CLIP特徴チャネルを、意味に支配されるサブスペースと構造に支配されるサブスペースに分割し、言語整列された意味的特徴を損なうことなく、DINOベースの構造強調を適用する。
- 事前知識に基づくグラフ整流モジュールが、DINOの指導のもと高忠実度の構造プライアを注入し、空間的な境界描写を改善するための洗練された分岐を生成する。
- 不確実性に導かれる適応的融合モジュールが、洗練されたDINO/整流分岐と元のCLIP分岐を、不確実性に応じて動的に組み合わせ、最終予測を行う。
- 8つのリモートセンシングベンチマークでの実験により、DR-Segが最先端(SOTA)の性能を達成し、オープンボキャブラリーな意味的グラウンディングを維持しつつ境界品質が向上したことを示している。




