Excite, Attend and Segment (EASe): 特徴キャリブレーションと自己教師ありアップサンプリングによるドメイン非依存の微細なマスク発見
arXiv cs.CV / 2026/4/2
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、複雑で多成分からなる形態を持つシーンにおいて微細なマスクを発見することを目的とした、教師なし・ドメイン非依存のセマンティックセグメンテーションフレームワーク「EASe」を提案する。
- EASeは、粗いパッチレベルでのマスク発見を改善し、セマンティック・アウェア・アップサンプリング(Semantic-Aware Upsampling)とチャネル励起(Channel Excitation)を用いて、低解像度の基盤モデル特徴を選択的にキャリブレーションする(SAUCE)ことで、ピクセルレベルの特徴表現上で動作する。
- さらに、空間エンコードされた画像特徴と基盤モデル特徴を統合する注意(attention)によって、完全解像度のセマンティック構造を復元する。
- 追加学習なしで多粒度のマスクを生成するために、EASeは、SAUCEの注意スコアを意味的なグルーピング指標として用いる、学習不要のCue-Attentive Feature Aggregator(CAFE)を採用する。
- 実験では、EASeが複数のベンチマークおよびデータセットにおいて、従来の最先端の教師なしセグメンテーション手法を上回ることが報告されており、著者らは公開コードも提供している。



