TF-SSD:学習不要の共顕著物体検出のための相乗的マスクフィルタによる強力なパイプライン
arXiv cs.CV / 2026/4/2
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、従来手法に典型的なクローズドセットの学習制約を超えてより良く一般化することを目的とした、学習不要の共顕著物体検出パイプラインTF-SSDを提案する。
- TF-SSDは、SAMを用いてラフなマスク提案を生成し、その後品質マスク生成器によって冗長なマスクをフィルタリングすることで、SAMとDINOを相乗的に活用する。
- SAMベースのフィルタは顕著性のセマンティクスを欠くため、TF-SSDはDINOの注意(attention)マップを用いて、各画像ごとに視覚的に顕著なマスクを選択する「画像内顕著性フィルタ」を追加する。
- 関連する画像群における一貫性を確保するために、さらに画像間のプロトタイプ類似度を比較し、最も高得点のマスクを最終予測として保持する「画像間プロトタイプセレクタ」を提案する。
- 実験では、TF-SSDが既存手法よりも高い性能を示し、最新の学習不要ベースラインに対して13.7%の改善が得られたと報告されている。コードはGitHubで公開されている。



