SPG: ゼロショット異常検知のための疎投影ガイド(Sparse-Projected Guides)と疎オートエンコーダ(Sparse Autoencoders)
arXiv cs.CV / 2026/4/6
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ターゲット領域の追加学習(ターゲットドメイン適応なし)を行わない「ゼロショット異常検知・セグメンテーション」を、凍結した基盤モデル特徴を用いて実現する枠組みを扱っています。
- 提案手法SPG(Sparse-Projected Guides)は、プロンプトベクトルを用いず、Sparse Autoencoder(SAE)の潜在空間で疎なガイド係数を学習して、辞書(dictionary)から通常/異常のガイドベクトルを生成する「プロンプトフリー」アプローチです。
- 学習は補助データセット上で2段階に分けられ、(1)パッチトークン特徴からSAEを学習し、(2)ピクセルレベルのマスクに基づいてガイド係数のみを最適化してバックボーンとSAEを凍結します。
- MVTec ADやVisAのクロスデータセット設定で、画像レベル検知およびピクセルレベルのセグメンテーションにおいて競争力のある結果が示され、DINOv3では比較手法中で最高のピクセルAUROCを達成したと報告されています。
- さらに、OpenCLIPベースに適用する構成も示され、学習されたガイド係数が少数の辞書アトムに意思決定を追跡できることで、カテゴリ一般/カテゴリ固有の要因の解釈可能性にも言及しています。



