スパース性が鍵:潜在構造の新たな洞察を用いた分布外(OOD)検出の解明
arXiv cs.CV / 2026/4/30
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文では、Sparse Autoencoder(SAE)をVision Transformer(ViT)の[CLS]トークンに適用し、分布外(OOD)検出を改善します。
- Top-k SAEによる枠組みを提案し、密な[CLS]特徴を構造化された潜在空間に分解( disentangle )することで、従来のもつれた特徴に依存する手法の制約を回避します。
- in-distribution(ID)データではクラスごとに一貫した活性パターンが現れることを見いだし、それを「Class Activation Profiles(CAPs)」として形式化します。
- CAPsにおけるコア・エネルギープロファイルの発散(divergence)に基づくスコア関数を導入し、複数ベンチマークでFPR95が強く、AUROCも競争力のある結果を示します。
- 総じて、SAEが得るスパースで解釈可能な特徴が、視覚モデルにおける頑健なOOD検出の有力な手段になることを示唆しています。