スパース性が鍵：潜在構造の新たな洞察を用いた分布外（OOD）検出の解明

arXiv cs.CV / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、Sparse Autoencoder（SAE）をVision Transformer（ViT）の[CLS]トークンに適用し、分布外（OOD）検出を改善します。
Top-k SAEによる枠組みを提案し、密な[CLS]特徴を構造化された潜在空間に分解（ disentangle ）することで、従来のもつれた特徴に依存する手法の制約を回避します。
in-distribution（ID）データではクラスごとに一貫した活性パターンが現れることを見いだし、それを「Class Activation Profiles（CAPs）」として形式化します。
CAPsにおけるコア・エネルギープロファイルの発散（divergence）に基づくスコア関数を導入し、複数ベンチマークでFPR95が強く、AUROCも競争力のある結果を示します。
総じて、SAEが得るスパースで解釈可能な特徴が、視覚モデルにおける頑健なOOD検出の有力な手段になることを示唆しています。

日経XTECH

Dev.to

Dev.to

Dev.to

Dev.to