スパース性が鍵:潜在構造の新たな洞察を用いた分布外(OOD)検出の解明

arXiv cs.CV / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、Sparse Autoencoder(SAE)をVision Transformer(ViT)の[CLS]トークンに適用し、分布外(OOD)検出を改善します。
  • Top-k SAEによる枠組みを提案し、密な[CLS]特徴を構造化された潜在空間に分解( disentangle )することで、従来のもつれた特徴に依存する手法の制約を回避します。
  • in-distribution(ID)データではクラスごとに一貫した活性パターンが現れることを見いだし、それを「Class Activation Profiles(CAPs)」として形式化します。
  • CAPsにおけるコア・エネルギープロファイルの発散(divergence)に基づくスコア関数を導入し、複数ベンチマークでFPR95が強く、AUROCも競争力のある結果を示します。
  • 総じて、SAEが得るスパースで解釈可能な特徴が、視覚モデルにおける頑健なOOD検出の有力な手段になることを示唆しています。