要旨: 深層学習モデルは、信頼性の高い分布外(OOD)検出が不可欠である安全性が重要なアプリケーションに、ますます導入されています。既存の手法の多くは、ニューラルネットワークの直前(penultimate)層の活性値に主に依存し、それらが最も情報量の多い分布内(ID)の表現を含んでいると仮定しています。本研究ではこの仮定を見直し、中間層がOOD検出のために同様に豊富で識別力のある情報をエンコードしていることを示します。これに基づき、複数層にまたがる内部表現を活用する、単純ながらも効果的なモデル非依存(model-agnostic)アプローチを提案します。提案手法は、連続する畳み込みブロックから特徴を集約し、クラスごとの平均埋め込み(mean embeddings)を計算したうえで、L_2正規化を適用し、クラスの意味論を捉えたコンパクトなIDプロトタイプを形成します。推論時には、テスト特徴とこれらのプロトタイプ間の余弦類似度をOODスコアとして用います--IDサンプルは少なくとも1つのプロトタイプに対して強い親和性を示すのに対し、OODサンプルは一様に遠いままです。多様なアーキテクチャにわたる最先端のOODベンチマークでの大規模な実験により、本手法が頑健でアーキテクチャに依存しない性能と、画像分類における強い汎化を実現することが示されます。特に、AUROCを最大4.41%向上させ、FPRを13.58%削減します。これは、OOD検出において未だ十分に探索されていない信号である「多層の特徴集約」が強力であることを示すとともに、直前層に基づく手法の優位性に挑戦する結果です。コードは以下で公開しています: https://github.com/sgchr273/cosine-layers.git。
Prototype Fusion:訓練不要のマルチレイヤーによるOOD検出手法
arXiv cs.CV / 2026/3/26
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、分布外(OOD)検出において、中間のニューラルネットワーク層の情報が、直前層(penultimate-layer)活性と同程度に有用になり得ると主張し、従来の前提に挑戦する。
- 様々な畳み込みブロックから特徴を集約し、L2正規化を施したクラスごとの平均「プロトタイプ」埋め込みを構築し、推論時にコサイン類似度でOODスコアリングを行う、訓練不要でモデルに依存しない手法を提案する。
- 複数の画像分類OODベンチマークおよび多様なアーキテクチャに対する実験により、堅牢でアーキテクチャ非依存の性能と強い汎化が示される。
- 報告されている改善として、最大でAUROCが4.41%向上し、FPRが13.58%低下しており、OOD検出における重要なシグナルとしてマルチレイヤー特徴集約が支持される。
- 著者らは、GitHubを通じて関連コードを公開しており、コサイン層プロトタイプ手法の再現とさらなる評価を容易にしている。