要旨: 最先端の事後(post-hoc)な分布外(out-of-distribution)検出手法は、中間層の活性化(activation)編集に依存しています。しかし、それらはデータセットやモデル間で一貫性のない性能を示します。本研究では、この不安定性が活性化分布の違いによって引き起こされることを示し、終盤層(penultimate layer)の活性化が補正(rectified)されていない場合に生じる、スケーリングに基づく手法の失敗モードを特定します。この分析に動機づけられて、
ours を提案します。これは、ハイパーパラメータを必要としない事後手法であり、ソートされた活性化の大きさを、固定された in-distribution(学習内分布)の参照プロファイルに置き換えます。私たちのシンプルなプラグアンドプレイ方式は、終盤層の活性化関数に関する仮定を置かず、またハイパーパラメータ調整も不要でありながら、データセットおよびアーキテクチャをまたいで強力かつ一貫した性能を示します。さらに、構成(construction)により in-distribution の分類精度を保持したまま動作します。加えて、改善を駆動する要因を分析し、活性化の抑制(inhibiting)と促進(exciting)の両方のシフトが、それぞれ独立により良い分布外識別に寄与していることを示します。
事後的(ポストホック)な外部分布(OOD)検出のための順位付けされた活性シフト
arXiv cs.LG / 2026/4/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- ポストホックな外れ値(OOD)検出は中間層の活性編集に依存するが、データセットやモデルで性能が安定しない原因が活性分布の違いにあることを分析している。
- ペナルティ層(penultimate layer)の活性が適切に補正されない場合に、スケーリング系手法で顕在化する失敗モードを特定している。
- 提案手法「Ranked Activation Shift」は、ソートした活性の大きさを固定のin-distribution参照プロファイルで置き換えることで、ハイパーパラメータ不要のプラグアンドプレイ方式として一貫したOOD検出性能を示す。
- in-distribution分類精度は構成上維持され、改善には活性の抑制(inhibiting shift)と活性の興奮(exciting shift)がそれぞれ独立に寄与することを追加分析している。




