SHAP(Shapley Additive Explanations)を用いた異常検知アルゴリズムの挙動理解と相補性の分析

arXiv stat.ML / 2026/4/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、無教師の異常検知でアンサンブルを「本当に相補的」に設計することが難しい点に注目し、検知器が類似した手掛かりに依存して冗長な異常スコアを出しがちな問題を扱います。
  • 各異常検知器の意思決定メカニズムを、SHAP(SHapley Additive exPlanations)により入力特徴の重要度帰属パターンを定量化して特徴付けする手法を提案します。
  • SHAPベースの説明プロファイルが似ている検知器は、異常スコアが相関し、検出する異常が大きく重複する傾向があることを示します。
  • 逆に、説明の分岐(divergence)は相補的な検知行動を示す信頼できる指標であることを示し、選別基準として生の出力とは異なる観点を提示します。
  • さらに、説明の多様性だけでは不十分で、各検知器の個別性能の高さが効果的なアンサンブルには前提条件であることを明らかにし、説明の多様性を狙いつつ品質を維持することで、より多様で相補的、かつ有効なアンサンブルを構築できると結論づけています。

Abstract

教師なし異常検知は、データ分布の多様性とラベルの欠如により難しい問題です。これらの課題を軽減するために、しばしば複数の検知器を組み合わせるアンサンブル手法が採用されます。これは、個々の偏りを低減し、頑健性を高めることができます。しかし、本当に相補的なアンサンブルを構築することは依然として困難です。多くの検知器が類似した判断の手がかりに依存してしまい、冗長な異常スコアを生成してしまうためです。その結果、アンサンブル学習の可能性は、異なる種類の不規則性を本当に捉えているモデルを識別することの難しさによって制限されがちです。そこで本研究では、異常検知器をその意思決定メカニズムによって特徴付けるための手法を提案します。SHapley Additive exPlanations(SHAP)を用いて、各モデルが入力特徴に対してどの程度重要性を帰属させているかを定量化し、この帰属プロファイルを用いて検知器同士の類似性を測定します。説明が似ている検知器は、異常スコアが相関しやすく、概ね重なり合う異常を特定することを示します。逆に、説明の乖離は相補的な検知挙動を確実に示します。以上の結果は、アンサンブルにおけるモデル選択において、生の出力とは異なる基準として説明に基づく指標が有効であることを示しています。しかし同時に、多様性だけでは不十分であり、有効なアンサンブルを得るためには個々のモデルの高い性能が前提条件であることも示します。モデル品質を維持しつつ説明の多様性を明示的に狙うことで、より多様で、より相補的で、そして最終的に教師なし異常検知により有効なアンサンブルを構築できることを示します。