EventADL:クラウド型サービスシステム向けイベントのためのオープンボックス異常検知・ローカライゼーションフレームワーク

arXiv cs.LG / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文は、これまでADL(異常検知・ローカライゼーション)が主にメトリクスやログに偏っていたのに対し、イベントデータに着目したオープンボックスのイベントベースADLフレームワーク「EventADL」を提案します。
  • 520件の実世界のインシデントに対する体系的な分析により、異常とその根本原因がイベントストリーム上でどのように現れるかを整理しています。
  • EventADLは「オフライン学習」「オンライン異常検知」「根本原因ローカライゼーション」の3段階で動作し、学習段階ではイベント意味パターン(通常のエンティティ間の相互作用)とイベント頻度パターン(既知パターンの通常の出現率)を学習します。
  • 説明可能で自動化された根本原因特定のために、検知された異常と直近のシステム相互作用の関係をモデル化するIntervention Graphを構築します。
  • 3つのクラウドサービスと2つの実世界インシデントでの評価では、検知のF1スコア少なくとも90%、根本原因のtop-3精度100%を達成し、既存手法より優れた性能を示しています。