負荷テストからライブストリームへ:マイクロサービスアーキテクチャにおけるグラフ埋め込みベースの異常検知

arXiv cs.LG / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • Prime Videoの負荷テストでは、実際のライブイベントおよびVODトラフィックに固有のふるまいを十分に捉えられないことがあり、その違いに着目した異常検知手法が求められる。
  • 本論文では、教師なしのグラフ埋め込みアプローチ(GCN-GAE)を提案し、1分単位の解像度で有向かつ重み付きのサービスグラフにおけるノードレベル表現を学習する。そして、負荷テストとイベントの埋め込み間のコサイン類似度により、十分に表現されていないサービスを検出する。
  • 報告された結果では、システムがインシデント関連のサービスを特定でき、早期検知能力も示される。さらに、合成的な異常注入フレームワークにより、高い精度(96%)と低い誤検知率(0.08%)が確認された。
  • 本研究では、保守的な伝播仮定の下での再現率が依然として限定的(58%)であり、現在の異常伝播モデルにおける制約が浮き彫りになっている。
  • Prime Videoへの適用に加えて、本研究は手法上の学びを提供し、より広いマイクロサービス・エコシステムに同様の技術を適用するための基礎となるベースラインを提示する。