STLGT:マイクロサービスにおけるテールレイテンシ予測のためのスケーラブルなトレースベース線形グラフ・トランスフォーマ

arXiv cs.AI / 2026/4/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、マイクロサービス環境のAPI向けにエンドツーエンドのp95テールレイテンシを予測し、SLO管理を先回りで行うことを目的としたSTLGTを提案する。
  • STLGTはサービスのトレースをスパン・グラフとして表現し、推論時間がグラフサイズに対して線形にスケールする形でサービス間の依存関係を伝播させ、スケール時の効率課題に対処する。
  • 非定常でバースト的なワークロードの動態を捉えるために、分離された時間(temporal)モジュールを用いる。
  • DeathStarBench(パーソナライズ教育マイクロサービス)とAlibabaトレースでの実験では、PERT-GNNに対して平均でMAPEが8.5%改善し、前処理後のN=32でCPU推論が最大12倍高速化することを示す。
  • アブレーション結果から、構造認識型の線形グラフ・トランスフォーマと時間モジュールの双方が、特にバーストトラフィック下で有効であることが確認される。

Abstract

マイクロサービスシステムにおけるプロアクティブなSLO管理には、正確なエンドツーエンドのテールレイテンシ予測が不可欠である。しかし、推論効率を大規模に維持しつつ、長期依存の伝播をモデリングし、非定常でバースト的なワークロードに対処することは依然として困難である。我々は、複数ステップのp95テールレイテンシ予測のためにトレースをスパン・グラフとしてエンコードする、APIごとの予測器であるSTLGT(Scalable Trace-based Linear Graph Transformer)を提案する。STLGTは、構造を意識した線形グラフTransformerを用いて、スパン・グラフサイズに対して推論時間が線形となる形でサービス間の依存関係を伝播させ、さらにデカップルされた時間モジュールによってワークロードのダイナミクスを捉える。個別最適化された教育マイクロサービスアプリケーションであるDeathStarBench、およびAlibabaのトレースにおいて、STLGTはPERT-GNNに比べて平均で8.5% MAPEの予測精度向上を達成し、さらにN=32で最大12倍高速なCPU推論を実現する。これは、Alibabaトレースの前処理後に得られる最大スパン・グラフサイズに整合している。アブレーション研究は、各コンポーネントの有効性、特にバースト的なトラフィック下での有効性をさらに示している。