STLGT：マイクロサービスにおけるテールレイテンシ予測のためのスケーラブルなトレースベース線形グラフ・トランスフォーマ

arXiv cs.AI / 2026/4/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、マイクロサービス環境のAPI向けにエンドツーエンドのp95テールレイテンシを予測し、SLO管理を先回りで行うことを目的としたSTLGTを提案する。
STLGTはサービスのトレースをスパン・グラフとして表現し、推論時間がグラフサイズに対して線形にスケールする形でサービス間の依存関係を伝播させ、スケール時の効率課題に対処する。
非定常でバースト的なワークロードの動態を捉えるために、分離された時間（temporal）モジュールを用いる。
DeathStarBench（パーソナライズ教育マイクロサービス）とAlibabaトレースでの実験では、PERT-GNNに対して平均でMAPEが8.5%改善し、前処理後のN=32でCPU推論が最大12倍高速化することを示す。
アブレーション結果から、構造認識型の線形グラフ・トランスフォーマと時間モジュールの双方が、特にバーストトラフィック下で有効であることが確認される。

Abstract

マイクロサービスシステムにおけるプロアクティブなSLO管理には、正確なエンドツーエンドのテールレイテンシ予測が不可欠である。しかし、推論効率を大規模に維持しつつ、長期依存の伝播をモデリングし、非定常でバースト的なワークロードに対処することは依然として困難である。我々は、複数ステップのp95テールレイテンシ予測のためにトレースをスパン・グラフとしてエンコードする、APIごとの予測器であるSTLGT（Scalable Trace-based Linear Graph Transformer）を提案する。STLGTは、構造を意識した線形グラフTransformerを用いて、スパン・グラフサイズに対して推論時間が線形となる形でサービス間の依存関係を伝播させ、さらにデカップルされた時間モジュールによってワークロードのダイナミクスを捉える。個別最適化された教育マイクロサービスアプリケーションであるDeathStarBench、およびAlibabaのトレースにおいて、STLGTはPERT-GNNに比べて平均で8.5% MAPEの予測精度向上を達成し、さらにN=32で最大12倍高速なCPU推論を実現する。これは、Alibabaトレースの前処理後に得られる最大スパン・グラフサイズに整合している。アブレーション研究は、各コンポーネントの有効性、特にバースト的なトラフィック下での有効性をさらに示している。

中国がハードもソフトも圧倒的に先行、日本はコア部品の技術で巻き返しへ

日経XTECH

ベクタDBとANN vs PHEの対立：実用的な回避策はある？

Reddit r/MachineLearning

エージェントの「アムネジア」とヘンリー・モライソンの事例

Dev.to

Azure Weekly：GPT-5.5がFoundryに到着する中、MicrosoftとOpenAIが提携を再編

Dev.to

2026年のOpenAI Codexにおける実証済みのパターン：プロンプト、検証、ゲートウェイのガバナンス

Dev.to

STLGT：マイクロサービスにおけるテールレイテンシ予測のためのスケーラブルなトレースベース線形グラフ・トランスフォーマ

要点

Abstract

関連記事

中国がハードもソフトも圧倒的に先行、日本はコア部品の技術で巻き返しへ

ベクタDBとANN vs PHEの対立：実用的な回避策はある？

エージェントの「アムネジア」とヘンリー・モライソンの事例

Azure Weekly：GPT-5.5がFoundryに到着する中、MicrosoftとOpenAIが提携を再編

2026年のOpenAI Codexにおける実証済みのパターン：プロンプト、検証、ゲートウェイのガバナンス

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer