TingIS:大規模企業におけるノイズの多い顧客インシデントからのリアルタイム・リスクイベント発見

arXiv cs.CL / 2026/4/24

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文は、ノイズの多い顧客インシデント報告から、企業規模でリアルタイムに実行可能な技術リスクイベントを発見するためのエンドツーエンド・システム「TingIS」を提案しています。
  • TingISは、効率的なインデキシングとLLM(大規模言語モデル)による判断を組み合わせたマルチステージのイベント・リンキング・エンジンで、インシデント記述の統合要否を決定します。
  • ビジネス上の帰属を正確に行うためのカスケード型ルーティングと、ドメイン知識・統計的パターン・行動ベースのフィルタリングを活用する多面的なノイズ低減パイプラインを備えています。
  • 1分あたり2,000件超、1日30万件規模のメッセージを処理する本番環境で、TingISはP90のアラート遅延3.5分と高優先度インシデントの発見率95%を達成し、ベースラインをルーティング精度、クラスタリング品質、信号対ノイズ比で上回ったと報告されています。

要旨: 大規模なクラウドネイティブ・サービスにおいて、技術的異常のリアルタイム検出と抑止は極めて重要です。わずか数分の停止でさえ、莫大な財務損失とユーザーの信頼低下につながり得ます。顧客インシデントは、監視によって見落とされたリスクの発見に向けた重要なシグナルですが、このデータから実行可能なインテリジェンスを抽出することは、極めて大きなノイズ、高いスループット、そして多様な業務ラインにまたがるセマンティックな複雑性のため、依然として困難です。本論文では、企業レベルのインシデント発見のために設計されたエンドツーエンドのシステム TingIS を提案します。TingIS の中核には、イベントのマージに関する意思決定を行うために、効率的なインデックス手法と大規模言語モデル(LLM)を相乗的に用いるマルチステージのイベント・リンキング・エンジンがあります。このエンジンにより、多様なユーザー記述がわずか数件しかない状況からでも、実行可能なインシデントを安定して抽出できるようになります。さらに、このエンジンには、正確な業務アトリビューション(帰属)を行うためのカスケード型のルーティング機構と、ドメイン知識、統計的パターン、行動ベースのフィルタリングを統合した多次元のノイズ低減パイプラインが補完として備わっています。TingIS は、生産環境にデプロイされ、ピーク時のスループットが1分あたり2,000メッセージ超、1日あたり300,000メッセージを取り扱います。TingIS は P90 のアラート遅延 3.5分と、高優先度インシデントに対する 95の発見率を達成します。実世界データから構築したベンチマークは、TingIS がルーティング精度、クラスタリング品質、およびシグナル対ノイズ比において、ベースライン手法を大きく上回ることを示しています。