根本原因分析のためのLLM拡張ナレッジベース構築

arXiv cs.CL / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、通信ネットワークの障害(アウトエイジ)時に「99.999%(five 9s)」の信頼性を保証できない状況でも、根本原因分析(RCA)を迅速化し質を向上させるために、サポートチケットからRCAのナレッジベースを構築することを提案する。
  • 素性(レキシカル)と意味(セマンティック)の類似度指標の両方を用いて、LLMベースのナレッジベース構築手法として、微調整(fine-tuning)、検索拡張生成(RAG)、およびハイブリッド手法の3つを評価する。
  • 実際の産業データセットでの実験により、生成されたナレッジベースが、RCAを加速するための初期リソースとして有効であり、ネットワークのより高いレジリエンス(耐障害性)を支えることが示される。
  • 本研究は、性能比較のための手法に焦点を当てており、非構造化チケットデータを実行可能なRCAアセットへと変える実務上の可能性を示す。
  • 全体として、本取り組みは、障害診断にかかる時間を短縮し、より良いRCA出力によって再発する混乱を防ぐことで、業務の継続性(オペレーショナル・コンティニュイティ)を目指している。

Abstract

通信ネットワークは現在、デジタル世界の基盤を形成しており、高速かつ信頼性の高い接続が実現されています。しかし、適切な冗長化やフェイルオーバーの仕組みがあっても、「5 9s」(99.999 %)の信頼性を保証することは困難であり、障害の際には迅速かつ正確な原因究明(RCA)が必要になります。障害が発生した場合、サービスを復旧し、将来の混乱を防ぐために、迅速かつ正確なRCAが不可欠です。 本研究では、サポートチケットからルート原因分析(RCA)知識ベースを構築するための3つの大規模言語モデル(LLM)手法――ファインチューニング、RAG、ハイブリッドアプローチ――を評価します。包括的な語彙的および意味的類似度指標の一式を用いてそれらの性能を比較します。実際の産業データセットで行った実験により、生成された知識ベースがRCAタスクの加速とネットワークのレジリエンス向上に向けた優れた出発点を提供することが示されました。