DQA:ITサポートのための診断質問応答

arXiv cs.CL / 2026/4/8

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、問題解決において根本原因を特定するために反復的な証拠収集が必要となる、エンタープライズITサポート対話向けのフレームワークであるDQA(Diagnostic Question Answering)を導入する。
  • 標準的なマルチターンRAGとは異なり、DQAは永続的な診断状態を維持し、取得したケースを根本原因ごとに集約することで、ターンをまたいで証拠をより効果的に蓄積し、競合する仮説を管理する。
  • DQAは、会話的なクエリ書き換え、リトリーバルの集約、そして状態に条件付けされた応答生成を用いることで、エンタープライズ環境の遅延および文脈の制約下で体系的なトラブルシューティング応答を生成する。
  • リプレイベースのプロトコルを用いた、匿名化されたエンタープライズITサポートシナリオ150件での評価では、DQAは成功率78.7%を達成し、マルチターンRAGのベースライン(41.3%)を上回った。さらに平均ターン数を8.4から3.9に削減した。

Abstract

エンタープライズITサポートのやり取りは本質的に診断的であり、効果的な解決には、曖昧なユーザ報告から反復的に証拠を収集して、根本原因を特定する必要があります。検索拡張生成(RAG)は過去の事例によって根拠を与えますが、標準的なマルチターンRAGシステムには明示的な診断状態がないため、ターンをまたいで証拠を蓄積し、対立する仮説を解消することに苦戦します。私たちは、根本原因のレベルで取得した事例を集約し、永続的な診断状態を維持する診断型質問応答フレームワークであるDQAを提案します。DQAは、会話的なクエリ書き換え、検索集約、状態に条件付けされた応答生成を組み合わせることで、エンタープライズのレイテンシおよび文脈制約下での体系的なトラブルシューティングを支援します。私たちは、リプレイベースのプロトコルを用いて、匿名化されたエンタープライズITサポートシナリオ150件でDQAを評価します。3回の独立した実行にわたって平均すると、軌跡(トラジェクトリ)レベルの成功基準でDQAは78.7%の成功率を達成し、マルチターンRAGのベースラインは41.3%でした。また、平均ターン数は8.4から3.9に減少しました。