Copilotのフィードバックから選択的LLM自律性を学ぶ:企業のカスタマーサポート業務ワークフロー

arXiv cs.CL / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureIndustry & Market MovesModels & Research

要点

  • 本論文は、BPM(ビジネス・プロセス・マネジメント)プラットフォーム内で企業のカスタマーサポート業務を、選択的(高い確信度の)自律性でエンドツーエンド自動化する導入済みシステムを報告しています。
  • 1つの新規プロセスに対して2週間で自動化を実現するなど、スケール性を重視し、ケースごとのUI操作トレースによる大規模な監督情報と、低オーバーヘッドなCopilotのフィードバックを活用します。
  • ステージ型のデプロイ手順では、次のUIアクション方策を学習し、Copilotフィードバックから“critic”を学んで棄権(abstention)を調整したうえで、信頼できる手順のみをバックグラウンドで実行し、不確実な判断はオペレーターに委ねます。
  • 運用では、1人のオペレーターが複数の同時セッションを監督でき、システムが不確実性を検知したときだけ中断される設計で、監視と安全なフォールバックも備えています。
  • 本番実績として、45%のセッションを自動化し、平均対応時間を39%短縮しつつ、サポート品質を損なわなかったと述べています。