ActionNex:クラウド向けの仮想アウトレージ・マネージャ

arXiv cs.AI / 2026/4/7

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • ActionNexは、エンドツーエンドのクラウド障害(アウトレージ)管理のためのプロダクショングレードなエージェント型システムとして提示されており、リアルタイムの更新と、役割/ステージに条件付けされた次善アクションの推奨を提供します。
  • このシステムは、マルチモーダルな運用入力(障害コンテンツ、テレメトリ、人間のコミュニケーション)を取り込み、それらを意味のある状態遷移を捉える重要イベントへと変換します。
  • ActionNexは、階層型メモリ(プレイブックから蒸留したキー条件-アクション知識、過去の障害に関するエピソード記憶、ライブ文脈のワーキングメモリ)と、現在のイベントを前提条件に整合させ、関連知識を取得する推論エージェントを組み合わせます。
  • 8件の実際のAzure障害を用いて、ActionNexは2つのグラウンドトゥルースとなるアクション集合に対して、報告ベースで71.4%の適合率(precision)と52.8〜54.8%の再現率(recall)を達成したとされています。
  • この研究は大規模データセット(800万トークン、4,000のクリティカルイベント)で評価されており、プロダクション環境で試験導入されて早期の肯定的なフィードバックが得られています。

要旨: 大規模クラウド運用における障害対応(アウトエイジ管理)は、依然として強く手作業に依存しており、部分的な観測可能性のもとで迅速な切り分け、チーム横断の調整、経験に基づく意思決定が必要です。私たちは、
\textbf{ActionNex} を提案します。ActionNex は本番環境向けのエージェント型システムであり、リアルタイム更新、知識蒸留、役割および段階に条件づけられた次善アクション(next-best action)提案を含む、エンドツーエンドの障害支援を可能にします。ActionNex はマルチモーダルな運用シグナル(例:障害コンテンツ、テレメトリ、人間のコミュニケーション)を取り込み、それらを意味のある状態遷移を表す重要イベントへと圧縮します。これにより、知覚レイヤを階層型メモリサブシステムと結合します。具体的には、プレイブックおよび過去の実行から蒸留した長期の Key-Condition-Action(KCA)知識、過去の障害に関するエピソード記憶、そしてライブな文脈に関する作業記憶です。推論エージェントは、現在の重要イベントを前提条件に整合させ、関連する記憶を取得し、実行可能な提案を生成します。実行された人間の行動は、人間とエージェントのハイブリッドシステムにおいて、継続的な自己進化を可能にする暗黙のフィードバック信号として機能します。私たちは、8つの実際の Azure 障害(8M トークン、4,000 の重要イベント)に対して ActionNex を評価しました。相補的な2種類のグラウンドトゥルース行動集合を用いた結果、71.4\% の適合率(precision)と、52.8〜54.8\% の再現率(recall)を達成しました。このシステムは本番環境で試験導入されており、初期の良好なフィードバックが得られています。