エンタープライズAIのための安全かつポリシー準拠なマルチエージェント・オーケストレーション

arXiv cs.AI / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、厳格なポリシー制約と完全な監査可能性を満たす必要があるエンタープライズAI向けに、マルチエージェントを統制するデプロイ時のオーケストレーション層としてCAMCOを提案しています。
学習時に制約を暗黙に扱うのではなく、CAMCOは協調を制約付き最適化として定式化し、制約射影エンジンでポリシーに適合する行動を強制します。
CAMCOは、リスク重み付きラグランジアン効用の適応的な設計と、有界収束が理論的に保証された反復ネゴシエーション手順を組み合わせています。
3つのエンタープライズシナリオでの評価では、ポリシー違反ゼロ、リスク曝露が閾値未満（平均比0.71）、効用の保持率92〜97%、収束が平均2.4イテレーションと高速であることが示されています。
CAMCOは、特定のエージェント構成に依存しないミドルウェアとして設計され、OPAのような本番ポリシーエンジンにポリシー述語を直接統合できる点が特徴です。

Abstract

エンタープライズAIシステムは、ミッションクリティカルなワークフローにおいて、厳格なポリシー制約を満たし、リスクへのエクスポージャーを上限内に抑え、かつ包括的な監査可能性（SOX、HIPAA、GDPR）を備える必要があることから、複数の知的エージェントを展開するケースがますます増えています。既存の協調手法――協調型MARL、コンセンサスプロトコル、中央集権的なプランナー――はいずれも、制約を暗黙に扱いながら期待報酬を最適化します。本論文では、CAMCO（Constraint-Aware Multi-Agent Cognitive Orchestration）を提案します。CAMCOは、制約付き最適化問題として複数エージェントの意思決定をモデル化する、ランタイムの協調レイヤーです。CAMCOは3つの仕組みを統合します：（i）凸射影による制約射影エンジンで、ポリシーを満たす行動を強制すること、（ii）適応的なリスク重み付きラグランジアン効用によるシェーピング、（iii）証明可能な収束上界を持つ反復型ネゴシエーションプロトコルです。訓練時の制約付き強化学習とは異なり、CAMCOは、どのようなエージェント構成とも互換なデプロイメント時ミドルウェアとして動作し、OPAのようなプロダクションエンジンへの直接統合を意図したポリシー述語を備えます。3つのエンタープライズシナリオで評価した結果（制約付きラグランジアンMARLのベースラインとの比較を含む）では、ポリシー違反がゼロであること、リスクへのエクスポージャーがしきい値以下であること（平均比0.71）、効用の保持率が92〜97%、収束までの平均反復回数が2.4回であることが示されました。