Safe Bilevel Delegation(SBD):マルチエージェントシステムにおける実行時委譲の安全性を形式化する枠組み

arXiv cs.AI / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、高リスク環境でLLMエージェントが動作する状況を想定し、階層型マルチエージェントシステムにおける実行時の安全な委譲判断を行うための形式的枠組み「Safe Bilevel Delegation(SBD)」を提案している。
  • SBDは委譲を二階最適化問題として定式化し、外側のメタ重みネットワークが状況依存の安全性と効率性のトレードオフ重みを学習し、内側のループが確率的な安全性制約を満たすように委譲方策を最適化する。
  • 委譲の連続度パラメータ(alpha)は、タスク文脈に応じて人の全面的な上書き(alpha=0)から完全自律実行(alpha=1)までを滑らかに補間する。
  • 著者らは、安全単調性、射影勾配降下による内側最適化の収束、ならびにマルチホップ委譲チェーン全体での説明責任(アカウンタビリティ)を分配する上限制約といった3つの理論結果を証明している。
  • 医療AI、金融リスク制御、教育におけるエージェント監督という3つの高リスク領域で、指定されたデータセット、安全性制約セット、ベースライン、評価手順に基づく実証検証を行う計画を述べている。