OpenKedge:実行境界付き安全性とエビデンスチェーンによるエージェント的突然変異のガバナンス

arXiv cs.AI / 2026/4/13

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、APIがトリガーする突然変異が、十分な文脈・調整・保証なしに確率的な意思決定から直接実行される場合、自律エージェントは危険になり得ると主張する。
  • それを踏まえ、OpenKedgeというプロトコルを提案する。これは、突然変異を、実行前に宣言的な意図(intents)の提案を要求し、それを決定論的に導出された状態、時間的シグナル、ポリシー制約と照合してから実行することで、統制されたワークフローへと変換する。
  • OpenKedgeは、承認された意図を実行契約(execution contracts)へとコンパイルし、実行できる行為、リソースのスコープ、時間を厳密に制限する。これは、より強い実行境界付き安全性のために、エフェメラル(期限付き)のタスク指向アイデンティティを通じて強制される。
  • 主要な貢献として、Intent-to-Execution Evidence Chain(IEEC)を提示する。これは、意図、文脈、ポリシー上の判断、実行の境界(bounds)、そして結果を暗号学的に結び付けることで、決定論的な監査可能性と推論を可能にする。
  • 複数エージェントの競合やクラウド基盤の突然変異といった評価では、本プロトコルがスループットを損なうことなく、危険な実行を封じつつ、競合する意図を決定論的に調停できることが示唆される。

Abstract

自律型AIエージェントの台頭は、API中心のアーキテクチャに内在する根本的な欠陥を露呈させます。すなわち、確率的システムが、十分な文脈、協調、または安全性の保証なしに状態変異を直接実行してしまう点です。私たちはOpenKedgeを導入します。これは、変異を「API呼び出しの即時の結果」ではなく「統治されたプロセス」として再定義するプロトコルです。OpenKedgeでは、アクターが宣言的な意図(intent)の提案を提出し、それらを実行前に、決定論的に導出されたシステム状態、時間的シグナル、ならびにポリシー制約に照らして評価します。承認された意図は、許可された操作、リソースのスコープ、時間を厳密に制約する実行契約へとコンパイルされ、エフェメラルでタスク指向のアイデンティティを通じて強制されます。これにより、安全性を「事後的なフィルタリング」から「予防的で、実行に結び付いた強制」へと移行します。重要な点として、OpenKedgeは、意図、文脈、ポリシー判断、実行境界、および結果を暗号学的に1つの系譜(lineage)へ結び付ける、Intent-to-Execution Evidence Chain(IEEC)を導入します。これにより、変異が検証可能で再構築可能なプロセスへと変わり、システム挙動についての決定論的な監査可能性と推論を可能にします。私たちは、OpenKedgeを複数エージェントの競合シナリオおよびクラウド基盤のインフラ変異にわたって評価します。結果は、プロトコルが競合する意図を決定論的に調停しつつ、高いスループットを維持しながら安全でない実行を封じ込めることを示し、エージェント型システムを大規模に安全に運用するための、原理に基づいた基盤を確立します。