身体化エージェントの活用:政策制約付き実行のためのランタイム統治

arXiv cs.RO / 2026/4/10

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、身体化エージェントにおける重要な転換点として、受動的な推論から、ツールや環境を実際に実行するシステムへ移行することで、ランタイムで統治され、政策に制約された行動制御が必要になることを強調している。
  • エージェントのループ内に安全性やリカバリを組み込むと、実行の標準化・監査・適応が難しくなるため、統治を専用のランタイム層へ外部化することを提案する。
  • 提案フレームワークは、エージェントの認知と実行の監督を分離し、政策チェック、ケイパビリティの受け入れ(admission)、実行モニタリング、ロールバック処理、人間によるオーバーライドといった機能を追加する。
  • 著者らは、身体化エージェント、身体化ケイパビリティモジュール(ECM)、およびランタイム統治層の間の制御境界を形式化し、1,000回のランダム化シミュレーション試行で評価する。
  • 報告された結果では、許可されていない行動の防止(96.2%のインターセプト)における大きな改善、ドリフト下での危険な継続の減少(100%から22.2%へ)、および政策完全遵守時のリカバリ成功率の向上(91.4%)が示されている。

Abstract

身体性を持つエージェントは、受動的な推論システムから、ツール、ロボット、そして物理環境と相互作用する能動的な実行者へと進化している。いったん実行権限が付与されると、中心的な課題は、実行時に行動をどのように制御可能に保つかである。既存のアプローチでは、安全性や復旧のためのロジックをエージェントのループ内部に埋め込むため、実行制御の標準化、監査、適応が困難になる。 本論文は、身体性を持つ知能には、より強力なエージェントだけでなく、より強力な実行時ガバナンスが必要だと主張する。エージェントの認知から実行の監督を切り離す、ポリシー制約付き実行のためのフレームワークを提案する。ガバナンスは、ポリシーチェック、能力の許可(admission)、実行監視、ロールバック処理、そして人間による上書き(human override)を行う専用の実行時レイヤーへと外部化される。 本論文では、身体性を持つエージェント、身体的能力モジュール(Embodied Capability Modules: ECMs)、そして実行時ガバナンスレイヤーの間の制御境界を形式化し、3つのガバナンス次元にわたって1000回のランダム化シミュレーション試行により検証する。その結果、未許可の行動の96.2%を遮断し、実行時ドリフト下での危険な継続は100%から22.2%へと低減し、さらにポリシー完全準拠のもとでの復旧成功率は91.4%であった。これらは(p<0.001で)すべてのベースラインを大幅に上回る。実行時ガバナンスを第一級のシステム問題として捉え直すことで、本論文は、身体性を持つエージェントシステムにおける重要な設計原則として、ポリシー制約付き実行を位置付ける。