集団的エージェンシーの因果的基礎

arXiv cs.AI / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、複数の単純なエージェントが意図せずに連携して、個々のエージェントとは異なる目標や能力を持つ「集団的エージェント」になる可能性という、先進AIの安全性に関わる重要な課題を扱います。
  • 著者らは、「集団の共同行動が、合理的で目的に向けた行動としてうまく予測できるかどうか」という基準に基づき、集団を統一的な集団的エージェンシーとして見なす条件を提案します。
  • 集団的エージェンシーを、因果ゲーム(戦略的な複数エージェント相互作用の因果モデル)と、因果抽象化(複雑な低レベルモデルを単純化した高レベルモデルが忠実に表せる条件)で形式化しています。
  • この枠組みを、actor-criticモデルにおける多エージェントのインセンティブに関するパズルの解決や、異なる投票メカニズムがどの程度の集団的エージェンシーを生むかの定量評価に適用します。
  • 本研究は、多エージェントAIシステムで出現する集団的エージェントを理解・予測・制御するための理論的基盤を、理論と実証の両面から提供することを目指しています。

要旨:高度なAIシステムの安全性にとっての重要な課題の一つは、複数のより単純なエージェントが、意図せずに、個々のエージェントとは異なる能力や目標を持つ集合的なエージェントを形成してしまう可能性である。より一般に、エージェントの集団を統一された集合的エージェントとしてみなせるのはいつかを判断することは、生物学的および人工的システムの双方における相互作用とインセンティブの研究において基礎となる問いである。本研究では、この問いへの答えとして行動に基づく視点を採用し、集団の共同の行動を合理的で目的志向的であるとみなすことで、その集団の行動を首尾よく予測できる場合に、その集団に集合的な主体性(collective agency)を帰属させる。我々は、因果ゲーム(因果ゲームは、戦略的なマルチエージェント相互作用の因果モデルである)と、因果アブストラクション(単純で高レベルのモデルが、より複雑な低レベルのモデルを忠実に捉えるのはいつかを形式化する)を用いて、この集合的主体性の視点を形式化する。本枠組みを用いて、アクター・クリティックモデルにおけるマルチエージェントのインセンティブに関するパズルを解き、さらに異なる投票メカニズムによって示される集合的主体性の程度を定量的に評価することを行う。我々の枠組みは、マルチエージェントAIシステムにおいて創発的な集合的エージェントを理解し、予測し、制御するための理論的および実証的研究の基盤を提供することを目指している。

集団的エージェンシーの因果的基礎 | AI Navigate