Arrowの不可能性を超えて:多剤(マルチエージェント)協働における公平性は創発的な性質である
arXiv cs.CL / 2026/4/16
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、言語モデル設定における公平性は、単一の中央集権的に最適化されたモデルによって保証されるのではなく、多剤(マルチエージェント)同士の相互作用から創発しうると主張する。
- 制御された病院のトリアージ(選別)シナリオを用い、構造化された討論ラウンドのもとで2つの交渉エージェントを配置した研究により、エージェントの倫理的「アライメント」(選択した枠組みへのRAGによって) が、交渉戦略と割当結果に強く影響することが示される。
- その結果、いずれのエージェントも単独では倫理的十分性(アデクアシー)を達成できない一方で、両者を組み合わせた最終的な割当は、個別に行った場合には到達しえない公平性の基準を満たしうることがわかる。
- 著者らは、アライメントされたエージェントがバイアスを、バイアスのあるエージェントを完全に上書きするのではなく、争点化(修正的な交渉)によって部分的に低減すること、またアライメントされたエージェントであっても枠組み嗜好に結びついた固有のバイアスは残存することを観察している。
- これらの挙動はArrowの不可能性定理に関連づけられ、多剤(マルチエージェント)の熟議(デリベレーション)によって、満たしがたい(両立不能な)集団的選択の制約を回避・迂回できる可能性が示唆される。さらに、公平性はエージェントごとではなくシステム/手続きレベルで評価されるべきであると結論づけている。
