マルチエージェント・ディベート・プロトコルが議論の質に与える影響：統制されたケーススタディ

arXiv cs.AI / 2026/4/1

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

結果は、ピア同士の相互作用（ピア参照）と合意形成（収束）の間にトレードオフがあることを示しており、特に合意形成が優先される場合には、プロトコルの選択が議論の質に実質的な変化をもたらし得ることがわかります。

Abstract

マルチエージェント・ディベート（MAD）システムでは、性能向上がしばしば報告されます。しかし、議論プロトコル（例：エージェント数、ラウンド数、集約ルール）は固定されることが多く、一方でモデルに関する要因が変動するため、プロトコルの効果とモデルの効果を切り分けることが困難です。そこで、これらの効果を分離するために、3つの主要プロトコル、Within-Round（WR；エージェントは現在のラウンドの貢献のみを参照）、Cross-Round（CR；完全な過去ラウンドの文脈を参照）、および新規のRank-Adaptive Cross-Round（RA-CR；外部のジャッジモデルにより各ラウンドでエージェントを動的に再順序付けし、1体を黙らせる）を、No-Interactionベースライン（NI；仲間の可視性のない独立応答）に対して比較します。制御されたマクロ経済のケーススタディ（20の多様なイベント、5つのランダムシード、マッチさせたプロンプト／デコーディング）では、RA-CRはCRよりも速い収束を達成し、WRはピア参照（他者への言及）がより高く、NIはArgument Diversity（議論の多様性）を最大化します（主要プロトコル間で不変）。これらの結果は、相互作用（ピア参照率）と収束（コンセンサス形成）の間にトレードオフがあることを示し、プロトコル設計が重要であることを裏付けます。コンセンサスが優先される場合、RA-CRが他を上回ります。