要旨: マルチエージェントによる討論(Multi-Agent Debate)は、反復的なエージェント間コミュニケーションを通じて、大規模言語モデルの推論品質を向上させる有望な枠組みとして注目されている。とはいえ、毎ラウンドですべてのエージェントのメッセージをブロードキャストすると、ノイズや冗長性が生じ、討論の質を低下させるとともに計算資源を無駄にする。現在の手法では、ブロードキャスト前に不確実性推定を用いて低い信頼度の応答をフィルタリングすることに依存しているが、この方法は、信頼度スコアが不適切に較正されていることや、しきい値選択への感度の高さにより信頼性がない。そこで本研究では、軽量な討論フレームワークである Diversity-Aware Retention(DAR)を提案する。DARは、各討論ラウンドにおいて、ブロードキャストする前に、互いに最大限異なる(反対する)ように、かつ多数決(majority vote)とも最大限食い違うようにするエージェント応答の部分集合を選択する。明示的なインデックスに基づく保持(retention)メカニズムにより、DARは元のメッセージを改変せずそのまま保持し、保持された不一致が真正であり続けることを保証する。多様な推論および質問応答ベンチマークでの実験により、本手法の選択的メッセージ伝播は、特にエージェント数が増えるにつれてノイズの蓄積が最も深刻になる状況で、討論性能を一貫して向上させることが示された。これらの結果は、マルチエージェント推論システムにおいて、エージェントが「何を言うか」だけでなく、「何を聞くか」も同様に重要であることを示している。
両方の視点を聞く:多様性を考慮したメッセージ保持による効率的なマルチエージェント討論
arXiv cs.CL / 2026/3/24
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、標準的なマルチエージェント討論が各ラウンドで全エージェントのメッセージをブロードキャストするため、推論の質を損ない得るノイズや冗長性を生み、計算コストの無駄にもなると主張する。
- 多様性を考慮した保持(Diversity-Aware Retention: DAR)を提案し、各エージェントの応答のうち、互いに最大限食い違い、かつ多数決(の投票)と最大限異なるもののサブセットのみを保持・ブロードキャストする。
- DARは、保持対象の意見の真正性を保つため、改変せず元のエージェントメッセージを転送するインデックスベースのメッセージ保持メカニズムを用いる。
- 複数の推論・質問応答ベンチマークでの実験により、選択的な伝播は討論の性能を改善し、特にエージェント数が増えるほど効果が大きいことが示される。
- 本研究は、マルチエージェントLLMシステムにおいて、エージェントが「聞く」内容を制御することが、生成する内容と同じくらい重要であることを強調する。
