Council Mode:マルチエージェント・コンセンサスによるLLMの幻覚とバイアスの低減
arXiv cs.CL / 2026/4/6
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文では、「Council Mode」というマルチエージェント・コンセンサスの枠組みを提案し、最先端の異種モデルを複数問い合わせ、その出力を専用のコンセンサスモデルで統合することで、LLMの幻覚(ハルシネーション)とバイアスを低減する。
- Council Modeは3つのフェーズで実装される:複雑度に応じてルーティングするトリアージ分類器、アーキテクチャが多様なLLM群での並列生成、そして合意・不一致・独自の知見を強調する構造化された統合。
- 著者らは、コンセンサスメカニズムの数学的な定式化を示し、オープンソースのAIワークスペース実装を含むシステム全体のアーキテクチャを説明している。
- 複数のベンチマークにおいて、Council ModeはHaluEvalで幻覚率を最良の単一モデルに対して35.9%相対的に低減し、TruthfulQAで7.8ポイントの改善を報告しており、さらに領域間でのバイアス分散も低下させている。
- 本研究には、各コンポーネントの寄与を検証するための、ベンチマーク比較を含む大規模な実験結果と、アブレーションスタディが含まれている。



