学習によるコミュニケーション:マルチエージェント言語システムのエンドツーエンド最適化に向けて
arXiv cs.AI / 2026/4/25
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、LLMベースのマルチエージェント研究が、エージェント間コミュニケーションを固定されたテキスト/プロトコル・インターフェースとして扱いがちであり、推論と共同最適化されていないと指摘しています。
- 提案するDiffMASは、内部表現(key-valueキャッシュなど)を用いた潜在的(非テキスト)コミュニケーションを、マルチエージェントの学習可能な構成要素として扱います。
- DiffMASは、マルチエージェントの潜在トラジェクトリに対するパラメータ効率の高い教師あり学習を行い、相互作用を通じて情報の符号化と解釈方法をエージェント同士で学習できるようにします。
- 数学推論、科学系QA、コード生成、コモンセンス推論などの実験で、DiffMASは単一エージェント推論やテキストベースのマルチエージェント、既存の潜在コミュニケーション手法に比べて、推論精度とデコード安定性を一貫して改善したと報告されています。
- 結果として、AIME24で26.7%、GPQA-Diamondで20.2%を達成し、複数の推論ベンチマークで安定した向上が示されています。



