LLMにグラフを読ませるな、グラフに考えさせよ
arXiv cs.AI / 2026/4/28
📰 ニュースModels & Research
要点
- 明示的な信念グラフがLLMの協調マルチエージェント推論に有効かどうかは、統合アーキテクチャとモデルの強さに大きく左右されることが示されました。
- Hanabiを用いた4つのLLMファミリにわたる制御実験では、信念グラフをプロンプト文脈として提示する場合は強いモデルではほぼ装飾的ですが、ランク付けしたショートリストで行動選択をゲートする形にすると強いモデルでも構造的に不可欠になることがわかりました。
- 「Planner Defiance(計画の反抗)」と呼ばれる失敗モードが見つかり、一部のモデルファミリでは部分的な能力の段階で正しいプランの提案を上書きすることが示され、GeminiとLlama 70Bの間で大きな差が観測されました。
- ゲーム全体の実験では、エージェント間の慣習と、信念グラフ構成要素を適切に組み合わせた介入が、単独のエージェント介入よりも優れることが確認されました。
- さらに予備的なスケーリング分析では、コスト対効果は浅いグラフが最も良い一方、より深いToMグラフはプレイヤー数が多い状況で性能を損なう可能性が示唆されています。



