CRAFT: Grounded Multi-Agent Coordination Under Partial Information
arXiv cs.CL / 3/27/2026
📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- 本稿は、部分情報下での実践的な会話・協調を評価するためのマルチエージェント・ベンチマーク「CRAFT」を新たに提案しています。
- 各エージェントは個別に観測しきれない状況で、自然言語による“実践的推論”を通じて共有3D構造を構築することが課題として定式化されています。
- 失敗要因を「空間グラウンディング」「信念(belief)モデリング」「実践的コミュニケーション」へ分解する診断フレームワークと、行動失敗プロファイルの分類(タクソノミー)を提示しています。
- 多様な推論モデル(オープンウェイト8、フロンティア7)を評価した結果、推論力の強さが協調性能に必ずしも結びつかず、個々の通信改善が協働成功を保証しないことが示されています。
- 現行の言語モデルにおいてマルチエージェント協調は根本的に未解決の難題であるという結論と、コード公開(GitHub)が案内されています。
広告
Related Articles

Got My 39-Agent System Audited Live. Here's What the Maturity Scorecard Revealed.
Dev.to

The Redline Economy
Dev.to

$500 GPU outperforms Claude Sonnet on coding benchmarks
Dev.to

From Scattershot to Sniper: AI for Hyper-Personalized Media Lists
Dev.to

The LiteLLM Supply Chain Attack: A Wake-Up Call for AI Infrastructure
Dev.to