プランナーこそ重要!長期計画のための効率的で不均衡なマルチエージェント協調フレームワーク
arXiv cs.AI / 2026/5/5
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、長期的な自律実行をLMベースのマルチエージェントで実現するために、役割を「プランナー(高レベルの意思決定)」「アクター(タスク実行)」「メモリマネージャ(文脈推論)」の3つに分解する枠組みを提案する。
- 著者らの計算資源配分(compute-allocation)分析の重要な結果として、タスク性能への影響は計画(planning)が支配的であり、実行(execution)とメモリ管理(memory management)は競争力のある結果を出すのに必要な計算量とモデル容量が大幅に少なくて済むことが示された。
- さらに、VLM-as-judgeによる軌道レベル報酬(trajectory-level rewards)でプランナーのみを最適化する、プランナー中心の強化学習手法を提案し、他のコンポーネント(アクターやメモリ)は凍結する。
- ウェブナビゲーション、OS制御、ツール利用といったベンチマークに関する実験で、学習と計算資源を高レベル計画に集中することで、長期ホライズンのエージェント自動化における頑健性と計算効率が向上することが確認された。
- 研究のコードは公開されており、再現や発展的な検証を支える。




