概要: 大規模言語モデルに基づくエージェントは、動的かつ複数ステップのタスクを解決するための強力なアプローチとして、近年注目されるようになりました。既存の多くのエージェントは、動的環境における長期的な行動を導くために計画メカニズムを用いています。しかし、現在の計画アプローチには基礎的な制約があります。それは、計画が固定された粒度レベルで動作する点です。具体的には、単純なタスクに対しては過度に詳細になったり、複雑なタスクに対しては十分に詳細にならなかったりして、単純さと複雑さの最適なバランスを達成できません。認知科学における extit{漸進的洗練(progressive refinement)} の原理から着想を得て、私たちは、人間の計画戦略を模倣する自己適応型の階層計画メカニズムである extbf{AdaPlan-H} を提案します。提案手法は、粗い粒度のマクロ計画から開始し、タスクの複雑さに応じてそれを段階的に洗練します。これにより、異なるタスクの難易度の違いに合わせた自己適応的な階層計画を生成でき、模倣学習および能力向上によって最適化可能です。実験結果は、本手法が、計画レベルにおける過剰計画を抑えつつ、タスク実行の成功率を大幅に改善することを示しています。これにより、複数ステップの複雑な意思決定タスクに対して、柔軟かつ効率的な解決策が提供されます。コミュニティへの貢献のため、私たちのコードとデータは https://github.com/import-myself/AHP で公開されます。
粗い計画から精緻へ:LLMエージェントのための自己適応型階層計画
arXiv cs.AI / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、AdaPlan-Hという自己適応型の階層計画手法を提案し、タスクの複雑さに応じて粗いマクロ計画から段階的に計画を洗練させます。
- 既存のLLMエージェント向けプランナーは、粒度が固定されているため、単純なタスクでは過度に詳細になったり、複雑なタスクでは不足したりすると指摘されています。
- AdaPlan-Hは、タスクの難易度に応じて計画の構造を最適化することで、単純さと複雑さのバランスを改善することを目指します。
- この手法は、模倣学習(imitation learning)や能力強化(capability enhancement)によって最適化できる設計になっています。
- 実験では、タスク実行の成功率が向上し、計画段階での「過剰計画(overplanning)」が抑えられることが報告されており、コードとデータの公開も予定されています。

