モンテカルロ木探索によるエージェント技能のバイレベル最適化
arXiv cs.AI / 2026/4/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、タスク遂行能力に大きく影響するLLMエージェントの「技能(skills)」(指示・ツール・補助リソースを構造化したもの)を、体系的に最適化する方法を扱います。
- スキル設計をバイレベル最適化問題として定式化し、スキルの構造選択と各コンポーネントの内容を同時に扱います。
- 提案手法では、外側ループでモンテカルロ木探索(MCTS)を用いてスキル構造を決定し、内側ループでその選ばれた構造の下でコンポーネント内容を改良します。
- 両方の最適化ループでLLMを活用して探索と洗練を支援し、構造と内容が強く結び付いた意思決定空間を扱います。
- オープンソースのOperations Research向け質問応答データセットでの実験により、最適化されたスキルを使うことでエージェントの性能が向上することが示されています。



