モンテカルロ木探索によるエージェント技能のバイレベル最適化

arXiv cs.AI / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、タスク遂行能力に大きく影響するLLMエージェントの「技能（skills）」（指示・ツール・補助リソースを構造化したもの）を、体系的に最適化する方法を扱います。
スキル設計をバイレベル最適化問題として定式化し、スキルの構造選択と各コンポーネントの内容を同時に扱います。
提案手法では、外側ループでモンテカルロ木探索（MCTS）を用いてスキル構造を決定し、内側ループでその選ばれた構造の下でコンポーネント内容を改良します。
両方の最適化ループでLLMを活用して探索と洗練を支援し、構造と内容が強く結び付いた意思決定空間を扱います。
オープンソースのOperations Research向け質問応答データセットでの実験により、最適化されたスキルを使うことでエージェントの性能が向上することが示されています。

Dev.to

Dev.to

Dev.to

Reddit r/artificial

Qiita