要旨: ツール利用により、大規模言語モデル(LLM)は外部情報にアクセスし、ソフトウェアシステムを呼び出し、モデルパラメータだけでは解けない範囲を超えたデジタル環境で行動できるようになります。初期の研究では主に、モデルが正しい単一のツール呼び出しを選択して実行できるかどうかが検討されました。しかし、エージェントシステムが進化するにつれて、中心課題は孤立した呼び出しから、中間状態を伴う長い軌道上での複数ツールのオーケストレーションへと移りました。そこでは、実行フィードバック、変化する環境、そして安全性、コスト、検証可能性といった実務上の制約が重要になります。本稿では、複数ツールLLMエージェントに関する最近の進展を包括的にレビューし、この急速に発展している領域における最先端の状況を分析します。まず、タスク定式化を統一し、単一呼び出しのツール利用と長期ホライズンのオーケストレーションを区別します。次に、文献を6つの中核的な次元に整理します:推論時の計画と実行、訓練と軌道構築、安全性と制御、資源制約下での効率、オープン環境における能力の完全性、そしてベンチマーク設計と評価です。さらに、ソフトウェア工学、企業のワークフロー、グラフィカルユーザインタフェース(GUI)、モバイルシステムにおける代表的な応用を要約します。最後に、主要な課題について議論し、信頼性が高く、スケーラブルで、検証可能な複数ツールエージェントを構築するための今後の方向性を提示します。
LLMエージェントにおけるツール利用の進化:単一ツール呼び出しからマルチツールのオーケストレーションへ
arXiv cs.CL / 2026/3/25
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、LLMによるツール利用が、単一の外部ツール呼び出しを選択する段階から、中間状態とフィードバックを伴う長期的なマルチツール・オーケストレーションを管理する段階へと進化してきたと主張している。