HTAA: ハイブリッド・ツールセットのエージェント化と適応によるLLM計画の強化

arXiv cs.CL / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、実世界のアプリケーションにおいてLLMが計画し、数百のツールを確実に実行する方法を改善するための階層型フレームワークHTAAを提案する。
  • HTAAは、「エージェント化」により、頻繁に共用されるツールを専門のエージェントツールへと変換し、フラットなツール呼び出しに起因する非効率性とエラーの蓄積を抑えることで、プランナの行動空間を縮小する。
  • これは、軌跡ベースの学習を用いた非対称プランナ適応(Asymmetric Planner Adaptation)を採用し、後方再構成と前方の洗練によって、高レベルのプランナをエージェントツールに整合させる。
  • InfoVerifyデータセット(大規模配車プラットフォームにおけるPOI検証ワークフロー)および複数のベンチマークでの実験により、タスク成功率の向上、ツール呼び出しの軌跡の短縮、強力なベースラインに比べてコンテキスト負荷の低減が示される。
  • 著者らは、手作業による検証負荷や運用コストの削減など、生産環境への導入における利点を報告しており、実用的な有効性を裏付けている。

Abstract

大規模言語モデルが何百ものツールを大規模に、かつ確実に利用できるようにすることは、実世界のアプリケーションにとって重要ですが、平坦なツール呼び出しアーキテクチャに固有の非効率性やエラーの蓄積のために困難です。これに対処するため、本研究では、スケーラブルなツール使用計画のための階層型フレームワークであるHybrid Toolset Agentization & Adaptation(HTAA)を提案します。頻繁に共使用されるツールを専門エージェント・ツールとしてカプセル化する新しいツールセットのエージェント化パラダイムを提案し、これによりプランナーの行動空間を削減し、冗長性を緩和します。効果的な協調を確実にするために、高レベルのプランナーとエージェント・ツールを、後方再構成と前方洗練によって整合させる、軌跡(トラジェクトリ)に基づく学習パラダイムであるAsymmetric Planner Adaptationを設計します。HTAAの性能を検証するために、中国最大のオンライン大規模配車(ライドヘイリング)プラットフォームにおけるPOI検証ワークフローに基づく、実世界の社内データセットInfoVerifyを用いて実験を行います。ここでは、長い時間軸を持つ実行可能なツール軌跡を特徴としています。InfoVerifyおよび広く使われているベンチマークでの実験結果から、HTAAは一貫してより高いタスク成功率を達成し、短いツール呼び出しの軌跡を必要とし、強力なベースラインと比べてコンテキストのオーバーヘッドを大幅に削減することが示されます。さらに、本番環境への導入では、HTAAが手作業による検証の労力と運用コストを大きく削減し、その実用的な有効性を示しています。