要旨: LLMエージェントは、大規模なAPIライブラリからツールを選択し、それらを正しい順序で並べる必要がある。既存手法では、検索と順序付けの両方に意味的類似度を用いるが、順序付けはツール記述には存在しないツール間のデータ依存関係に依存する。その結果、意味のみの手法は、構造化されたワークフロードメインで負のKendall-\tauを生じうる。そこで、49,831件の成功したLLMエージェント軌跡から採掘した、方向付き重み付き実行遷移グラフであるSkillGraphを導入する。これは、事前にワークフローの先行関係の規則性を再利用可能なグラフ基盤として符号化する。こうしたグラフ基盤の事前知識に基づき、2段階の分離(デカップル)フレームワークを提案する。候補選択にはGS-Hybridによる検索を用い、順序付けには学習されたペアワイズのリランカーを用いる。ToolBench(9,965件のテストインスタンス;約16,000ツール)において、本手法はSet-F1 = 0.271、Kendall-\tau = 0.096を達成する。API-Bankでは、Kendall-\tauが-0.433から+0.613へ改善する。同一のStage-1入力のもとで、学習済みリランカーはLLaMA-3.1-8BのStage-2リランカーよりも性能が高い。
SkillGraph:LLMエージェントのツール手順推薦のためのグラフ基盤プライオリ
arXiv cs.LG / 2026/4/23
💬 オピニオンDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、LLMエージェントのツール選択と順序付けが、ツール説明に含まれないツール間のデータ依存関係を順序決定に必要とする領域で失敗しうると指摘しています。
- そこで、SkillGraphを提案します。SkillGraphは49,831件の成功したエージェント軌跡から抽出した、有向重み付きの実行遷移グラフであり、ワークフローの先行関係という再利用可能な規則性を符号化します。
- 提案手法は2段階の分離フレームワークで、候補選択にはGS-Hybridリトリーバルを用い、順序付けには学習済みのペアワイズ・リランカーで最終順序を決めます。
- 実験ではToolBenchでの改善に加え、API-BankでKendall-τが大きく向上し、負の相関から正の相関へ改善したと報告されています。
- 同一のStage-1入力条件のもとで、Stage-2のリランカーにおいて学習済みリランカーがLLaMA-3.1-8Bベースのリランカーより優れたとされています。




