ToolGrad:テキストの「グラデーション」による効率的なツール使用データセット生成
arXiv cs.CL / 2026/5/4
💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文では、従来の「クエリ先行」パイプラインに見られる、注釈作業の失敗が起きやすく効率が低い問題を回避するためのツール使用データセット生成フレームワーク「ToolGrad」を提案しています。
- ToolGradは、ユーザーの問い合わせを先に作ってから複雑なツール使用注釈を後付けするのではなく、テキストの「グラデーション」に導かれる反復プロセスでまず有効なツール使用チェーンを構築し、その後に対応するユーザー質問を合成します(「answer-first」)。
- ToolGradは「ToolGrad-500」を生成し、より複雑なツール使用、生成コストの低さ、そして生成サンプルのほぼ100%のパス率を示しています。
- 実験では、ToolGradのデータセットで学習したモデルが、高コストなベースラインデータセットや一部のプロプライエタリなLLM由来データセットで学習したモデルを上回ることが示されています。
- 著者らは、再現やさらなる研究のために、ソースコード・データセット・モデルをGitHubで公開しています。




