ToolOmni:先読み型のリトリーバルとグラウンディドな実行によるエージェント型学習で、オープンワールドにおけるツール活用を可能にする

arXiv cs.CL / 2026/4/16

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • ToolOmniは、巨大で変化するツール群を対象とするオープンワールド環境で、LLMがツールの検索から実行までを「推論ループ」内で行えるようにする統一的なエージェント型フレームワークだ。
  • 静的な埋め込み検索やツールの暗記に依存する従来手法では、ユーザー意図とツール意味の整合や未知ツールへの一般化が難しいという課題に対し、先にコールドスタート用のマルチターン相互作用データセットをSFTで学習させる。
  • オープンワールドでのツール学習には、ツール検索精度と実行有効性をオンライン環境で同時に最適化するDecoupled Multi-Objective GRPOアルゴリズムを提案している。
  • 実験では、検索と実行の双方でSOTAを達成し、強力なベースラインに対してエンドツーエンドの実行成功率で+10.8%と大幅な改善を示すとともに、頑健性と一般化性能も高いと報告している。

ToolOmni:先読み型のリトリーバルとグラウンディドな実行によるエージェント型学習で、オープンワールドにおけるツール活用を可能にする | AI Navigate