ToolOmni: Enabling Open-World Tool Use via Agentic learning with Proactive Retrieval and Grounded Execution

arXiv cs.CL / 4/16/2026

📰 NewsIdeas & Deep AnalysisModels & Research

Key Points

  • ToolOmniは、巨大で変化するツール群を対象とするオープンワールド環境で、LLMがツールの検索から実行までを“推論ループ”内で行えるようにする統一的なエージェント型フレームワークだ。
  • 静的な埋め込み検索やツールの暗記に依存する従来手法では、ユーザー意図とツール意味の整合や未知ツールへの一般化が難しいという課題に対し、先にコールドスタート用のマルチターン相互作用データセットをSFTで学習させる。
  • オープンワールドでのツール学習には、ツール検索精度と実行有効性をオンライン環境で同時に最適化するDecoupled Multi-Objective GRPOアルゴリズムを提案している。
  • 実験では、検索と実行の双方でSOTAを達成し、強力なベースラインに対してエンドツーエンドの実行成功率で+10.8%と大幅な改善を示すとともに、頑健性と一般化性能も高いと報告している。

Abstract

Large Language Models (LLMs) enhance their problem-solving capability by utilizing external tools. However, in open-world scenarios with massive and evolving tool repositories, existing methods relying on static embedding retrieval or parameter memorization of tools struggle to align user intent with tool semantics or generalize to unseen tools, respectively, leading to suboptimal accuracy of open-world tool retrieval and execution. To address these, we present ToolOmni, a unified agentic framework that enables LLMs for open-world tool use by proactive retrieval and grounded execution within a reasoning loop. First, we construct a cold-start multi-turn interaction dataset to instill foundational agentic capabilities via Supervised Fine-Tuning (SFT). Then, we introduce open-world tool learning based on a Decoupled Multi-Objective GRPO algorithm, which simultaneously optimizes LLMs for both tool retrieval accuracy and execution efficacy in online environments. Extensive experiments demonstrate that ToolOmni achieves state-of-the-art performance both in retrieval and execution, surpassing strong baselines by a significant margin of +10.8% in end-to-end execution success rate, while exhibiting exceptional robustness and generalization capabilities.