TInR:大規模言語モデルにおけるツール内在化推論の探究

arXiv cs.CL / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、推論時に外部のツール・ドキュメントに依存するのではなく、ツール知識をLLM内部に内在化することで、ツール統合型推論を改善するためのTool-Internalized Reasoning(TInR)を提案する。
  • TInRにおける主要な課題として、(1) ツール知識の内在化、(2) 内部での推論と実際のツール使用の協調、の2点を特定する。
  • 著者らは、三段階のパイプラインで学習する統一フレームワークであるTInR-Uを提案する。具体的には、双方向の知識アラインメント、質の高い推論アノテーションによる教師あり微調整、そしてTInR固有の報酬を用いた強化学習である。
  • in-domainおよびout-of-domainのタスクにまたがる実験の結果、TInR-Uはより良い性能を示すだけでなく効率も向上し、このアプローチが既存のツールのサイズや推論の非効率といった問題を緩和できる可能性を示唆する。
  • 本研究は、TInRを、外部ドキュメントへの依存に伴うオーバーヘッドや制約を負うことなく、LLMがツールをより効果的に使えるようにするためのアーキテクチャ/学習上の方向性として位置づけている。