呼ぶべきか、呼ばざるべきか：LLMのツール呼び出しを評価・最適化するためのフレームワーク

arXiv cs.AI / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、エージェント型AIアーキテクチャが外部ツールで能力を拡張できる一方で、ツール呼び出しが冗長になったり有害になったりすることがあるため、「呼ぶか呼ばないか」の判断が効果的な活用の鍵だと主張しています。
ウェブ検索ツールの利用判断を、必要性・有用性・負担（アフォーダビリティ）の3要素で評価する、意思決定理論に触発されたフレームワークを提案しています。
このフレームワークは、規範的な視点（最適なツール呼び出し割り当てから真の必要性・有用性を推定）と記述的な視点（観測された行動からモデルの自己認識としての必要性・有用性を推定）を組み合わせ、両者がしばしば一致しないことを示します。
モデルの隠れ状態に基づいて「必要性」と「有用性」を推定する軽量推定器を導入し、その推定を使ったシンプルなコントローラにより、意思決定の質を改善して複数タスク・複数モデルで性能向上につなげます。
まとめると、本手法はモデルの自己評価だけに頼らずに、LLMのツール呼び出しを原理的かつ検証可能な形で最適化する道筋を提供します。

Anthropic News

日経XTECH

The Verge

Dev.to

Dev.to