Profile-Then-Reason:ツール拡張型言語エージェントのための境界付きセマンティック複雑性

arXiv cs.AI / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、リアクティブ(反応的)な実行として実装されたツール拡張LLMエージェントが、観測のたびに推論を繰り返し再計算することで、遅延が増大し、誤りへの感度も増幅されることを主張する。
  • 提案手法は Profile--Then--Reason(PTR)であり、まずLLMが明示的なワークフローを作成し、決定的/ガード付きのオペレータがそれを実行し、生成されたトレースを検証器が確認し、ワークフローが信頼できなくなった場合にのみ修復(repair)を起動する。
  • PTRは、(profile, routing, execution, verification, repair, reasoning からなる)境界付きパイプラインとして形式化されており、LLM呼び出し回数は制約される。名目ケースでは2回で、境界付き修復の最悪ケースでは3回である。
  • 4つの言語モデルを用いた6つのベンチマークでの実験により、PTRはReActベースラインに対して24構成中16で優れており、とりわけ検索(retrieval)中心の課題や分解(decomposition)中心の課題で改善が顕著である。
  • 本研究は、反応的実行は、当初計画したワークフロー以上のオンライン適応が高性能にとって重要になる場合には、依然として有利になり得ると結論づける。