Profile-Then-Reason：ツール拡張型言語エージェントのための境界付きセマンティック複雑性

arXiv cs.AI / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、リアクティブ（反応的）な実行として実装されたツール拡張LLMエージェントが、観測のたびに推論を繰り返し再計算することで、遅延が増大し、誤りへの感度も増幅されることを主張する。
提案手法は Profile--Then--Reason（PTR）であり、まずLLMが明示的なワークフローを作成し、決定的／ガード付きのオペレータがそれを実行し、生成されたトレースを検証器が確認し、ワークフローが信頼できなくなった場合にのみ修復（repair）を起動する。
PTRは、（profile, routing, execution, verification, repair, reasoning からなる）境界付きパイプラインとして形式化されており、LLM呼び出し回数は制約される。名目ケースでは2回で、境界付き修復の最悪ケースでは3回である。
4つの言語モデルを用いた6つのベンチマークでの実験により、PTRはReActベースラインに対して24構成中16で優れており、とりわけ検索（retrieval）中心の課題や分解（decomposition）中心の課題で改善が顕著である。
本研究は、反応的実行は、当初計画したワークフロー以上のオンライン適応が高性能にとって重要になる場合には、依然として有利になり得ると結論づける。

AI Business

日経XTECH

日経XTECH

日経XTECH

日経XTECH