静的テンプレートから動的ランタイムグラフへ:LLMエージェントのワークフロー最適化に関するサーベイ

arXiv cs.AI / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本記事は、LLMエージェントが、LLM呼び出し、検索(retrieval)、ツール利用、コード実行、メモリ更新、検証(verification)を組み合わせた実行可能なワークフローをどのように構築できるかを調査する。
  • それらのワークフローをエージェンティック計算グラフ(ACG)として位置づけ、ワークフロー構造がいつ決定されるか(静的 vs 動的)、何が最適化されるか、そしてどのような信号が最適化を導くか(タスク指標、検証器シグナル、嗜好、またはトレースのフィードバック)によって手法を分類する。
  • 再利用可能なワークフローテンプレート、実行ごとの具体化されたグラフ、実行トレースを区別し、設計時の意思決定と、実際にランタイムで起こることを明確に分離する。
  • 本サーベイでは、タスク成功率といった指標を超えて、グラフの性質、実行コスト、堅牢性、さらに入力に応じて構造の変化がどのように起こるかを含む、構造を考慮した評価アプローチを提案する。
  • 明記された目的は、共通の語彙と統一された枠組みを提供し、将来のワークフロー最適化研究における比較可能性、再現性、評価基準を改善することにある。

Abstract

Large language model (LLM)-based systems are becoming increasingly popular for solving tasks by constructing executable workflows that interleave LLM calls, information retrieval, tool use, code execution, memory updates, and verification. This survey reviews recent methods for designing and optimizing such workflows, which we treat as agentic computation graphs (ACGs). We organize the literature based on when workflow structure is determined, where structure refers to which components or agents are present, how they depend on each other, and how information flows between them. This lens distinguishes static methods, which fix a reusable workflow scaffold before deployment, from dynamic methods, which select, generate, or revise the workflow for a particular run before or during execution. We further organize prior work along three dimensions: when structure is determined, what part of the workflow is optimized, and which evaluation signals guide optimization (e.g., task metrics, verifier signals, preferences, or trace-derived feedback). We also distinguish reusable workflow templates, run-specific realized graphs, and execution traces, separating reusable design choices from the structures actually deployed in a given run and from realized runtime behavior. Finally, we outline a structure-aware evaluation perspective that complements downstream task metrics with graph-level properties, execution cost, robustness, and structural variation across inputs. Our goal is to provide a clear vocabulary, a unified framework for positioning new methods, a more comparable view of existing body of literature, and a more reproducible evaluation standard for future work in workflow optimizations for LLM agents.

静的テンプレートから動的ランタイムグラフへ:LLMエージェントのワークフロー最適化に関するサーベイ | AI Navigate