進化を学ぶ:テキストによるパラメータグラフ最適化を通じたマルチエージェントシステムの自己改善フレームワーク

arXiv cs.AI / 2026/4/23

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この論文は、フラットなプロンプト調整に比べて構造的な理解を欠く既存手法の限界を超え、マルチエージェントシステムを自動最適化する Textual Parameter Graph Optimization(TPGO)を提案します。
  • TPGO はマルチエージェントシステムを Textual Parameter Graph(TPG)として表現し、エージェント、ツール、ワークフローなどのモジュール化された最適化可能なノードを扱います。
  • 「テキスト勾配(textual gradients)」として、実行トレースから生成される自然言語ベースのフィードバックにより、失敗箇所を特定し、きめ細かな変更を提案します。
  • フレームワークの中核である Group Relative Agent Optimization(GRAO)は、過去の最適化の成功と失敗からメタ学習し、システムが自分自身の最適化方針を時間とともに改善できるようにします。
  • GAIA や MCP-Universe などのベンチマークでの実験では、TPGO が最先端のエージェントフレームワークの成功率を大きく高め、自己改善型の自動最適化を実現することが示されています。

Abstract

複数エージェントシステム(MAS)の設計と最適化は、「エージェント工学(Agent Engineering)」と呼ばれる、複雑で労力のかかるプロセスです。既存の自動最適化手法は主にフラットなプロンプトチューニングに重点を置いているため、MASにおける相互作用の入り組んだ網目をデバッグするための構造的な認識を欠いています。さらに重要なのは、これらの最適化器が静的であることです。最適化器自身が経験から学習して、自身の最適化戦略を改善することがありません。こうした不足に対処するために、私たちは「テキストパラメータグラフ最適化(Textual Parameter Graph Optimization: TPGO)」を導入します。これは、複数エージェントシステムが進化することを学習できるようにする枠組みです。TPGOはまず、MASをテキストパラメータグラフ(Textual Parameter Graph: TPG)としてモデル化します。ここでは、エージェント、ツール、ワークフローがモジュール化された、最適化可能なノードとして表現されます。進化を導くために、私たちは実行トレースから得られる、失敗箇所を特定しきめ細かな変更を提案するための、構造化された自然言語フィードバックである「テキスト勾配(textual gradients)」を導出します。私たちの枠組みの中核は、過去の最適化経験から学習する新しいメタ学習戦略であるグループ相対エージェント最適化(Group Relative Agent Optimization: GRAO)です。過去の成功と失敗を分析することで、GRAOは効果的な更新案を提案する能力を徐々に高め、システムが自分自身を最適化する方法を学習できるようになります。GAIAやMCP-Universeのような複雑なベンチマークに対する大規模な実験の結果、TPGOは最先端のエージェントフレームワークの性能を大幅に向上させ、自動化された自己改善によってより高い成功率を達成することが示されています。