EvoAgent:スキル学習とマルチエージェント委譲を備えた進化可能なエージェント・フレームワーク

arXiv cs.AI / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • EvoAgentは、構造化されたスキル学習と階層的なサブエージェント委譲を統合した「進化可能な」LLMエージェントのフレームワークです。
  • スキルはマルチファイルの能力ユニットとして表現され、トリガー機構や進化に関するメタデータを備えたうえで、ユーザーフィードバックに基づくクローズドループで継続的に生成・最適化されます。
  • 3段階のスキル照合戦略と3層メモリにより、複雑課題を動的に分解し、長期的な能力の蓄積を支えます。
  • 実世界の貿易関連シナリオの実験では、GPT5.2にEvoAgentを組み込むことで専門性・正確性・実用性が大きく向上し、LLM-as-Judge評価で平均スコアが約28%上昇したと報告されています。
  • モデル転移の追加実験では、エージェント性能は基盤モデルの能力だけでなく、モデルとエージェント設計(アーキテクチャ)の「シナジー」の大きさにも左右されることが示唆されています。

Abstract

本論文は、構造化されたスキル学習を階層的なサブエージェント委譲メカニズムと統合する、進化可能な大規模言語モデル(LLM)エージェントフレームワークであるEvoAgentを提案する。EvoAgentは、トリガリング機構と進化的メタデータを備えたマルチファイルの構造化能力ユニットとしてスキルをモデル化し、ユーザーフィードバックに基づくクローズドループ方式によって、継続的なスキル生成と最適化を可能にする。さらに、3段階のスキルマッチング戦略と3層のメモリアーキテクチャを組み込むことで、本フレームワークは複雑な問題に対する動的なタスク分解と、長期的な能力の蓄積を支援する。実世界の貿易シナリオに基づく実験結果は、EvoAgentを統合した後、GPT5.2が専門性、精度、実用的有用性において顕著な改善を達成することを示している。LLM-as-Judgeの5次元評価プロトコルのもとで、総合平均スコアは約28%増加する。さらに、モデル移転の実験では、エージェントシステムの性能は、基盤モデルの固有の能力だけでなく、モデルとエージェントアーキテクチャの間のシナジーの度合いにも依存することが示される。