Mem$^2$Evolve:共進化的な能力拡張と経験蒸留による自己進化エージェントへの道

arXiv cs.CL / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、既存のLLMエージェントの自己進化手法が、経験の蓄積と動的な資産(ツール)の生成を別々に扱っていると主張する。しかし、これらのプロセスは本質的に相互依存している。
  • 蓄積された経験を用いて新しい資産の生成の仕方を導くための、共進化パラダイム「能力拡張と経験蒸留(Capability Expansion and Experience Distillation)」を提案する。
  • 提案システムであるMem$^{2}$Evolveは、経験メモリと資産メモリを組み合わせることで、新しいツール/専門エージェントを作ることによって能力を拡張しつつ、さらなる成長のために蒸留された経験も生成する。
  • 6つのタスクカテゴリと8つのベンチマークにわたる実験により、Mem$^{2}$Evolveは標準的なLLMに対して18.53%、経験のみの進化に対して11.80%の性能向上を示し、資産のみの進化よりも小幅ながら上回る(6.46%)。
  • 著者らは実装を提示し、経験や資産生成のいずれか単独に依存するアプローチよりも、進化をより安定に導くことを意図した枠組みであることを述べている。

要旨: 大規模言語モデル--駆動型エージェントは、経験を蓄積することで、または新しいアセット(すなわち、ツールや専門エージェント)を動的に作成することで自己進化できます。しかし、既存の枠組みでは通常、この2つの進化プロセスを別々に扱っています。この分離は、それらの本質的な相互依存性を見落としています。すなわち、前者は手動で事前に定義された静的なツールセットの範囲に本質的に制約される一方、後者は経験によるガイダンスなしにゼロから新しいアセットを生成するため、能力の成長が限定的になり、進化が不安定になります。この制約に対処するために、本稿では「共進化的な能力拡張と経験蒸留」という新しいパラダイムを提案します。このパラダイムに基づき、2つの中核コンポーネントを統合した
\textbf{Mem^{\textbf{2}}Evolve} を提案します。すなわち、\textbf{経験メモリ} と \textbf{アセットメモリ} です。具体的に、Mem^{2}Evolve は蓄積された経験を活用してアセットの動的生成を導き、その結果、エージェントの能力空間を拡張しつつ、同時に新たな経験を獲得して共進化を達成します。6つのタスクカテゴリと8つのベンチマークにわたる大規模な実験により、Mem^{2}Evolve は標準的なLLMに対して18.53
%、経験のみで進化するエージェントに対して11.80
%、アセット生成のみで進化するエージェントに対して6.46
%の改善を達成し、それを、実質的により効果的で安定した自己進化エージェントの枠組みとして確立します。コードは次で公開されています: https://buaa-irip-llm.github.io/Mem2Evolve.