自己改善エージェント・システムの軌跡情報に基づくメモリ生成
arXiv cs.AI / 2026/3/12
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 四部構成のフレームワーク(Trajectory Intelligence Extractor、Decision Attribution Analyzer、Contextual Learning Generator、Adaptive Memory Retrieval System)を提示し、エージェントの実行軌跡から実用的な学習を抽出して将来のタスクに適用する。
- 汎用的な会話事実を保存するのではなく、出所を明示した文脈的、タスク固有の取得を重視する構造化学習を強調する。
- Contextual Learning Generator は3種類のヒントを提供する— 成功パターンからの戦略ヒント、失敗処理からの回復ヒント、非効率だが回収可能な実行からの最適化ヒント — Adaptive Memory Retrieval System による多次元類似性に基づくプロンプトへの注入。
- AppWorld ベンチマークでの評価は顕著な改善を示し、未知タスクのシナリオ目標達成で最大14.3ポイント、複雑なタスクで28.5ポイントの改善(相対約149%の増加)を実現した。
要旨: LLM搭載エージェントは、将来の性能を向上させるために実行経験から学ぶという継続的な課題に直面している。エージェントは多くのタスクを成功裏に完了できる一方で、しばしば非効率的なパターンを繰り返し、同様のエラーから回復できず、過去の実行から成功した戦略を適用する機会を逃してしまう。我々は、エージェントの実行軌跡から実用的な学習を自動的に抽出し、文脈的メモリ検索を通じて将来のパフォーマンスを改善する新しいフレームワークを提示する。我々のアプローチは次の四つの構成要素からなる:(1) 実行軌跡インテリジェンス抽出器(Trajectory Intelligence Extractor)— エージェントの推論パターンの意味解析を行う、(2) 意思決定帰属分析器(Decision Attribution Analyzer)— どの意思決定・推論ステップが失敗、回復、または非効率につながったかを特定する、(3) 文脈学習生成器(Contextual Learning Generator)— 3種類の指針を生成する:成功パターンからの戦略ヒント、失敗処理からの回復ヒント、非効率だが成功した実行からの最適化ヒント、(4) 適応的メモリ取得システム(Adaptive Memory Retrieval System)— 多次元的な類似性に基づいて関連学習をエージェントのプロンプトへ注入する。汎用の対話的事実を保存する既存のメモリシステムとは異なり、私たちのフレームワークは実行パターンを理解し、出所付きの構造化された学習を抽出し、特定のタスク文脈に合わせた指針を取得する。 AppWorld ベンチマークでの評価は一貫した改善を示し、未知のタスクにおけるシナリオ目標の達成で最大14.3ポイントの増加、特に複雑なタスクでは大きな恩恵をもたらす(28.5ポイントのシナリオ目標改善、相対で約149%の増加)。