Memento-Skills: エージェントがエージェントを設計する

arXiv cs.AI / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Memento-Skills は、新しいタスクに対してエージェントをエンドツーエンドで設計できる、汎用性が高く継続的に学習可能な LLM エージェントシステムである。
  • 状態を持つプロンプトを用いたメモリーベースの強化学習フレームワークを採用し、再利用可能なスキルを相互作用を超えて持続・進化する構造化された Markdown ファイルとして保存する。
  • システムは Read–Write Reflective Learning ループを通じて継続的に改善され、LLM のパラメータを変更することなく継続的な適応を可能にする。
  • General AI Assistants ベンチマークと Humanity's Last Exam レポートにおける全体的な正確性の相対改善は、それぞれ 26.2% および 116.2% であり、コードは GitHub で公開されている。

概要: \emph{Memento-Skills}を紹介します、汎用的で継続的に学習可能な LLM エージェント・システムで、\emph{agent-designing agent}として機能します。経験を通じて、タスク固有のエージェントを自律的に構築・適応・改善します。
このシステムは、\emph{stateful prompts}を用いたメモリーベースの強化学習フレームワークの上に構築されており、再利用可能なスキル(構造化された Markdown ファイルとして格納)は、永続的で進化する記憶として機能します。
これらのスキルは、挙動と文脈の両方をエンコードし、相互作用を跨いで知識を継承できるようにします。
シンプルな基礎スキル(例:Web検索や端末操作)から始まり、エージェントは\emph{Read--Write Reflective Learning}機構(\emph{Memento~2}~\cite{wang2025memento2}で導入)を通じて継続的に改善します。
\emph{read} フェーズでは、挙動を訓練可能なスキル・ルーターが、現在の状態付きプロンプトに条件付けられた最も関連性の高いスキルを選択します;\emph{write} フェーズでは、エージェントは新しい経験に基づいてスキルライブラリを更新・拡張します。
この閉ループ設計は、\emph{LLMパラメータを更新せずに行う継続的学習}を可能にします。すべての適応は、外部化されたスキルとプロンプトの進化を通じて実現されます。
従来の人間設計のエージェントに依存するアプローチとは異なり、\emph{Memento-Skills}は汎用エージェントが新しいタスクに対して\emph{エージェントをエンドツーエンドで設計}できるようにします。
反復的なスキル生成と洗練を通じて、システムは自らの能力を徐々に向上させます。
\emph{General AI Assistants} ベンチマークと \emph{Humanity's Last Exam} の実験は、持続的な利益を示し、全体精度における相対的改善として、それぞれ 26.2\% および 116.2\% を達成しました。
コードは https://github.com/Memento-Teams/Memento-Skills にあります。