Memento-Skills: エージェントがエージェントを設計する

arXiv cs.AI / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

Memento-Skills は、新しいタスクに対してエージェントをエンドツーエンドで設計できる、汎用性が高く継続的に学習可能な LLM エージェントシステムである。
状態を持つプロンプトを用いたメモリーベースの強化学習フレームワークを採用し、再利用可能なスキルを相互作用を超えて持続・進化する構造化された Markdown ファイルとして保存する。
システムは Read–Write Reflective Learning ループを通じて継続的に改善され、LLM のパラメータを変更することなく継続的な適応を可能にする。
General AI Assistants ベンチマークと Humanity's Last Exam レポートにおける全体的な正確性の相対改善は、それぞれ 26.2% および 116.2% であり、コードは GitHub で公開されている。

概要: \emph{Memento-Skills}を紹介します、汎用的で継続的に学習可能な LLM エージェント・システムで、\emph{agent-designing agent}として機能します。経験を通じて、タスク固有のエージェントを自律的に構築・適応・改善します。
このシステムは、\emph{stateful prompts}を用いたメモリーベースの強化学習フレームワークの上に構築されており、再利用可能なスキル（構造化された Markdown ファイルとして格納）は、永続的で進化する記憶として機能します。
これらのスキルは、挙動と文脈の両方をエンコードし、相互作用を跨いで知識を継承できるようにします。
シンプルな基礎スキル（例：Web検索や端末操作）から始まり、エージェントは\emph{Read--Write Reflective Learning}機構（\emph{Memento~2}~\cite{wang2025memento2}で導入）を通じて継続的に改善します。
\emph{read} フェーズでは、挙動を訓練可能なスキル・ルーターが、現在の状態付きプロンプトに条件付けられた最も関連性の高いスキルを選択します；\emph{write} フェーズでは、エージェントは新しい経験に基づいてスキルライブラリを更新・拡張します。
この閉ループ設計は、\emph{LLMパラメータを更新せずに行う継続的学習}を可能にします。すべての適応は、外部化されたスキルとプロンプトの進化を通じて実現されます。
従来の人間設計のエージェントに依存するアプローチとは異なり、\emph{Memento-Skills}は汎用エージェントが新しいタスクに対して\emph{エージェントをエンドツーエンドで設計}できるようにします。
反復的なスキル生成と洗練を通じて、システムは自らの能力を徐々に向上させます。
\emph{General AI Assistants} ベンチマークと \emph{Humanity's Last Exam} の実験は、持続的な利益を示し、全体精度における相対的改善として、それぞれ 26.2\% および 116.2\% を達成しました。
コードは https://github.com/Memento-Teams/Memento-Skills にあります。

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 3/20Dailyインサイトを見る →

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Memento-Skills: エージェントがエージェントを設計する

要点

💡 この記事が使われたインサイト

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer