非構造のリコールからスキーマに基づくメモリへ:反復的かつスキーマ対応の抽出による信頼性あるAIメモリ

arXiv cs.AI / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文は、「永続的なAIメモリ」を単なる検索・想起の問題として扱うのでは不十分だと主張しており、実運用のエージェントには正確な事実、現在状態、更新・削除、集約、関係、否定クエリ、そして明示的な不明(unknown)が必要になるためです。
  • スキーマに基づいてメモリを設計し、スキーマが「必ず記憶すべきもの」「無視してよいもの」「推論してはならない値」を定義することで、信頼性のないメモリや捏造を防ぎます。
  • 提案手法では、反復的かつスキーマ対応の書き込みパイプラインを用い、取り込みをオブジェクト検出、フィールド検出、フィールド値抽出に分解し、検証ゲート、ローカルリトライ、状態を持つプロンプト制御で支えます。
  • 評価では大きな改善が示されており、xmemoryは構造化抽出ベンチマークでオブジェクト単位の精度90.42%、出力精度62.67%、エンドツーエンドのメモリベンチマークでF1 97.10%、アプリケーションレベル課題で精度95.2%を達成しています。
  • 著者らは、安定した事実や状態を伴う計算が必要なメモリワークロードでは、スキーマに基づく検証済みの書き込みといったアーキテクチャが、検索規模やモデルの強さだけよりも重要になり得ると結論づけています。

Abstract

永続的なAIメモリは、多くの場合「検索問題」に還元されます。すなわち、過去のやり取りをテキストとして保存し、それらを埋め込み、後でモデルに関連する文脈を取り戻させるのです。この設計はテーマの想起には有用ですが、実運用のエージェントが必要とする種類のメモリとは噛み合っていません。必要なのは、正確な事実、現在の状態、更新と削除、集約、関係、否定クエリ、そして明示的な未知(unknown)です。これらの操作では、メモリが検索のように振る舞うのではなく、「台帳(system of record)」のように振る舞うことが求められます。 本論文は、信頼できる外部AIメモリはスキーマに基づく必要があると主張します。スキーマは、何を記憶しなければならないか、何を無視してよいか、そしてどの値を推論してはならないかを定義します。そこで我々は、メモリ取り込みをオブジェクト検出、フィールド検出、フィールド値抽出に分解する、反復的でスキーマを意識した書き込み経路(write path)を提示します。これには、バリデーションゲート、ローカルなリトライ、状態を持つプロンプト制御が含まれます。その結果、解釈の焦点が読み取り経路(read path)から書き込み経路(write path)へと移ります。読み取りは、取得した散文に対する推論を繰り返すのではなく、検証済みレコードに対する制約付きクエリになります。 我々は、この設計を構造化抽出およびエンドツーエンドのメモリベンチマークで評価します。抽出ベンチマークでは、judge-in-the-loop 構成がオブジェクト単位の精度 90.42% と出力精度 62.67% を達成し、テストしたすべての最先端の構造化出力ベースラインを上回ります。エンドツーエンドのメモリベンチマークでは、xmemory が F1 97.10% を達成し、第三者のベースラインでの 80.16%〜87.24% と比較して優れています。アプリケーションレベルのタスクでは、xmemory は精度 95.2% に到達し、専用のメモリシステム、コード生成された Markdown のハーネス、および顧客向けの最先端モデルのアプリケーションハーネスを上回ります。これらの結果は、安定した事実と状態を持つ計算を必要とするメモリワークロードにおいては、アーキテクチャが、単に検索規模やモデルの強さだけよりも重要であることを示しています。