非構造のリコールからスキーマに基づくメモリへ：反復的かつスキーマ対応の抽出による信頼性あるAIメモリ

arXiv cs.AI / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

この論文は、「永続的なAIメモリ」を単なる検索・想起の問題として扱うのでは不十分だと主張しており、実運用のエージェントには正確な事実、現在状態、更新・削除、集約、関係、否定クエリ、そして明示的な不明（unknown）が必要になるためです。
スキーマに基づいてメモリを設計し、スキーマが「必ず記憶すべきもの」「無視してよいもの」「推論してはならない値」を定義することで、信頼性のないメモリや捏造を防ぎます。
提案手法では、反復的かつスキーマ対応の書き込みパイプラインを用い、取り込みをオブジェクト検出、フィールド検出、フィールド値抽出に分解し、検証ゲート、ローカルリトライ、状態を持つプロンプト制御で支えます。
評価では大きな改善が示されており、xmemoryは構造化抽出ベンチマークでオブジェクト単位の精度90.42%、出力精度62.67%、エンドツーエンドのメモリベンチマークでF1 97.10%、アプリケーションレベル課題で精度95.2%を達成しています。
著者らは、安定した事実や状態を伴う計算が必要なメモリワークロードでは、スキーマに基づく検証済みの書き込みといったアーキテクチャが、検索規模やモデルの強さだけよりも重要になり得ると結論づけています。

Abstract

永続的なAIメモリは、多くの場合「検索問題」に還元されます。すなわち、過去のやり取りをテキストとして保存し、それらを埋め込み、後でモデルに関連する文脈を取り戻させるのです。この設計はテーマの想起には有用ですが、実運用のエージェントが必要とする種類のメモリとは噛み合っていません。必要なのは、正確な事実、現在の状態、更新と削除、集約、関係、否定クエリ、そして明示的な未知（unknown）です。これらの操作では、メモリが検索のように振る舞うのではなく、「台帳（system of record）」のように振る舞うことが求められます。本論文は、信頼できる外部AIメモリはスキーマに基づく必要があると主張します。スキーマは、何を記憶しなければならないか、何を無視してよいか、そしてどの値を推論してはならないかを定義します。そこで我々は、メモリ取り込みをオブジェクト検出、フィールド検出、フィールド値抽出に分解する、反復的でスキーマを意識した書き込み経路（write path）を提示します。これには、バリデーションゲート、ローカルなリトライ、状態を持つプロンプト制御が含まれます。その結果、解釈の焦点が読み取り経路（read path）から書き込み経路（write path）へと移ります。読み取りは、取得した散文に対する推論を繰り返すのではなく、検証済みレコードに対する制約付きクエリになります。我々は、この設計を構造化抽出およびエンドツーエンドのメモリベンチマークで評価します。抽出ベンチマークでは、judge-in-the-loop 構成がオブジェクト単位の精度 90.42% と出力精度 62.67% を達成し、テストしたすべての最先端の構造化出力ベースラインを上回ります。エンドツーエンドのメモリベンチマークでは、xmemory が F1 97.10% を達成し、第三者のベースラインでの 80.16%〜87.24% と比較して優れています。アプリケーションレベルのタスクでは、xmemory は精度 95.2% に到達し、専用のメモリシステム、コード生成された Markdown のハーネス、および顧客向けの最先端モデルのアプリケーションハーネスを上回ります。これらの結果は、安定した事実と状態を持つ計算を必要とするメモリワークロードにおいては、アーキテクチャが、単に検索規模やモデルの強さだけよりも重要であることを示しています。

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

Dev.to

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

ITmedia AI+

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

Reddit r/artificial

FDAコンプライアンスを自動化する：専門食品メーカー向けのAI活用

Dev.to

GPT-5.5のサイバー攻撃能力は一部「Mythos超え」　英政府機関が評価

ITmedia AI+

非構造のリコールからスキーマに基づくメモリへ：反復的かつスキーマ対応の抽出による信頼性あるAIメモリ

要点

Abstract

関連記事

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

FDAコンプライアンスを自動化する：専門食品メーカー向けのAI活用

GPT-5.5のサイバー攻撃能力は一部「Mythos超え」　英政府機関が評価

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

ChatGPTの「画像生成」、どう進化？ 開発者に聞く “文字化け解消”の秘訣

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

FDAコンプライアンスを自動化する：専門食品メーカー向けのAI活用

GPT-5.5のサイバー攻撃能力は一部「Mythos超え」 英政府機関が評価

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

GPT-5.5のサイバー攻撃能力は一部「Mythos超え」　英政府機関が評価