MemoryCD: Benchmarking Long-Context User Memory of LLM Agents for Lifelong Cross-Domain Personalization
arXiv cs.CL / 3/30/2026
📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- MemoryCD を提案し、百万トークン級の長文コンテキストでも不足していた「ユーザーメモリ」を、実ユーザー行動に基づく形で評価する大規模クロスドメイン・ベンチマークを提供します。
- Amazon Review の時系列・複数ドメインの行動データから、年単位のライフロングな相互作用を追跡して、従来の台本ベースの疑似ペルソナに依存しないベンチマーク構築を行っています。
- 14 の最先端 LLM 基盤モデルと 6 つのメモリ手法ベースラインを、4 つのパーソナライゼーション課題/12 の多様なドメインに対して単一・クロスドメインの両方で評価する評価パイプラインを構築します。
- 分析の結果、既存のメモリ手法はドメインごとのユーザー満足にほど遠く、クロスドメインのライフロング・パーソナライゼーションを検証するための初のテストベッドになると述べています。
💡 Insights using this article
This article is featured in our daily AI news digest — key takeaways and action items at a glance.
Related Articles

Black Hat Asia
AI Business

Mr. Chatterbox is a (weak) Victorian-era ethically trained model you can run on your own computer
Simon Willison's Blog
Beyond the Chatbot: Engineering Multi-Agent Ecosystems in 2026
Dev.to

I missed the "fun" part in software development
Dev.to

The Billion Dollar Tax on AI Agents
Dev.to