Abstract
長期記憶は、パーソナライズされた自律エージェントにとって基本的な要素である一方、これを入力していくことはボトルネックになりがちです。既存のシステムでは、記憶抽出をワンショットの受動的な書き起こし(文脈から構造化されたエントリへ転記すること)として扱うため、ノイズのある対話、参照の欠落、ターンをまたぐ依存関係にうまく対応できず、結果として記憶汚染、価値の低い書き込み、そして不整合が生じます。本論文では、エージェントシステムにおける能動的な長期記憶抽出のためのMemReaderファミリーを提案します。MemReader-0.6Bは、正確でスキーマに一貫した構造化出力を行うために蒸留された、コンパクトでコスト効率の高い受動的抽出器です。MemReader-4Bは、記憶の書き込み判断を行うために、Group Relative Policy Optimization(GRPO)で最適化された能動的抽出器です。ReActスタイルのパラダイムのもとで、MemReader-4Bは、行動する前に情報価値、参照の曖昧さ、そして完全性を明示的に評価し、必要に応じて記憶を書き込んだり、不完全な入力は保留したり、過去の文脈を取得したり、無関係な雑談を破棄したりできます。LOCOMO、LongMemEval、HaluMemに対する実験により、MemReaderが既存の抽出ベースラインを一貫して上回ることが示されます。とりわけ、MemReader-4Bは、知識更新、時間的推論、幻覚(ハルシネーション)の低減を含むタスクにおいて最先端の性能を達成します。これらの結果は、効果的なエージェントの記憶とは、単により多くの情報を抽出することではなく、推論に基づき選択的に記憶を抽出して、低ノイズで動的に進化する長期記憶を構築する必要があることを示唆しています。さらに、MemReaderはMemOSに統合され、実世界のアプリケーションで展開されています。将来の研究と導入を支援するために、モデルを公開し、公的なAPIアクセスを提供します。