要旨: 長期の会話的メモリでは、複数のセッションに散在する証拠を取り出す必要があるが、単回通過の検索(single-pass retrieval)では、時間的およびマルチホップの質問で失敗する。既存の反復手法は、生成された内容や文書レベルの信号によってクエリを洗練させることを行うが、証拠ギャップ、すなわち、蓄積された検索集合から何が欠けているのか、を明示的に診断するものはない。そのため、クエリの洗練が的を射ていない。私たちはEviMemを提示する。EviMemは、十分性評価によって証拠ギャップを検出し、何が欠けているのかを診断し、的を絞ったクエリ洗練へと導くクローズドループの枠組みであるIRIS(Insufficiency Signals を用いた反復検索: Iterative Retrieval via Insufficiency Signals)と、きめ細かなギャップ診断を支える粗いものから細かいものへ段階的に構成されたメモリ階層であるLaceMem(会話的証拠メモリのための層状アーキテクチャ: Layered Architecture for Conversational Evidence Memory)を組み合わせたものである。LoCoMoにおいて、EviMemは時間的(73.3%から81.6%)およびマルチホップ(65.9%から85.2%)の質問で、MIRIXに対してJudge Accuracyを向上させ、レイテンシは4.5倍低い。コード: https://github.com/AIGeeksGroup/EviMem。
EviMem:長期対話メモリのためのエビデンスギャップ駆動型反復検索
arXiv cs.CL / 2026/5/1
💬 オピニオンTools & Practical UsageModels & Research
要点
- この論文では、単発検索や方向性のない改善ではなく「エビデンスギャップ(必要だが欠けている根拠)」に基づいて反復検索を行う長期対話メモリ手法「EviMem」を提案します。
- EviMemは閉ループの枠組み(IRIS)を用い、十分性評価によって現在の検索集合に何が欠けているかを検出し、そのギャップを診断したうえでクエリを重点的に改善します。
- また、粗→細の層構造を持つメモリ階層「LaceMem」を導入し、セッションをまたいだエビデンスギャップをきめ細かく診断できるようにします。
- LoCoMoでの実験では、EviMemがMIRIXに対して時間的質問(73.3%→81.6%)とマルチホップ質問(65.9%→85.2%)でJudge Accuracyを向上させ、さらに遅延を4.5倍低減しました。
- 著者はGitHubリポジトリを公開しており、再現や発展的な開発を可能にしています。




