要約: メモリを拡張したエージェントは複数の専門的ストアを維持しますが、ほとんどのシステムは各クエリごとにすべてのストアから取得するため、コストが増大し、関係の薄い文脈が導入されます。私たちはメモリ取得をストア・ルーティング問題として定式化し、カバレッジ、厳密一致、およびトークン効率性指標を用いて評価します。下流の質問応答において、オラクル・ルータは一様取得と比較してより高い精度を達成しつつ、文脈トークンを大幅に少なく使用します。これにより、選択的取得が効率と性能の双方を向上させることを示しています。私たちの結果は、ルーティング決定がメモリを拡張したエージェント設計の第一級の要素であることを示し、スケーラブルなマルチストアシステムのための学習済みルーティング機構を動機づけます。さらに、ストア選択を回答の精度と取得コストを天秤にかけるコスト感度の意思決定問題として形式化し、ルーティングポリシーの原理的解釈を提供します。
正しいポケットを確認しましたか? メモリ拡張エージェントのコスト感度を考慮したストアアルーティング
arXiv cs.AI / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、メモリ拡張エージェントの複数ストアにまたがる検索をストアアルーティング問題として再定義し、選択的検索がコストを削減しつつ性能を維持または向上させることを示している。
- オラクル・ルーターは、一様な検索よりもはるかに少ない文脈トークンを使用しながら、下流の質問応答タスクでより高い精度を達成する。
- 著者らはストア選択を、答えの正確性と検索コストをトレードオフするコスト感度の意思決定問題として形式化し、ルーティングを設計上の第一級の選択肢として強調している。
- 複数ストアのメモリシステムをスケールさせるための学習型ルーティング機構を提案し、効率的なメモリアーキテクチャ設計のための体系的なフレームワークを提供する。




