「いつ思い出すか」を学ぶ:棄権(abstention)を意識したLLMベースコーディングエージェントのリスク感受的文脈バンディットによる記憶検索
arXiv cs.CL / 2026/5/1
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- この論文は、LLMベースのコーディングエージェントが外部メモリを常に再利用すべきではないと主張しており、スタックトレース等の見かけ上の類似が「不安全なメモリ注入」を引き起こし得る点を問題化しています。
- そこでメモリ検索を、純粋な上位k抽出ではなくリスク感受的な選択制御問題として捉え直し、RSCB-MCを提案します。RSCB-MCは「メモリを使わない」「上位解決を注入する」「候補を要約する」「高精度/高再現で検索する」「棄権する」「フィードバックを求める」などのアクションを文脈に応じて選びます。
- RSCB-MCは、再利用可能な課題知識をpattern-variant-episodeスキーマで保存し、関連性・不確実性・構造的適合・フィードバック履歴・偽陽性リスク・レイテンシ・トークンコストを含む16特徴量の固定表現で検索文脈を表します。
- 報酬設計では「誤ったメモリ注入(偽陽性)」を「再利用の見逃し」に比べて強く罰し、棄権や非注入を安全性のための第一級アクションとして扱います。
- オフライン評価と限定的なホットパス検証で、RSCB-MCは高い成功率(オフラインで62.5%、プロキシで60.5%)を達成しつつ偽陽性率0.0%を維持し、意思決定のp95レイテンシも約331マイクロ秒と低いことを示しています。




