要旨: 検索補助付き生成はすべてのコンテンツを区別なく格納し、ノイズが蓄積するにつれて精度を低下させる。パラメトリック手法は知識を重みの中へ圧縮し、選択的な更新を不可能にする。どちらも生物学的記憶を模していない。生物は顕著性に基づいて符号化をゲート制御し、過去の情報を削除するのではなくアーカイブする。私たちは入ってくる知識オブジェクトを複合顕著性スコア(情報源の評判、新規性、信頼性)を用いてフィルタリングする書き込み時ゲーティングを導入し、以前の状態を保持するバージョンチェーンを維持する。品質ラベルへのオラクルアクセスなしで実測のLLM評価を用いて、書き込み時ゲーティングは100%の精度を達成するのに対し、ゲートなしの格納は13%だった。重要な発見はディストラクター比率のスケーリング下で現れる:8:1のディストラクター比率では、読み取り時フィルタリング(Self-RAG)は0%に崩壊する一方、書き込み時ゲーティングは100%を維持し、書き込み時と読み取り時のキュレーションの構造的優位性を明らかにする。Wikipedia(20エンティティ)、手続き的に生成された薬理データ、そして2026年のarXiv論文でこれらの発見を検証している。パラメトリック記憶サポートに対してゲーティングの優位性は反比例的に拡大する:Wikipediaでは+25pp、cutoff後のarXivでは+48pp、訓練知識ゼロの手続きデータでは+65pp。信号アブレーションは、この方法がオラクルと相関したメタデータに依存していないことを確認する。書き込み時ゲーティングはSelf-RAGの精度と同等で、クエリ時間コストの9分の1で実現する。
人工知能の選択的記憶: 階層アーカイブを用いた書き込み時ゲーティング
arXiv cs.AI / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論は、階層的アーカイブを用いた書き込み時ゲーティングを提案し、複合的顕著性スコア(情報源の評価、新規性、信頼性)を用いて入ってくる知識オブジェクトをフィルタリングし、過去の状態を保持するためのバージョン連鎖を保存します。
- このアプローチは、検索強化生成およびパラメトリック・メモリの限界に対処し、無差別なデータ格納を回避し、選択的な更新を可能にします。
- 実際のLLMsを用いた評価で、オラクル品質ラベルなしの場合、書き込み時ゲーティングは100%の精度を達成し、未ゲートの格納は13%となりました。
- ディストラクターのスケーリング(8:1)の下で、読取時フィルタリングは0%に収束する一方、書き込み時ゲーティングは100%を維持し、Self-RAGに対するクエリ時コストを9分の1に削減します。Wikipedia、薬理学データ、カットオフ後の arXiv 論文で精度向上が観察されます。