MemGuard-Alpha:メンバーシップ推論とクロスモデルの不一致により、LLMベースの金融予測における記憶(memorization)汚染された信号を検出・フィルタリングする
arXiv cs.LG / 2026/3/31
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- MemGuard-Alphaは、LLMベースの金融予測において先読みバイアス(look-ahead bias)を引き起こし得る、記憶(memorization)汚染された信号を検出・除去するための、ゼロコストの生成後(post-generation)フレームワークとして提示される。
- この手法は、複数のメンバーシップ推論攻撃のシグナルを時間的近接(temporal proximity)特徴とともに集約するMemGuard Composite Score(MCS)と、異なるLLM間で学習打ち切り日(training cutoff date)の違いを活用して記憶された出力を検出するCross-Model Memorization Disagreement(CMMD)を組み合わせる。
- 7つのLLM、S&P 100の50銘柄、2019〜2024年の42,800プロンプトに対する実験では、フィルタリング後に取引パフォーマンスが大幅に改善したことが示される。具体的にはSharpe比が(4.11 vs 2.76)と向上し、「クリーン」信号における平均日次リターンが大きくなる。
- 論文は明確な記憶のシグネチャを報告している。すなわち、汚染が増えるにつれてインサンプル精度は上昇する一方、アウト・オブ・サンプル精度は低下する。このことは、記憶が見かけのモデル性能を不当に押し上げることを直接的に示している。
- 著者らは、再学習や入力の匿名化といった従来の対策はコストが高い、または情報を失わせるとしており、MemGuard-Alphaを、量的(quantitative)戦略のための実用的なリアルタイム・フィルタリング手段として位置付けている。



