セマンティックな関連性を超えて:堅牢なリトリーバル拡張生成のための反事実リスク最小化

arXiv cs.CL / 2026/5/5

📰 ニュースModels & Research

要点

  • 多くの既存RAGシステムは検索を意味的な関連性で最適化していますが、意思決定の場面でユーザーのクエリに認知バイアス(誤った前提や確証バイアスなど)が含まれると失敗します。
  • 「関連性-堅牢性ギャップ」として、関連性を高めることが、幻覚を強める迎合的(sycophantic)な証拠の取得につながり得ることを示します。
  • 提案手法CoRM-RAGは、類似度ではなく意思決定の安全性に合わせて検索を行い、反事実リスク最小化によって堅牢性を高めます。
  • 因果的介入に基づき、学習時にCognitive Perturbation Protocolで認知バイアスをシミュレートし、その知見を軽量なEvidence Criticへ蒸留します。
  • 意思決定ベンチマークでの実験では、CoRM-RAGが敵対的なクエリ摂動下で強力な密ベース検索器やLLMベース再ランキングを上回り、堅牢性スコアによるリスク認識の棄却(abstention)も改善します。

要約: 標準的な検索拡張生成(RAG)システムは、主として有用性の代理として意味的関連性を依存しています。しかし、この前提は、ユーザーのクエリが誤った前提や確証バイアスのような認知バイアスを帯びる、現実的な意思決定の状況では崩れ落ちます。このような場合、関連性を最大化することは逆説的に、幻覚を強化するへつらい的な証拠の取得を促進し、これは我々が「``Relevance-Robustness Gap(関連性-頑健性ギャップ)''」と呼ぶ重要な失敗です。このギャップを埋めるために、我々はCoRM-RAG(RAGに対する反実リスク最小化)を提案します。これは、単なる類似性ではなく意思決定の安全性に基づいて検索を整合させる枠組みです。因果介入に基づき、訓練中にユーザーバイアスをシミュレートするための認知攪乱プロトコルを導入し、その後それを軽量なエビデンス・クリティックへ蒸留します。このスコアリングモジュールは、敵対的なクエリ攪乱があっても、モデルを正しさへ導くのに十分な証拠の強度を持つ文書を識別することを学習します。意思決定ベンチマークに対する大規模な実験により、CoRM-RAGは敵対的状況において強力な密検索器やLLMベースの再ランキング手法を大幅に上回ること、さらに信頼できる頑健性スコアリングを通じてリスクを意識した効果的な棄権(abstention)を可能にすることを示します。我々のコードは https://github.com/PeiYangLiu/CoRM-RAG.git で公開されています。