反復的推論を伴う状態保持型・証拠駆動リトリーバル強化生成

arXiv cs.CL / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、通常のリトリーバル強化生成(RAG)が、フラットな文脈表現とステートレスな検索のために不安定になりやすく、それが信頼できる質問応答を妨げると指摘しています。
  • 「状態保持型・証拠駆動RAG(反復的推論付き)」では、QAを1回の検索・生成ではなく、段階的な証拠の蓄積としてモデル化します。
  • 検索で得た文書を、関連度や信頼度といった明示的なシグナルを含む構造化された推論ユニットに変換し、支持情報だけでなく反対・矛盾情報も含めて持続的な証拠プールに保持します。
  • 証拠に基づく不足分析や対立の検出を行い、その結果を踏まえて次の検索を導くようにクエリを反復的に改良します。
  • 複数のQAベンチマークで、標準的RAGやマルチステップ基線に対して一貫した改善が示され、さらに検索ノイズが大きい状況でも安定した性能が得られると報告しています。

Abstract

Retrieval-Augmented Generation(RAG)は外部知識によって大規模言語モデル(LLM)を裏付けますが、多くの場合、平坦なコンテキスト表現とステートレスな検索によって性能が不安定になります。そこで本研究では、反復推論を伴うステートフルなエビデンス駆動RAG(Stateful Evidence-Driven RAG)を提案します。この枠組みは、質問応答を進行的なエビデンス蓄積プロセスとしてモデル化します。取得した文書は、明示的な関連性および信頼度のシグナルを持つ構造化された推論ユニットへと変換され、支持情報と非支持情報の両方を捉える持続的なエビデンスプールとして維持されます。さらにこの枠組みは、エビデンスに基づく欠陥分析を実行してギャップや矛盾を特定し、その後の検索を導くためにクエリを反復的に洗練します。この反復推論プロセスにより、安定したエビデンス集約が可能となり、ノイズの多い検索に対する頑健性が向上します。複数の質問応答ベンチマークで行った実験では、標準的なRAGや多段(multi-step)ベースラインに比べて一貫した改善が示されると同時に、大規模な検索ノイズの下でも高品質なエビデンスを効果的に蓄積し、性能を安定に維持できることが確認されました。