検索拡張生成におけるジョイントデコードで知識統合を保証する

arXiv cs.CL / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、検索拡張生成(RAG)における「統合ボトルネック」を特定する。すなわち、LLMが関連文書を検索できても、パラメトリックな知識との衝突によりそれらをうまく活用できない場合がある。
  • それに対し、GuarantRAGを提案する。これは推論とエビデンス統合を切り離し、パラメトリック知識から生成されるInner-Answerと、検索された文書に制約されたRefer-Answerを生成することで実現する。さらに、新しいContrastive DPO目的関数を用いる。
  • 次に、ジョイントデコード機構によって、単純な連結に頼るのではなく、トークン単位でInner-Answerの論理的一貫性とRefer-Answerの事実の正確さを融合させる。
  • 5つのQAベンチマークにわたる実験では、標準および動的RAGのベースラインに比べて精度が最大12.1%向上し、幻覚(hallucinations)が16.3%減少することが示される。
  • 全体として、本研究はエビデンス統合を、検索品質の問題「だけ」として捉えるのではなく、明示的な学習・デコードの問題として位置付ける。