曖昧さから精度へ:コアファレンス解決がリトリーバル拡張生成(RAG)システムに与える変革的効果

arXiv cs.CL / 2026/4/29

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、参照(代名詞や同一実体の繰り返しなど)のコアファレンスが、外部文書検索を組み合わせるリトリーバル拡張生成(RAG)におけるインコンテキスト学習を弱める要因になり得ることを体系的に調査している。
  • コアファレンス解決を適用することで、検索の有効性(より関連性の高い文書の選択)と、下流の質問応答(QA)性能の双方が向上することを示している。
  • 検索タスクにおけるプーリング戦略を比較した結果、コアファレンス解決後には平均プーリングが文脈の捕捉能力において最も優れていると分かった。
  • また、曖昧性の解消から得られる恩恵はより小型のモデルで大きいことが示されており、これは参照の曖昧さを扱うための内在的な能力が小さいことに起因する可能性がある。
  • 以上より、本研究は、知識集約型AIアプリケーションにおいてコアファレンスの複雑さに対処することで、検索と生成の両方を改善するための指針を提供する。

Abstract

生成拡張(Retrieval-Augmented Generation; RAG)は、自然言語処理(NLP)において重要な枠組みとして注目されており、大規模言語モデル(LLM)に外部文書の検索を統合することで事実整合性を向上させ、幻覚を抑制します。しかし、RAGの有効性は、検索された文書における指示対象の同一性(コアファレンス)の複雑さによってしばしば妨げられ、その結果、生じる曖昧さがインコンテキスト学習を阻害します。本研究では、RAGベースのシステムにおいて、エンティティのコアファレンスが文書検索と生成性能の両方にどのように影響するのかを、検索の関連性、文脈理解、そして全体的な応答品質に焦点を当てて体系的に検証します。本研究では、コアファレンス解消が検索の有効性を高め、質問応答(QA)の性能を改善することを示します。検索タスクにおける異なるプーリング戦略の比較分析により、コアファレンス解消適用後、平均プーリングが文脈を捉える能力において優れていることがわかります。QAタスクでは、より小規模なモデルほど曖昧性解消の恩恵をより大きく受けることを見出します。これは、おそらくそれらが参照の曖昧さを扱うための固有の能力が限定的であるためです。これらの知見に基づき、本研究はRAGにおけるコアファレンスの複雑さがもたらす課題をより深く理解し、知識集約型AIアプリケーションにおける検索と生成の改善に向けた指針を提供することを目的とします。