広告

アンサンブル投票によるRAGにおけるハルシネーション・オン・ハルシネーションの低減

arXiv cs.CL / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • Retrieval-Augmented Generation(RAG)では、欠陥のある検索がLLMを誤誘導すると、「ハルシネーション・オン・ハルシネーション」が依然として発生し、応答生成中に誤りが増幅されることがあります。
  • 本論文では、学習不要の二段階アンサンブル投票フレームワーク「VOTE-RAG」を提案します。まず検索投票により文書を集約し、次に応答投票により最終回答を選択します。
  • 検索投票では、複数の並列なクエリ生成エージェントを用いてクエリを多様化し、取得した文書をプールすることで、単一の不適切な検索が与える影響を減らすことを狙います。
  • 応答投票では、複数のエージェントが集約された文書から独立に回答を生成し、多数決投票により堅牢性と信頼性を高めます。
  • 6つのベンチマークデータセットでの実験では、VOTE-RAGはより複雑な手法と同等以上の性能を示しつつ、よりシンプルで、完全に並列化可能であり、「問題のドリフト(problem drift)」のリスクを回避できることが示されています。

Abstract

リトリーバル強化生成(Retrieval-Augmented Generation: RAG)は、外部知識を統合することで、大規模言語モデル(LLM)の幻覚を減らすことを目指します。しかしRAGには重要な課題があります。「幻覚の上に幻覚(hallucination on hallucination)」であり、誤った検索結果が生成モデルを誤誘導し、幻覚が積み重なってしまいます。そこで本研究では、この問題に対処するため、学習不要の新しい枠組みVOTE-RAGを提案します。これは二段階の構造と、効率的で並列化可能な投票メカニズムを備えています。VOTE-RAGは次を含みます。(1)検索投票(Retrieval Voting):複数のエージェントが並列に多様なクエリを生成し、取得した全ての文書を集約します。(2)応答投票(Response Voting):複数のエージェントが集約された文書に基づいて独立に回答を生成し、最終出力は多数決によって決定されます。6つのベンチマークデータセットで比較実験を行います。その結果、VOTE-RAGは、より複雑な枠組みに匹敵する、あるいはそれを上回る性能を達成することが示されました。さらにVOTE-RAGは、より単純なアーキテクチャを特徴とし、完全に並列化可能であり、「問題ドリフト」リスクも回避します。本研究は、単純で信頼性の高いアンサンブル投票が、RAGの幻覚を緩和するための、より優れた、かつより効率的な方法であることを示しています。

広告
アンサンブル投票によるRAGにおけるハルシネーション・オン・ハルシネーションの低減 | AI Navigate