アンサンブル投票によるRAGにおけるハルシネーション・オン・ハルシネーションの低減

arXiv cs.CL / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

Retrieval-Augmented Generation（RAG）では、欠陥のある検索がLLMを誤誘導すると、「ハルシネーション・オン・ハルシネーション」が依然として発生し、応答生成中に誤りが増幅されることがあります。
本論文では、学習不要の二段階アンサンブル投票フレームワーク「VOTE-RAG」を提案します。まず検索投票により文書を集約し、次に応答投票により最終回答を選択します。
検索投票では、複数の並列なクエリ生成エージェントを用いてクエリを多様化し、取得した文書をプールすることで、単一の不適切な検索が与える影響を減らすことを狙います。
応答投票では、複数のエージェントが集約された文書から独立に回答を生成し、多数決投票により堅牢性と信頼性を高めます。
6つのベンチマークデータセットでの実験では、VOTE-RAGはより複雑な手法と同等以上の性能を示しつつ、よりシンプルで、完全に並列化可能であり、「問題のドリフト（problem drift）」のリスクを回避できることが示されています。

Abstract

リトリーバル強化生成（Retrieval-Augmented Generation: RAG）は、外部知識を統合することで、大規模言語モデル（LLM）の幻覚を減らすことを目指します。しかしRAGには重要な課題があります。「幻覚の上に幻覚（hallucination on hallucination）」であり、誤った検索結果が生成モデルを誤誘導し、幻覚が積み重なってしまいます。そこで本研究では、この問題に対処するため、学習不要の新しい枠組みVOTE-RAGを提案します。これは二段階の構造と、効率的で並列化可能な投票メカニズムを備えています。VOTE-RAGは次を含みます。（1）検索投票（Retrieval Voting）：複数のエージェントが並列に多様なクエリを生成し、取得した全ての文書を集約します。（2）応答投票（Response Voting）：複数のエージェントが集約された文書に基づいて独立に回答を生成し、最終出力は多数決によって決定されます。6つのベンチマークデータセットで比較実験を行います。その結果、VOTE-RAGは、より複雑な枠組みに匹敵する、あるいはそれを上回る性能を達成することが示されました。さらにVOTE-RAGは、より単純なアーキテクチャを特徴とし、完全に並列化可能であり、「問題ドリフト」リスクも回避します。本研究は、単純で信頼性の高いアンサンブル投票が、RAGの幻覚を緩和するための、より優れた、かつより効率的な方法であることを示しています。

Black Hat Asia

AI Business

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

日経XTECH

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

Reddit r/MachineLearning

Claude Codeの全ソースコードがnpmのソースマップ経由で流出していた──中身を解説

Dev.to

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

Dev.to

アンサンブル投票によるRAGにおけるハルシネーション・オン・ハルシネーションの低減

要点

Abstract

関連記事

Black Hat Asia

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

Claude Codeの全ソースコードがnpmのソースマップ経由で流出していた──中身を解説

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer