広告

エントロピーによる主張解決:RAGにおける不確実性駆動のエビデンス選択

arXiv cs.AI / 2026/3/31

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、RAGにおける従来の関連度ベースの密検索は、クエリが曖昧であったり証拠が競合していたりする場合に失敗しうると主張する。これは、関連度だけでは認識論的な不確実性を解消できないためである。
  • そこで提案されるのが、Entropic Claim Resolution(ECR)である。ECRは推論時アルゴリズムであり、クエリと文書の類似度を最大化するのではなく、競合する意味的な回答仮説間のエントロピーを最小化することでエビデンスを選択する。
  • ECRは、意思決定理論に基づくExpected Entropy Reduction(EER)の基準により原子的なエビデンスを逐次的に選択し、コヒーレンス制約の下で認識論的十分条件(H ≤ epsilon)を満たした時点で停止する。
  • 著者らは、ECRをプロダクション品質のマルチストラテジー検索パイプライン(CSGR++)に統合し、提案手法の性質に関する理論的分析を行う。
  • 本研究は、RAGを「最も関連する」文書を取得する枠組みから、「最終回答の不確実性を低減する最も弁別的な」エビデンスを取得する枠組みに再定義する。

概要: 現在の検索拡張生成(RAG)システムは主として、関連性に基づく密な(dense)検索に依存し、クエリとの意味的類似性を最大化するために文書を逐次取得します。しかし、証拠が相反する、あるいはクエリ自体に本質的な曖昧性があるといった、知識集約的で現実世界に特有の状況では、関連性だけでは、認識論的不確実性を解消するには不十分です。私たちは、新しい推論時アルゴリズムであるEntropic Claim Resolution(ECR)を提案します。これは、RAGの推論を、競合する意味的な回答仮説間でのエントロピー最小化として言い換えるものです。ReActのような行動駆動型のエージェント的枠組みや、固定パイプライン型のRAGアーキテクチャとは異なり、ECRは、情報の価値を定める意思決定論的基準であるExpected Entropy Reduction(EER)を最大化することで、原子的な根拠(エビデンス)主張を逐次的に選択します。このプロセスは、(認識論的整合性に従って)システムが数学的に定義された認識論的十分性の状態に到達した時点で動的に終了します(H <= epsilon)。ECRを、本番品質のマルチ戦略検索パイプライン(CSGR++)に統合し、その理論的性質を分析します。私たちの枠組みは、不確実性を考慮した根拠選択に対する厳密な基盤を提供し、「最も関連性が高いものを取得する」というパラダイムから、「最も識別的なものを取得する」への転換を促します。

広告