CAR：クエリ誘導による信頼度（Confidence）を意識した再ランキング手法

arXiv cs.AI / 2026/5/7

💬 オピニオンTools & Practical UsageModels & Research

共有:

要点

本論文は、RAGの再ランキングはクエリと文書の関連度だけでなく、生成の有用性（不確実性の低減など）を最適化すべきだと主張しています。
提案手法CAR（Confidence-Aware Reranking）は、トレーニング不要でプラグアンドプレイ可能な枠組みで、生成器の信頼度変化を文書の有用性として利用して再順序付けします。
CARは、複数サンプル回答の意味的一貫性を「クエリのみ」と「クエリ＋文書」の条件で比較することで信頼度を推定し、信頼度を上げる文書を昇格し下げる文書を降格し、状況が不確かな場合は基準の並びを維持します。
BEIRの4つのデータセットで、NDCG@5が一貫して改善し、スパース/ダンス両方のリトリーバや複数の再ランキング手法、さまざまなLLMバックボーンに対して効果が確認されています。
CARのランキング改善は生成側の品質向上と強く整合しており、生成F1との相関は非常に高い（Spearman ρ = 0.964）ことに加え、Contrieverによる検索下でYesNo再ランカーが平均25.4%改善するなどの結果が示されています。

要旨: Retrieval-Augmented Generation（RAG）は、有用な生成のための根拠を提供するために文書のランキングに依存しますが、従来の再ランキング手法は主にクエリと文書の関連性を最適化しており、生成の有用性そのものは最適化していません。関連する文書であってもノイズを持ち込む可能性があります。一方で、より低い順位の文書の方が、生成器の不確実性をよりうまく低減できる場合があります。そこで本研究では、CAR（Confidence-Aware Reranking：確信度を考慮した再ランキング）を提案します。CARは、クエリに導かれた学習不要でプラグアンドプレイな再ランキングの枠組みであり、文書の有用性のシグナルとして、生成器の確信度（confidence）の変化を用います。CARは、クエリのみの条件およびクエリ—文書の条件の下で、複数サンプルされた回答の意味的整合性を通じて確信度を推定します。確信度を大きく増加させる文書は昇格し、確信度を低下させる文書は降格されます。不確かなケースではベースラインの順序を維持しつつ、クエリレベルのゲートにより、すでに十分に確信しているクエリに対する不要な介入を避けます。4つのBEIRデータセットに対する実験により、CARは、疎および密なリトリーバ、LLMベースおよび教師ありの再ランカ、および4つのLLMバックボーンにわたって、NDCG@5を一貫して改善することが示されています。特に、ContrieverのリトリーバにおいてCARはYesNo再ランカを平均で25.4パーセント改善し、ランキングの獲得は、下流の生成におけるF1の改善と強く相関し、Spearmanのrho = 0.964を達成しています。