QPPは最適なクエリ・バリアントを選べるのか?RAGパイプラインにおけるクエリ・バリアント選択の評価
arXiv cs.CL / 2026/4/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、RAGパイプラインにおいてQPP(Query Performance Prediction)でクエリ書き換え(リフォームレーション)の各バリアントを最適に選び、全バリアントで検索・生成を毎回実行せずに済むかを検討する。
- 従来のQPPがトピック横断でクエリ難易度を推定するのに対し、本研究では同一の情報要求に対する競合する複数バリアントの中から最良を選ぶ「同一トピック内の識別」を扱う。
- TREC-RAGでの実験の結果、検索のランキング指標(nDCGなど)を最大化するバリアントが、必ずしも最良の生成回答につながらないことが示され、「検索適合性」と「生成の忠実度」の間に“utility gap(有用性の隔たり)”がある。
- それでもQPPは、元のクエリよりもエンドツーエンドの品質を改善するバリアントを一貫して特定できる。
- 特に、軽量な事前(pre-retrieval)予測器は、高コストな事後(post-retrieval)手法に匹敵、あるいは上回ることが多く、頑健で低遅延なRAGのバリアント選択の可能性が示される。




