Rag Performance Prediction for Question Answering

arXiv cs.CL / 4/10/2026

💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • 研究では、質問応答タスクにおいてRAG(retrieval augmented generation)を使う場合の性能向上(得られる利得)を、RAGを使わない場合との比較で事前に予測する手法を扱っています。
  • 既存の「前段(pre-retrieval)」「後段(post-retrieval)」「生成後(post-generation)」の複数の予測器を検討し、その有効性を比較しています。
  • 生成後ベースの予測器のうち1つは新規提案で、全体として最高の予測品質を示したと報告されています。
  • 最も効果的だったのは、質問・検索されたパッセージ・生成された回答の間の意味的関係を明示的にモデリングする新しい教師あり予測器であることが結論づけられています。

Abstract

We address the task of predicting the gain of using RAG (retrieval augmented generation) for question answering with respect to not using it. We study the performance of a few pre-retrieval and post-retrieval predictors originally devised for ad hoc retrieval. We also study a few post-generation predictors, one of which is novel to this study and posts the best prediction quality. Our results show that the most effective prediction approach is a novel supervised predictor that explicitly models the semantic relationships among the question, retrieved passages, and the generated answer.