質問応答のためのRAG性能予測

arXiv cs.CL / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 研究では、質問応答タスクにおいてRAG(retrieval augmented generation)を使う場合の性能向上(得られる利得)を、RAGを使わない場合との比較で事前に予測する手法を扱っています。
  • 既存の「前段(pre-retrieval)」「後段(post-retrieval)」「生成後(post-generation)」の複数の予測器を検討し、その有効性を比較しています。
  • 生成後ベースの予測器のうち1つは新規提案で、全体として最高の予測品質を示したと報告されています。
  • 最も効果的だったのは、質問・検索されたパッセージ・生成された回答の間の意味的関係を明示的にモデリングする新しい教師あり予測器であることが結論づけられています。

Abstract

本稿では、質問応答においてRAG(retrieval augmented generation:検索拡張生成)を用いることによる利得を、用いない場合と比較して予測するという課題に取り組みます。私たちは、もともとアドホック検索のために考案されたいくつかの、検索前および検索後の予測器の性能を調査します。さらに、いくつかの生成後予測器も調査します。そのうちの一つは本研究で新しく、最も高い予測品質を提示します。実験結果は、最も効果的な予測アプローチが、質問、検索された文書(パッセージ)、生成された回答の間の意味的関係を明示的にモデル化する新しい教師あり予測器であることを示しています。