適応的RAGのための軽量クエリルーティング:RAGRouter-Benchに関する基礎研究

arXiv cs.CL / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、Retrieval-Augmented Generation(RAG)における効率の課題に取り組む。クエリのタイプに応じて最適な検索戦略を選択し、能力を失うことなくトークンコストを削減する。
  • RAGRouter-Benchに対して、軽量な分類器ベースのクエリルーティングを行う初の体系的評価を提示する。5種類の古典的分類器と3種類の特徴レジーム(TF-IDF、MiniLM文埋め込み、構造特徴)を用いることで、合計15の特徴/分類器の組み合わせを検証した。
  • 最良の構成はTF-IDF特徴とSVMであり、マクロF1が0.928、精度が93.2%を達成し、最も高コストな検索パラダイムを常に使う場合と比べてシミュレーション上28.1%のトークン削減を実現する。
  • 語彙ベースのTF-IDF特徴は、意味的な文埋め込みをマクロF1で3.1ポイント上回り、表層のキーワードパターンがクエリタイプの複雑さを強く予測できることを示している。
  • ドメイン分析では、医療クエリが最もルーティングが難しく、法務クエリが最も扱いやすいことが分かる。さらに著者らは、コーパスを考慮したルーティング手法に残されたギャップを特定している。

Abstract

リトリーバル拡張生成(Retrieval-Augmented Generation, RAG)パイプラインは、トークンコストと能力が大きく異なる多様な検索戦略にまたがります。クエリごとに適切な戦略を選択することは実用的な効率化の課題ですが、RAGRouter-Bench citep{wang2026ragrouterbench}(最近公開されたベンチマーク)では、ルーティング分類器が訓練されていません。このベンチマークは、4つの知識領域にまたがる7,727件のクエリを対象としており、それぞれが3つの代表的なクエリタイプ(事実・推論・要約)のいずれか1つで注釈されています。私たちは、このベンチマークにおける軽量な分類器ベースのルーティングに関する、最初の体系的な評価を提示します。5つの古典的分類器を、3つの特徴量レジーム、すなわちTF-IDF、MiniLM文埋め込み citep{reimers2019sbert}、手作りの構造特徴量のもとで評価し、全部で15通りの分類器の特徴量組み合わせを得ます。最良の構成である「TF-IDF + SVM」は、マクロ平均F1がmathbf{0.928}、精度がmathbf{93.2\\%}を達成し、最も高コストなパラダイムを常に使う場合と比べてmathbf{28.1\\%}のトークン節約をシミュレーションします。語彙的なTF-IDF特徴量は、意味的な文埋め込みよりもマクロF1で3.1ポイント上回っており、表面のキーワードパターンがクエリタイプの複雑さに対する強力な予測因子であることを示唆します。領域レベルの分析では、医療クエリが最もルーティングが難しく、法務クエリが最も扱いやすいことが分かります。これらの結果は、再現可能なクエリ側のベースラインを確立するとともに、コーパスを考慮したルーティングが埋めるべきギャップを明らかにします。