LLMベースのクエリ再構成に関する再現性研究
arXiv cs.CL / 2026/5/1
💬 オピニオンSignals & Early TrendsModels & Research
要点
- 本研究は、10のLLMベース・クエリ再構成手法を単一で厳密に統制された実験環境で体系的に評価し、本当に再現可能な効果を切り分けようとしています。
- 再構成の有効性は検索(レトリーバル)のパラダイムに強く依存し、語彙ベース(lexical)の検索で見られた改善がニューラル検索(neural retrievers)へ一貫して転移するわけではないことが示されました。
- 大規模なLLMを使っても、下流の検索性能が設定全体で一様に向上するとは限らないという結果です。
- 実験は、2つのLLMファミリとパラメータ規模、3種類の検索方式(語彙ベース、学習済みスパース、密ベクトル)、TREC Deep LearningおよびBEIRの9つのベンチマークにまたがっています。
- 透明性を高め、継続的な比較を可能にするため、著者らはQueryGymを通じてプロンプト、設定、評価スクリプト、実行ファイルを公開し、公開リーダーボードも提供しています。