概要:Retrieval-Augmented Generation(RAG)は、外部の非パラメトリックな知識に基づいて生成を根拠づけることにより、Large Language Models(LLMs)を向上させる。
しかし、タスクが競合する選択肢の中から一つを選ぶ必要がある場合、単に広く関連する文脈に生成を根拠づけるだけでは最終決定を導くには不十分であることが多い。
従来のRAG手法は通常、単一の初期クエリに頼ることが多く、しばしばトピックの関連性を意思決定に関連する証拠よりも優先させ、そのため回答オプション間を識別できない背景情報を取得してしまう。
この問題に対処するため、ここではHypothesis-Conditioned Query Rewriting(HCQR)を提案する。これはトレーニング不要のプレリトリーバルフレームワークで、RAGをトピック指向の検索から証拠指向の検索へと再編成する。
HCQR は、入力質問と候補オプションから軽量な作業仮説を導出し、取得を3つのターゲットクエリへ書き換える。これらは証拠を求めるもので、(1) 仮説を支持する、(2) 競合する代替案と区別する、(3) 質問の顕著な手掛かりを検証する証拠を求める。
この手法は、回答選択とより直接的に整合した文脈取得を可能にし、取得された証拠に基づいて初期仮説を確認または覆すことを可能にする。
MedQA および MMLU-Med の実験は、HCQR が単一クエリ RAG および再ランク付け/フィルタリングのベースラインを一貫して上回ることを示しており、Simple RAG に対する平均正確度をそれぞれ 5.9 ポイントと 3.6 ポイント向上させている。
コードは https://anonymous.4open.science/r/HCQR-1C2E で公開されています。
意思決定に有用な検索のための仮説条件付きクエリリライト
arXiv cs.CL / 2026/3/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- HCQRは、トレーニングを必要としない事前検索フレームワークで、入力質問と候補オプションから軽量な作業仮説を導出することにより、Retrieval-Augmented Generation(RAG)をトピック指向の検索からエビデンス指向の検索へと再指向する。
- 検索を3つのターゲットクエリへと書換え、(1) 仮説を支持する証拠、(2) 仮説を競合する代替案と区別する証拠、(3) 質問における顕著な手掛かりを検証する証拠を求める。
- MedQA および MMLU-Med の実験は、HCQR が一つのクエリを用いる RAG や再ランキング/フィルタリングのベースラインを一貫して上回すことを示し、平均正解率をそれぞれ5.9ポイントおよび3.6ポイント改善した。
- コードは https://anonymous.4open.science/r/HCQR-1C2E で公開されている。

