意思決定に有用な検索のための仮説条件付きクエリリライト

arXiv cs.CL / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

HCQRは、トレーニングを必要としない事前検索フレームワークで、入力質問と候補オプションから軽量な作業仮説を導出することにより、Retrieval-Augmented Generation（RAG）をトピック指向の検索からエビデンス指向の検索へと再指向する。
検索を3つのターゲットクエリへと書換え、(1) 仮説を支持する証拠、(2) 仮説を競合する代替案と区別する証拠、(3) 質問における顕著な手掛かりを検証する証拠を求める。
MedQA および MMLU-Med の実験は、HCQR が一つのクエリを用いる RAG や再ランキング/フィルタリングのベースラインを一貫して上回すことを示し、平均正解率をそれぞれ5.9ポイントおよび3.6ポイント改善した。
コードは https://anonymous.4open.science/r/HCQR-1C2E で公開されている。

概要：Retrieval-Augmented Generation（RAG）は、外部の非パラメトリックな知識に基づいて生成を根拠づけることにより、Large Language Models（LLMs）を向上させる。
しかし、タスクが競合する選択肢の中から一つを選ぶ必要がある場合、単に広く関連する文脈に生成を根拠づけるだけでは最終決定を導くには不十分であることが多い。
従来のRAG手法は通常、単一の初期クエリに頼ることが多く、しばしばトピックの関連性を意思決定に関連する証拠よりも優先させ、そのため回答オプション間を識別できない背景情報を取得してしまう。
この問題に対処するため、ここではHypothesis-Conditioned Query Rewriting（HCQR）を提案する。これはトレーニング不要のプレリトリーバルフレームワークで、RAGをトピック指向の検索から証拠指向の検索へと再編成する。
HCQR は、入力質問と候補オプションから軽量な作業仮説を導出し、取得を3つのターゲットクエリへ書き換える。これらは証拠を求めるもので、(1) 仮説を支持する、(2) 競合する代替案と区別する、(3) 質問の顕著な手掛かりを検証する証拠を求める。
この手法は、回答選択とより直接的に整合した文脈取得を可能にし、取得された証拠に基づいて初期仮説を確認または覆すことを可能にする。
MedQA および MMLU-Med の実験は、HCQR が単一クエリ RAG および再ランク付け/フィルタリングのベースラインを一貫して上回ることを示しており、Simple RAG に対する平均正確度をそれぞれ 5.9 ポイントと 3.6 ポイント向上させている。
コードは https://anonymous.4open.science/r/HCQR-1C2E で公開されています。

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

Dev.to

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

Dev.to

意思決定に有用な検索のための仮説条件付きクエリリライト

要点

関連記事

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer