この論文は、検索補助付き質問応答のための決定論的な証拠選択フレームワークを提案します。アプローチは、意味-有用性推定(Meaning-Utility Estimation, MUE)と多様性-有用性推定(Diversity-Utility Estimation, DUE)を導入し、回答生成前に証拠の適格性を決定する固定スコアリングと冗長性制御の手順を提供します。各文またはレコードは、意味的関連性、用語の網羅性、概念的独自性、および冗長性を示す明示的な信号を用いて独立に評価されます。トレーニングやファインチューニングは必要ありません。
プロトタイプでは、タスクで求められる事実、規則、条件を明示的に述べている場合にのみ、その単位を受理します。単位は統合されたり拡張されたりしません。いずれの単位も独立して要件を満たさない場合、システムは回答を返しません。この決定論的ゲーティングは、コンパクトで監査可能な証拠セットを生み出し、関連テキストと使用可能な証拠との間に明確な境界を確立します。
決定論的有用性ゲーティングによる検索強化型質問応答における制御可能な証拠選択
arXiv cs.CL / 2026/3/20
📰 ニュースModels & Research
要点
- 本論文は、Meaning-Utility Estimation (MUE) および Diversity-Utility Estimation (DUE) を用いて、回答生成前に証拠をゲーティングする、検索強化型QAのための決定論的証拠選択フレームワークを提案する。
- 固定スコアリングと冗長性制御の手続きを導入し、意味的関連性、用語カバー率、概念的独自性、冗長性といった信号に基づいて、各候補文を独立に評価する。
- 従来のアプローチとは異なり、ユニットは要求された事実・規則・条件を明示的に満たす場合のみ受理され、要件を満たすユニットがない場合は回答を返さず、監査可能な証拠集合を実現する。
- トレーニングやファインチューニングは不要で、ゲーティングは関連テキストと利用可能な証拠との間に明確な境界を確立する。
関連記事
[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし
Reddit r/MachineLearning
[P] 自宅PC上の Vibecoded: Karpathyに触発されたAI支援の研究ループを用いて、約2700 Elo のブラウザでプレイ可能なニューラルチェスエンジンを構築
Reddit r/MachineLearning
DuckLLM 1.0 — 私の初めてのモデルを紹介します!
Reddit r/LocalLLaMA
FastFlowLMがLinux対応を追加したため、同社がサポートする全モデルをベンチマークしました。以下が結果です。
Reddit r/LocalLLaMA
高次元生存分析におけるネストしたモデルと非ネストモデルを比較する際に用いる評価指標は何ですか [D]
Reddit r/MachineLearning