PassiveQA:教師ありファインチューニングによるエピステミックに較正された質問応答のための3アクション・フレームワーク
arXiv cs.CL / 2026/4/7
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMベースのQAシステムがしばしばクエリは完全に指定されていることを前提としており、不十分または曖昧な情報に対して過度に自信のある回答や幻覚(ハルシネーション)を生むと主張する。
- 著者らは、モデルがエピステミックな十分性に基づいて、3つの行動—Answer(回答)、Ask for clarification(釈明を求める)、Abstain(棄権)—から選択する意思決定に基づく設定を研究する。
- 著者らは、標準的および強化RAGアプローチでは、この「エピステミックな気づき」を確実に提供できず、必要な変数が欠けている場合でも回答を生成しがちであることを見出す。
- そこで著者らはPassiveQAを提案する。これは、構造化された情報状態の表現、知識グラフに基づく文脈、欠落変数を推論するファインチューニング済みプランナを用いた教師ありファインチューニングによって実現される。
- 複数のQAデータセットでの実験により、計算資源に制約のある学習下で、幻覚率を低くしつつマクロF1と棄権(abstention)のリコールが改善することが示され、エピステミックな意思決定は学習の過程で獲得されるべきだという示唆が得られる。
