ケースに基づく証拠検証：証拠に敏感な監督を構築するためのフレームワーク

arXiv cs.CL / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、証拠に基づく推論は、モデルの意思決定が、取得したテキストが予測に付加されるかどうかではなく、提供された証拠が主張を支持しているかどうかに明示的に依存するように、学習および評価されるべきだと主張する。
「ケースに基づく証拠検証」を導入する。ここでは、モデルにローカルなケース文脈、外部の証拠、構造化された主張を与え、その特定のケースに対して証拠が支持しているかを判断させる。
著者らは、自動化された監督（supervision）構築手法を提案する。この手法は、明示的な支持例に加え、反実仮想的に誤った状態を含む反支持例や、話題関連のネガティブ例など、意味的に制御された非支持（non-support）例を作成する。さらに、手作業での証拠アノテーションは行わない。
放射線医学の実験では、新しい支持タスクで学習した標準的な検証器が、ケースのみおよび証拠のみのベースラインを上回る。また、証拠を削除または置換すると性能が崩れることにより、証拠依存性を示す。
学習した検証器は、未見の証拠記事および外部のケース分布に対して一般化する。ただし、証拠ソースの変化では性能が低下し、モデルのバックボーンの選択によって結果が変動する。

日経XTECH

日経XTECH

日経XTECH

日経XTECH

日経XTECH