一般リスク制御による適合的選択予測

arXiv cs.LG / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、AIシステムが不確実である場合に予測を保留（棄権）できる一方で、信頼できる予測の部分集合に対して厳密な誤り／リスク制御をなお維持する選択的予測のための枠組み SCoRE（E値を用いた選択的・適合的リスク制御）を提案する。
SCoRE は、適合推論と仮説検定の概念を用いて一般化された非負の e値（e-values）を構成し、データの交換可能性（data exchangeability）により、e値で重み付けされた未知リスクの期待値が 1 以下に抑えられることを保証する。
この枠組みは、これらの e値を二値の「信頼」判断へと変換し、一様な集中（uniform concentration）仮定に依存せずに、正（信頼された）ケースにおけるリスクに関する有限標本保証を与える。
本手法はモデルに依存しない（model-agnostic）よう設計されており、ユーザ定義の有界な連続リスクをサポートし、分布シフトのシナリオへ拡張できる可能性もある。
シミュレーションによる実験および、創薬、健康リスク予測、大規模言語モデルへの応用により、棄権と信頼性が重要となる場面での誤り管理における有効性が示されている。

要旨: 人工知能（AI）モデルを導入する際、選択的予測では、モデルの品質について不確実である場合に予測を棄権（出さない）する選択肢がある。約束を果たすためには、モデルが信頼されるケースに対して、厳格で正確な誤り制御を強制することが重要である。本研究では、あらゆる学習済みモデルと、ユーザーが定義した、上界があり連続値をとるリスクに対して、そのような判断を導出するための新しい枠組みとして、E値を用いた選択的適合リスク制御（SCoRE: Selective Conformal Risk control with E-values）を提案する。SCoREは、システムがモデルを信頼することを選択する「正」のケースにおけるリスクに関して、2種類の保証を提供する。適合推論（conformal inference）と仮説検定（hypothesis testing）の考え方に基づき、SCoREはまず、（一般化された）e値のクラスを構築する。これらは非負の確率変数であり、未知のリスクとその積の期待値が1以下となる。こうした性質は、モデリングの仮定を必要とせずに、データの交換可能性によって保証される。これらのe値を仮説検定手続きへ渡すことで、有限標本における誤り制御を伴う二値の信頼判断が得られる。SCoREは一様な集中（uniform concentration）の必要性を回避し、分布シフトを伴う設定にも容易に拡張できる。提案手法をシミュレーションで評価し、創薬における誤り管理、健康リスク予測、大規模言語モデルへの応用を通じて有効性を示す。