条件付き予測区間のための共形予測におけるテール配分

arXiv stat.ML / 2026/4/29

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • この論文は、予測集合を単一の区間として報告するという厳しい制約の下で、回帰における分割共形(split-conformal)予測を分析し、目標の周辺カバレッジ1-αを満たすことに焦点を当てています。
  • 等テールの設定や、連結していない高確率集合ではなく、「最短の条件付き区間」という目標を自然な基準として定め、区間両端に対してαをどう配分するかを表す下側テール配分でパラメータ化します。
  • 下側テール配分を推定するために量子化(quantile)で定義したコアを探索し、その後に非負の加法的な分割共形キャリブレーションを適用する、テール配分共形化量子回帰(TA-CQR)を提案し、交換可能性のもとで有限標本の周辺カバレッジの厳密性を維持します。
  • 主な貢献は理論であり、オラクル構造(単峰性の下での最高密度解釈など)を特徴付け、選択された配分とコアの局所的な復元を示し、端点密度の条件下でキャリブレーション半径が漸近的に無視できることを明らかにし、有限標本の長さに関するオラクル不等式(推定・キャリブレーション項を明示)を与えます。
  • シミュレーションと実データ例で、カバレッジと区間長の両方を同時に評価し、提案手法の実用的価値を報告します。

Abstract

本論文では、報告される予測集合が単一の区間でなければならない回帰における分割適合(split-conformal)予測を研究する。目標となる限界カバレッジは 1- alpha とし、ここで alpha は公称の見逃し(miscoverage)レベルである。この報告制約の下では、自然な条件付きの目標は、等両側(equal-tailed)区間や、確率が高いものの分断された可能性のある集合ではなく、条件付き質量が少なくとも 1- alpha となる最短の区間である。われわれは、この単一区間のオラクルを下側裾(lower-tail)の割当てによってパラメータ化する。これは、公称の見逃し確率 alpha を2つの端点の間でどのように分割するかを決めるものであり、裾割当てに適合化した分位点回帰(TA-CQR: tail-allocation conformalized quantile regression)を提案する。TA-CQR は、分位点で定義されたコア(core)を探索することでこの割当てを推定し、その後、非負の加法的(additive)な分割適合(split-conformal)による較正を適用する。これにより、交換可能性(exchangeability)のもとで有限標本における限界カバレッジの厳密な保証を保持する。主な貢献は理論的である。われわれはオラクルの幾何学的構造を特徴づける。そこには、単峰性(unimodality)の仮定のもとでのその最も高密度(highest-density)としての解釈や、高密度集合が分断されることによって生じる正の連結性コストが含まれる。さらに、選択された割当てとコアの局所的な回復を示し、端点の密度条件(endpoint-density conditions)のもとで較正半径(calibration radii)が漸近的に無視できることを確立する。そして、明示的なグリッド、端点分位点の推定、較正サンプリングの項を用いた、有限標本の較正済み長さオラクル不等式を与える。シミュレーションと実データの例では、カバレッジと長さが同時に報告される。