Abstract
本論文では、報告される予測集合が単一の区間でなければならない回帰における分割適合(split-conformal)予測を研究する。目標となる限界カバレッジは 1- alpha とし、ここで alpha は公称の見逃し(miscoverage)レベルである。この報告制約の下では、自然な条件付きの目標は、等両側(equal-tailed)区間や、確率が高いものの分断された可能性のある集合ではなく、条件付き質量が少なくとも 1- alpha となる最短の区間である。われわれは、この単一区間のオラクルを下側裾(lower-tail)の割当てによってパラメータ化する。これは、公称の見逃し確率 alpha を2つの端点の間でどのように分割するかを決めるものであり、裾割当てに適合化した分位点回帰(TA-CQR: tail-allocation conformalized quantile regression)を提案する。TA-CQR は、分位点で定義されたコア(core)を探索することでこの割当てを推定し、その後、非負の加法的(additive)な分割適合(split-conformal)による較正を適用する。これにより、交換可能性(exchangeability)のもとで有限標本における限界カバレッジの厳密な保証を保持する。主な貢献は理論的である。われわれはオラクルの幾何学的構造を特徴づける。そこには、単峰性(unimodality)の仮定のもとでのその最も高密度(highest-density)としての解釈や、高密度集合が分断されることによって生じる正の連結性コストが含まれる。さらに、選択された割当てとコアの局所的な回復を示し、端点の密度条件(endpoint-density conditions)のもとで較正半径(calibration radii)が漸近的に無視できることを確立する。そして、明示的なグリッド、端点分位点の推定、較正サンプリングの項を用いた、有限標本の較正済み長さオラクル不等式を与える。シミュレーションと実データの例では、カバレッジと長さが同時に報告される。