要旨: 共形予測(conformal prediction)は、有限標本における周辺(marginal)カバレッジが有限標本のまま保証される、分布に依存しない予測区間を提供します。しかし、条件付き妥当性(conditional validity)と区間効率(短い区間長の観点での効率性)を達成することは、特に、分散が一様でない(heteroskedasticity)状況、歪んだ応答(skewed responses)、あるいは推定誤差を伴う複雑な設定では依然として困難です。そこで本研究では、条件付き累積分布関数(CDF)をニューラルネットワークで推定し、その確率積分変換(PIT: probability integral transform)によって得られた応答に対して、共形スタイルの較正(calibration)手法を提案します。これにより、推定された条件付きCDFによって決まる最短長の有限標本調整済みパーセンタイル区間を構成します。CDF推定器が正確であるとき、PIT値は漸近的に特徴(feature)に依存しないため、PIT空間で較正することが有効です。これによって、特徴依存の誤カバレッジ(miscoverage)が緩和され、条件付き較正が改善されます。一方で、我々のパーセンタイル較正は、経験的なPIT分布に適応し、条件付きCDFの推定が不完全である可能性があっても頑健です。提案手法の有限標本における周辺カバレッジ性質(finite-sample marginal coverage property)を証明し、緩やかな整合性条件のもとで漸近的な条件付きカバレッジを示します。多様な合成データおよび実世界のベンチマークに関する実験により、既存手法よりも条件付き較正が良く、かつ区間長が大幅に短いことが示されます。
等角化パーセンタイル区間:有限標本の妥当性と改善された条件付き性能
arXiv stat.ML / 2026/5/6
📰 ニュースModels & Research
要点
- 本論文は、ニューラルネットワークで推定した条件付きCDFに基づくPIT(確率積分変換)値から、有限標本で調整されたパーセンタイル予測区間を構成する等角風の手法を提案する。
- 条件付きCDF推定器が正確である場合、PIT空間での較正により特徴量依存の取りこぼし(ミスカバレッジ)を抑えられるため、条件付き妥当性とキャリブレーションが改善されると主張している。
- 条件付きCDFが不完全に推定されている可能性があっても、パーセンタイル較正で経験的なPIT分布を用いることで頑健性を持たせている。
- 著者らは理論的な保証を示し、提案手法の有限標本での周辺カバレッジと、軽い整合性(consistency)条件の下での漸近的な条件付きカバレッジを証明する。
- 合成データおよび実データのベンチマークで、既存手法より条件付きキャリブレーションが向上し、区間長も大幅に短くなることを実験で確認している。



