回帰データ駆動モデルの(再)較正における定量的不確実性の品質評価
arXiv stat.ML / 2026/4/23
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、安全性が重要なアプリケーションでは回帰モデルが正確さだけでなく、不確実性推定の信頼性(較正)も提供すべきだと主張し、それがリスクに基づく意思決定に不可欠だと述べています。
- 回帰における既存の較正指標を体系的に抽出・分類し、特定のモデル化手法や再較正手法に依存しない形でベンチマークします。
- 実データ、合成データ、さらに意図的に不適切に較正されたデータでの制御実験により、較正指標は同一の再較正結果に対してしばしば相反する評価をし、矛盾した結論に至ることが示されます。
- この不一致は、成功を装うために指標を恣意的に選別できてしまう可能性があるため、特に懸念だと警告しています。
- その検証の結果、Expected Normalized Calibration Error(ENCE)とCoverage Width-based Criterion(CWC)が最も信頼できる較正指標として挙げられています。



