Abstract
キャリブレーション(較正)は、予測器が保持する情報に依存する条件付きの性質である。我々は、この依存関係を明示する任意の適切損失(proper loss)に対する分解恒等式を開発する。任意の情報レベル
\mathcal A において、
\mathcal A-可測な予測器の期待損失は、適切レグレット(信頼性)項と、条件付きエントロピー(残留不確実性)項に分解できる。情報レベルがネストしていて
\mathcal A\subseteq\mathcal B の場合には、連鎖分解によって
\mathcal A から
\mathcal B への情報獲得量を定量化する。特徴
\boldsymbol{X} とスコア S=s(\boldsymbol{X}) を用いた分類に適用すると、三項の恒等式が得られる。すなわち、誤キャリブレーション、
\boldsymbol{X} から S への情報損失を測る {
\em grouping(グルーピング)} 項、そして特徴レベルでの消去不能な不確実性である。我々はこの枠組みを活用して、事後的な較正(post-hoc recalibration)、較正済みモデルの集約(aggregation)、段階的/ブースティング構成(stagewise/boosting)を解析する。さらに、ブライヤー(Brier)損失と対数損失(log-loss)について、明示的な形を提示する。