Explainable Boosting Machinesに対する統計的推論
arXiv stat.ML / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、Explainable Boosting Machines(EBM)の重要な制約に取り組む。すなわち、特徴量の効果可視化によって解釈可能性は得られるものの、学習された各単変量関数に対する不確実性の定量化は、ブートストラップに起因して計算コストが高いという問題があった。
- 勾配ブースティングに対する統計的推論手法を導入し、計算コストの高い再サンプリングを用いずに不確実性推定を可能にする、エンドツーエンドの理論的保証を与える。
- 「Boulevard regularization」により、木の和ではなく移動平均を用いることで、ブースティング手続きが特徴ごとのカーネルリッジ回帰へ収束することを示し、漸近的に正規分布に従う予測を導く。
- リプシッツ連続な一般化加法モデル(GAM)への当てはめに対して、ミニマックス最適な平均二乗誤差の到達率を導出し、さらに次元の呪いを回避する結果も含める。
- 予測区間および特徴量レベルの信頼区間を構成し、その計算実行時間がデータ点数に依存しないことを示す。また、付随するコードをGitHubで公開している。



