こんにちは r/MachineLearning,
私たちは、MCGrad をオープンソース化します。これは Meta にてプロダクションで開発・導入された、多重較正(multicalibration)のための Python パッケージです。この取り組みは KDD 2026 でも発表されます。
問題: モデルが全体としてはグローバルに較正されていても、識別可能なサブグループや特徴の交差(例:「モバイル端末のうち地域 X のユーザー」)の中では大きくミス較正されていることがあります。多重較正は、こうしたサブ集団にわたって信頼性を確保することを目指します。
解決策: MCGrad は、多重較正を勾配ブースト決定木で言い換えます。各ステップで、軽量なブースターが、与えられた特徴に基づいてベースモデルの残差のミス較正を予測することを学習し、自動的にミス較正された領域を特定して修正します。この手法は大規模データセットにスケールし、予測性能を維持するために early stopping(早期終了)を使用します。ライブデモはチュートリアルをご覧ください。
主な結果: Meta の 100 以上のプロダクションモデルにおいて、MCGrad は 88% のモデルで対数損失と PRAUC を改善しつつ、サブグループの較正エラーを大幅に低減しました。
リンク:
- リポジトリ: https://github.com/facebookincubator/MCGrad/
- ドキュメント: https://mcgrad.dev/
- 論文: https://arxiv.org/abs/2509.19884
pip install mcgrad または conda 経由でインストールできます。質問があればお答えしたり、詳細について議論したりするのも大歓迎です。
[link] [comments]




