キャリブレーション付き予測パワード推論
arXiv stat.ML / 2026/4/24
📰 ニュースTools & Practical UsageModels & Research
要点
- この論文は、小規模のラベル付きデータ、大規模のラベルなしデータ、そして出力が不適切にキャリブレーションされている可能性のあるブラックボックス予測モデルを用いた半教師あり平均推定に取り組みます。
- 提案手法は、元モデルを再学習せずにラベル付きデータ上で予測スコアを事後キャリブレーションすることで、予測の質と半教師あり推論の双方を改善する「Calibrated Prediction-Powered Inference(PPIのキャリブレーション版)」です。
- キャリブレーション法として線形と等張(isotonic)を扱い、等張キャリブレーションでは一次の最適性・効率性に関する保証を提示し、当てはめ済み等張スコアへの追加の事後処理では一次の改善が得られないことも示します。
- 既存推定量との関係も整理しており、元のPPIはAIPWの特殊ケースで、予測がすでに良く整合している場合に非効率になり得る一方、PPI++は実データに基づく効率最大化を伴うAIPWに相当すると述べています。
- シミュレーションと実データ実験の結果、キャリブレーション付き推定量はPPIを上回ることが多く、AIPWやPPI++とも競合、またはそれらより良い性能を示し、あわせてPythonパッケージ(ppi_aipw)も公開されています。



