マルチキャリブレートされたLLMによる偏りのない有病率推定
arXiv cs.AI / 2026/4/25
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、診断テストや分類器、さらにはLLMなどの「測定装置」を使ってカテゴリの有病率(集団内での割合)を推定する際に、誤り率が集団間で安定しない可能性がある問題を扱います。
- よくある「誤り率は安定している」という前提が、共変量シフト下では破綻し、その結果、標準的なキャリブレーション/クオンティフィケーション手法がバイアスを生むことを示します。
- 入力特徴量を平均だけでなく特徴量の条件付き区分ごとに較正するマルチキャリブレーションによって、共変量シフト下でも偏りのない有病率推定が理論的に可能であることを証明します。
- シミュレーションおよび実データでの2つの検証(米国の雇用有病率推定と、複数国の政治テキストをLLMで分類)では、マルチキャリブレーションが実際にバイアスを大きく低減し、較正データには集団差が生じうる主要な特徴量次元を含める必要があることが示唆されます。
- LLMを中心に議論されますが、理論結果は任意の分類モデルに適用でき、フェアネスのための較正理論と、幅広い学術分野にまたがる古典的な計測課題を結び付けています。



