FairTree:バイアス・分散分解による機械学習モデルのサブグループ公正性監査

arXiv cs.LG / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、通常の損失ベースの評価では特定のサブグループにおける性能変化が見落とされ得るため、公正性監査のためのより良い手法が必要だと主張している。
  • 連続・カテゴリカル・順序特徴量を離散化なしで直接扱える、公正性監査アルゴリズム「FairTree」を提案している。
  • FairTreeは従来手法の考え方を拡張し、性能の不公平差を系統的バイアスと分散に分解することで、サブグループ性能が変化する理由をより明確に解釈できる。
  • 提案手法はパーミュテーションベースとフラクチュエーション(揺らぎ)検定の2つのバリエーションで、シミュレーションではいずれも偽陽性率が許容できる一方、フラクチュエーション法の方が検出力が高いことを示している。
  • UCI Adult Censusデータセットでの実例により、比較的小規模データでも公正性の統計的評価を支援し得る枠組みであることを示している。

Abstract

機械学習モデルの評価は通常、損失関数に基づく性能指標に主として依存しており、関連するサブグループにおける性能の変化を見落とすおそれがあります。SliceFinder や SliceLine のような監査ツールが、このようなグループを検出するために提案されてきましたが、多くの場合、連続共変量に対して直接的に対処できないといった概念的な欠点があります。本論文では、心理測定における不変性検定から適応した新しいアルゴリズム FairTree を導入します。SliceFinder および関連アルゴリズムとは異なり、FairTree は離散化なしで、連続・カテゴリ(名義)・順序(オーディナル)特徴を直接的に扱います。さらに、性能格差を体系的バイアスと分散に分解し、アルゴリズム性能の変化を分類できるようにします。本研究では、アルゴリズムの 2 つのバリエーションを提案し評価します。1つは概念的に SliceFinder により近い置換(パーミュテーション)ベースのアプローチで、もう 1 つは揺らぎ(フラクチュエーション)検定です。SliceLine との直接比較を含むシミュレーション研究により、両アプローチが満足できる偽陽性率を持つ一方で、揺らぎアプローチは相対的に高い検出力を持つことを示します。さらに、この方法を UCI Adult Census データセットに適用し、具体的に示します。提案するアルゴリズムは、比較的小規模なデータであっても、多様な応用領域において機械学習モデルの性能および公平性の側面を統計的に評価するための柔軟な枠組みを提供します。