MESD: 交差的属性グループにおける手続き的バイアスの検出と緩和

arXiv cs.AI / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • MESD は multi-category explanation stability disparity の略で、複数の保護属性の交差サブグループ間で、モデル説明の質がどのように変化するかを測定する、手続き的視点に基づく新しい指標です。
  • 本研究は MESD を、結果指向の公正性測定の補完指標として提示し、説明における手続き的公正性のギャップを明らかにします。
  • また、UEF(Utility-Explanation-Fairness)と呼ばれる、有用性、説明品質、そして公正性を同時に最適化する多目的最適化フレームワークを提案します。
  • 複数データセットを用いた実験結果は、MESD が交差的グループ間の説明の差異を捉えることを示し、UEF が三つの目的をバランスさせる能力を実証します。

概要:
機械学習におけるバイアスに関する研究は、主に結果指向の公平性指標(例:等化オッズ)と単一の保護カテゴリに焦点を当ててきた。これらのアプローチはMLにおけるバイアスについて大きな洞察を提供する一方で、モデルの手続き上のバイアスについての洞察は限定的である。このギャップを埋めるため、私たちは複数の保護カテゴリにおける交差的サブグループ間で説明の質の格差を測定する、交差的かつ手続き指向の指標であるマルチカテゴリ説明安定性格差(MESD)を提案した。MESDは結果指向の指標に対する補完的な指標として機能し、モデルの手続きについての詳細な洞察を提供する。全体的な選択モデルの範囲をさらに拡張するために、私たちは3つの目的を同時に最適化する多目的最適化フレームワークUEF(Utility-Explanation-Fairness)を提案する。複数のデータセットにわたる実験結果は、UEFが3つの目的を効果的にバランスさせることを示している。また、結果はMESDが交差的グループ間の説明の差を効果的に捉えることができることを示している。本研究は、複数の保護カテゴリに跨る公正性に関する説明可能性を検討することで、重要なギャップに対処している。

返却形式: {"translated": "翻訳されたHTML"}