差別の分解：AIによる信用判断に対する因果メディエーション分析

arXiv cs.LG / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

本論文は、AIの信用スコアリングにおける標準的な統計的公平性指標が、因果的に異なる2つの経路を混在させていると主張する。すなわち、保護属性から転帰（アウトカム）への直接的な差別、および、構造的不平等を反映する金融上のメディエータを介した間接的な影響である。
信用判断における差別の分解を、パール流の自然な直接効果／間接効果（natural direct/indirect effects）として形式化し、保護属性がメディエータと最終的な意思決定の両方に影響する「治療に起因する交絡（treatment-induced confounding）」下での同定に焦点を当てる。
著者らは、介入的な直接効果／間接効果（interventional direct/indirect effects：IDE/IIE）が、より弱い「修正逐次無視（Modified Sequential Ignorability）」の仮定のもとで同定可能であること、さらにIDE/IIEが、間接経路に関する単調な間接治療反応（monotone indirect treatment response）のもとで、本来同定不能である自然効果を保守的に下支え（バウンド）できることを示す。
クロスフィッティングを備えた、二重頑健な拡張逆確率重み付け（AIPW）推定量を導入し、残余の直接経路の交絡に対するE値感度分析（E-value sensitivity analysis）も行う。
ニューヨーク（2022年）のHMDA住宅ローン申請89,465件を用いた分析により、人種的な却下格差（7.9ポイント）のうち約77%が、金融的に関連する特徴を介して媒介されていることを見出す。残り23%は、直接差別に関しての保守的な下限として作用する。そして、実運用のためのオープンソースのCausalFair Pythonパッケージを提供している。

Abstract

AIによる信用決定における統計的公平性指標は、因果的に区別される2つのメカニズムを混同している。すなわち、保護属性から信用結果へ直接作用する差別と、正当な金融上の特徴を通じて伝播する構造的な不平等である。本稿では、信用決定の設定に対してパールの枠組みである自然直接効果および自然間接効果を適用することで、この区別を形式化する。我々の主要な理論的貢献は、治療によって生じる交絡（treatment-induced confounding）の下での自然直接効果・自然間接効果の同定戦略である。これは、保護属性が金融メディエータと最終決定の双方に因果的に影響し、標準的な逐次無視可能性（sequential ignorability）を破るという、一般的な状況である。我々は、介入的直接効果および介入的間接効果（IDE/IIE）が、より弱いModified Sequential Ignorabilityの仮定のもとで同定可能であることを示し、さらに、単調な間接治療応答のもとで未同定の自然効果に対してIDE/IIEが保守的な境界を与えることを証明する。加えて、交差適合（cross-fitting）によって実装される、準パラメトリック効率特性を持つ、二重頑健な拡張逆確率重み付け（AIPW）推定量をIDE/IIE向けに提案する。E値による感度分析により、直接経路における残差的交絡に対処する。ニューヨーク州（2022年）の実データである89,465件のHMDAの一般的購入向けモーゲージ申請に対する実証評価は、観測された人種による拒否格差（7.9パーセンテージポイント）のうち約77%が、構造的不平等によって形成された金融メディエータを通じて生じていること、そして残りの23%が直接差別に対する保守的な下限であることを示す。オープンソースのCausalFair Pythonパッケージは、資源制約のある金融機関への導入に向けた完全なパイプラインを実装している。