差別の分解:AIによる信用判断に対する因果メディエーション分析
arXiv cs.LG / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、AIの信用スコアリングにおける標準的な統計的公平性指標が、因果的に異なる2つの経路を混在させていると主張する。すなわち、保護属性から転帰(アウトカム)への直接的な差別、および、構造的不平等を反映する金融上のメディエータを介した間接的な影響である。
- 信用判断における差別の分解を、パール流の自然な直接効果/間接効果(natural direct/indirect effects)として形式化し、保護属性がメディエータと最終的な意思決定の両方に影響する「治療に起因する交絡(treatment-induced confounding)」下での同定に焦点を当てる。
- 著者らは、介入的な直接効果/間接効果(interventional direct/indirect effects:IDE/IIE)が、より弱い「修正逐次無視(Modified Sequential Ignorability)」の仮定のもとで同定可能であること、さらにIDE/IIEが、間接経路に関する単調な間接治療反応(monotone indirect treatment response)のもとで、本来同定不能である自然効果を保守的に下支え(バウンド)できることを示す。
- クロスフィッティングを備えた、二重頑健な拡張逆確率重み付け(AIPW)推定量を導入し、残余の直接経路の交絡に対するE値感度分析(E-value sensitivity analysis)も行う。
- ニューヨーク(2022年)のHMDA住宅ローン申請89,465件を用いた分析により、人種的な却下格差(7.9ポイント)のうち約77%が、金融的に関連する特徴を介して媒介されていることを見出す。残り23%は、直接差別に関しての保守的な下限として作用する。そして、実運用のためのオープンソースのCausalFair Pythonパッケージを提供している。



