反事実的公平性のための効率的で解釈可能なトランスフォーマー
arXiv cs.LG / 2026/4/30
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、高リスクの規制産業における重要な課題として、モデルが予測精度と解釈可能性、そして反事実的公平性の要請を同時に満たす必要がある点を扱っています。
- tabular(表形式)データ向けに、注意機構を軽量化した Feature Correlation Transformer(FCorrTransformer)を提案し、その注意行列を統計的に「特徴間のペア依存」として解釈できるようにしています。
- Counterfactual Attention Regularization(CAR)では、センシティブ特徴に関して注意レベルでグループ不変な公平表現を強制し、明示的な因果仮定に依存せずに反事実的に公平な予測を目指します。
- 不均衡な分類・回帰ベンチマークでの実験により、FCorrTransformer+CARが強い反事実的公平性を示しつつ、予測性能も競争力があり、標準的なトランスフォーマー基線よりモデル複雑性を大幅に削減できることが示されています。
- 総じて、本研究は「責任あるAI」を実現するための、フェアネス理論と実運用可能なモデル設計のギャップを埋める実践的な枠組みを提示しています。



