条件付き独立性と最適輸送バリセントル問題による不変特徴抽出:ガウスの場合

arXiv stat.ML / 2026/5/1

💬 オピニオンModels & Research

要点

  • 本論文は、XとYの双方に影響しうる交絡変数Zによる混入を避けつつ、応答変数Yを予測する不変特徴W=f(X)を学習する手法を提案している。
  • そこで、WとZの「Y条件付きの統計的依存」を抑える難しい目的を、Mongeの最適輸送バリセントル問題の解に基づく変換Z_Y=T(Z,Y)を用いた、より実装しやすいWとZ_Yの独立性制約へ置き換えている。
  • ガウス設定では、条件付き独立性に基づく主張と、変換後の独立性基準が同値であり、緩和を伴わないことを示している。
  • 真の交絡変数Zが未知の場合は測定可能な文脈変数Sを代理変数として使えるが、この置き換えもガウスの場合は共分散行列Σ_ZSがフルランクなら厳密に成り立つ。
  • 得られる線形特徴抽出器は、既知の行列の先頭d個の固有ベクトルに基づく閉形式になっており、さらに一般の非ガウス/非線形へも大きな変更なく拡張できるとしている。

要旨:応答変数 Y を予測する d 個の不変特徴 W=f(X) を抽出するための方法論を開発する。このとき、XY の両方に影響し得る変数 Z による交絡(confounding)を受けないようにする。提案手法の主要な構成要素は、Y 条件付きで WZ の間に存在するあらゆる統計的依存を罰則化することにある。これは、Z\mid Y に対して [Monge] の最適輸送バリセンタ問題を解く確率変数 Z_Y = T(Z,Y)W の間の、より実装しやすい単純な独立性へ置き換えられる。本論文で扱うガウスの場合には、これら二つの主張は同値である。真の交絡因子 Z が未知である場合には、他の測定可能な文脈変数 S を代理変数(サロゲート)として用いることができる。この置換は、共分散行列
ablaigma_{ZS}
がフルレンジであるガウスの場合には緩和(relaxation)を伴わない。得られる線形特徴抽出器は、既知の行列の最初の d 個の固有ベクトルに関する閉形式を採用する。この手順は、より一般的な非ガウス/非線形の場合にも、ほとんど変更なく拡張できる。