Abstract
細胞集団や経済コホートのような多くの科学的システムは、時間とともに進化する確率分布によって自然に記述されます。そのようなシステムが、異なる力や初期条件の下でどのように進化していたかを予測することは、因果推論、ドメイン適応、反実仮想予測にとって基本的です。しかしながら、分布の空間は、多くの古典的方法が依拠するベクトル空間構造を欠いていることがしばしばあります。これに対処するために、分布レベルでの平行ダイナミクスの一般的な概念を導入します。我々はこの原理を、最適輸送の測地線に沿った接ベクトル(タングェント)ダイナミクスの平行移送に基づいて構築し、それを「``Wasserstein Parallel Trends''(ワッサースタイン並行トレンド)」と呼びます。古典的方法におけるベクトルの差を、測地線に沿った平行移送で置き換えることで、因果推論、ドメイン適応、実験設定におけるバッチ効果補正といった応用において、分布ダイナミクスに対する反実仮想的な比較を提供できます。主要な数学的貢献は、ワッサースタイン多様体上での扇形スキーム(fanning scheme)に関する新しい概念です。これにより、測地線に沿った平行移送を効率的に近似できるだけでなく、ワッサースタイン空間における平行移送についての初めての理論的保証も同時に与えます。さらに、Wasserstein Parallel Trends は、平均に対する古典的な並行トレンド仮定を特殊な場合として復元することを示し、ガウス分布に対して閉形式の平行移送を導出します。本手法を合成データと、単一細胞RNAシーケンシングの2つのデータセットに適用し、生物学的システム間での遺伝子発現ダイナミクスを補完(impute)します。