関数空間における相対エントロピー推定:軌跡推論への理論と応用

arXiv cs.LG / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、スナップショットデータから潜在の力学過程を復元することを目的とする軌跡推論(TI)を扱い、観測されるのは時刻インデックス付き周辺分布の独立サンプルのみだとする。
  • 関数(経路)空間上の確率測度間のKullback–Leibler(KL)ダイバージェンスを推定するための一般的な枠組みを提案し、実データにスケール可能なデータ駆動型推定量を示す。
  • ベンチマークでは、推定された関数KLが解析的KLと非常によく一致し、推定量の精度が裏付けられている。
  • 合成データおよび実データ(scRNA-seq)に適用すると、既存の評価指標はしばしば一貫しない評価結果を与える一方、経路空間KLはTI手法同士を首尾一貫して比較でき、特に疎または欠損データがある領域で推定ダイナミクスの不一致を明らかにする。
  • この結果から、部分観測下での軌跡推論の評価基準として関数KLが原理的な指標になり得ることを主張している。

Abstract

軌道推論(Trajectory Inference, TI)は、スナップショットデータから潜在的な力学過程を復元しようとするものであり、時間インデックス付きのマージナル(marginals)からの独立なサンプルのみが観測される。単一細胞ゲノミクスのような応用では、破壊的な測定のために、有限個のマージナルだけからは経路空間(path-space)に関する法則は同定不能となり、保持した(held-out)マージナル予測が支配的だが限界のある評価プロトコルになる。ここでは、関数空間上の確率測度間のKullback-Leibler発散(KL発散)を推定するための一般的な枠組みを導入し、確率的に実行可能でデータ駆動の推定量を与えるとともに、現実的なスナップショット・データセットへとスケール可能であることを示す。ベンチマーク群において、推定された関数(functional)KLが解析的KLと非常に近く一致することにより、我々の推定量の精度を検証する。この枠組みを合成および実データのscRNA-seqデータセットに適用することで、現在の評価指標がしばしば一貫しない評価を与えるのに対し、経路空間KLは軌道推論手法を首尾一貫して比較するための枠組みを可能にし、特にデータが疎であったり欠損している領域において、推定される力学の相違を明らかにする。これらの結果は、部分的な観測可能性の下での軌道推論を評価するための、原理的な基準としての関数KLを支持する。