ワッサースタイン-p 中心極限定理の収束率:局所依存からマルコフ連鎖へ

arXiv stat.ML / 2026/4/21

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、p≥1 の任意の p に対して、ワッサースタイン-p 距離で測った従属する多変量データの非漸近的な中心極限定理(CLT)収束率を導出する。
  • 局所依存列と幾何学的にエルゴード的なマルコフ連鎖という、実務でよく現れる2つの従属性に対して、初めての最適な O(n^{-1/2}) のワッサースタイン1(W1)CLT 収束率を示す。
  • p≥2 では、比較的穏やかなモーメント仮定のもとで初めての Wp(p≥2)の CLT 収束率も与え、従属データ領域での従来の既知上界を大幅に改善する。
  • 応用として、局所依存列に対する最適な W1 結果を用い、多変量 U 統計量に対する初めての最適な W1-CLT 収束率を得る。
  • 技術面では、W1 のガウス近似誤差に対する扱いやすい補助境界を導出し、さらに分割鎖の再生時間について、強い非周期性などの制約を仮定せずに幾何学的な裾(tail)を示す。

概要: 非漸近的な中心極限定理(CLT)の収束速度は、現代の機械学習およびオペレーションズ・リサーチにおいて中核的な役割を果たす。本論文では、一般のp\ge 1に対して、ワッサースタイン-pW_p)距離における多変量従属データのCLT速度を研究する。実務でしばしば現れる2つの基礎的な従属性構造、すなわち局所的に従属な系列と、幾何学的にエルゴード的なマルコフ連鎖に焦点を当てる。これらの両設定において、W_1に関して最初の最適なmathcal O(n^{-1/2})率を確立するだけでなく、穏やかなモーメント仮定の下で、W_pp\ge 2)に関する最初のCLT速度も与える。これにより、これらの従属データの状況で従来までに知られていた最良の評価を大幅に改善する。さらに、局所的に従属な系列に対する我々の最適なW_1速度を応用して、多変量U統計量に対する最初の最適なW_1-CLT速度も得る。
技術面では、従属データの研究に適した、W_1のガウス近似誤差に対する扱いやすい補助的評価を導出する。マルコフ連鎖については、幾何学的にエルゴード的な連鎖に対応するスプリット連鎖の再生時間が、強い周期性の仮定やその他の制約的な条件を置かずに、幾何学的な裾(テール)を持つことをさらに証明する。これらの道具は独立した関心を呼ぶ可能性があり、我々の最適なW_1速度を可能にするとともに、W_pp\ge 2)の結果を支えるものとなる。