ワッサースタイン-p 中心極限定理の収束率：局所依存からマルコフ連鎖へ

arXiv stat.ML / 2026/4/21

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、p≥1 の任意の p に対して、ワッサースタイン-p 距離で測った従属する多変量データの非漸近的な中心極限定理（CLT）収束率を導出する。
局所依存列と幾何学的にエルゴード的なマルコフ連鎖という、実務でよく現れる2つの従属性に対して、初めての最適な O(n^{-1/2}) のワッサースタイン1（W1）CLT 収束率を示す。
p≥2 では、比較的穏やかなモーメント仮定のもとで初めての Wp（p≥2）の CLT 収束率も与え、従属データ領域での従来の既知上界を大幅に改善する。
応用として、局所依存列に対する最適な W1 結果を用い、多変量 U 統計量に対する初めての最適な W1-CLT 収束率を得る。
技術面では、W1 のガウス近似誤差に対する扱いやすい補助境界を導出し、さらに分割鎖の再生時間について、強い非周期性などの制約を仮定せずに幾何学的な裾（tail）を示す。

概要: 非漸近的な中心極限定理（CLT）の収束速度は、現代の機械学習およびオペレーションズ・リサーチにおいて中核的な役割を果たす。本論文では、一般の $p\ge 1$ に対して、ワッサースタイン- $p$ （ $W_p$ ）距離における多変量従属データのCLT速度を研究する。実務でしばしば現れる2つの基礎的な従属性構造、すなわち局所的に従属な系列と、幾何学的にエルゴード的なマルコフ連鎖に焦点を当てる。これらの両設定において、 $W_1$ に関して最初の最適な $mathcal O(n^{-1/2})$ 率を確立するだけでなく、穏やかなモーメント仮定の下で、 $W_p$ （ $p\ge 2$ ）に関する最初のCLT速度も与える。これにより、これらの従属データの状況で従来までに知られていた最良の評価を大幅に改善する。さらに、局所的に従属な系列に対する我々の最適な $W_1$ 速度を応用して、多変量 $U$ 統計量に対する最初の最適な $W_1$ -CLT速度も得る。
技術面では、従属データの研究に適した、 $W_1$ のガウス近似誤差に対する扱いやすい補助的評価を導出する。マルコフ連鎖については、幾何学的にエルゴード的な連鎖に対応するスプリット連鎖の再生時間が、強い周期性の仮定やその他の制約的な条件を置かずに、幾何学的な裾（テール）を持つことをさらに証明する。これらの道具は独立した関心を呼ぶ可能性があり、我々の最適な $W_1$ 速度を可能にするとともに、 $W_p$ （ $p\ge 2$ ）の結果を支えるものとなる。