広告

確率測度のワッサースタイン空間におけるランダム座標降下

arXiv stat.ML / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ワッサースタイン-2 の幾何学を用いて確率測度の空間上での最適化を研究し、困難な高次元や不良条件(ill-conditioned)な状況において、完全なワッサースタイン勾配法の計算負担を軽減することに焦点を当てています。
  • ワッサースタイン多様体上で、標準的な目的関数向けの RWCD と、近接勾配法のような定式化に適合する合成目的関数向けの RWCP の、2 つのランダム化座標降下の枠組みを提案します。
  • 本手法は、座標ごとの構造を活用することで、全勾配最適化が非効率になりやすい異方的(anisotropic)な目的関数の地形に対処しやすくします。
  • 著者らは、非凸、Polyak–Łojasiewicz、および測地的凸(geodesically convex)の各レジームを含む複数の条件のもとで収束保証を示し、その結果をユークリッド空間における既知の座標降下の挙動と関連付けています。
  • 不良条件なエネルギーに関する数値実験では、ランダム化座標法が従来の全勾配法に比べて大幅な高速化をもたらし得ることが示唆されます。

要旨: Wasserstein-2 の幾何を備えた確率測度の空間における最適化は、現代の機械学習および平均場モデリングにおいて中核的である。しかし、全 Wasserstein 勾配に依存する従来の手法は、高次元または不適切に条件付けられた状況において計算オーバーヘッドが大きくなりがちである。我々は Wasserstein 多様体に特化したランダム化座標降下フレームワークを提案し、合成目的関数に対する Random Wasserstein Coordinate Descent (RWCD) と Random Wasserstein Coordinate Proximal{-Gradient} (RWCP) の両手法を導入する。座標ごとの構造を活用することで、これらの手法は、全勾配アプローチが典型的に苦手とする異方的な目的地形に適応する。我々は、さまざまな地形の幾何にわたる厳密な収束解析を提示し、非凸、Polyak-{}-ojasiewicz、ならびに測地的に凸の場合に対する保証を確立する。理論結果はユークリッド空間における古典的な収束特性を模倣しており、ベクトルに対する座標降下と確率測度に対する座標降下の間に、強い対称性があることを示している。開発した手法は Wasserstein 幾何に本質的に適応的であり、測度空間内の他の最適化ソルバへ拡張可能な堅牢な解析テンプレートを提供する。不適切に条件付けられたエネルギーに関する数値実験により、本フレームワークが従来の全勾配法に比べて大幅な高速化をもたらすことが示される。

広告