さまざまなステップサイズおよびサンプル/バッチサイズのスケジュールに対する、射影付き確率的自然勾配変分推論(NGVI)の収束

arXiv stat.ML / 2026/4/2

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、変分分布が指数族に属するという仮定の下で、射影付き確率的自然勾配変分推論(NGVI)を研究する。
  • 定常(定数)または減少するステップサイズのスケジュールと、定常(定数)または増加するサンプル/バッチサイズのスケジュールのさまざまな組み合わせをカバーする、新しい非漸近的な収束保証を示す。
  • ハイパーパラメータを固定した場合、この手法は、必ずしも厳密な最適解に到達するのではなく、最適解の近傍へ幾何級数的に収束することが示される。
  • 他のスケジュールの組み合わせでは、著者らは O(1/T^ρ) の形の収束率で、最適解への収束を確立し、ステップ/サンプル/バッチの設定に応じて ρ≥1 を達成し得る。
  • これらの結果は、ターゲット事後分布が選択した指数族に「近い」場合に適用でき、NGVIにおいて速度、計算資源、精度のトレードオフを原理に基づいて行う方法として位置づけられる。

Abstract

確率的自然勾配変分推論(Stochastic natural gradient variational inference; NGVI)は、ベイズ推論のための人気があり効率的なアルゴリズムです。経験的には成功しているにもかかわらず、この手法の収束はまだ十分に理解されていません。本研究では、変分分布が指数族を成すときに、射影された確率的NGVI(projected stochastic NGVI)を定義し、その性質を調べます。確率性は、勾配が計算不能な期待値である場合、あるいは大きな和が関わる場合に生じます。定数ステップサイズまたは減少するステップサイズと、定数または増加するサンプル/バッチサイズの組み合わせに対して、新たな非漸近的(non-asymptotic)収束結果を証明します。すべてのハイパーパラメータが固定されている場合、NGVIは最適解の近傍へ幾何学的に収束することが示されます。一方、ステップサイズとサンプル/バッチサイズのスケジュールの他の組み合わせすべてについて、 ho 1となる可能性を含めて、収束率が 1  1  1  1  1 1     1  1  1  1  1  1  1  1  1 の形、すなわち 1   1  1  の形で最適解への収束が確立されます。これらの率は、目標とする事後分布が、ある意味で考慮する指数族に近い場合に適用されます。私たちの理論結果は、既存のNGVIおよび確率的最適化の結果を拡張し、速度、計算資源、精度の制約に応じて、ステップサイズやサンプル/バッチサイズを原理的に調整するための柔軟性を高めます。