ガウス分布のモーメント収束評価のための多項式・スティーン不一致

arXiv stat.ML / 2026/5/1

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ベイズ推論においてサンプル集合が所望の事後分布とどれだけ異なるかを測る手法として、多項式スティーン不一致(PSD)を提案している。
  • 有効サンプルサイズのような一般的な診断は、確率勾配ラ ンジュバン動力学のような大規模ベイズサンプリング手法では非適切になり得る(漸近的にバイアスが入るため)と主張している。
  • その背景として、カーネル・スティーン不一致(KSD)はサンプル数に対して二次コストがかかり、さらに次元の呪いによる影響やチューニングの手間が問題になりやすい点を挙げている。
  • 提案する適合度検定について、ガウス目標分布では最初のrモーメントの違いを検出できることを証明する一方で、「収束を完全に保証する」わけではないとしている。
  • 実験では複数の例において競合手法より検出力が高く、かつ計算コストが低いことが示され、PSDがベイズサンプリングアルゴリズムのハイパーパラメータ選択を効率化できることも示している。

Abstract

本研究では、サンプル集合と、ベイズ推論に用いる所望の事後分布との間の不一致(discrepancy)を測定するための新しい手法を提案する。効果的サンプルサイズ(effective sample size)のようなサンプル品質を評価する古典的手法は、確率的勾配ラプラス動力学(stochastic gradient Langevin dynamics)などの、大規模化に適したベイズサンプリングアルゴリズムには適していない。これらは漸近的にバイアスを持つためである。代わりにゴールドスタンダードとなるのはカーネル・スティーン不一致(kernel Stein Discrepancy, KSD)の利用であるが、KSDはサンプル数に対して二次の計算コストがかかるため、それ自体が大規模化に向かない。さらに、KSDおよびその高速化拡張は、典型的には高次元の呪い(curse of dimensionality)にも悩まされ、広範なチューニングを要することが多い。これらの制約に対処するため、我々は多項式スティーン不一致(polynomial Stein discrepancy, PSD)と、それに関連する適合度検定を開発する。新しい検定は完全に収束を判定できるわけではないが、ガウス分布のターゲットに対しては、最初のr個のモーメントの違いを検出できることを証明する。実験的に、当該検定がいくつかの例において競合手法よりも高い検出力を持ち、かつ計算コストが低いことを示す。最後に、PSDが、競合手法よりも効率的にベイズサンプリングアルゴリズムのハイパーパラメータを選択するのに実務者を支援し得ることを示す。