スコア反発型モンテカルロ:一般の状態空間に対する定数メモリで効率的な非マルコフ・サンプラーへ

arXiv cs.LG / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文は、完全な履歴を保存せずに長期的なモンテカルロ分散を抑えるための、履歴依存サンプリング手法「Score-Repellent Monte Carlo(SRMC)」を提案します。
  • SRMCでは、有限状態の経験分布のような形で履歴を保持する代わりに、軌跡のスコア評価の移動平均(R^d)で履歴を要約し、その上で α(反発の強さを表すパラメータ)により指数的スコア・チルトを適用します。
  • 論文は、正規化を必要としないサロゲート目標(サロゲートターゲット)族を与え、πを狙う任意のMCMCカーネルを「現在のサロゲート π_{θ_n}」に置き換える汎用ラッパーとして実装できることを示します。
  • 履歴再帰と推定量の結合的な挙動を理論解析し、マルコフ雑音を制御した確率近似に基づき、ほぼ確実な収束とジョイントの中心極限定理を証明します。
  • 実験では、連続ターゲットと離散のエネルギーベースモデルで推定量分散の低減とモード網羅性の向上が確認され、メモリは O(d) に保たれつつ、各反復の計算オーバーヘッドも控えめであることが示されます(α増加で漸近共分散は O(1/α) で減少)。