コアセットを用いた多変量分布のスケーラブルな学習

arXiv cs.LG / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 多変量条件変換モデル(MCTMs)向けの新規コアセット構築法を導入し、半パラメトリック回帰分析と密度推定におけるスケーラビリティと学習効率を向上させる。
  • 本研究は半パラメトリック分布モデルの初のコアセットを提示し、重要サンプリングを用いてデータを大幅に削減する。
  • この手法は、高い確率で対数尤度が(1±ε) の乗法誤差の範囲内に収まることを保証し、統計モデルの精度を維持する。
  • 正規化対数項の数値計算上の問題に対処するため、入力データの凸包に基づく幾何近似を採用し、大規模データセットでの安定推論を可能にする。
  • 数値実験は、大規模かつ複雑なデータセットに対して顕著な計算効率の向上を示し、統計学および機械学習への広範な適用性を示唆している。