コアセットを用いた多変量分布のスケーラブルな学習
arXiv cs.LG / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 多変量条件変換モデル(MCTMs)向けの新規コアセット構築法を導入し、半パラメトリック回帰分析と密度推定におけるスケーラビリティと学習効率を向上させる。
- 本研究は半パラメトリック分布モデルの初のコアセットを提示し、重要サンプリングを用いてデータを大幅に削減する。
- この手法は、高い確率で対数尤度が(1±ε) の乗法誤差の範囲内に収まることを保証し、統計モデルの精度を維持する。
- 正規化対数項の数値計算上の問題に対処するため、入力データの凸包に基づく幾何近似を採用し、大規模データセットでの安定推論を可能にする。
- 数値実験は、大規模かつ複雑なデータセットに対して顕著な計算効率の向上を示し、統計学および機械学習への広範な適用性を示唆している。