密度比のための加法ツリーモデルによる二標本比較
arXiv stat.ML / 2026/4/23
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、2つの分布間の密度比をi.i.d. サンプルから推定することで二標本比較を行い、加法ツリーモデルを用いることを提案しています。
- 学習目的関数として「balancing loss(バランシング損失)」を新たに導入し、フォワード・ステージワイズ最適化やグラディエントブースティングなど、教師あり学習で用いられる手法で木モデルを学習できるようにしています。
- balancing loss は指数族カーネルに関連し、擬似尤度としても利用できるため、ベイズ加法回帰ツリー(BART)向けの backfitting サンプラーによって密度比の一般化ベイズ推論が可能になることが示されています。
- 推定した密度比に対する不確実性の定量化を提供し、さらに二値分類における損失や f-divergence の変分表現(特に二乗ヘリング距離)とのつながりが説明されています。
- 実験では精度と計算効率の両立が確認され、微生物叢(マイクロバイオーム)の構成データに対する生成モデルの評価への適用例も示されています。




