回帰における条件付き密度推定のためのタブラー基盤モデルのベンチマーク
arXiv cs.LG / 2026/3/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、回帰における条件付き密度推定(CDE)に対して、タブラー基盤モデルの派生(例:TabPFN/TabICLスタイルのモデル)をベンチマークし、点推定ではなく予測の全分布の復元に焦点を当てる。
- 学習データサイズ(50〜20,000)と複数のベースラインに対する、39の実世界のタブラー・データセットでの評価により、基盤モデルが概ね密度精度、対数尤度、CRPSにおいて最良の性能を示し、オフ・ザ・シェルフなCDEの有効性が強く示された。
- キャリブレーションは少数サンプル条件では競争力があるが、特定のデータセット/指標ではデータサイズが増えるにつれて、専門的なニューラルCDEベースラインに後れを取ることがある。これは事後的な再キャリブレーションにより信頼性が改善し得ることを示唆する。
- SDSS DR18の測光赤方偏移の事例研究では、50,000銀河で学習したTabPFNの変種が、500,000銀河という全データで学習したベースラインを上回る。これはサンプル効率の利点を示している。
- これらの結果は、タブラー基盤モデルを汎用的な条件付き密度推定器として位置づけ、点予測と比べてCDEの性能が体系的に評価されていなかったギャップを埋めるものである。



