要旨:予測不確実性を定量化することは、安全で信頼できる実世界のAI導入に不可欠です。しかし、多変量ターゲットに対する条件付き分布の完全な非パラメトリック推定は依然として難しい課題です。本研究では、Tomographic Quantile Forests(TQF)を提案します。これは、多変量ターゲットに対するための、非パラメトリックで不確実性を考慮した木ベースの回帰モデルです。TQFは、入力と単位方向
\mathbf{x}の関数として、方向付き投影
\mathbf{n}の条件付き分位点を学習します。推論時には、多くの方向にわたって分位点を集約し、効率的な交互最適化の手法(凸部分問題を伴う)によりスライス付きワッサースタイン距離を最小化することで、多変量の条件付き分布を再構成します。通常、古典的な方向付き分位点アプローチは凸な分位点領域しか得られず、さらに方向ごとに別々のモデルを学習する必要がありますが、TQFは凸性の制約を課すことなく、単一のモデルであらゆる方向をカバーします。合成データセットと実世界データセットの両方でTQFを評価し、ソースコードをGitHubで公開します。
\mathbf{n}^{\top}\mathbf{y}
トモグラフィック・クオンタイル・フォレストによる多変量不確実性定量化
arXiv stat.ML / 2026/4/2
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、多変量予測分布のための非パラメトリックで不確実性を考慮したツリーベースのモデル「トモグラフィック・クオンタイル・フォレスト(TQF)」を提案する。
- TQFは、入力xと単位方向nの関数として、目的変数の方向投影(nᵀy)の条件付きクオンタイルを学習し、推論時に完全な多変量条件付き分布を再構成できるようにする。
- 多数の方向にわたって集約し、効率的な交互最適化(凸部分問題を用いる)によってスライス・ワッサースタイン距離を最小化することで分布を再構成する。
- 本手法は、従来の方向付きクオンタイル手法が持つ制約を回避し、凸なクオンタイル領域の制約を課すことなく、すべての方向をカバーする単一のモデルで対応する。
- 著者らは、合成データと実データの両方でTQFを評価し、再現性のために公開GitHubのソースコードも提供している。


