要旨: 意思決定木と拡散モデルは一見すると互いに無関係なモデル群であり、一方は離散的で階層的、他方は連続的で動的です。本研究は、適切な極限領域において、階層的な意思決定木と拡散過程の間に明確な数学的対応関係を確立することで、両者を統一します。私たちの統一の結果として、共通の最適化原理が明らかになります。それは
\emph{Global Trajectory Score Matching (GTSM)} です。この原理のもとでは、(理想化した形での)勾配ブースティングが漸近的に最適です。さらに、本研究の概念的価値を2つの主要な実用的な具体化によって強調します。すなわち、\treeflow は、表形式データに対して競争力のある生成品質をより高い忠実度で実現し、かつ計算速度を 2 imes 高めます。また\dsmtree は、新しい蒸留手法であり、階層的な意思決定ロジックをニューラルネットワークへと転送し、多くのベンチマークにおいて教師の性能に対して 2\% 以内で一致させます。
木からフローへ、そして再び:決定木と拡散モデルの統一
arXiv cs.AI / 2026/5/4
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- この論文は、階層的な決定木と拡散プロセスの間に、適切な極限領域で成り立つ数学的な対応関係を示し、異なる構造にもかかわらず両者を統一できることを主張しています。
- 共通の最適化原理として Global Trajectory Score Matching(GTSM)を提示し、(理想化した)勾配ブースティングがそのもとで漸近的に最適であると論じています。
- 理論を実装で裏付ける形として、タブularデータの生成に用いる treeflow と、ニューラルネットへ決定木の階層的論理を蒸留する dsmtree の2つの実用的手法を示しています。
- 実験では、treeflow は高い生成品質(忠実度)を保ちつつ計算が約2倍高速であり、dsmtree は多くのベンチマークで教師モデルに対して約2%以内の性能一致を報告しています。
- 総じて、本研究は離散的な意思決定ロジックと拡散ベースの生成モデリングをつなぐ理論的ブリッジと具体的な手法の両方を提供します。



