柔軟な密度ベースクラスタリングに対するスケーラブルな事後不確実性
arXiv stat.ML / 2026/4/20
💬 オピニオンDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、不確実性を伴うクラスタリング推定のために、クラスタを潜在変数としての混合モデルではなく、データ生成密度の関数(functional)として扱う新しい枠組みを提案している。
- モデルのスコア評価に基づく予測リサンプリング手法により、マルチンゲール事後サンプルを得ることで、特定のパラメトリックな密度仮定に依存せずに密度の不確実性を特徴づけている。
- 正規化フローなどの微分可能な密度推定器を活用することで、密度リサンプリングを効率化し、大規模設定でもGPU上で高い並列性を実現している。
- 密度の各サンプルに対して密度ベースのクラスタリングを適用することで、クラスタ構造の事後サンプルを得て、クラスタリング関連量に対する原理的な推論を可能にしている。
- 画像データと単一細胞RNAシーケンスでの評価により、GPU適合による計算効率と、ドメインをまたいで意味のあるクラスタを不確実性付きで復元できることを示している。



