肘(エルボー)統計:マルチスケールクラスタリングの統計的有意性
arXiv stat.ML / 2026/5/5
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は教師なし学習における中心的課題である「クラスタ数の選択」を扱い、従来法がしばしば単一の“最適”分割に偏って多解像度の統計的構造を見落としがちである点を指摘しています。
- ElbowSigという推論フレームワークを提案し、クラスタリングの各解像度における「クラスタ内異質性」の系列から得られる正規化離散曲率統計で、肘(エルボー)ヒューリスティックを形式化します。
- ElbowSigは、観測された曲率を非構造データ(クラスタがない)に対するヌル分布と比較することで、複数のクラスタリングスケールで仮説検定を行います。
- 著者らは、ヌル統計の漸近的挙動を大標本・高次元の両レジームで解析し、極限の形とばらつきを特徴づけています。
- この手法は異質性系列のみを使うため、ハード/ファジー/モデルベースなど幅広いクラスタリング手法に適用可能であり、実験では単一解像度の基準では見逃されがちなマルチスケール構造を検出しつつType-I誤りを制御できることが示されています。



