要旨: クラスタ分析は、理想的にはいくつかの望ましい特性を示すようなグループへとオブジェクトを割り当てるという課題に関係している。クラスタ構造が特徴空間のある部分集合に限定されると、従来のクラスタリング手法は前例のない課題に直面する。私たちは、疎なデータに関連する問題を克服し、特徴の重み付けとクラスタリングの両方を同時に行える情報理論的枠組みを提示する。提案手法は、合成データでのシミュレーションによって示されるように、疎なデータに対する既存のクラスタリングアルゴリズムに対する競争力のある代替案を構成する。提案手法の有効性は、実世界のゲノミクスのデータセットへの適用によって確立される。
決定論的情報ボトルネックアルゴリズムによるスパースクラスタリング
arXiv stat.ML / 2026/4/14
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、特徴空間のスパースな部分集合のみにクラスタ構造が存在するような場合に対応する、情報理論に基づくクラスタリングの枠組みである決定論的情報ボトルネックアルゴリズムを提案する。
- 特徴量の重み付けとクラスタ割り当てを共同で学習し、スパース、または高次元データにおいて従来のクラスタリング手法が抱える困難に対処する。
- 合成データセットでのシミュレーションにより、既存のスパースデータ向けクラスタリング手法と比較して競争力のある性能を報告する。
- 制御された実験の範囲を超えた実用性を示すため、実世界のゲノミクスデータセットへの適用によって提案手法を検証する。




