混在型表形式データのための重み込み自己説明クラスタリング
arXiv cs.LG / 2026/4/8
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、数値・カテゴリ混在の表形式データをクラスタリングする際の表現の不整合、特徴重要度のばらつき、解釈が後付けになりがちな問題に対し、完全教師なしで一貫した枠組みを提案している。
- 提案手法WISEは、Binary Encoding with Padding(BEP)で異種特徴を統一した疎空間に整列し、Leave-One-Feature-Out(LOFO)で複数の特徴重み付けビューを生成して、2段階の重み考慮クラスタリングで意味的な分割を統合する。
- 説明可能性についてはDiscriminative FreqItems(DFI)を導入し、インスタンスからクラスタまで整合した特徴レベルの説明を、加法分解の保証つきで提供することを目指している。
- 6つの実データセットでの実験では、WISEが従来手法やニューラル基線に対してクラスタリング品質で一貫して優位であり、かつ効率も保ちつつ、クラスタリングに用いた同一の要素に基づく人が解釈できる説明を生成することを示している。



