ヒンジ損失とL1ノルムの混合距離による、頑健なファジィな局所k-平面クラスタリング

arXiv cs.LG / 2026/4/27

📰 ニュースModels & Research

要点

  • 本論文は、k-平面クラスタリング、超平面クラスタリング、混合回帰の考え方を統合し、高次元のK個の部分空間(または線形マニフォールド)へのクラスタリングとして捉える枠組みのもとで、新しい頑健なファジィ局所k-平面クラスタリング(RFLkPC)を提案する。
  • 既存のファジィKPCや関連手法がL2に基づく距離を前提としてアウトライヤーに弱い点や、クラスタが無限に広がるという仮定によって精度が落ちる点に対処することが目的である。
  • RFLkPCは、ヒンジ損失とL1ノルムの混合距離を用い、さらに各平面クラスタを有限の有界領域に制約することで、外れ値に対して柔軟かつ頑健にクラスタリングできるようにしている。
  • 著者らはRFLkPCのモデル定式化と最適化アルゴリズムを提示し、シミュレーションデータと実データの両方で多くの実験により有効性を示している。
  • その手法のソースコードがGitHubで公開されており、再現や発展的利用が可能である。

概要: K平面クラスタリング(KPC)、超平面クラスタリング、混合回帰はいずれも、実質的に同じクラスの問題に属します。この問題は、比較的高次元のK個の部分空間、またはK個の線形多様体におけるクラスタリングとして概念化できます。従来のKPCまたはファジィKPCモデルは、データ点と平面の法線ベクトルとの間の射影距離がL2距離に従うことを前提とするため、外れ値に対して顕著な脆弱性を示します。一方で、クラスターが無限に延びるという仮定は、クラスタリング性能を悪化させます。これらの問題を解決するため、本論文では、ヒンジ損失の混合距離とL1ノルムを組み合わせた、新しい頑健なファジィローカルk平面クラスタリング(RFLkPC)手法を提案します。RFLkPCモデルは、各平面クラスターが有限の領域に制限されると仮定しており、外れ値の有無にかかわらず、平面クラスタリングの課題を柔軟かつ頑健に扱うことができます。RFLkPCの対応するモデルと最適化アルゴリズムを提示しました。本トピックに関連する他のモデルと比較して、多数の実験により、RFLkPCがシミュレーションデータおよび実データの両方において有効であることが検証されています。提案したRFLkPC手法のソースコードは、https://github.com/xuelin-xie/RFLkPC で公開されています。