最適クラスタ数を自動選択する連邦階層クラスタリング(Fed-$k^*$-HC)

arXiv cs.AI / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Fed-$k^*$-HC は、クライアントによって生成されたマイクロサブクラスタのプロトタイプと階層クラスタリングを用いて、最適なクラスタ数 k* を自動的に決定する連邦クラスタリングフレームワークである。
  • 未知のクラスタ数、クラスタサイズの不均衡、および連邦学習におけるプライバシー保護伝送の制約といった課題に対処する。
  • クライアントからのプロトタイプはサーバにアップロードされ、密度ベースのマージ設計によって階層的に統合され、さまざまなサイズと形状のクラスタを探索する。
  • プロトタイプ間の近傍関係に基づいて自己終了するまでマージ処理が進行し、k* を決定する。
  • 多様なデータセットを用いた実験は、連邦クラスタリングにおいて適切なクラスタ数を正確に特定できることを示している。

要約: Federated Clustering (FC) は、分散され、プライバシー保護されたデータから、教師なしでデータ分布パターンを探索する新興で有望な解決策です。既存の FC 手法は、クライアントが既知の等尺性のクラスタ数を有するという仮定に黙示的に依存しています。しかし、真のクラスタ数は通常未知であり、現実のシナリオではクラスタサイズは自然に不均衡です。さらに、連合学習におけるプライバシー保護送信の制約は、利用可能な情報を不可避的に減らし、堅牢で正確な FC の開発を極めて困難にします。したがって、階層的クラスタリングを通じてデータ分布を探索し、最適なクラスタ数 k^* を自動的に決定できる新しい FC フレームワーク Fed-k^*-HC を提案します。k^* の決定のためのグローバルなデータ分布を取得するために、各クライアントにマイクロサブクラスタを生成させます。それらのプロトタイプをサーバにアップロードして階層的な結合を行います。密度ベースの結合設計は、さまざまなサイズと形状のクラスタを探索可能にし、進行的な結合プロセスはプロトタイプ間の近傍関係に従って自己終了し、k^* を決定します。多様なデータセットに対する広範な実験は、提案された Fed-k^*-HC の FC 能力が適切なクラスタ数を正確に探索することを示しています。