要旨:
高次元データ分析と機械学習において、効果的な特徴選択は不可欠である。教師なし特徴選択(UFS)は、データを同時にクラスタリングし、最も識別性の高い特徴を特定することを目的とする。既存の多くのUFS手法は、特徴をクラスタリングのための疑似ラベル空間に線形投影しますが、次の2つの重大な限界があります:(1)複雑な特徴関係を捉えきれない過度に単純化された線形写像、(2)実世界データに蔓延する外れ値を無視する一様なクラスタ分布の仮定。これらの問題に対処するため、頑健なオートエンコーダベースの教師なし特徴選択(RAEUFS)モデルを提案します。深層オートエンコーダを活用して非線形の特徴表現を学習し、外れ値に対する頑健性を自然に向上させます。我々はさらに、RAEUFSの効率的な最適化アルゴリズムを開発します。広範な実験により、クリーンデータと外れ値が混入したデータの両方の設定で、我々の手法が最先端のUFSアプローチを上回ることを示しています。
ロバストオートエンコーダと適応的グラフ学習による無監督特徴選択
arXiv stat.ML / 2026/3/23
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、線形マッピングに依存し、クラスタ分布が均一であると仮定する既存の無監督特徴選択手法の制限を特定し、非線形な特徴関係を捉え、外れ値へのロバスト性を向上させるためのロバストオートエンコーダベースのアプローチを提案する。
- 提案する Robust Autoencoder-based Unsupervised Feature Selection (RAEUFS) モデルは、深層オートエンコーダを用いて非線形表現を学習し、外れ値への耐性を高めつつ特徴選択を可能にする。
- 適応的グラフ学習コンポーネントと効率的な最適化アルゴリズムを開発し、表現と判別性の高い特徴を共同で学習する。
- 広範な実験の結果、RAEUFSがクリーンデータおよび外れ値汚染データの両方において、最先端のUFS手法を上回ることを示した。