分類タスクの性能向上:LCENと重み付きフォーカルの微分可能MCC損失

arXiv cs.LG / 2026/4/24

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、回帰向けだったLASSO-Clip-EN(LCEN)を、非線形で解釈可能な特徴選択として分類タスクに適用できるように改良したことを提案している。
  • 4つの代表的な2値および多クラス分類データセットでの実験では、LCENが他の10種類のモデルよりも高いmacro F1とMatthews相関係数(MCC)を一貫して達成した。
  • 分類でもLCENはスパース性を維持し、平均で入力特徴量の56%を削減しつつ、LCENで選ばれた特徴量を用いて他モデルを再学習すると3つの実験で統計的に有意な性能改善が得られた。
  • さらに、重み付きフォーカルの微分可能MCC(diffMCC)損失も同じデータセットで評価し、diffMCCで学習したモデルが全実験で最良となり、平均でmacro F1が4.9%高く、MCCは重み付き交差エントロピー学習より8.5%高かった。
  • これらの結果は、LCENが分類でも有効な特徴選択アルゴリズムになり得ること、またdiffMCC損失が検証タスクにおいて重み付き交差エントロピーを上回る高精度モデルを学習できることを示している。

概要: LASSO-Clip-EN(LCEN)アルゴリズムは、非線形で解釈可能な特徴選択および機械学習のために、以前に導入されました。しかし、その設計と利用は回帰タスクに限定されていました。本研究では、分類タスクに適した、かつ解釈可能性などの望ましい性質を維持するLCENアルゴリズムの改良版を作成します。この改良版LCENアルゴリズムは、広く用いられている4つの2値分類および多クラス分類データセットで評価されます。これらの実験では、LCENは他の10種類のモデルタイプと比較され、一貫して高いテストセットのマクロF_1スコアおよびMatthews相関係数(MCC)指標に到達し、調査したモデルの大多数よりも優れます。分類用のLCENモデルはスパース性を保っており、実施した実験では全入力特徴量の平均56%を削除します。さらに、LCENで選択された特徴量を用いて、同じデータによりすべてのモデルを再学習します。これにより、4つの実験のうち3つでは統計的に有意な性能改善が得られ、4つ目では、すべての特徴量や他の特徴選択手法を用いた場合と比べて有意差のない結果になります。同時に、重み付き焦点付き微分可能MCC(diffMCC)損失関数が、同じデータセットで評価されます。diffMCC損失関数で学習したモデルは、これらの実験において常に最良の性能を示し、重み付きクロスエントロピー損失で学習したモデルが得た値と比べて、平均でテストセットのマクロF_1スコアが4.9%高く、MCCが8.5%高い値に到達します。これらの結果は、LCENが分類タスクに対しても特徴選択および機械学習アルゴリズムとして高い性能を発揮できること、ならびにdiffMCC損失関数が、調査したタスクにおいて重み付きクロスエントロピー損失を上回る非常に高精度なモデルを学習できることを示しています。