分類モデルの感度をエラー感度プロファイルで測定する

arXiv cs.LG / 2026/4/29

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文では、分類モデルの性能が単一の特徴量または複数の特徴量に含まれる誤りに対してどれほど敏感かを測る「エラー感度プロファイル(ESP)」を提案する。
  • ESPにより、モデル性能に悪影響を与えやすいエラーの種類や特定の特徴量に基づいてデータクリーニングの優先順位を決められるようにする。
  • ESPを実際に計算するために、著者らは統合ツール群「\\dirty」を作成し公開する。
  • 2つの代表的データセットと14種類の分類モデルに対する広範な実験から、性能劣化はターゲット変数との単純な相関だけでは必ずしも予測できないことが示される。
  • その結果、下流の分類精度にとって「どのデータ誤りが重要か」をデータ中心に診断するための手法が提供される。