MinShap:特徴量選択のための改良版シャープレイ値アプローチ

arXiv stat.ML / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文では、非線形で依存関係のある特徴量を含む状況での特徴量選択に適した、MinShapという改良版シャープレイ値フレームワークを提案しています。
  • 通常のシャープレイ値に基づく帰属が特徴量ごとの直接効果と他特徴量を介した間接効果を混在させるのに対し、MinShapは特徴量の順列にわたる最小の限界貢献を用いて予測に有用な特徴量をより切り分けるようにしています。
  • 著者らはDAG(有向非巡回グラフ)におけるfaithfulness(忠実性)仮定に基づく理論的根拠を示し、MinShapのType Iエラーに関する保証も与えています。
  • 数値シミュレーションと実データ実験の結果、MinShapはLOCO、GCM、Lassoといった既存の特徴量選択手法よりも、精度と安定性の両面で優れていることが示されています。
  • さらに、複数検定/p値の観点を取り入れたMinShap関連のアルゴリズム群も提案し、サンプル数が少ない場面での性能改善と追加の理論的保証を示しています。

emph{MinShap} という提案により特徴量選択へ適応します。
emph{MinShap} は、シャプレイ値の枠組みを変更したものであり、さらに他の関連アルゴリズム群も併せて提示します。とりわけ MinShap では、特徴量の順列にわたる平均の周辺寄与(marginal contributions)を取る代わりに、順列間での最小の周辺寄与を考慮します。DAG(有向非巡回グラフモデル)における忠実性(faithfulness)仮定に動機づけられた理論的基礎を提示し、MinShap の Type I 誤りの保証を与え、数値シミュレーションおよび実データ実験を通して、MinShap が精度と安定性の両面において、LOCO、GCM、Lasso のような最先端の特徴量選択アルゴリズムよりも優れる傾向があることを示します。さらに、多重検定/p値の観点を用いることで、サンプル数が少ない設定における性能を改善し、加えて裏付けとなる理論的保証も提供する、MinShap に関連する一連のアルゴリズムを導入します。