$-テーブル：グローバルSHAPのための統計的説明

arXiv stat.ML / 2026/5/5

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、一般的なグローバルSHAPの要約（特徴量重要度ランキング）では、効果の方向性、要約の不確実性、そして要約がモデル応答をどれだけ忠実に反映しているかが分からない点を指摘しています。
そこで、表形式のブラックボックス回帰向けに、SHAPに基づく「$-table（テーブル）」を提案し、SHAP重要度ランキングを、モデル出力 f(X) に適合させた標準化線形サロゲートで拡張します。
$-tableは、SHAP重要度に加えて、サロゲートの係数、要約された不確実性、元モデルに対するサロゲートの忠実度、係数のブートストラップ安定性も併せて報告します。
合成・半合成・実データの実験により、ランキングだけに留まらず、方向性・不確実性・忠実度・安定性を別々の成分として明示することで、より包括的なグローバル説明へ拡張できることを示しています。
係数は、SHAPで選択された特徴量集合上への、適合済みモデル応答の射影として解釈でき、ランキングのみよりも方向性を伴う統計的な説明が得られます。

要旨: グローバルなSHAPによる説明は、通常、特徴量の重要度ランキングとして提示されます。これはブラックボックスモデルにとって重要な変数を特定しますが、これらの効果が明確な方向性の要約を許容するかどうか、そうした要約の不確実性がどの程度か、また学習（フィット）された応答をどれほど忠実に表しているかは示しません。本論文では、表形式のブラックボックス回帰モデルのためのSHAPベースの統計的説明表である $phi$ -tableを提案します。この手順はSHAP重要度によって特徴量を選択し、学習済みモデル応答 $f(X)$ に対して標準化された線形サロゲート（代理モデル）を当てはめます。その上で、SHAP重要度とモデル応答係数、不確実性の要約、サロゲートの忠実度、ブートストラップによる係数の安定性を併せて報告します。得られた係数は、SHAP選択された特徴量集合への、学習済みモデル応答の射影として解釈されます。合成データ、準合成データ、および実データの各種実験において、 $phi$ -tableは、ランキングのみのSHAPを、方向、不確実性、忠実度、安定性を学習済みモデルの挙動の別個の構成要素として明示することで、統計的なグローバル説明へと拡張します。