Abstract
私たちは、特徴量 x_i の値が特定の予測 f(x_1, ,x_p) に対して持つ寄与を定量化することを目的とした、広く用いられている2つのローカル帰属手法、Local Shapley Values と LIME を分析する。広く利用されているにもかかわらず、正確な計算と独立な特徴量という理想的な条件の下でも、ローカルに重要な特徴量を確実に検出する能力には根本的な限界があることを見出す。私たちは、健全なローカル帰属手法は、モデル出力に影響を与えない特徴量(たとえば線形モデルで係数がゼロの特徴量)に対して重要度を付与してはならず、また機能にとって関連する特徴量と統計的な依存関係を示さない特徴量にも重要度を付与すべきではない、と主張する。Local SV と LIME の双方がこの基本原則に違反することを示す。これに対処するため、R-LOCO(Regional Leave Out COvariates)を提案する。これは、ローカル説明とグローバル説明のギャップを埋め、より正確な帰属を提供する。R-LOCO は入力空間を、特徴量の重要度特性が類似した領域に分割する。その上で、各領域内でグローバル帰属手法を適用し、そのインスタンスが属する領域から特徴量の寄与を導出する。このアプローチは、ローカル説明の不安定性を回避しつつ、グローバル手法で失われがちなインスタンス固有の詳細を保持することで、より忠実なローカル帰属を実現する。