確率的価値推定のための統計的観点による一次(ファーストオーダー)効率

arXiv stat.ML / 2026/5/5

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • シャプレイ値やセミバリューなどの確率的価値推定は、ブラックボックスモデルの挙動をデータ点や特徴に帰属させるためのモデル非依存の枠組みとして有用だが、結集(コアリション)の数が指数的に増えるため正確な計算は困難である。
  • 本論文は、加重平均、自分で正規化した重み付け、回帰調整、重み付き最小二乗など複数の既存モンテカルロ推定器が、共通の一次誤差構造を持つことを見出し、主要項がサンプリング則と作業用サロゲート関数によって決まる拡張逆確率重み付けの影響(influence)項だと示している。
  • 一次の平均二乗誤差(MSE)の明示的な式を導出することで、統計効率がサンプリング戦略とサロゲートの双方により決まる関係を明確にしている。
  • この一次MSE基準に基づき、サンプリング則とサロゲートを一次MSEが最小になるように選ぶEfficiency-Aware Surrogate-adjusted Estimator(EASE)を提案している。
  • 実験では、EASEが複数の確率的価値推定タスクにおいて、最先端の推定器より一貫して優れた性能を示したことが報告されている。

概要: シャープレイ値やセミバリューを含む確率的な値は、ブラックボックスモデルの振る舞いをデータ点や特徴へ帰属させるためのモデル非依存の枠組みを提供し、説明可能な人工知能やデータ価値の評価など、幅広い応用がある。しかし、それらを正確に計算するには、指数的に多数の連合に対するユーティリティ評価が必要となるため、現代の機械学習アプリケーションではモンテカルロ近似が不可欠である。既存の推定量は、加重平均、自己正規化による重み付け、回帰調整、加重最小二乗といった、さまざまな同定戦略を通じて開発されることが多い。私たちの重要な観察は、これら一見異なる構成が、共通の一次の誤差構造を共有していることであり、このとき主要項は、サンプリング則と作業用サロゲート関数によって決まる、拡張された逆確率重み付けの影響(インフルエンス)項となる。この一次の表現は、主要な平均二乗誤差(MSE)の明示的な式を与え、それによってサンプリング則とサロゲートが統計的効率をどのように共同で決定するかを特徴づける。この基準に導かれ、私たちは、一次のMSEを最小化するためにサンプリング則とサロゲートを直接選択する、効率を意識したサロゲート調整推定量(Efficiency-Aware Surrogate-adjusted Estimator; EASE)を提案する。EASEは、さまざまな確率的な値において、最先端の推定量よりも一貫して優れていることを示す。