打ち切り直交多項式カーネルによるSVMにおける構造的解釈可能性

arXiv stat.ML / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、打ち切り直交多項式カーネルで構築したサポートベクターマシン(SVM)向けの事後学習型の解釈可能性手法を提案し、RKHSが有限次元で明示的な直交正規基底を持つ点を活用します。
  • 学習済みの判別関数を固有のRKHS座標で正確に展開し、そのための診断枠組みとしてORCA(Orthogonal Representation Contribution Analysis)を導入します。
  • ORCAでは正規化されたOKC(Orthogonal Kernel Contribution)指標を用い、分類器のRKHSノルムが相互作用次数、総多項式次数、周辺(マージナル)座標の効果、ならびにペアごとの寄与にどう分配されているかを定量化します。
  • この手法は完全に事後学習で完結し、再学習やサロゲートモデルを必要としません。また、合成の二重らせん問題と実データの5次元心エコーデータで有効性を示します。
  • 実験結果から、これらの指標は予測精度だけでは捉えられないモデル複雑性の構造的特徴を明らかにすることが示されています。

Abstract

本研究では、切り詰められた直交多項式カーネルから構築されたサポートベクターマシン(SVM)に対する事後学習解釈可能性を調べる。関連する再生核ヒルベルト空間(RKHS)は有限次元であり、明示的なテンソル積の直交正規基底を備えているため、適合された判別関数は内在RKHS座標において正確に展開できる。これにより、正規化された直交カーネル寄与(OKC)指標に基づく診断フレームワークであるOrthogonal Representation Contribution Analysis(ORCA)が得られる。これらの指標は、分類器のRKHSノルムの二乗が、相互作用の次数、全多項式次数、周辺(マージナル)座標の効果、そして対(ペア)ごとの寄与にまたがってどのように分配されるかを定量化する。提案手法は完全に事後学習であり、代理モデルも再学習も不要である。合成の二重らせん問題と、実データである5次元の心エコーデータセットに対して、その診断的価値を示す。結果は、提案された指標が、予測精度だけでは捉えられないモデル複雑性の構造的側面を明らかにすることを示している。