H-Sets：画像分類器におけるセット単位の特徴相互作用をヘッセ行列ガイドで発見する

arXiv cs.AI / 2026/4/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、既存の特徴属性（アトリビューション）手法が主に限界効果を捉えるため、画像分類における解釈に重要な「特徴同士の相互作用（高次の相互作用）」を見落としやすいと指摘している。
提案するH-Setsは2段階の枠組みで、まず入力のヘッセ行列を用いて局所的に相互作用する特徴ペアを検出し、次に再帰的にそれらを意味的に整合した特徴セットへ統合する（空間的なまとまりの事前知識としてSAMのセグメンテーションを利用でき、他のセグメンテーションへ置き換えも可能）。
さらにIDG-Visとして、ピクセル空間上の経路に沿って方向付き勾配を統合し、Harsanyiの配当で集約することで、発見された各セットに対するセット単位の寄与を属性付けする拡張手法を提示している。
ヘッセ行列に基づく検出段階では計算コストが増えるものの、VGG/ResNet/DenseNet/MobileNetをImageNetおよびCUBで評価した結果、従来手法よりもスパースで忠実なサリエンシマップが得られることが示されている。

アブストラクト: 特徴量帰属（feature attribution）手法は、個々の入力特徴に重要度スコアを割り当てることで、深層ニューラルネットワークの予測を説明します。しかし、既存のほとんどの手法は周辺的（marginal）効果のみに注目しており、特徴同士の相互作用、すなわち特徴の集合がモデル出力に共同で影響する点を見落としています。このような相互作用は、画像分類タスクにおいて特に重要です。画像分類では、意味論的な意味が、単独の特徴ではなく画素間の依存関係によって生じることが多いためです。画像に対する既存の相互作用ベース手法は、粗いもの（例えばスーパーピクセルのみ）であるか、あるいは主要な解釈可能性の公理を満たせていません。本研究では、画像分類器における高次の特徴相互作用を発見し帰属するための新しい二段階フレームワークであるH-Setsを提案します。第一に、入力ヘッセ行列（input Hessians）によって局所的に相互作用しているペアを検出し、それらを再帰的に意味的に一貫した集合へと統合します。空間的なグルーピングの事前情報としてSegment Anything（SAM）からのセグメンテーションを用いますが、他のセグメンテーションに置き換えることも可能です。第二に、各集合をIDG-Visで帰属させます。IDG-Visは、画素空間上の経路に沿って方向勾配を統合し、Harsanyi配当（dividends）で集約する、統合方向勾配（Integrated Directional Gradients）の集合レベル拡張です。検出段階でヘッセ行列により追加の計算コストが生じる一方で、この狙いを定めたコストは一貫して、より疎でより忠実なサリエンシーマップ（saliency maps）をもたらします。ImageNetおよびCUBデータセット上でのVGG、ResNet、DenseNet、MobileNetモデルに対する評価により、H-Setsは既存手法と比べて、より解釈可能で忠実なサリエンシーマップを生成することが示されます。