白箱信号部分空間プローブによるグラフデータセットの運用特徴フィンガープリント

arXiv cs.LG / 2026/4/27

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、通常はブラックボックスになりがちなGNNの学習を解明するための白箱プローブ「WG-SRC」を提案し、ノード分類を駆動するメカニズムを診断できるようにします。
  • WG-SRCは、学習済みのメッセージパッシングを、明示的なグラフ信号辞書(生特徴に加えて低域・高域の伝播項)へ置き換え、Fisher座標選択、クラスごとのPCA部分空間、複数alphaの閉形式リッジ判定、さらに検証に基づくスコア融合を用いて分類します。
  • 6つのノード分類データセットで、WG-SRCは再現されたグラフベースラインに対して競争力を保ち、整合(aligned)された分割条件では平均的に正の改善が得られたと報告されています。
  • 本手法は、予測を「生特徴の影響」「低域・高域の寄与」「クラス幾何」「リッジ境界挙動」といった成分に分解する“運用特徴フィンガープリント”を出力します。
  • これらのフィンガープリントを使い、例えば高域ブロックが除去可能なノイズとして働くのか、生特徴を保持すべきか、またリッジ型の境界補正が重要か、といったメカニズムに応じた次の分析・データセット改変の指針を提示します。

概要: グラフニューラルネットワークはノード分類の高い精度を達成しますが、学習されたメッセージパッシングは、自己属性、近傍の平滑化、高周波のグラフ差分、クラスの幾何、そして分類器の境界を、不透明な表現の中で絡み合わせてしまいます。これにより、「なぜあるノードが分類されるのか」や、「あるデータセットが必要とする特徴レベルのグラフ学習メカニズムは何か」が見えなくなります。
我々は、予測とグラフデータセット診断のためのホワイトボックス信号部分空間プローブであるWG-SRCを提案します。WG-SRCは、学習されたメッセージパッシングを、固定された、名前付きのグラフ信号辞書(生の特徴からなるもの)に置き換えます。この辞書は、行正規化および対称正規化された低域パス伝播と、高域パスのグラフ差分を含みます。さらに、Fisher座標の選択、クラスごとのPCA部分空間、閉形式のマルチαリッジ分類、検証ベースのスコア融合を組み合わせることで、予測と分析が明示的なクラス部分空間、エネルギー制御された次元、閉形式の線形判断を用いるようにします。
ホワイトボックスなグラフ学習の計測装置として、WG-SRCは診断の妥当性を予測性能によって検証します。6つのノード分類データセットにわたって、足場(scaffold)は再現されたグラフのベースラインと競争力を保ち、整合した分割(aligned splits)では平均で正のゲインを達成します。そのアトラスは、予測器によって生成され、振る舞いを、生の特徴、低域パス、高域パス、クラス幾何、そしてリッジ境界の各成分に分解します。これらの操作上の特徴フィンガープリントは、低域パス優勢なAmazonグラフ、混合した高域パスとクラス幾何的に複雑なChameleonの振る舞い、生の特徴または境界に敏感なWebKBグラフを識別します。事後的な説明(post-hoc)ではなく、内在的な分類器の出力として、これらのフィンガープリントは、その後の分析やデータセット固有の修正のためのガイダンスを提供します。整合したメカニスティックな介入は、このガイダンスを、高域パスのブロックが除去可能なノイズとして働くのはいつか、生の特徴を保持すべきはいつか、そしてリッジ型の境界補正が重要になるのはいつか、を示すことで支えます。