GRAFT:グローバル特徴帰属によるグラフニューラルネットワークの監査

arXiv cs.LG / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • GRAFTは、グラフニューラルネットワーク(GNN)の予測に影響する入力特徴を、クラス単位でグローバルに説明するための事後処理型フレームワークである。
  • 従来のグローバルなGNN説明手法が構造的モチーフ(部分グラフ)を中心に扱うのに対し、GRAFTは入力のノード属性(特徴)に基づく特徴レベルの重要度プロファイルを対象とする。
  • 本手法は、多様性ガイド付きの代表例選択、Integrated Gradientsに基づく帰属(attribution)、そして集約を組み合わせることで、クラスごとの特徴影響の全体像を構築する。
  • GRAFTは、自己改善(self-refinement)付きで大規模言語モデル(LLM)を用いることで、特徴挙動を簡潔な自然言語ルールとして表現でき、さらにルールの解釈可能性を評価するための構造化された人手評価プロトコルも提示されている。
  • 複数のデータセットやアーキテクチャを用いた実験により、GRAFTがモデルに関連する特徴を捉えること、バイアス分析を支援すること、そして特徴効率の高い転移学習を可能にすることが示されている。

Abstract

グラフニューラルネットワーク(GNN)はノード分類タスクで強力な性能を示す一方、特にどの入力特徴が予測に寄与しているのかという点に関しては、解釈が難しいままです。既存のグローバル型GNN説明手法は、再発する部分グラフのモチーフを特定することで構造レベルで動作しますが、入力ノード属性のレベルで、モデルの振る舞いをグローバルに説明するものは存在しません。そこで本研究では、GRAFT という事後的なグローバル説明フレームワークを提案します。これは、GNNのクラスレベルの特徴重要度プロファイルを特定します。この手法は、多様性に導かれた代表例(エグザンプル)の選択、Integrated Gradientsに基づく帰属、そして集約を組み合わせることで、各クラスに対する特徴の影響のグローバルな見取り図を構築します。さらに、この見取り図は、大規模言語モデルを自己改善(self-refinement)付きで用いることで、簡潔な自然言語ルールとして表現することが可能です。本手法を複数のデータセット、アーキテクチャ、実験設定にわたって評価し、モデルにとって関連のある特徴を捉える有効性、バイアス分析を支援すること、そして特徴効率のよい転移学習を可能にすることを示します。加えて、生成されたルールの解釈可能性を、精度や有用性といった次元に沿って評価するための構造化された人手評価プロトコルも導入します。これらの結果は、GRAFT が、定量的な帰属(attribution)と人が理解しやすい説明をつなぐことで、GNNにおける特徴レベルの振る舞いを分析するための実用的で解釈可能なアプローチを提供することを示唆しています。