二重パスのグラフフィルタリングによるグラフベース不正検知

arXiv cs.LG / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、グラフ構造データ上の不正検知を扱い、詐欺グラフにおける関係のカモフラージュ、強い異種性(ヘテロフィリー)、クラス不均衡のために一般的なGNNが性能を発揮しにくいと述べています。
  • DPF-GFDとして、まず元のグラフにβ(ベータ)ウェーブレットに基づく演算子を適用して構造パターンを捉え、その後距離ベースのノード表現から類似グラフを構築します。
  • 類似グラフには改善されたローパスフィルタを適用し、さらに監督付き表現学習により両パスの埋め込みを融合して、識別力の高いノード特徴を得ます。
  • 学習したノード特徴を用いてアンサンブル木モデルが未ラベルノードの不正リスクを推定し、実在の金融不正検知データセット4つで有効性が示されています。
  • 既存の単一グラフ平滑化と異なり、周波数補完的な二重パスのフィルタリングにより、構造異常のモデリングと特徴の類似性モデリングを明示的に分離して、厳しいグラフ条件下でより安定した表現を実現する点が新規性です。

要旨: グラフデータにおける詐欺検出は、異なる種類のノードを見分けることを要する、要求の厳しい課題として捉えることができます。グラフニューラルネットワーク(GNN)は、メッセージパッシング操作によってグラフ形式で符号化された情報を処理するのに自然に適しているため、GNNモデルに基づく手法は詐欺検出領域でますます注目を集めています。しかし、詐欺グラフは本質的に関係のカモフラージュ、高い異種性(heterophily)、クラス不均衡を示し、その結果、多くのGNNは詐欺検出タスクで十分な性能を発揮できません。これらの課題に対処するため、本論文はデュアルパス・グラフフィルタリング(DPF-GFD)を用いたグラフベースの詐欺検出モデルを提案します。DPF-GFDはまず、ベータ・ウェーブレットに基づく演算子を元のグラフに適用し、主要な構造パターンを捉えます。次に、距離ベースのノード表現から類似グラフを構築し、改良されたローパスフィルタを適用します。元のグラフと類似グラフから得られた埋め込みは、教師あり表現学習によって融合され、ノード特徴量を得ます。その後、このノード特徴量を用いてアンサンブル木モデルがラベル未付与ノードの詐欺リスクを評価します。既存の単一グラフに対する平滑化アプローチとは異なり、DPF-GFDは詐欺検出に特化した、周波数補完的なデュアルパス・フィルタリングのパラダイムを導入し、構造異常のモデリングと特徴類似性のモデリングを明示的に分離(デカップリング)します。この設計により、高い異種性および不均衡を伴う詐欺グラフにおいて、より識別的で安定したノード表現を実現できます。実世界の金融詐欺検出データセット4件に対する包括的な実験により、提案手法の有効性が示されています。