テキスト属性付きグラフに対するグラフ対応型テキストのみバックドア・ポイズニング

arXiv cs.LG / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ノードにテキスト属性が付与されたグラフ学習システムに対する現実的な脅威モデルを扱っており、攻撃者がグラフ構造を変更せずに、ノードのテキストのみをポイズニングするという前提を研究します。
  • TAGBDを提案し、学習に強い影響を与えうるトレーニングノードを特定し、シャドー・グラフ・モデルを用いて自然に見えるトリガーテキストを生成し、トリガーをノードテキストの置換または短いフレーズの付加によって注入します。
  • 3つのベンチマークデータセットでの実験により、TAGBDは非常に効果的であり、異なるグラフモデル間での転移が可能で、一般的な防御を適用しても強さが維持されることが示されます。
  • これらの結果は、テキストのみの操作がテキスト属性付きグラフにおいて実用的なバックドア手口であることを示唆しており、ノードの内容とグラフ接続の両方を検証する防御の必要性を促します。

概要: 多くの学習システムでは、各ノードがテキストを含むグラフデータが現在広く使われています。たとえば、抄録付きの論文や投稿を持つユーザなどです。これらのテキストはしばしばオープンなプラットフォームから得られるため、攻撃者は学習データの一部を静かに汚染し、その後、要求に応じてモデルに誤った予測を生成させることが可能かもしれません。本論文では、攻撃者がノードのテキストのみを編集し、グラフ構造は変更しないという、現実的な設定でこのリスクを検討します。私たちは、テキスト属性付きグラフに対するテキストのみのバックドア攻撃であるTAGBDを提案します。TAGBDはまず、影響を与えやすい学習ノードを特定し、次にシャドウグラフモデルの助けを借りて自然に見えるトリガテキストを生成し、最後に、元のテキストを置き換えるか、短いフレーズを付加することでトリガを注入します。3つのベンチマークデータセットでの実験により、この攻撃が非常に効果的であり、異なるグラフモデル間で転移し、一般的な防御下でも強力であることが示されました。これらの結果は、グラフ学習システムにおいてテキストのみが実用的な攻撃経路であることを示しており、今後の防御はグラフのリンクとノードの内容の両方を検査すべきだという示唆を与えます。