PASTA:Vision Transformer向けのパッチ非依存・二段階ステルス型バックドア攻撃

arXiv cs.CV / 2026/4/23

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この論文は、Vision Transformer(ViT)がパッチ単位のバックドア攻撃に対して脆弱であることを述べつつ、従来手法が推論時にトリガー位置を1か所に固定する前提を置きがちだと指摘しています。
  • Trigger Radiating Effect(TRE)として、パッチトリガーを置いたときにViTの自己注意によって近傍パッチへバックドアが波及すると、高い攻撃有効性が得られることを示します。
  • PASTAは、ピクセル領域と注意(attention)領域の両方で動作する二段階のステルス型バックドア攻撃として提案され、推論時に任意のパッチへトリガーを置いても発動できるようにします。
  • 強いTREを維持しながらステルス性を保つために、学習時にパッチ間へのトリガー挿入と、生産的な局所解を避けるための適応的な双レベル最適化フレームワークを用います。
  • 実験では、任意パッチに対する平均で99.13%の攻撃成功率を報告しており、視覚的・注意領域でのステルス性(それぞれ144.43倍、18.68倍)と、4データセットにわたるViT防御へのロバスト性(2.79倍)も大幅に向上したとされています。