TsallisPGD:意味論的セグメンテーションに対する敵対的攻撃のための適応的勾配重み付け

arXiv cs.CV / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 意味論的セグメンテーションの敵対的攻撃は、攻撃者が数千ものピクセル予測を同時に反転させる必要があるため、分類よりも難しく、標準のピクセルごとのクロスエントロピー(CE)は最適化の観点で不適合になりやすい。
  • 本論文では、Tsallisクロスエントロピー(qでパラメータ化されたCEの一般化)を用いるTsallisPGDという敵対的攻撃を提案し、ピクセル間の勾配集中度を制御することで勾配地形を適応的に再形成する。
  • qを変化させることで、異なる確信度レベルのピクセルを狙うよう攻撃を誘導でき、固定のqが常に最適とはならないことを、データセット・モデル構造・摂動予算への依存として示す。
  • 動的なqスケジュール(最適化中にqを掃引)を提案し、Cityscapes、Pascal VOC、ADE20Kでの実験により、検証で選んだ単一のスケジュールでも平均的に最良の攻撃順位を達成することを報告する。
  • TsallisPGDはCEPGD、SegPGD、CosPGD、JSPGD、MaskedPGDよりも、標準モデルだけでなくロバスト性を意識したモデルに対しても精度とmIoUをより大きく低下させる。

Abstract

意味セグメンテーションモデルへの攻撃は、画像分類モデルへの攻撃よりも大幅に難しいです。攻撃者は、何千ものピクセル予測を同時に反転させる必要があるためです。標準的なピクセル単位のクロスエントロピー(CE)は、この状況に適していません。CEはすでに誤分類されているピクセルを過度に重視する傾向があり、その結果として最適化が遅くなり、モデルの頑健性を過大評価してしまいます。これらの問題に対処するために、TsallisPGDを提案します。これは、qによってパラメータ化されたCEの一般化であるTsallisクロスエントロピーに基づいて構築された敵対的攻撃です。TsallisPGDは、ピクセル間での勾配の集中度を制御することで、勾配の地形(グラディエントランドスケープ)を適応的に再形成します。qの値を変えることで、攻撃の焦点を異なる信頼度(コンフィデンス)レベルのピクセルへと誘導できます。まず、データセット、モデルアーキテクチャ、摂動予算によって有効性が変わるため、固定された単一のqが常に普遍的に最適であることはないことを示します。これに動機づけられて、最適化中にqをスイープする動的qスケジュールを提案します。Cityscapes、Pascal VOC、ADE20Kに関する大規模な実験により、TsallisPGDは、単一の検証(validation)で選択したスケジュールを用いることで、評価したすべての設定における最良の平均攻撃順位を達成し、標準モデルおよび頑健モデルの両方で精度とmIoUを低下させる点において、CEPGD、SegPGD、CosPGD、JSPGD、MaskedPGDよりも改善することが示されます。