物理的に誘発された大気下の敵対的摂動：リモートセンシング画像分類における転移可能性と頑健性の強化

arXiv cs.CV / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、リモートセンシング（RS）画像分類向けに、単純なピクセル単位の改変ではなく霧のような摂動を用いる物理的にもっともらしい敵対的攻撃「FogFool」を提案する。
FogFoolは、Perlinノイズを用いた反復的最適化により不規則で自然な霧パターンを生成し、見た目として実画像に整合する敵対例でもモデルを欺けることを狙っている。
2つのベンチマークRSデータセットでの実験では、白箱設定での攻撃有効性が向上し、黒箱でも高い転移可能性が確認され、TASR最大83.74%が報告された。
JPEG圧縮やフィルタリングといった一般的な前処理ベースの防御に対しても頑健性が示され、実環境での持続性が示唆される。
混同行列やCAM（Class Activation Map）による分析では、摂動がモデルの注目（attention）を普遍的にシフトさせることが示され、なぜアーキテクチャを越えて転移するのかの説明に役立っている。

概要: 敵対的攻撃は、リモートセンシング（RS）画像分類における深層学習モデルの信頼性に対して深刻な脅威をもたらします。既存の手法の多くは、直接的なピクセル単位の摂動に依存しており、RS画像に固有の大気の特性を活用できず、また実世界での画像劣化にも耐えられません。本論文では、Perlinノイズに基づいて大気パターンを反復的に最適化することで霧ベースの摂動を生成する、物理的にもっともらしい敵対的枠組み FogFool を提案します。霧の形成を自然で不規則な構造としてモデル化することで、FogFool は、実際のRSシーンに視覚的に整合するだけでなく、欺瞞的でもある敵対例を生成します。大気現象の空間的な一貫性と中〜低周波の性質を活用することで、FogFool は、さまざまなアーキテクチャ間で共有される構造的特徴の中に敵対情報を埋め込みます。2つのベンチマークRSデータセットに対する大規模な実験により、FogFool が優れた性能を達成することが示されています。白箱設定では上回るだけでなく、優れたブラックボックス転移性を示し（TASR 83.74% に到達）、JPEG圧縮やフィルタリングといった一般的な前処理ベースの防御に対しても頑健です。混同行列や Class Activation Map（CAM）可視化を含む詳細な分析により、本研究の大気駆動型の摂動がモデルの注意（attention）に普遍的な変化を引き起こすことが明らかになりました。これらの結果は、FogFool が、RS分類システムに対する実用的でステルス性が高く、かつ非常に持続的な脅威を表し、複雑な環境におけるモデルの信頼性を評価するための堅牢なベンチマークとなることを示しています。