空間的に構造化されたタスクに対する高度に転移可能な変換ベース攻撃のための統一型空間アライメント枠組み

arXiv cs.CV / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

この論文では、変換ベースの敵対的攻撃（TAA）が画像分類ではよく転移する一方で、意味セグメンテーションや物体検出のような空間的に構造化されたタスクでは失敗したり性能が低下したりし得ると述べている。
その根本原因は空間のミスアライメント（不整合）にあると主張する。構造化タスクではラベルが空間的に構造化されているため、入力に対して空間変換を適用するだけでラベルの変換を同期させないと、学習時の勾配が壊れてしまう。
著者らは、Spatial Alignment（SA）アルゴリズムにより、入力と同期してラベルを空間的に変換することで攻撃中の整合性を維持する、統一型のSpatial Alignment Framework（SAF）を提案する。
実験により、SAFは構造化タスクにおいて重要であり、枠組みなしの攻撃と比べてセグメンテーションのmIoUおよび検出のmAPを大幅に低減できることが示されている（例：論文中の比較ではCityscapesのmIoU 24.50→11.34、COCOのmAP 17.89→5.25）。