ロバスト・アライメント：敵対的学習におけるクリーン精度と敵対的頑健性の調和

arXiv cs.CV / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、深層ニューラルネットワークにおける敵対的学習の主要な課題である「クリーン精度」と「敵対的頑健性」のトレードオフを扱います。
決定境界の近くにある学習サンプルで、学習時の摂動強度を変えても頑健性への影響が小さいという新しい観測を報告し、原因として入力空間と潜在空間の不一致を特定しています。
この不一致を緩和するために著者らは「Robust Alignment（ロバスト・アライメント）」を提案し、入力摂動によりモデルの認識は変わるが最終ラベル予測は不変であることを促す新しい敵対的学習の目標を定義します。
実現のために、境界サンプルでは縮小・固定した摂動強度を用いること、さらにDICAR（Domain Interpolation Consistency Adversarial Regularization）により入力と潜在表現の意味的アライメントを明示的に導入するという2つの方法を提案します。
これらを統合したRAAT手法は、CIFAR-10/100およびTiny-ImageNetで複数のResNet系モデルに対し、4つの一般的ベースラインを上回り、多数の関連するSOTAの性能改善につながることを実験で示しています。