要旨: 特異点に対する深層ニューラルネットワークの脆弱性は、現実世界への導入に関して重大な懸念を引き起こしている。現実世界における最も著名でインパクトの大きい物理的な敵対的撹乱の一つは、クリーン画像にパッチを取り付けることとして知られる敵対的パッチ攻撃である。同様に、ガウスノイズやソルト\&ペッパーのような自然ノイズも、現実世界では非常に広く見られる。現在の研究の必要性は、上述の脆弱性と、これら二つの特異点を独立に、そしてとりわけ組み合わせて対処するための取り組みが欠けていることに起因する。本研究では、初めてこれら二つの主要な特異点を組み合わせ、新しいデータセットを提案した。このデータセットを用いて、複数の畳み込みニューラルネットワークから得られる特徴に基づく、特異点データ点検出のベンチマーク研究を実施した。分類においては、広く用いられているニューラルネットワークに基づくパラメータ調整ではなく、従来からあるが有効な機械学習分類器を用いた。さまざまな in-分布および out-of-distribution(OOD)の特異点にまたがる大規模な実験により、分類器の有効性に関していくつかの興味深い知見が明らかになり、特異点を独立に扱う場合、攻撃者から防御することは難しく、効率の悪い分類器が選ばれてしまうことを示している。
見えない敵:敵対的パッチに対する堅牢で汎用的な防御
arXiv cs.CV / 2026/4/30
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、深層学習の脆弱性に対する重要なギャップとして、物理世界の脆弱性である「敵対的パッチ」と「一般的な自然ノイズ」を1つの評価設定に組み合わせて扱います。
- 新しいデータセットを提案し、これらの「特異性(singularities)」を同時に扱うことで、防御が1種類の攻撃だけでなく他にも一般化できるかをより現実的にベンチマークできるようにしています。
- ベンチマークでは、人気のニューラルネットのパラメータ調整だけに頼らず、複数の畳み込みニューラルネット(CNN)から特徴を抽出して特異性の検出を行います。
- 検出のために、ニューラルネットのチューニングではなく、従来型でありながら有効な機械学習分類器を用いる点が特徴です。
- in-distribution(学習分布内)とout-of-distribution(学習分布外)の幅広い特異性にまたがる実験から、攻撃タイプを独立に扱うだけでは防御が難しく、さらに非効率な分類器を選ぶと有効性が下がることが示されます。



