低ランク適応(LoRA)による敵対的摂動
arXiv cs.LG / 2026/5/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、敵対的例の攻撃で生成される敵対的摂動が、LoRAで用いられる低ランク更新と同様に低ランク構造を持つかを調べています。
- 理論的な裏付けと、攻撃手法・モデル構造・データセットにまたがる広範な実験により、敵対的摂動が本質的に低ランクな性質を持つことを示しています。
- この性質を活用し、参照モデルと補助データで勾配を低次元部分空間へ射影したうえで、黒箱攻撃における摂動探索をその部分空間に制限することで、黒箱の敵対的攻撃を効率化・強化します。
- 複数のベンチマークや脅威モデルにおいて、従来手法に比べて低ランク攻撃が攻撃性能で大きく一貫した改善を示しました。
- 低ランクという観点が、より強力な攻撃だけでなく、効果的な防御にも新たな可能性をもたらすことを示唆しています。




