A briefly survey on ensemble adversarial attack

集成攻击方法调研

A briefly survey on ensemble adversarial attack

对抗样本的迁移性是指针对模型A生成的对抗样本也能攻击模型B。可见对抗样本迁移性的定义可以视为在不同模型上均能攻击成功,提升对抗样本迁移性的目的是针对不同模型均有能攻击成功。由此可见,集成对抗攻击算法是提升对抗样本迁移性的一种很直接的方法。为了了解这方面的研究,故在此对现有基于集成攻击算法的方法做一个简单的回顾。注意,我们只关注与集成攻击算法相关的部分,忽略了研究种其他方面的贡献。

【ICLR2017】Delving into transferable adversarial examples and black-box attacks

\[\arg \min_{x^*}-\log((\sum_{i=1}^{K}\alpha_iJ_i(x^*))\cdot\textbf{1}_{y^*})+\lambda d(x,x^*)\]

其中,$J$表示模型的softmax输出;$\sum_{i=1}^{K}\alpha_i=1$。d是距离度量指标,表示为范数,无穷范数或2范数。

【CVPR2018】Boosting Adversarial Attacks with Momentum

【AAAI2020】Learning transferable adversarial examples via ghost networks

image-20230420155836621

image-20230420155844728

image-20230420160114143

image-20230420160232298

采用JSD指标,对模型输出logit计算相关性

image-20230420160647764

image-20230420160701306

【AAAI2020】A new ensemble adversarial attack powered by long-term gradient memories

由于用于Image-to-Image任务,实验结果省略。

【Signal Processing: Image Communication】Revisiting ensemble adversarial attack

image-20230423161940919

【CVPR2022】Stochastic variance reduced ensemble adversarial attack for boosting the adversarial transferability

上图是给定图片在不同模型上梯度的cos相似度,值越靠近0,相似度越低(cos 90=0)

image-20230423162722910

image-20230423162738564

image-20230423162800160

Table of Contents