【对抗样本(九)】【CVPR2019】Once a MAN Towards Multi-Target Attack via Learning Multi-Target Adversarial Network Once

摘要

基于一阶优化攻击方法以及其改进方法提升了对抗攻击的性能和速度。最近,基于生成模型的方法受到很多关注,因为他们可以直接使用前向网络来生成对抗样本,这避免了在基于优化和梯度中time-consuming的迭代攻击过程。然而,当前的生成方法仅能攻击某个特定模型中的特定目标,使其无法应用到数以千计的现实分类系统中。在本文,作者提出了第一个多目标对抗攻击网络,MAN,可以用单个模型生成多目标对抗样本。通过将特定类别的信息结合到中间特征层,在训练时它能够攻击目标分类模型的任意类别。实验结果显示MAN可以构建更强的攻击结果并且拥有更好的迁移性。进一步使用由MAN生成的对抗样本来提升分类模型的鲁棒性

image-20211031143603396

介绍

现有方法的缺点:

因此,作者提出采用将来自正确类别信息的目标信息嵌入到编解码器中,来生成可以攻击特定目标的对抗样本。

此外, 作者还指出如果要用对抗样本进行对抗训练,需要大量的对抗样本,因此生成对抗样本的速度决定了对抗训练的效率。为此,作者聚焦于如何快速地生成对抗样本来攻击所有类别,并用来训练鲁棒模型。

方法

作者的提出方法的框架如下

image-20211031143554529

MAN网络包括两个分支:

在上述两个分支后接一个信息集成模块,如上图中的2e。其中解码器网络包括6个残差层和2个反卷积层来生成最后的对抗样本。

为了约束网络的学习引入了两个损失:

image-20211031150130939

两种特征集成方法:

实验(存在符号说明不清晰的问题)

测试阶段对扰动的处理

image-20211031150749883

实验结果如下

单目标攻击

image-20211031151101355

image-20211031151108018

作者吹嘘方法的迁移性好,但是使用这种方式生成的对抗样本迁移性为什么好呢?

作者的解释:网络中的一个分支编码目标标签并且在生成更强大的对抗样本上提供了额外的指导。

多目标攻击

image-20211031151825055

MANc的特征组合方式不会受到特征图的影响,因此可以在两个数据集上平行执行。MANr重新校准了特征图的每个通道。

Table of Contents