2021 November 09

【对抗样本（十六）】Feature Importance-aware Transferable Adversarial Attacks

关键词：VGG-16作为源模型的时候，可以获得最高的攻击成功率（这条在多篇论文中都有提及）。模型越大（越复杂），优化就越困难，也就越难以找到局部最优值（难已收敛）。

在原始批的干净图像中进行随机变换以得到一些列干净图像的梯度，然后使用这些梯度的均值来表征模型感兴趣的区域。本质上是输入图像的变换上做操作。

摘要

对抗样本的迁移性是攻击未知模型的关键问题，迁移性使得对抗攻击更适用于实际场景，如黑盒攻击。现有的迁移攻击倾向于通过不加区别地扭曲扰动来构建对抗样本以降低原始模型地预测准确率，并未意识到图像中目标特征的内在性质。相反，作者提出特征重要性攻击（FIA），通过破坏重要目标意识特征，这主导了模型决策的一致性。具体地，作者通过介绍积累梯度得到特征重要性，这是原始模型特征图的梯度均值，这由在原始干净图像的随机变换计算得到。梯度将与模型兴趣的区域高度相关，这种相关性提供了跨模型的不变性。此外，随机变换将保留目标对象的固有特征，并且抑制模型特定的信息。最终，特征重要性知道搜索对抗样本以破坏关键特征，获得了强大的迁移性。大量的实验验证证明了FIA的有效性和优秀的性能，比如，比正常训练的模型的攻击成功率高了9.5%，与SOTA迁移攻击相比，对防御模型的性能提高了12.8%。

引言

常见的黑盒攻击类型[33,14,2]通过查询估计梯度（概率向量和硬标签）来构建对抗样本，这种是查询攻击，大量的查询攻击在现实世界中是不切实际的，因为大量的查询是不被允许的。于此相反，典型的黑盒攻击，称为基于迁移攻击，依赖对抗样本的跨模型迁移性[21]，这更符合实际并且更加灵活。

然而，由传统方法构造的对抗样本通常由于对源模拟过拟合，从而展示出很弱的迁移性。有一些方法尝试通过在优化过程中引入额外操作来减弱这种过拟合，如随机变换[35]，转换操作[6]。最近，[36,23,7]通过直接攻击中间层来增强迁移性。不同于扰动输出层，这些特征攻击最大化中间层失真从而得到更高的迁移性。然而，通过不加区分地扭曲特征来构建对抗样本地现有方法并未意识到图像中目标物体地内在特征，因此很容易陷入局部最优。由于分类器倾向于提取任何可得到地特征来最大化分类准确率，甚至那些在图像中隐含地不可感知的噪声[15]，模型将学习额外的噪声特征以及目标的内在特征，但是噪声特征与目标相关的特征被同等对待来支撑最终的决策，这种噪声特征将会是模型相关的。因此，现有的对抗样本生成方法倾向于对源模型过拟合，并线阻碍了对抗样本的迁移性。

本文提出了一种特征重要性意识（FIA），通过扭曲对不同模型决策都具有主导作用的重要特征（不同模型上都），极大地提升了对抗样本的迁移性。为对抗特定模型的特征，作者引入聚合梯度，这能有效地抑制模型相关特征，同时能提供目标相关的重要性特征。如图1所示，与传统无区别攻击方法相比，FIA生成的攻击图像存在极大的散焦，即未能捕获目标的重要性特征。更具体地，随机变换（随机像素dropping） 被首先应用到原始图片上。因为转换后地图像会保留空域结构和纹理，但是有不同的语义细节，它们的特征在对象感知特征上是一致的，但在非对象（即特定于模型的“嘈杂”）特征上会有所波动。关于这些特征，对梯度进行平均，以统计方式抑制那些波动地模型特定特征。同时，目标相关和重要性特征被保留下来以知道更多迁移对抗样本地生成，因为特征重要性高度与感兴趣目标相关，并且在不同模型上保持一致性。

贡献：

作者提出了一种FIA的方法来增强对抗样本的迁移性，该方法荣国破坏目标相关的关键特征，该关键特征主导不同模型的决策。
我们分析了现有工作迁移性相对较低背后的逻辑，如对模型相关的噪声特征过拟合，作者通过引入聚合梯度来指导更多迁移性对抗样本
在不同分类方模型的大量实验证明了由FIA方法生成的对抗样本相对于其他方法的优越性。

方法

作者提出的FIA方法的框架如下图所示

随即变换的示意图如下图所示

聚合梯度生成的特征重要性

模型重要性与特征如何影响最终决策有关，直观策略是获得梯度，即

其中l表示真实标签t对应的logit输出，fk(x)表示从第k层特征中得到的特征图。原始的公式2包含模型特定信息。正如图3所示，原始梯度图和原始特征图二者均有视觉噪声，即在目标区域的脉冲和大梯度，这可能是由于模型特定解决空间引起的。

为了解决模型特定信息，作者提出了聚合梯度，其从随机变换x中聚集梯度（如图4）。转换应该会损失图像细节，但是会保留空间结构和通用纹理。因为语义目标相关或重要特征/梯度对于这些变换具有一定的鲁棒性，但是模型特定的噪声就对这些操作很脆弱，这些鲁棒性/迁移性特征/梯度在聚合后变得明显，其他则会变得中性。在本文，作者采用了以概率pd的随机像素dropping（随机mask）。因此，聚合梯度可以表示成以下的形式