2021 December 13 NAS,, 对抗攻击,, 对抗防御

【文献调研】NAS对抗攻击和防御方法

【ICCV2021】AdvRush: Searching for Adversarially Robust Neural Architectures

关键词：

一句话概述：

摘要

深度神经网络以他们令人印象深刻的性能持续地令世界敬畏。然而，他们的预测容易受到对抗样本的破坏。当前提升模型对对抗样本的鲁棒性的工作主要几种在开发鲁棒训练方法，通过以更鲁棒的方向更新网络的权重。在本文，作者绕过权重参数的训练，考虑设计一种具有内在鲁棒性的对抗鲁棒性网络结构。作者提出AdvRush，一种对抗鲁棒性神经网络结构搜索算法，基于找到独立于训练方法，神经网络的内在鲁棒性可以被表示成其输入损失景观的平滑性。通过一个正则化算子，支持具有平滑输入损失景观的候选结构，AdvRush可以成功地发现对抗鲁棒结构。伴随着AdvRush全面理论动机，我们进行了大量的实验来证明AdvRush在不同benchmark数据集上的效率。特别是，在CIFAR10上，在对抗训练后，AdvRush取得了在FGSM下55.91%的鲁棒准确率，在7-step PGD对抗训练后在AutoAttack上取得了50.04%的鲁棒准确率。

引言

作者指出尚有一个重要的问题等待探索：能否利用具有高度内在鲁棒性的结构来提升模型的对抗鲁棒性？如果可以，能否可以自动地搜索这种鲁棒的神经网络结构。

作者应用神经网络搜索来搜索鲁棒的神经网络结构。现有的NAS算法的主要目标是提升标准准确率，因此，他们在搜索过程中并未考虑搜索结构的鲁棒性。结果，他们并未保证搜索得到的模型结构的鲁棒性，因为没有免费的午餐理论，对抗性鲁棒性阻止神经网络在没有额外努力的情况下获得足够的鲁棒性。此外，标准准确率和对抗鲁棒性之间的trade-off表明最大化标准准确率和对抗鲁棒性不可同时兼得，因此需要设计特别NAS来得到对抗鲁棒性的模型。

贡献：