分销赏收藏举报申诉 / 8

立即下载开通VIP

当前位置：首页 > 学术论文 > 自然科学论文 > 基于信息瓶颈的深度学习模型鲁棒性增强方法.pdf

基于信息瓶颈的深度学习模型鲁棒性增强方法.pdf

上传人：自信****多点

文档编号：328147

上传时间：2023-08-16

格式：PDF

页数：8

大小：3.11MB

《基于信息瓶颈的深度学习模型鲁棒性增强方法.pdf》由会员分享，可在线阅读，更多相关《基于信息瓶颈的深度学习模型鲁棒性增强方法.pdf（8页珍藏版）》请在咨信网上搜索。

1、基于信息瓶颈的深度学习模型鲁棒性增强方法董庆宽何浚霖*(西安电子科技大学综合业务网国家重点实验室西安710071)摘要：作为深度学习技术的核心算法，深度神经网络容易对添加了微小扰动的对抗样本产生错误的判断，这种情况的出现对深度学习模型的安全性带来了新的挑战。深度学习模型对对抗样本的抵抗能力被称为鲁棒性，为了进一步提升经过对抗训练算法训练的模型的鲁棒性，该文提出一种基于信息瓶颈的深度学习模型对抗训练算法。其中，信息瓶颈以信息论为基础，描述了深度学习的过程，使深度学习模型能够更快地收敛。所提算法使用信息瓶颈理论提出的优化目标推导出的结论，将模型中输入到线性分类层的张量加入损失函数，通过样本交叉训练

2、的方式将干净样本与对抗样本输入模型时得到的高层特征对齐，使模型在训练过程中能够更好地学习输入样本与其真实标签的关系，最终对对抗样本具有良好的鲁棒性。实验结果表明，所提算法对多种对抗攻击均具有良好的鲁棒性，并且在不同的数据集与模型中具有泛化能力。关键词：深度学习；对抗训练；信息瓶颈；对抗样本；鲁棒性中图分类号：TP18文献标识码：A文章编号：1009-5896(2023)06-2197-08DOI:10.11999/JEIT220603Robustness Enhancement Method of Deep Learning ModelBased on Information Bottlene

3、ckDONGQingkuanHEJunlin(State Key Laboratory of Integrated Service Networks,Xidian University,Xian 710071,China)Abstract:Asthecorealgorithmofdeeplearningtechnology,deepneuralnetworkiseasytomakewrongjudgmentontheadversarialexampleswithimperceptiveperturbation.Thissituationbringsnewchallengestothesecur

4、ityofdeeplearningmodel.Theresistanceofdeeplearningmodeltoadversarialexamplesiscalledrobustness.Inordertoimprovetherobustnessofthemodeltrainedbyadversarialtrainingalgorithm,anadversarialtrainingalgorithmofdeeplearningmodelbasedoninformationbottleneckisproposed.Amongthis,informationbottleneckdescribes

5、theprocessofdeeplearningbasedoninformationtheory,sothatthedeeplearningmodelcanconvergefaster.Theproposedalgorithmusestheconclusionsderivedfromtheoptimizationobjectiveproposedbasedontheinformationbottlenecktheory,addsthetensorinputtothelinearclassificationlayerinthemodeltothelossfunction,andalignsthe

6、cleansampleswiththehigh-levelfeaturesobtainedwhentheadversarialsamplesareinputtothemodelbymeansofsamplecross-training,sothatthemodelcanbetterlearntherelationshipbetweentheinputsamplesandtheirtruelabelsduringthetrainingprocessandfinallyhasgoodrobustnesstotheadversarialsamples.Experimentalresultsshowt

7、hattheproposedalgorithmhasgoodrobustnesstoavarietyofadversarialattacks,andhasgeneralizationabilityindifferentdatasetsandmodels.Key words:Deeplearning;Adversarialtraining;Informationbottleneck;Adversarialexample;Robustness1 引言随着深度学习的发展，生活中越来越多的地方开始将各种技术与深度学习相结合，在自然语言处理、机器视觉等多个领域中取得了令人瞩目的成果。但深度学习模型实际上

8、相当脆弱，当输入被添加了人眼无法分辨的微小的扰动时，会导致模型产生高置信度的误判。这种含有微小扰动且能干扰模型正常工作的输入被称为对抗样本。自从Szegedy等人1提出对抗样本的概念后，多种对抗攻击与对抗防御算法被提出。在图像分类方面，常见的攻击算法有基于反向梯度的FGSM(FastGradientSignMethod)2、被证明是最强1阶攻击收稿日期：2022-05-12；改回日期：2022-10-13；网络出版：2022-10-20*通信作者：何浚霖基金项目：陕西省自然科学基础研究计划(2020JM-184)FoundationItem:TheScienceBasicResearchPla

9、ninShaanxiProvinceofChina(2020JM-184)第45卷第6期电子与信息学报Vol.45No.62023年6月JournalofElectronics&InformationTechnologyJun.2023的PGD(ProjectGradientDescent)3，基于超平面分类的DeepFool4以及基于优化的C&W(CarliniandWagnerAttacks)5。这些算法被认为是训练鲁棒性网络的有效手段，并且被广泛用于评判深度学习模型的鲁棒性。对抗防御算法通常通过使用更大的训练集、修改模型结构、修改损失函数等方法来提升模型的鲁棒性。这些防御算法大致可以分为

10、对抗训练算法3,612和图像预处理算法1317两大类。图像预处理算法将对抗样本中的扰动看作噪声，通过对输入图像去噪的方式来防御对抗攻击。但是在去除输入样本中的噪声时，容易将样本中包含的信息也一同去除，会使模型对干净样本的正确率大幅下降。对抗训练使用梯度攻击算法获得对抗样本，使用干净样本与对抗样本一同训练模型，使训练的模型拥有更好的鲁棒性，是目前最常用的方法，也是目前最优秀的对抗防御方法之一。但该类算法的训练过程耗时较长，模型收敛较慢，同时因为训练时同时使用干净样本与对抗样本，模型对干净样本的正确率也会产生一定幅度的下降。Tishby等人1820于1999年以信息论为基础首次提出信息瓶颈方法，给

11、出了优化问题的数学定义和迭代算法，并且证明了算法的收敛性，指出深度神经网络的实质是对信息的压缩。并且尝试使用信息瓶颈理论对深度学习网络的特征拟合与特征压缩这两个阶段进行解释。Kolchinsky等人21与Alemi等人22类似，通过在网络中添加VAE编码器结构来实现信息瓶颈理论，仅使用干净样本来训练模型来增强模型的鲁棒性。他们的工作将信息瓶颈理论提出的优化目标推广到了包括离散域与连续域的更一般的领域，为本文将信息瓶颈引入对抗训练提供了理论推导基础。为了进一步提升对抗训练的鲁棒性，本文提出一种基于信息瓶颈理论的对抗训练防御算法，主要贡献如下：(1)将信息瓶颈理论引入了对抗训练，使深度学习模型能够

12、更好地学习输入数据与真实标签之间的关系，将对抗样本的高层特征向干净样本的高层特征对齐，从而提升深度学习模型的鲁棒性。(2)在多个数据集与深度学习模型中对算法进行了仿真，展示了算法在不同对抗攻击、不同深度学习模型以及不同的数据集中都具有良好的防御性能与泛化性能。2 相关工作对抗训练作为最常用的方法，无需修改模型f(xi,yi)L的结构，只需要将对抗样本加入训练集，就能够使训练的模型拥有更好的鲁棒性。给定由参数化的网络，数据集，损失函数，扰动值与扰动的限制范围对抗训练通常可以看作以下的优化问题。minimaxL(f(xi+),yi)(1)对抗训练利用对抗攻击使模型获得内部最大化，同时使用梯度

13、下降法对模型进行训练，使模型获得外部最小化，这正是Madry等人3提出的min-max优化框架。为了能够更好地获得内部最大化，多种对抗攻击算法被提出。f(x,y)xf(x,y)FGSM算法2是最早来近似内部最大化的方法，能够使用较少的时间使深度学习模型获得鲁棒性，算法的公式化呈现为式(2)。给定由参数化的网络，数据集，即可算出当前输入的梯度。将梯度用符号函数sign()与扰动范围限制后，就得到了最终的扰动。将扰动与输入叠加就能够获得对抗样本，使深度学习模型作出错误的判断。=sign(xf(x,y)(2)使用FGSM算法进行对抗训练所获得的深度学习模型仅对FGSM算法本身生成的样本有良好的鲁

14、棒性，原因是FGSM算法只迭代了1次，获得的梯度并不是准确的，因而PGD算法3在FGSM算法的基础上对扰动进行N次迭代，每次迭代都将获得的扰动限制在指定的范围内，算法的公式化呈现为式(3)。这种方式能够获得更贴近于模型的梯度，因而获得的扰动也更有效，进一步提升了深度学习模型的鲁棒性。因为使用PGD进行对抗训练的每次训练都需要经过N次迭代，因此耗时将会是普通训练的N倍。xn+1=clip(xn+sign(xf(x,y)(3)为了避免PGD算法带来的大量资源消耗，Fast-AT算法6对FGSM算法进行了改进，为FGSM算法在开始前添加非零的随机初始化步骤，并在最后将扰动限制在指定范围内，算法的公式

15、化呈现为式(4)。无论随机初始化步骤将为扰动带来什么样的值，这一操作都能够使FGSM在不牺牲速度的情况下拥有比肩使用PGD进行对抗训练的性能。=clip(random(,)+sign(xf(x,y)(4)在监督学习中，信息瓶颈将深度学习模型的训练过程表述为最大化地压缩输入，并且保留关于标签的信息。信息瓶颈理论使用互信息来衡量输出中含有的输入信息，将深度学习模型的训练过程看作最小化隐藏变量与输入数据之间的互信息，并最大2198电子与信息学报第45卷化隐藏变量与输出数据的互信息的过程。Alemi等人22将马尔可夫过程引入信息瓶颈，并使用变分推理构造优化目标的下界后，使深度学习网络在训练时能够更快地

16、收敛，同时使输入更难通过信息瓶颈传递细小、特殊的扰动，从而使模型对对抗输入更具鲁棒性。该方法在深度学习模型中加入了新的结构，改变了模型的结构，不能简单地进行部署。本文提出的算法将信息瓶颈引入了对抗训练中，能够在不对深度学习模型进行修改的前提下，在输入干净样本时正确率仅产生小幅下降，同时大幅提升模型对其他对抗攻击的鲁棒性。3 基于信息瓶颈的模型鲁棒性增强方法深度神经网络通常由前方的特征提取层与后方的线性分类层组成，通常能够将线性分类层的输入看作深度神经网络将输入通过特征提取层后获得的高层特征。高层特征确定了深度神经网络最终将输入样本分为哪一类，如图1。x xL=I(z,y;)I(z,x;)信息瓶

17、颈理论将深度神经网络的高层特征看作信息瓶颈，高层特征应该尽可能地保留与其对应的真实标签有关的信息，并遗忘其他无关的信息。因此，将深度神经网络中的高层特征抽象为隐藏变量z，记网络参数为，输入的对抗样本为，因而需要使隐藏变量z与网络输出y的互信息最大，使隐藏变量z与网络输入的互信息最小，即最大化目标函数。下面将从由目标函数推导至损失函数与算法的实际应用两个方面来讲述。3.1 训练优化的目标函数推导L=I(z,y;)I(z,x;)首先通过信息瓶颈理论提出的目标函数推导至损失函数，因为整个过程未改变网络结构且都在同一个网络中完成，下面的推导将省略网络参数，公式变量对照如表1。I(z,y)I(z,y)

18、首先来推导的下界。由互信息的定义，可以得到隐藏变量z与网络输出y之间的互信息。I(z,y)=H(p(y)H(p(y|z)(5)H(p(y)p(y)q(y)其中，是变量y的熵，为网络输出y的边缘概率分布。算法的目的是希望对抗样本经由目标网络后获得的高层特征与干净样本经由目标网络后获得的高层特征尽可能相似，从而使目标网络在不同的情况下都能给出正确的输出。因而在此引入与输入样本相对应真实标签的边缘分布概率。p(y|z)q(y)当与相同时，目标网络就能够在输入是对抗样本时获得与输入是干净样本相同的输出。对于两个概率分布，本文在这里使用KL散度来衡量二者之间的差距。KLp(y|z)|q(y)0(6)且交

23、息通过瓶颈的多少，随使用的数据集进行调整。Shamir等人23,Still等人24,Alemi等人22对的取值进行了相关研究，通常。KLp(z|xn)|q(z)与正常训练损失函数相比，这一部分的增加使模型能够在训练过程中，以对齐模型的高层特征的方法使模型在面对对抗样本时能够获得与干净样本相似的高层特征，从而做出正确的判断。3.2 基于信息瓶颈的深度学习防御模型训练方法基于上述算法推导，本文提出一个基于信息瓶颈的防御模型，包含3部分：目标模型、样本交叉训练与特征对齐。目标模型可以是目前使用的任意图像分类模型。样本交叉训练可以让目标模型保持在干净样本下的正确率，同时也能更好地学习样本间的联系。特

24、征对齐是使用基于信息瓶颈理论推导而来的结论，能够使目标模型更好地学习输入样本与真实标签之间的关系，使模型的高层特征对齐，不容易被微小的扰动干扰。q(z)p(z|xn)p(y|z)图2展示了整个算法的流程。首先使用干净样本训练一个高正确率的模型，记为DNN0，同时将目标模型记为DNN1。将干净样本输入DNN0，从模型中输入线性分类层中取得此时的高层特征。然后使用Fast-AT算法生成对抗样本，将对抗样本输入DNN1，从模型中输入线性分类层中取得此时的高层特征与输出。q(y)将以上取得的数据与真实标签一同代入式(10)作为损失函数来更新模型的参数。同样地，将干净样本输入DNN1进行1次如上过程的模

25、型参数更新，最后获得的模型DNN1就是所需的模型。4 实验结果及分析4.1 实验设置算法使用Python3.8与Pytorch1.9.0在GeForceRTX3070上实现与测试，优化器使用Adam25，对抗攻击算法使用FoolBox开源库中的实现的FGSM2,PGD3,DeepFool3与C&W4对模型进行测试。实验数据集使用CIFAR10，MNIST与Fashion-MNIST数据集，Fashion-MNIST的复杂度略高于MNIST，数据集信息如表2。实验共包含3项测试，第1项是算法与不同防御方法的比较，第2项是算法在不同深度学习模型中的泛化性，第3项是算法在不同数据集中的泛化性。在CI

26、FAR10数据集上进行第1项与第2项的测试，在图2算法流程图表 2 使用的数据集信息数据集名称图片大小是否彩色数量(万张)类别(种)CIFAR1003232是620105CIFAR103232是610105MNIST2828否710103Fashion-MNIST2828否7101032200电子与信息学报第45卷MNIST与Fashion-MNIST数据集上进行第2项与第3项的测试。防御算法对比实验采用了TRADES26,ADT8,FeatureScatter29与Fast_AT5算法进行结果对比。4.2 实验结果在CIFAR10数据集上，目标模型使用ResNet1827和VGG1628

27、，使用FGSM,PGD,DeepFool,C&W攻击算法进行测试。超参数设置如下：Res-Net18以0.1的学习率训练120代，以0.01的学习率训练5代，以0.001的学习率训练5代。VGG16以0.1的学习率训练100代，0.01的学习率训练45代，0.001的学习率训练10代。其中，对比算法中，ADT算法8通过对抗分布训练框架学习对抗性分布来获取对抗样本进行对抗训练。TRADES算法26使用分类校准损失理论提出了新的损失函数对模型进行对抗训练。FeatureScatter算法29使用特征散射方法，用无监督的方式生成对抗样本进行对抗训练。表3对比了不同防御方法在CIFAR10数据集上的鲁

28、棒性，各算法均采用ResNet18模型在CIFAR10数据集上进行训练，且扰动强度均为8，因此对比算法除Fast_AT外，均直接引用了相关论文中的数据。实验结果表明在CIFAR10数据集上，本文提出的算法对各种攻击都具有较好的鲁棒性。本文提出的算法在干净样本上的正确率与无防御的模型相比，由93.0%下降到了85.0%，但在面对FGSM,PGD-20与PGD-100攻击时，正确率均有较大幅度的提升。TRADES(1/=1)、ADT与FeatureScatter防御算法在干净样本上的正确率略微高于本文提出的算法，但在面对各种对抗攻击时，本文提出的算法的正确率均高于上述防御算法。表4的实验结果表明在

29、CIFAR10数据集上，C&W攻击在1000次迭代的设置下，对二者效果均不明显，因此正确率与输入干净样本时相似，无防御时的正确率要高于本算法。对于其他攻击算法，本文提出的算法在Resnet18模型和VGG16模型上在扰动强度为0到16时，面对对抗攻击准确率的下降均小于15%，以少量降低干净样本正确率的代价使模型对多数对抗攻击算法具有了鲁棒性。证明了本文提出的算法对不同的深度学习模型具有良好的泛化性能。图3展示了ResNet18模型中，由2幅CIFAR10图片得到的部分类激活图与特征图。其中类激活图由ResNet18.Layer4的输出获得，特征图由ResNet18.Layer1的输出获得。从类

30、激活图可以看到，正常训练的模型关注的像素范围较小，容易受到扰动的干扰产生误判，由本文提出算法进行训练的模型将更多的像素纳入了关注的范围，能够更好地抵抗扰动，从而做出正确的判断。从特征图可以看到，正常模型输入干净样本时，特征图可以看到明显的轮廓，而输入对抗样本时，特征图的轮廓则不再清晰。由本文提出算法进行训练的模型在输入对抗样本时仍然能够得到较清晰的轮廓，使模型能够将更多信息传递下去，最终作出正确的判断。在CIFAR100数据集20分类任务上，使用ResNet18表 3 不同防御方法在CIFAR10数据集上的鲁棒性(%)干净样本FGSMPGD-20PGD-100C&WDeepFool无防御93.

31、065.954.249.792.041.9TRADES(1/=6)84.961.056.656.481.261.3TRADES(1/=1)88.656.349.148.984.059.1ADT86.860.452.151.652.4FeatureScatter90.078.470.568.662.6Fast_AT78.672.472.372.278.571.1本文85.079.078.878.784.973.5表 4 Resnet18与VGG16模型在CIFAR10数据集上的鲁棒性(%)无防御(Resnet18)本文(Resnet18)无防御(VGG16)本文(VGG16)干净样本(=0)93

32、.085.092.181.4FGSM(=2/8/16)83.1/65.9/66.484.9/79.0/78.783.6/47.8/28.381.4/79.8/75.9PGD-40(=2/8/16)79.1/51.5/45.284.9/78.7/77.681.3/24.3/11.881.4/79.7/74.6C&W(=2/8/16)92.7/92.0/91.085.0/84.9/84.892.0/91.5/90.781.3/81.2/81.2DeepFool(=2/8/16)78.3/41.9/16.583.5/78.5/71.578.6/31.8/5.179.2/73.5/67.0第6期董庆宽

33、等：基于信息瓶颈的深度学习模型鲁棒性增强方法2201模型进行训练。超参数设置如下：以0.1的学习率训练100代，0.01的学习率训练10代，0.001的学习率训练5代。表5的实验结果表明，ResNet18模型使用本文提出的算法训练后，在CIFAR100数据集20分类任务上，以降低干净样本10.7%正确率的代价使模型对多数对抗攻击算法具有了鲁棒性，在扰动强度为0到16时，面对对抗攻击准确率的下降均小于16%，证明了本文提出的算法在更复杂的图像分类任务上仍能具有良好的鲁棒性。图4展示了使用正常方法训练模型与使用本文提出算法进行训练时得到的模型在面对干净样本与FGSM(eps=8/255)对抗样本时

34、的正确率，其中使用本文算法进行训练的正确率曲线中100代后的突变是学习率从0.1缩小至0.01导致。在图中可以看到，正常方法训练时，随着训练代数的增加，模型对干净样本的正确率有明显的上升，但是对FGSM对抗样本的正确率却上升不明显。使用本文提出算法进行训练时，随着训练代数的增加，模型对干净样本与FGSM对抗样本的正确率同步上升，证明了本文提出的算法能使模型具有良好的鲁棒性。MNIST与Fashion-MNIST数据集由于图像构成简单，在此采用由两层CNN网络与两层线性网络，使用ReLU激活函数构建的模型进行训练与测试。超参数设置如下：均使用0.001的学习率训练60代。表6与表7的实验结果表明

35、，CNN网络使用本文提出的算法训练后，在MNIST数据集上，无论是干净样本还是对抗样本的正确率都高于或等于无防御的模型。在Fashion-MNIST数据集上，在干净样本的正确率下降了6%，但在对抗样本的正确率有了大幅的提升，展现出了与在CIFAR10数据集上类似的鲁棒性。证明了本文提出的算法对不同的数据集具有良好的泛化性能。图3类激活图与特征图图4干净样本与对抗样本测试正确率对比图表 5 ResNet18模型在CIFAR100数据集20分类任务上的鲁棒性(%)攻击算法无防御本文干净样本(=0)76.7466.02FGSM(=2/8/16)51.71/34.73/30.6464.28/59.18

36、/52.78PGD-20(=2/8/16)46.10/14.34/5.2564.26/58.96/51.91PGD-100(=2/8/16)44.12/8.73/2.5664.26/58.94/51.62C&W(=2/8/16)49.64/16.55/3.6664.05/58.22/50.48DeepFool(=2/8/16)76.21/74.42/72.1966.00/65.86/57.002202电子与信息学报第45卷5 结束语对深度学习模型易受到对抗攻击干扰而产生高置信度误判的问题，本文将信息瓶颈引入了对抗训练中，使深度学习模型能够更好地学习输入数据与真实标签之间的关系，从而获得更好的鲁

37、棒性。并且在多个数据集与深度学习模型中对算法进行了仿真，证明了算法的防御性能优于其他的防御算法，并且算法在不同条件下均展现了良好的防御性能，证明了算法具有良好的泛化性能。参考文献SZEGEDY C,ZAREMBA W,SUTSKEVER I,et al.IntriguingpropertiesofneuralnetworksC.The2ndInternationalConferenceonLearningRepresentations(ICLR),Banff,Canada,2014:110.1GOODFELLOW I J,SHLENS J,and SZEGEDY C.Explaining

38、andharnessingadversarialexamplesC.The3rdInternationalConferenceonLearningRepresentations(ICLR),SanDiego,USA,2015:111.2MADRYA,MAKELOVA,SCHMIDTL,et al.TowardsdeeplearningmodelsresistanttoadversarialattacksC.6thInternationalConferenceonLearningRepresentations(ICLR),Vancouver,Canada,2018:128.3MOOSAVI-DE

39、ZFOOLISM,FAWZIA,andFROSSARDP.DeepFool:AsimpleandaccuratemethodtofooldeepneuralnetworksC.IEEEConferenceonComputerVisionandPatternRecognition(CVPR),LasVegas,USA,2016:25742582.doi:10.1109/CVPR.2016.282.4CARLININandWAGNERD.TowardsevaluatingtherobustnessofneuralnetworksC.IEEESymposiumonSecurityandPrivacy

40、(SP),SanJose,USA,2017:3957.doi:510.1109/SP.2017.49.WONGE,RICEL,andKOLTERJZ.Fastisbetterthanfree:RevisitingadversarialtrainingC.The8thInternationalConferenceonLearningRepresentations(ICLR),AddisAbaba,Ethiopia,2020:117.6ZHENGHaizhong,ZHANGZiqi,GUJuncheng,et al.Efficientadversarialtrainingwithtransfera

41、bleadversarialexamplesC.IEEE/CVFConferenceonComputerVisionandPatternRecognition(CVPR),Seattle,USA,2020:11781187.doi:10.1109/CVPR42600.2020.00126.7DONG Yinpeng,DENG Zhijie,PANG Tianyu,et al.Adversarial distributional training for robust deeplearningC.The34thInternationalConferenceonNeuralInformationP

42、rocessingSystems(NeurIPS),Vancouver,Canada,2020:693.8WANGHongjun,LIGuanbin,LIUXiaobai,et al.AHamiltonian Monte Carlo method for probabilisticadversarialattackandlearningJ.IEEE Transactions onPattern Analysis and Machine Intelligence,2022,44(4):17251737.doi:10.1109/TPAMI.2020.3032061.9CHENSizhe,HEZhe

43、ngbao,SUNChengjin,et al.UniversaladversarialattackonattentionandtheresultingdatasetDAmageNetJ.IEEE Transactions on Pattern Analysis andMachine Intelligence,2022,44(4):21882197.doi:10.1109/TPAMI.2020.3033291.10FANJiamengandLIWenchao.Adversarialtrainingandprovablerobustness:AtaleoftwoobjectivesC/OL.Th

44、e35thAAAIConferenceonArtificialIntelligence,2021:73677376.doi:10.1609/aaai.v35i8.16904.11GOKHALE T,ANIRUDH R,KAILKHURA B,et al.Attribute-guidedadversarialtrainingforrobustnesstonaturalperturbationsC/OL.The35thAAAIConferenceonArtificialIntelligence,2021:75747582.doi:10.1609/aaai.v35i9.16927.12LIXiaoy

45、u,ZHUQinsheng,HUANGYiming,et al.ResearchonthefreezingphenomenonofquantumcorrelationbymachinelearningJ.Computers,Materials&Continua,2020,65(3):21432151.doi:10.32604/cmc.2020.010865.13SALMANH,SUNMingjie,YANGG,et al.Denoisedsmoothing:AprovabledefenseforpretrainedclassifiersC.The34thInternationalConfere

46、nceonNeuralInformationProcessingSystems(NeurIPS),Vancouver,Canada,2020:1841.14SHAORui,PERERAP,YUENPC,et al.Open-setadversarial defense with clean-adversarial mutuallearningJ.International Journal of Computer Vision,2022,130(4):10701087.doi:10.1007/s11263-022-01581-0.15MUSTAFAA,KHANSH,HAYATM,et al.Im

47、agesuper-resolutionasadefenseagainstadversarialattacksJ.IEEETransactions on Image Processing,2020,29:17111724.16表 6 CNN网络在MNIST数据集上的鲁棒性(%)攻击算法无防御本文干净样本(=0)99.199.1FGSM(=2/8/16)98.9/96.3/88.999.1/98.1/94.9PGD(=2/8/16)98.8/90.8/67.099.1/97.8/91.4C&W(=2/8/16)99.1/99.0/99.099.1/99.0/99.0DeepFool(=2/8/16

48、)98.4/93.4/64.298.8/97.5/93.7表 7 CNN网络在Fashion-MNIST数据集上的鲁棒性(%)攻击算法无防御本文干净样本(=0)93.4787.41FGSM(=2/8/16)80.13/48.09/35.1786.18/82.74/78.40PGD-20(=2/8/16)76.27/32.76/24.2386.14/81.90/75.04PGD-100(=2/8/16)75.41/29.11/23.8886.14/81.78/74.10C&W(=2/8/16)93.25/91.95/90.2887.35/87.21/86.96DeepFool(=2/8/16)7

49、7.67/25.64/0.3686.09/82.26/76.69第6期董庆宽等：基于信息瓶颈的深度学习模型鲁棒性增强方法2203doi:10.1109/TIP.2019.2940533.GU Shuangchi,YI Ping,ZHU Ting,et al.Detectingadversarial examples in deep neural networks usingnormalizingfiltersC.The11thInternationalConferenceonAgentsandArtificialIntelligence(ICAART),Prague,CzechRepublic

50、,2019:164173.doi:10.5220/0007370301640173.17TISHBY N,PEREIRA F C,and BIALEK W.TheinformationbottleneckmethodEB/OL.https:/arxiv.org/pdf/physics/0004057.pdf,2000.18TISHBYNandZASLAVSKYN.DeeplearningandtheinformationbottleneckprincipleC.IEEEInformationTheoryWorkshop(ITW),Jerusalem,Israel,2015:15.doi:10.

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于信息瓶颈深度学习模型鲁棒性增强方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。