分销赏收藏举报申诉 / 8

立即下载 VIP下载

当前位置：首页 > 学术论文 > 毕业论文/毕业设计 > 基于主从博弈的分层联邦学习激励机制研究_贾云健.pdf

基于主从博弈的分层联邦学习激励机制研究_贾云健.pdf

上传人：自信****多点

文档编号：370627

上传时间：2023-09-07

格式：PDF

页数：8

大小：1.32MB

《基于主从博弈的分层联邦学习激励机制研究_贾云健.pdf》由会员分享，可在线阅读，更多相关《基于主从博弈的分层联邦学习激励机制研究_贾云健.pdf（8页珍藏版）》请在咨信网上搜索。

1、基于主从博弈的分层联邦学习激励机制研究贾云健黄宇梁靓*万杨亮周继华(重庆大学微电子与通信工程学院重庆400044)(95696部队重庆400030)(重庆金美通信有限责任公司复杂环境通信重庆市重点实验室重庆400030)摘要：为了优化分层联邦学习(FL)全局模型的训练时延，针对实际场景中终端设备存在自私性的问题，该文提出一种基于博弈论的激励机制。在激励预算有限的条件下，得到了终端设备和边缘服务器之间的均衡解和最小的边缘模型训练时延。考虑终端设备数量不同，设计了基于主从博弈的可变激励训练加速算法，使得一次全局模型训练时延达到最小。仿真结果显示，所提出的算法能够有效降低终端设备自私性带来的影响，提

2、高分层联邦学习全局模型的训练速度。关键词：分层联邦学习；博弈论；激励机制中图分类号：TN92文献标识码：A文章编号：1009-5896(2023)04-1366-08DOI:10.11999/JEIT220175Research on Hierarchical Federated Learning IncentiveMechanism Based on Master-Slave GameJIAYunjianHUANGYuLIANGLiangWANYangliangZHOUJihua(School of Microelectronics and Communication Engineering

3、,Chongqing University,Chongqing 400044,China)(95696 Troops,Chongqing 400030,China)(Chongqing Key Laboratory of Complex Environment Communication,Chongqing Jinmei CommunicationCo.Ltd.Chongqing 400030,China)Abstract:InordertooptimizethetrainingdelayofthehierarchicalFederatedLearning(FL)globalmodel,foc

4、usingontheselfishnessoftheterminaldevicesintheactualscene,anincentivemechanismbasedongametheoryisproposed.Undertheconditionoflimitedincentivebudget,theequilibriumsolutionbetweenterminaldevicesandedgeserversandtheminimumedgemodeltrainingdelayareobtained.Consideringthedifferentnumberofterminaldevices,

5、avariableincentivetrainingaccelerationalgorithmbasedonStackelberggameisdesignedtominimizethetrainingdelayofaglobalmodel.Simulationresultsdemonstratethattheproposedalgorithmcaneffectivelyreducetheimpactofterminaldevicesselfishnessandimprovethetrainingspeedofhierarchicalfederatedlearningglobalmodel.Ke

6、y words:HierarchicalFederatedLearning(FL);Gametheory;Incentivemechanism1 引言随着各种智能设备的不断普及，依赖数据和计算能力的机器学习技术得到了迅速发展。为了解决机器学习模型训练面临的数据安全问题，2017年谷歌提出了一种新的分布式机器学习方法联邦学习(FederatedLearning,FL)1。在联邦学习的架构中，设备用户的原始数据不会上传至数据中心，而是留在设备本地进行模型训练，设备只上传训练出的模型参数2。联邦学习将机器学习与在中心服务器中获取、存储和训练数据分离开来，实现了用户数据隐私保护3。自从谷歌提出联邦学习

7、这个概念后，联邦学习就成为机器学习领域的一个研究热点。McMahan等人4提出了一个基于模型平均的联邦学习实用模型，并进行了广泛的实证评估，这篇文章提出的联收稿日期：2022-02-25；改回日期：2022-06-27；网络出版：2022-08-16*通信作者：梁靓基金项目：国家自然科学基金(62071075,61971077)，重庆市自然科学基金(cstc2020jcyj-msxmX0704)FoundationItems:TheNationalNaturalScienceFoundationofChina(62071075,61971077),TheNaturalScienceFounda

8、tionofChongqing(cstc2020jcyj-msxmX0704)第45卷第4期电子与信息学报Vol.45No.42023年4月JournalofElectronics&InformationTechnologyApr.2023邦平均算法(FederatedAveragealgorithm,FedAvg)成为一个经典的联邦学习算法。在此基础上，研究者针对FedAvg算法优化，进行了一系列研究。Li等人5在FedAvg的基础上引入了一个修正项，提出了FedProx(FedAvgwiththeProximalterm)算法，它允许在设备之间局部地执行可变量的工作，并且依赖这个修正项来确

9、保方法的稳定性，解决了联邦学习固有的系统异质性和统计异质性问题。Mills等人6采用分布式Adam优化技术和模型压缩技术，提出了一种改进的FedAvg算法CE-FedAvg(Communication-EfficientFedAvg)，该算法可以减少达到目标精度所需的通信轮次和每一轮需要加载的数据量，解决了联邦学习在物联网边缘计算的高效通信问题。Li等人7则从算法的公平性角度出发，提出了q-FairFL算法，它重新权衡了FedAvg算法中的目标函数，在损失函数中分配更高的权重给损失较高的设备，从而使训练精度分布更加均匀。为了进一步优化联邦学习的性能，有研究者对传统联邦学习框架进行了改进。Liu

10、等人8将基于边缘和基于云的联邦学习结合起来，提出了分层联邦学习架构，该分层联邦学习架构与基于云的联邦学习架构相比，模型训练时间和终端设备的能耗都得到了降低。Abad等人9通过分簇法研究了在蜂窝网中的分层联邦问题，优化了分层联邦学习的全局通信时延。然而不管是针对传统联邦学习框架还是分层联邦学习框架，目前已有的研究大多集中在优化联邦学习算法以提高模型训练性能上，用于激励终端设备参加模型训练的激励机制在很大程度上却被忽视了。大多数流行的分布式训练算法都是使用小批量随机梯度下降10，这在实际训练中，需要等待每一个同步批次中最慢的设备，导致随机优化的完全同步往往很慢，即受到“掉队效应”11的影响，这在异

11、构网络中更为明显。同时，目前的大多数研究都做出了一个乐观的假设，即所有的终端设备在受到邀请时，都将无条件地参与联邦学习。这在现实世界中是不实际的，因为在联邦模型训练过程中，终端设备在计算和通信方面承受着相当大的开销12，如果没有精心设计的激励机制，具有自私性的终端设备将不会拿出足够的资源甚至不愿意加入到联邦学习任务中来，这将导致十分严重的“掉队效应”，使得模型的训练时间大大增加，影响联邦学习的使用。针对上述问题，本文在分层联邦学习框架下，考虑实际场景中每个边缘服务器下连接的终端设备数量不同，首先对模型训练过程进行了建模分析，得出一次全局模型训练的时间消耗和资源消耗。然后在终端设备和边缘服务器之

12、间设计了两层主从博弈(即Stackelberg博弈13)，通过调整分配给每个边缘服务器的激励预算值，提出了基于主从博弈的可变激励训练加速算法。该算法能够刺激终端设备更加积极地参与到联邦学习的任务中来，有效地减小“掉队效应”的影响，从而最小化全局模型训练时间。2 系统模型CN=i:i=1,2,.,NiMi=m:m=1,2,.,M如图1所示在分层FL架构中，假设有一个云服务器，边缘服务器集合为，边缘服务器下连接的终端设备集合为，每个终端设备集合大小不相同。考虑完全同步的FL，完成一次全局训练过程如下：m (0,1)m终端设备端。终端设备基于本地的数据集来进行本地模型训练，假设所有的终端设备的本地

13、数据集大小相同，为了达到相同的本地模型精度，终端设备需要进行迭代的次数可以表示为14L()=log2(1)(1)fi:mimCmL()im其中，是一个取决于数据集大小和机器学习任务的参数。表示边缘服务器下的终端设备进行本地计算时的CPU频率，表示完成1次本地迭代计算任务需要的总的CPU转圈数。那么完成次本地迭代，边缘服务器下的终端设备所消耗的能量和时间可以分别表示为ecmpi:m=L()kCm(fi:m)2(2)tcmpi:m=L()Cmfi:m(3)kiqi:mimmqi:mfi:m其中，是一个取决于芯片结构的系数。为了使终端设备投入更多的计算资源以减小本地训练模型所花的时间，边缘服务器

14、端会引入激励机制，即边缘服务器向其下面的终端设备提供奖励，表示边缘服务器对其服务范围内的终端设备提供的CPU频率单价，那么终端设备迭代一次获得的收入为。本地模型精度达到之后，终端设备图1系统模型图第4期贾云健等：基于主从博弈的分层联邦学习激励机制研究1367B向对应的边缘服务器上传训练得到的参数。假设每个边缘服务器能够分配给终端设备的信道总带宽均为，边缘服务器将其均分给下面的每一个终端设备，那么传输率可以表示为rmi=Bmlog2(1+hmumN0)(4)N0umhmmi其中，为噪声功率，为传输功率，为信道增益。终端设备完成一次参数传输至边缘服务器所需要的时间为tcommi=dmrmi(

15、5)dmm其中，表示终端设备传输的参数量，所需要的能量为ecommi=tcommium(6)i边缘服务器端。边缘服务器在收到终端设备传来的参数后，会进行聚合然后再分发下去。以上的过程会迭代多次，直到所有的边缘服务器达到一个相同边缘服务器模型精度。为了达到所需精度，对于一个凸的机器学习任务，边缘服务器需要迭代的次数可以表示为14I(,)=(log2(1)1 (7)iI(,)其中，是取决于学习任务的参数。由于边缘服务器通常拥有强大的计算能力和稳定的能量供给，所以边缘服务器端的模型参数聚合和分发所产生的时间与能量消耗在本文中没有考虑。对于终端设备来说，接收分发下来的参数所消耗的时间和能量相比于它上

16、传参数要小得多，在这里本文也不予考虑。因此，边缘服务器完成次迭代，所需要的时间为Ti=I(,)maxmMi(tcmpi:m)+tcommi(8)m终端设备消耗的总能量为Ei:m=I(,)(ecmpi:m+ecommi)(9)ridi边缘服务器会向云服务器上传满足精度要求的边缘服务器模型参数，假设边缘服务器的传输率都为，上传的参数量为，那么上传1次参数，边缘服务器的时间和能量消耗分别为tcomiC=diri(10)ecomiC=uitcomiC(11)ui其中，表示边缘服务器的传输功率。云服务器端：在接收到边缘服务器端传来的模型参数后，云服务器端进行参数聚合并更新模型，这样就完成了一次全局迭代

17、。相较于其他环节，这个聚合时间非常短，本文也不考虑。那么，一次全局迭代，所需要的总时间为T=maxiNTi+tcomiC(12)ViWii1TiiRciRc1Ti云服务器负责分配激励预算给每个边缘服务器，总预算为。边缘服务器所分配到的激励预算为。定义边缘服务器对于一次全局迭代的时间贡献度为，时间贡献度越大，表示边缘服务器迭代到所要求的精度的时间越短。云服务器会基于每个边缘服务器的时间贡献度来给予边缘服务器奖励，云服务器端总的奖励为，边缘服务器从云服务器端获得的奖励定义为。3 基于主从博弈的激励机制3.1 博弈问题定义imqi:m=qi:1,qi:2,.,qi:mfi:m=fi:1,fi

18、:2,.,fi:mqi:mim本文考虑信息对称场景，即每个终端设备会在训练开始前向其所连接的边缘服务器报告自己能够提供的最大算力、本地数据集大小等先验信息。在终端设备层和边缘服务器层之间引入主从博弈(即Stackelberg博弈)。将终端设备作为跟随者(follower)，边缘服务器作为领导者(leader)。边缘服务器决定给每个终端设备的CPU频率单价。根据报价，每个边缘服务器服务范围内的各个终端设备向其报告自己用于参与训练的CPU频率，然后边缘服务器再调整单价。边缘服务器下的终端设备的效用函数可以表示为Ui:m=I(,)L()qi:mfi:m Ei:m(13)mi其中，第1项为终端设备

19、完成一次全局迭代获得的激励奖励，第2项为总的计算和传输能耗。系数用于匹配效用函数前后两项的数量级。边缘服务器的效用函数可以表示为Ui=Rc1TimMiqi:mfi:m ecomiC(14)iii其中，第1项为边缘服务器从云服务器获得的奖励，第2项为边缘服务器向下面的终端设备支出的激励总和，第3项为边缘服务器上传参数的传输能耗。Wi博弈框架如图2所示。首先明确引入激励机制的目的是减小完成一次全局迭代的时间。云服务器作为激励预算分配者(Allocator)，负责为每个边缘服务器分配用于激励的预算，然后每个边缘服务器和其服务范围内的终端设备形成1个博弈簇，进行Stackelberg博弈。在1

20、个博弈簇内，每个终端1368电子与信息学报第45卷m Miimi设备根据边缘服务器的激励报价，决定自己投入训练任务的CPU频率，从而最大化自己的效用函数。故会产生个下层子博弈问题。边缘服务器根据其服务范围内的所有终端设备的CPU频率投入情况，再重新调整自己给出的激励报价，最大化自己的效用函数。故产生一个上层子博弈问题。一个博弈簇内上下两层子博弈反复进行，直到达到纳什均衡点。下层子博弈问题定义为maxfi:mUi:m=I(,)L()qi:mfi:m Ei:ms.t.fmini:m fi:m fmaxi:m(15)上层子博弈问题定义为maxqi:mUi=Rc1TimMiqi:mfi:m eco

21、miCs.t.mMiqi:mfi:m WiiNWi V|(16)3.2 博弈均衡解分析3.2.1 下层子博弈求解Ui:m为了找到下层子博弈的均衡解，首先对求1阶导数，可以得到Ui:mfi:m=I(,)L()qi:m 2I(,)L()kCmfi:m(17)因为2Ui:mf2i:m=2I(,)L()kCm 0(18)Ui:m所以是严格凹的，保证了纳什均衡解存在且唯一。可得均衡解为fi:m(qi:m)=maxqi:m2kCm,fmaxi:m(19)3.2.2 上层子博弈求解iRc1TimMiqi:mfi:mecomiCecomiC边缘服务器的效用函数式(14)由3部分组成，(1)，(2)，(3)。

22、由前面系统模型的描述中可知，可视为一个常量，所以下面分析(1)和(2)的凹凸情况。h=Rc1Tifi:m分析(1)，令并代入可得表达式h(qi:m)=Rc1I(,)maxmMi(2kC2mL()/qi:m)+tcommi(20)h(qi:m)的黑塞矩阵定义为A=|2hq2i:1.2hqi:1qi:m.2hqi:mqi:1.2hq2i:m|(21)由于2hq2i:m=4kRcL()I(,)2C2mtcommi(2kL()I(,)C2m+I(,)tcommiqi:m)3(22)2hqi:mqi:n=0(m=n)(23)h(qi:m)所以的黑塞矩阵可进一步表示为A=|4kRcL()I(,)2C2mt

23、com1i(2kL()I(,)C2m+I(,)tcom1iqi:1)3.0.0.4kRcL()I(,)2C2mtcommi(2kL()I(,)C2m+I(,)tcommiqi:m)3|(24)图2博弈框架图第4期贾云健等：基于主从博弈的分层联邦学习激励机制研究1369AAh(qi:m)矩阵的所有特征值均小于等于0，矩阵负定，所以为凹函数。g=mMiqi:mfi:mfi:m分析(2)，令，代入可得表达式g(qi:m)=mMi12kCmqi:m2(25)g(qi:m)qi:m对求2阶导可得2gq2i:m=1kCm 0(32)所以mMi12kCmq2i:m Wi=0(33)imqi:m表明解是存在的

24、。当边缘服务器给每一个终端设备的相同时，可解得qi:m=2kCmmWi(34)qi:miiWiqi:mimTii这个特殊解的实际意义在于如果不相同，那么时间会由算得最慢的那个终端设备决定，从而使得边缘服务器的效用函数降低。只有当边缘服务器将激励预算全部使用，且分配下去的相等时，边缘服务器以及终端设备这一簇的时间消耗才能达到最小，从而使得边缘服务器的效用函数达到最大值。3.3 博弈执行过程VW1=W2=.=Wi=Vi初始化阶段，云服务器将总预算均分给每个边缘服务器，此时。iqi:mmUi:miI(,)qi:mTiUiiWiqi:m步骤1边缘服务器刚开始随意分配激励单价，终端设备会提供相

25、应的算力，使得自己的效用函数达到最大。此时边缘服务器会发现它完成次迭代的时间是受限于计算最慢的那个终端设备，故它会重新分配，激励最慢的终端设备增加算力，从而减小，增加自己的效用函数。最终边缘服务器会根据终端设备的个数，均分，此时的即为前面求出的特殊解式(34)。iTiUiiTiTi步骤2当每个边缘服务器和它连接的终端设备达到均衡点后，边缘服务器得到了和最终的效用函数。此时每个边缘服务器会将最终的上报给云服务器。为了使得一次全局迭代的总时间达到最小，云服务器会根据每个边缘服务器的大小值调整激励预算分配比例。Ti步骤3得到重新分配的激励预算后，每个边缘服务器再重复步骤1，然后云服务器重复步

26、骤2，直到每个边缘服务器的值最终相等。整个系统达到稳定的状态，且完成一次全局迭代的时间达到最短。根据上述过程，本文提出了全局模型训练的加速算法，如算法1所示。4 仿真结果与分析Cm=5 000imfi:m 1,109B=106N0=108um=200本文用MNIST数据集15来评估所提出的激励机制的性能。随机分配相同数量的10个种类的训练数据给每个终端设备，用随机梯度下降来训练本地模型，学习率为0.1。其他一些参数为：完成1次本地迭代计算任务需要的总的CPU转圈数，边缘服务器下的终端设备进行本地计算时的CPU频率Hz，信道总带宽Hz，噪声功率W，传输功率mW，终1370电子与信息学报第45卷

27、mdm=2 500mL()=2I(,)=5k=2 1028=1018端设备传输的参数量bit，终端设备进行迭代的次数，边缘服务器需要迭代的次数，芯片结构的系数，系数。(1)边缘服务器与终端设备的博弈迭代过程。为了评估这个过程，本文对一个博弈簇进行仿真实验，在激励预算足够的情况下，探究边缘服务器给出的激励单价对终端设备效用以及边缘服务器自身效用的影响，同时验证引入激励机制能够刺激终端设备投入更多的计算资源，减少本地计算时间。qq=20q图3显示的是边缘服务器给出的CPU激励单价对单个终端设备效用值的影响。可见，单个终端设备的效用值随着激励单价的增加逐渐上升并最终达到最大值稳定下来。这是因为随着激

28、励单价的增加，终端设备得到的奖励越来越多，导致其效用不断增加。当激励单价增加到某个值，如图中的时，终端设备会将所有的计算资源都投入到本地模型训练任务中，此时它获得的奖励值达到最大，故效用值也达到最大。而如果继续增加，由于该终端设备之前就已投入了全部的CPU频率资源，所以边缘服务器为了节省激励成本，实际上并不会继续增加真正给到该终端设备的激励单价，故该终端设备的效用值保持最大值不变。图3虽然是显示的单个终端设备效用与激励单价的关系，但是该博弈簇中的所有终端设备都遵循这个关系，当每个终端设备效用值达到最大时，下层子博弈达到均衡点。qTiq=20Ti图4显示的一个边缘服务器给出的激励单价对其效用

29、值的影响。可以看到，边缘服务器的效用值随着激励单价的增加而增加，最后达到最大值并稳定下来。这是因为增加激励单价，能够刺激终端设备提供更多的算力到模型训练任务中来，从而减小时间，增大了该边缘服务器对于一次全局迭代的时间贡献度。虽然增加激励单价会导致边缘服务器的激励支出增加，但是它能够从云服务器端获得更多的奖励，故其效用值最终增加。当激励单价增加到某个值，比如图中的时，终端设备将全部算力投入计算，时间达到最小，该边缘服务器效用值达到最大。同样地，之后激励单价如果继续增加，边缘服务器为了节约激励成本，实际上并不算法1基于主从博弈的可变激励训练加速算法N=i:i=1,2,.,NMi=m:m=1,2,.

30、,MDW1=W2=.=Wi=Vi输入：，计算任务Task，数据集，。Wi=Wi,i NQi:m=qi:m,m MimF*i:m=fi:m,m Mi输出：激励预算分配的均衡点，终端设备提供的算力均衡解。(1)repeatiNiqi:m,m MimMiqi:mfi:m Wimfi:m=maxqi:m2kCm,fmaxi:m,m MiUi:m(2)for indo(3)边缘服务器分配激励单价，激励单价需满足条件。终端设备会提供相应的算力，使得自己的效用达到最大。tcmpi:m/=tcmpi:n(m/=n)(4)iftheniqi:mUiTi(5)边缘服务器重新分配，使得自己的效用函数达到最大，同

31、时得到时间。(6)end forTi Tj(i/=j)(7)ifthenVWiWj(8)云服务器重新分配(减小，增大)。Ti=Tj(i/=j)(9)Untilq图3激励单价与单个终端设备效用的关系q图4激励单价与单个边缘服务器效用的关系第4期贾云健等：基于主从博弈的分层联邦学习激励机制研究1371会给予已经完全激励了的终端设备更高的激励单价，故终端设备的效用值保持最大值不变。当一个博弈簇中的边缘服务器的效用达到最大时，上层子博弈达到均衡点。当上下两层子博弈同时达到均衡点时，该博弈簇内的Stackelberg博弈达到纳什均衡点。qqq=20q图5显示的是单个终端设备的本地计算时间与边缘服务器

32、给出的激励单价的关系。可以看到，终端设备的本地计算时间随着激励单价的增加逐渐减少，因为终端设备提供了更多的本地计算资源。当激励单价增大到某个值，比如图中的时，该终端设备贡献出全部的算力，本地计算时间达到最小。此后继续增加，由于没有多余的计算资源，本地计算时间不会再继续减小，故保持最小值不变。qi:m=2kCmmWiTi以上的仿真实验虽然是对一个博弈簇，在激励预算分配足够的情况下进行的实验，但是所有的博弈簇中的博弈迭代过程都遵循上述分析的结果。并且在激励预算不够的情况下，边缘服务器最终会根据其服务范围内的终端设备个数，均分激励预算，即满足前文解出的特殊解，从而博弈达到纳什均衡点，最小化本地

33、计算时间。(2)云服务器激励预算分配达到平衡点的过程。假设边缘服务器数量为2，边缘服务器1下连接的终端设备数量为1000个，边缘服务器2下连接的数量V=40 000W1=W2=V/2=20 000W1W2W2=V W1为1200个，云服务器能够分配的总激励预算。刚开始时分配情况为，然后云服务器会调整分配情况，一部分分给，剩余部分全部分给，即。T1T2W1W2T1W1T1W1W2T2W1=8 700W2=31 300T1=T2从图6可以看到，刚开始均分时，由于边缘服务器1连接的终端设备数量更少，故，全局训练时间取决于较大者。然后云服务器开始减小，同时等量增大。随着的减小而增大，因为边缘服务器1连

34、接的终端设备得到的激励在减小，用于计算的CPU频率降低，本地计算时间增加，导致最终增大。减小，相应地在增加，边缘服务器2获得更多的激励预算，故逐渐减小。当云服务器分配，时，如图6中的两条曲线的交点处所示，此时全局训练时间达到最小，激励预算分配达到均衡点。(3)将本文提出的基于主从博弈的可变激励训练加速算法与没有设计激励机制的算法8进行比较。边缘服务器个数设置为2个，每个边缘服务器下连接不同数量的终端设备。两个边缘服务器连接的终端设备总数分别设置为800个、1000个、1200个。在没有设计激励机制的算法中，为了反映真实情况下终端设备的自私性，本文假设会有一定比例的终端设备不会完全贡献自己的资源

35、甚至不愿意参与到联邦学习中。从图7可以看到，在没有激励机制的情况下，全局模型的训练时延随着终端设备数的增加而减小，这是因为虽然设备存在自私性，但是随着设备的基数增加，总的算力资源是增加的。而在本文提出的激励机制算法中，由于激励预算是一定的，所以随着设备数量的增加，每个设备能够分到的激励量在减小，所以总的算力在减小，导致总时间增加。但是，在不同终端设备总数的情况下，与没有激励机制的算法相比，本文提出的带有激励机制的算法均能够有效地刺激终端设备积极参与到训练中q图5激励单价与单个终端设备本地计算时间的关系W1T1T2图6不同的值与,的关系图7两种算法在不同终端设备总数下训练总时间的比较1372电

36、子与信息学报第45卷来，提供更多的资源到训练过程中，从而有效降低了全局模型训练的总时延。5 结束语本文面向分层联邦学习框架，针对联邦学习中终端设备存在自私性而影响全局模型训练时间的问题，设计了基于主从博弈的激励机制。该机制通过对分层联邦学习模型训练过程进行建模，利用可变激励训练加速算法，不断调整分配给边缘服务器的激励预算，使得边缘服务器和终端设备达到纳什均衡点的同时，最小化1次全局模型训练时间。仿真结果表明，本文所提算法能够有效地降低终端设备自私性带来的影响，优化分层联邦学习全局模型的训练时延。参考文献MCMAHANBandRAMAGED.Federatedlearning:Collab

37、orativemachinelearningwithoutcentralizedtrainingdataEB/OL.https:/ for wireless communications:Motivation,opportunities,andchallengesJ.IEEE CommunicationsMagazine,2020,58(6):4651.doi:10.1109/MCOM.001.1900461.2LIUYi,PENGJialiang,KANGJiawen,et al.Asecurefederatedlearningframeworkfor5GnetworksJ.IEEEWire

38、less Communications,2020,27(4):2431.doi:10.1109/MWC.01.1900525.3McMAHAN B,MOORE E,RAMAGE D,et al.Communication-efficientlearningofdeepnetworksfromdecentralizeddataC.The20thInternationalConferenceonArtificialIntelligenceandStatistics,FortLauderdale,USA,2017:12731282.4LI Tian,SAHU A K,ZAHEER M,et al.F

39、ederatedoptimization in heterogeneous networksC.MachineLearningandSystems2020,Austin,USA,2020,2:429450.5MILLSJ,HUJia,andMINGeyong.Communication-efficientfederatedlearningforwirelessedgeintelligenceinIoTJ.IEEE Internet of Things Journal,2020,7(7):59865994.doi:10.1109/JIOT.2019.2956615.6LITian,SANJABI

40、M,BEIRAMIA,et al.FairresourceallocationinfederatedlearningC.The8thInternationalConferenceonLearningRepresentations(ICLR),AddisAbaba,Ethiopia,2019:127.7LIULumin,ZHANGJun,SONGSH,et al.Client-edge-8cloud hierarchical federated learningC.2020 IEEEInternational Conference on Communications(ICC),Dublin,Ir

41、eland,2020:16.doi:10.1109/ICC40277.2020.9148862.ABAD M S H,OZFATURA E,GUNDUZ D,et al.HierarchicalfederatedlearningACROSSheterogeneouscellularnetworksC.2020IEEEInternationalConferenceonAcoustics,Speech and Signal Processing(ICASSP),Barcelona,Spain,2020:88668870.doi:10.1109/ICASSP40776.2020.9054634.9S

42、UN Haifeng,LI Shiqi,YU F R,et al.Towardcommunication-efficientfederatedlearningintheinternetofthingswithedgecomputingJ.IEEE Internet of ThingsJournal,2020,7(11):1105311067.doi:10.1109/JIOT.2020.2994596.10SHI Yuanming,YANG Kai,JIANG Tao,et al.Communication-efficient edge AI:Algorithms andsystemsJ.IEE

43、E Communications Surveys&Tutorials,2020,22(4):21672191.doi:10.1109/COMST.2020.3007787.11LUOSiqi,CHENXu,WUQiong,et al.HFEL:Jointedgeassociation and resource allocation for cost-efficienthierarchicalfederatededgelearningJ.IEEE Transactionson Wireless Communications,2020,19(10):65356548.doi:10.1109/TWC

44、.2020.3003744.12KHANLU,RAJPANDEYS,TRANNH,et al.Federatedlearningforedgenetworks:ResourceoptimizationandincentivemechanismJ.IEEE Communications Magazine,2020,58(10):8893.doi:10.1109/MCOM.001.1900649.13TRANNH,BAOWei,ZOMAYAA,et al.Federatedlearningoverwirelessnetworks:Optimizationmodeldesignandanalysis

45、C.IEEEINFOCOM2019-IEEEConferenceonComputerCommunications,Paris,France,2019:13871395.doi:10.1109/INFOCOM.2019.8737464.14LECUNY,BOTTOUL,BENGIOY,et al.Gradient-basedlearningappliedtodocumentrecognitionJ.Proceedings ofthe IEEE,1998,86(11):22782324.doi:10.1109/5.726791.15贾云健：男，博士，教授，研究方向为新一代移动通信网络、网络内生安全.黄宇：男，硕士生，研究方向为联邦学习.梁靓：女，博士，副教授，研究方向为移动通信网络、可信网络.万杨亮：女，硕士，工程师，研究方向为计算机网络与无线通信.周继华：男，博士，研究员，研究方向为无线通信.责任编辑：马秀强第4期贾云健等：基于主从博弈的分层联邦学习激励机制研究1373

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于主从博弈分层联邦学习激励机制研究贾云健

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。