基于非稳态MAB的LEO卫星跳波束时隙分配算法.pdf
《基于非稳态MAB的LEO卫星跳波束时隙分配算法.pdf》由会员分享,可在线阅读,更多相关《基于非稳态MAB的LEO卫星跳波束时隙分配算法.pdf(10页珍藏版)》请在咨信网上搜索。
1、2023 年 8 月 Journal on Communications August 2023 第 44 卷第 8 期 通 信 学 报 Vol.44 No.8基于非稳态 MAB 的 LEO 卫星跳波束时隙分配算法 林敏1,阚鹏程1,赵柏1,程铭1,杨绿溪2(1.南京邮电大学通信与信息工程学院,江苏 南京 210003;2.东南大学信息科学与工程学院,江苏 南京 211189)摘 要:针对低地球轨道(LEO)卫星系统中的跳波束资源分配算法不能适应小区业务动态变化等问题,提出了一种基于非稳态多臂赌博机(MAB)的 LEO 卫星跳波束时隙分配算法。首先,以系统二阶差分容量最小化为优化目标,建立了时
2、隙分配和波束等级匹配的联合优化问题。其次,由于该问题非凸且难以直接求解,基于有效小区和有效关键小区的概念提出波束等级组合方案生成算法,从而生成所有可能的波束等级组合方案。接下来,提出了基于非稳态 MAB 模型的动态时隙分配方案,在最优波束等级组合方案下完成时隙分配与波束等级匹配的联合优化。最后,计算机仿真结果表明,所提算法在多种小区业务分布的情况下,系统平均冗余度均不超过 20;相比于其他对比方案,所提算法在保持较高的系统吞吐量的同时,还可以将波束平均重访时间控制在 300 ms 左右。关键词:低地球轨道;跳波束;分等级波束;非稳态多臂赌博机 中图分类号:TN92 文献标志码:A DOI:10
3、.11959/j.issn.1000436x.2023160 Time-slot allocation algorithm for LEO satellite beam hopping based on non-stationary MAB LIN Min1,KAN Pengcheng1,ZHAO Bai1,CHENG Ming1,YANG Lyuxi2 1.School of Communications and Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,
4、China 2.School of Information Science and Engineering,Southeast University,Nanjing 211189,China Abstract:Aiming at the problem of inadequate adaptation to dynamic changes in cell services in the resource allocation algorithm for hopping beams in low earth orbit(LEO)satellite systems,a time-slot allo
5、cation algorithm for LEO satellite beam hopping based on a non-stationary multi-armed bandit(MAB)was proposed.Firstly,the joint optimization problem of slot allocation and beam grading matching was established,with the minimization of the systems second-order differ-ential capacity as the optimizati
6、on objective.Secondly,due to the non-convexity and difficulty in direct solution of this problem,a beam grading combination scheme generation algorithm was proposed based on the concept of effective cells and effective critical cells,which generated all possible beam grading combination schemes.Next
7、,a dynamic slot alloca-tion scheme based on the non-stationary MAB model was proposed,and joint optimization of slot allocation and beam grading matching was completed under the optimal beam grading combination scheme.Finally,the computer simulation results show that the average redundancy of the pr
8、oposed algorithm is less than 20%in the case of multiple cell service distributions.In addition,compared with other schemes,the proposed algorithm can control the average beam revisit time to about 300 ms while maintaining high system throughput.Keywords:LEO,beam hopping,graded beam,non-stationary M
9、AB 收稿日期:20230509;修回日期:20230816 基金项目:国家自然科学基金资助项目(No.61971128,No.62301282);南京邮电大学引进人才科研启动基金资助项目(No.NY220111,No.NY221009);江苏省研究生科研与实践创新计划基金资助项目(No.KYCX22_0965)Foundation Items:The National Natural Science Foundation of China(No.61971128,No.62301282),Talent Research Start-upFoundation of Nanjing Univer
10、sity of Posts and Telecommunications(No.NY220111,No.NY221009),The Postgraduate Research andPractice Innovation Program of Jiangsu Province(No.KYCX22_0965)第 8 期 林敏等:基于非稳态 MAB 的 LEO 卫星跳波束时隙分配算法 135 0 引言 针对 6G 网络中“泛在连接”的技术愿景,卫星通信因其通信覆盖范围大、不受地理条件限制、组网灵活等优点,被产业界和学术界认为是实现 6G技术愿景的一种重要的通信方式1。在卫星通信中,低地球轨道(LE
11、O,low earth orbit)卫星通信凭借其传输时延短、建设成本相对较低等特点,在近几年得到了较多的关注和发展2。随着 SpaceX、OneWeb等公司低轨卫星星座建设计划的提出与实施,以及我国低轨卫星互联网星座的研究和部署,LEO 卫星通信成为卫星通信领域研究的焦点。跳波束(BH,beaming hopping)技术以业务需求为驱动,通过在同一时刻只激活部分波束覆盖相应的地面小区,实现系统资源的合理分配和灵活调度,一经提出便得到了广泛的关注和研究3-4。文献5-6综合考虑了跳波束系统中波束重访时间和分簇尺寸等因素,以n 阶差分容量最小化为目标建立相应的优化问题,采用凸优化方法求解得到时
12、隙分配结果,并通过时隙分配进一步缓解了多波束卫星的同频干扰问题。然而,该方法采用离线静态资源分配,并不能很好地适应用户业务需求动态变化的场景。文献7则基于贪婪算法根据用户业务的需求分布灵活地分配星载资源,但是该算法未考虑服务公平性问题。文献8则在保证每个波束服务公平性的前提下,建立了最小化实时性服务数据包时延以及最大化非实时性服务数据包吞吐量的多目标优化问题,并基于深度强化学习实现了该多目标优化问题的动态求解。该方法虽然能很好地适应用户业务需求动态变化的场景,但仍然存在学习模型复杂度较高、对计算资源需求较高的问题。多臂赌博机(MAB,multi-armed bandit)模型作为强化学习中实现
13、探索和利用平衡的一类经典模型,因其具有在未知环境信息条件下也能实现动态优化的特点,在信道选择、推荐系统等领域得到了广泛的应用9-11。传统的MAB 模型依赖于平稳的奖励分布,文献12进一步研究了非稳态 MAB 模型并提出了相应的求解算法,并且通过理论和实践证明,该求解算法能在保证收敛性的情况下很好地应用于奖励分布未知且随时间动态变化的场景,同时相比于深度强化学习等人工智能算法,其对计算资源的需求更低。本文考虑 LEO 跳波束卫星系统中地面小区业务需求分布不均以及动态变化的场景,在满足小区业务需求量的基础上建立以二阶差分容量为目标的最小化问题。由于小区业务需求的时变性,所建立的优化问题难以直接求
14、解,因此本文首先提出波束等级组合方案生成算法以生成所有可能的波束等级组合方案;然后在固定波束等级组合方案的情况下,通过非稳态 MAB 模型完成时隙的动态分配;最后以二阶差分容量最小化为准则选择最优波束等级组合方案,从而完成时隙分配与波束等级匹配的联合优化。由仿真结果可知,与单一等级方案和单一波束方案相比,本文算法能够进一步降低跳波束系统业务处理的归一化平均冗余度;同时相比于其余的时隙分配方案,本文算法在总业务需求量变化的同时能达到较高的系统吞吐量,并保持相对较低的波束平均重访时间。1 系统模型 如图 1 所示,本文研究 LEO 跳波束卫星通信系统的前向链路传输场景,它由网络控制中心、配备跳波束
15、控制器的 LEO 卫星和地面小区组成,并采用兼容 DVB-S2/S2X 协议的跳波束工作方式。综合考虑 LEO 卫星所处的轨道高度以及移动性,本文将 LEO 卫星在飞行过程中的总体覆盖区域划分为不同的观察窗口,并且在每个观察窗口内能够服务N个地面小区。为了提高系统的频谱利用效率,LEO 卫星在当前观察窗口内以全频率复用的方式同时生成K 个点波束服务N个小区。由于星载资源较有限,在跳波束卫星通信系统中通常假设点波束数目远小于小区数目,即KN。基于上述的 LEO卫星跳波束通信场景,本文将分别详细介绍小区业务模型、信道模型以及分等级波束模型。图 1 LEO 跳波束卫星通信系统模型 136 通 信 学
16、 报 第 44 卷 假设跳波束卫星通信系统的跳波束周期为WT,而卫星在跳波束周期内的每个时隙以数据包的形式向地面小区提供业务数据,且数据包大小均为X bit/s。同时假设各个小区在t时隙到达的数据包个数为T12()(),(),()Nta t a tatA,其中数据包的到达数量()na t服从均值为(1,2,)nnN的泊松分布,则在该观察窗口中各个小区在一个跳波束周期内的业务需求量为 1(),1,2,WTnntRXa t nN(1)此外,各小区数据包达到后若不能及时处理则进入缓冲区队列等待,并将t时隙的缓冲区数据量表示为 T12()(),(),()Ntttt(2)在传统的跳波束卫星通信系统中,其
17、单波束业务数据处理能力较固定,这可能会导致在跳波束时隙分配过程中存在以下2种固有问题。1)当某些小区的业务需求量较大以至于接近甚至超过了单波束最大业务数据处理能力时,便需要卫星波束长期照射这些小区,这会导致其他小区业务处理不及时、数据包等待时延过长;2)当某几个相邻小区的总业务需求量较低时,如果仍然使用单一等级波束在这些小区间进行跳变,则会占用过多的跳波束时隙,导致其余小区的业务需求量难以得到满足。针对上述问题,本文采用波束分级方法来进一步提高跳波束LEO卫星通信系统的资源利用率13-14。具体来讲,本文考虑采用3种等级的波束处理小区的业务数据包,如图2所示。图 2 分等级波束示意 本文考虑3
18、种等级的波束,并分别记为1L、2L和3L。其中,1L等级波束覆盖1个小区,2L等级波束覆盖7个小区,3L等级波束覆盖19个小区。综合考虑分等级波束增益差异性、卫星信号传播过程中的自由空间传输损耗以及雨衰等因素的影响,卫星下行信道可建模为14 1txrx2,4iikn Lkn LnnnchGGrd f(3)其中,,ikn Lh表示采用iL等级的第k号波束到小区n的信道参数;4ncd f表示自由空间传播损耗,且c、f和nd分别表示光速、载波频率和小区n到卫星的距离;nr表示雨衰系数,其dB形式服从对数正态随机分布,即dB2lnCN()(),snsr,其中s和s取决于卫星的通信频率、极化方式和用户的
19、位置;tx,ikn LG表示采用iL等级的第k号波束到小区n的发射天线增益,其具体表达式为 21,3,tx,max,3,362iiiiiikn Lkn Lkn LLkn Lkn LJJGG(4)其中,,3dB,sin2.07123siniiknkn LL,kn为波束k的波束中心与小区n关于卫星连线之间的夹角,1()J和3()J分别为第一类一阶和第一类三阶贝塞尔函数。根据天线增益相关理论,随着波束覆盖范围的增加,其峰值发射增益下降。具体来讲,若以半功率波束宽度表示波束的有效覆盖范围,则峰值发射增益与半功率波束宽度的关系可表示为15 max,23dB,28000iiLLG(5)其中,3dB,iL为
20、(1,2,3)iL i等级波束对应的半功率波束角度,其具体值可通过空间几何关系得到。例如,用iL等级波束覆盖1号小区,并假设卫星高度为H,小区边长为d,如图3所示。图 3 波束 3 dB 角度计算示意 第 8 期 林敏等:基于非稳态 MAB 的 LEO 卫星跳波束时隙分配算法 137 通过几何推导,可得出13dB,L具体表达式为 13dB,2arctanLdH(6)同理,可以得出23dB,L和33dB,L具体表达式分别为 23dB,72arctanLdH(7)33dB,192arctanLdH(8)根据式(3)可以得出t时隙被iL等级波束k服务的小区n的输出信干噪比(SINR,signal t
21、o inter-ference plus noise ratio)表达式为 2T,2()()iikn Lkn LnP httI(9)其中,TP表示卫星发射功率;2noiseTW表示噪声功率,其中、noiseT和W分别表示玻耳兹曼常数、噪声温度和载波带宽;()ntI表示该小区在当前时隙受到来自其他被照射小区的同频干扰,其具体表达式为 2,T()()iknk n LkKk nNthtP I(10)其中,K为当前工作的波束集合,kN为波束k服务的小区集合。进一步地,可以得到t时隙针对被照射小区n的数据包处理能力为 ,()lb 1()iin Lkn LCtWt(11)于是小区n经过一个跳波束周期后的总
22、业务数据处理量为 ,11(),1,2,WiWTn LTnntCtCnNXI(12)其中,表示向下取整;1WTnI表示小区n的跳波束时隙分配矩阵,当小区n在t时隙被照射时,11WTnt I,否则10WTnt I。2 问题建立与求解 2.1 问题建立 由小区业务模型和分等级波束模型可知,当部分小区业务数据量需求量较大时,应尽量采用1L等级波束以尽可能满足其业务需求;当部分小区业务数据量较小时,可考虑优先采用2L等级波束或3L等级波束对这部分小区进行合并,从而将更多的时隙资源分配给其余业务需求量较大的小区。因此,需要通过联合优化时隙分配与波束等级匹配以尽可能满足各小区在一个跳波束周期内的业务需求,本
23、文以二阶差分容量最小化为目标函数,建立如下形式的联合优化问题 2,11231min s.t.C1:,C2:()01,1,2,1 C3:(),1,2,nniNnnLnninWNnWinnRCLL L LttTtK tTlIII,(13)其中,C1限定了每个小区的波束等级选取范围;C2限定了时隙分配矩阵中每个元素的取值范围;C3中inl表示小区n选择的iL等级波束所覆盖的小区数目,因此C3表示在同一时隙服务地面小区的波束数不能超过多波束卫星的最大波束数目。由于该问题为非线性整数规划问题,且由于小区业务需求的动态变化,直接求解该问题将变得十分困难。因此本文首先提出波束等级组合方案生成算法以生成所有可
24、能的波束等级组合方案;然后在固定波束等级组合方案的情况下,通过非稳态MAB模型完成时隙的动态分配;最后根据二阶差分容量最小化为准则选择最优波束等级组合方案,从而完成时隙分配和波束等级匹配的联合优化。2.2 波束等级组合方案生成算法 由于跳波束周期通常较短,且LEO卫星过境时间有限,因此为了避免LEO卫星波束等级的频繁切换,本文假设在一个跳波束周期中,每个小区只可以固定选择一种等级的波束。基于该假设,本文提出一种波束等级组合方案的生成算法以生成各个小区在一个跳波束周期内所有可能的波束等级组合,从而为后续的动态时隙分配提供先验知识。首先考虑2种特殊波束等级组合方案,即单一等级方案和单一波束方案。在
25、这2种方案中,各个小区在一个跳波束周期内均采用同一种波束等级(1L等级或3L等级),不存在多种波束等级并存的场景,此时,退化为传统的跳波束时隙分配问题或单波束场景。然后考虑更一般的情况,即部分小区选择2L等级波束,而部分小区选择1L等级波束。此时对波束等级组合方案的分析将变得复杂,因为尽管在一个138 通 信 学 报 第 44 卷 跳波束周期中各个小区只能选择一种等级的波束,但是小区对2L等级波束的选择可能在不同时隙上存在重叠,如图4所示。图 4 混合波束等级示意 从图4可知,从单个时隙来看,当17号小区选择2L等级波束时,其余小区均只可以选择1L等级波束。从整个跳波束周期来看,1214号小区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 稳态 MAB LEO 卫星 波束 分配 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。