具有反馈控制的多自主体系统迭代学习输出一致性.pdf
《具有反馈控制的多自主体系统迭代学习输出一致性.pdf》由会员分享,可在线阅读,更多相关《具有反馈控制的多自主体系统迭代学习输出一致性.pdf(6页珍藏版)》请在咨信网上搜索。
1、2023 08 10计算机应用,Journal of Computer Applications2023,43(8):2630-2635ISSN 10019081CODEN JYIIDUhttp:/具有反馈控制的多自主体系统迭代学习输出一致性王嘉欣,刘成林*(轻工过程先进控制教育部重点实验室(江南大学),江苏 无锡 214122)(通信作者电子邮箱)摘要:为改进多自主体系统的学习过程并提高系统对外部干扰的鲁棒性,提出一种具有反馈控制的迭代学习一致性控制算法。首先,自主体之间通过共享控制输入信息以改进其学习过程,并且当系统外部存在非迭代重复干扰时,通过设计反馈控制器以提高系统的鲁棒性;然后,使用
2、压缩映射的方法对系统一致性进行分析,并严格推导出算法的收敛条件;最后,通过仿真实验验证了算法的正确性和有效性,改进后的算法与P型算法相比有更高的收敛速度,且在存在外部干扰时有更平滑的收敛曲线。关键词:迭代学习;多自主体系统;输出一致性;反馈控制;加权平均值中图分类号:TP273 文献标志码:AIterative learning output consensus of multi-agent systems with feedback controlWANG Jiaxin,LIU Chenglin*(Key Laboratory of Advanced Process Control for
3、Light Industry,Ministry of Education(Jiangnan University),Wuxi Jiangsu 214122,China)Abstract:To improve the learning process of multi-agent system and the robustness of the system to external disturbances,an iterative learning consensus control algorithm with feedback control was proposed.Firstly,th
4、e learning process of agents was improved by sharing the control input information among agents,and the robustness of the system was improved by designing a feedback controller when there were non-iterative repetitive disturbances outside the system.Then,by using the contraction mapping method,the s
5、ystem consensus was analyzed,and the convergence condition of the algorithm was derived strictly.Finally,the correctness and effectiveness of the algorithm was verified through simulations.Compared with the P-type algorithm,the improved algorithm has higher convergence speed and smoother convergence
6、 curve in the presence of external disturbances.Key words:iterative learning;multi-agent system;output consensus;feedback control;weighted average value0 引言 近年来,多自主体系统的协同控制得到了国内外的广泛关注与研究1-3,并在多机器人系统协调控制4、无人机编队控制5、交通控制6等工程领域得到了广泛应用。一致性问题是多自主体系统协同控制研究中的一个基本问题7-9,是指使用自主体之间的交互信息设计合适的一致性控制算法,最终使自主体的状态信息或
7、输出信息达到一致。在实际工程应用中,存在一类执行重复任务的多自主体系统,例如工厂执行重复任务的多机械臂、卫星编队10。为实现具有重复运动性质的多自主体系统在整个作业区间上对期望轨迹的完全跟踪,迭代学习控制11-12被引用到多自主体系统的一致性跟踪问题中。文献 13 中提出一种分布式迭代控制律,解决了有限时间内多自主体系统的输出饱和一致性问题,并由固定拓扑结构拓展到切换拓扑结构。当系统模型未知且存在输出饱和时,文献 14 中使用迭代域线性化技术建立基于数据的系统模型,提出了分布式数据驱动控制算法使系统达到一致性。在文献 14 的基础上,文献 15 中优化了迭代学习算法,实现了多自主体系统的点对点
8、一致性跟踪控制。文献 16 中考虑了多自主体系统中的时延问题,并提出分布式P型迭代算法,使两个自主体之间的一致性误差可以在L2范数意义下收敛到零。对于非线性分数阶多自主体系统,文献 17 中研究了具有遗忘因子和初态学习的D算法,通过压缩映射的方法得到系统收敛的充分条件,使所有自主体达到输出一致性。文献 18 中通过为每个自主体设计自适应迭代学习算法,解决了未知增益符号下多自主体系统的一致性问题。在上述研究中,分布式迭代学习算法具有相同的结构,即每个自主体有单独的学习行为,根据系统的一致性误差修正控制输入,但没有控制输入信息的分享交流。由于控制输入包含了一致性误差信息,所以控制输入信息之间的交流
9、可以使系统有更高的收敛速度,进而使系统达到预定误差范围所需的迭代次数更少。文献 19 中提出一种基于控制输入共享的迭代学习算法,该算法由自主体的前一次控制输入及其邻居自主体前一次控制输入的加权平均值组成,但主要考察连续多自主体系统。针对离散多自主体系统,首先,本文在文献 19 的基础上提出了P型迭代算法;其次,对于非迭代重复出现的扰动,使用反馈控制器20-21来抑制扰动对系统动态性能的影响。因此,本文考虑使用自主体加权平均控制输入和误差反馈组成文章编号:1001-9081(2023)08-2630-06DOI:10.11772/j.issn.1001-9081.2022070976收稿日期:2
10、0220706;修回日期:20221121;录用日期:20221130。基金项目:国家自然科学基金资助项目(61973139)。作者简介:王嘉欣(1996),男,山西临汾人,硕士研究生,主要研究方向:多自主体系统迭代学习控制;刘成林(1981),男,江苏宿迁人,教授,博士,主要研究方向:多自主体系统协调控制、非线性控制。第 8 期王嘉欣等:具有反馈控制的多自主体系统迭代学习输出一致性的迭代学习算法,改进自主体的学习过程,提高系统的鲁棒性。随后通过使用压缩映射的方法,得出系统的收敛条件,最后通过仿真验证算法的有效性。1 预备知识 首先,介绍本文中相关数学符号。R、N和RN N分别表示实数集、自然
11、数集和N N维矩阵。AT表示矩阵的转置矩阵,IN是N维单位矩阵。此外,矩阵的范数表示为,表示矩阵的Kronecker积,对角矩阵表示为diag。其次,介绍图论的相关概念。N个多自主体之间的拓扑信息用有向图G=V,E,A来表示,其中,V=(1,2,N)表示多自主体点集,E VV表示边集,A=aij RN N是G的邻接矩阵,矩阵A中的元素aii=0且aij 0。节点i的邻居节点的集合表示为Ni=j V:(i,j)E,i j。eij E表示节点i可以获得节点j的信息。如果eij E,则aij 0,否则aij=0。定 义 有 向 图G的 拉 普 拉 斯 矩 阵 为L=D-A=lij RN N,其中,度
12、矩阵表示为D=diag d1,d2,dN,di=j=1Naij表示节点i的输入度。对于有向图G中的任意两个节点,至少存在一条连通路径,则图G为强连通图。考虑领导跟随多自主体系统,领导者用节点0表示,带有领导者的有向图-G表示为-G=0 G。领导者与跟随者i之间的邻接关系表示为S=diags1,s2,sN,如果自主体i可以获得领导者的信息,si 0,否则si=0。2 问题描述 考察由N个跟随者和一个虚拟领导者组成的多自主体系统,其中第i个跟随者的系统模型为:xi(t+1,k)=Axi(t,k)+Bui(t,k)yi(t,k)=Cxi(t,k)(1)其中:xi(t,k)Rp,ui(t,k)Rr和y
13、i(t,k)Rm分别表示第i个自主体的状态信息、控制输入和系统输出;A、B和C为适维系数矩阵;t表示时间,t 0,T;k表示迭代次数;i=1,2,N。领导者的输出轨迹yd(t)由以下模型产生:xd(t+1)=Axd(t)+Bud(t)yd(t)=Cxd(t)(2)其中:xd(t)Rp、ud(t)Rr和yd(t)Rm为相应的期望状态、期望输入和期望输出。在本文所研究的多自主体系统中,只有部分跟随者可以获得领导者的信息。当跟随者i可以接收领导者的信息时,取si=1。定义跟随者i的跟踪误差:ei(t,k)=yd(t)-yi(t,k)(3)eij(t,k)=yj(t,k)-yi(t,k)(4)其中:e
14、i(t,k)表示跟随者i的输出误差;eij(t,k)表示跟随者i和其邻居j之间的输出误差。由式(3)、(4)和可得:eij(t,k)=ei(t,k)-ej(t,k)(5)对于多自主体系统(1),在只有部分自主体可以获得领导者信息的前提下,要求设计合适的控制输入ui(t,k)使得每个自主体的输出都能够跟踪上期望轨迹yd(t),即limk ei(t,k)=0;t 0,T(6)在设计迭代控制算法之前,先给出两个假设条件。假设1 由虚拟领导者0和N个跟随者组成的有向图-G=0 G 包含一个生成树,并且生成树的根是领导者。注1 假设1保证了领导者到任意跟随者都有一条路径,并且领导者的信息能够间接被每个跟
15、随者获得。假设2 在系统的每次迭代中,假设每个自主体都有相同 的 初 始 化 条 件,即xi(0,k)=xd(0),i=1,2,N,其 中xi(0,k)表示自主体i的初始状态,xd(0)是领导者的初始状态。定义122 存在向量函数q(t),其范数定义如下:q(t)=supt 0,T e-tq(t)其中 0。3 迭代学习算法和收敛性分析 本章给出多自主体系统的迭代学习控制算法,并对该算法的收敛性进行分析。3.1迭代学习算法本文设计的基于迭代学习的一致性控制算法由3个部分组成:一致性跟踪误差项、控制输入的加权平均项和反馈修正项。本文算法的控制框图如图1所示。第1部分是一致性跟踪误差项。对于自主体i
16、,在第k次迭代时,定义一致性跟踪误差i(t,k)为:i(t,k)=j Niaijeij(t,k)+siei(t,k)=j Niaij(ei(t,k)-ej(t,k)+siei(t,k)(7)其中:aij是有向图-G中邻接矩阵的元素;Ni表示自主体i的邻居节点的集合。在典型的迭代学习算法中,使用一致性误差项i(t,k)乘以适当的学习增益作为校正项。第2个部分是控制输入的加权平均项,由跟随者和它邻居自主体控制输入的加权平均值构成。共享自主体控制输入让自主体能更快地接近理想的控制目标。此外,加权平均项和一致性误差项共同组成学习算法的前馈部分ufi(t,k+1),表示如下:ufi(t,k+1)=j N
17、iaijufj(t,k)+diufi(t,k)j Niaij+di+1i(t+1,k)(8)其中:di是度矩阵D中的元素;1表示系统的学习增益。第3个部分是控制输入的反馈修正项。对于部分能直接获取领导者信息的自主体,通过设计其误差信息的反馈校正项,提高系统的鲁棒性,使系统有更好的瞬态响应。基于跟踪图1本文算法的控制框图Fig.1Control block diagram of the proposed algorithm2631第 43 卷计算机应用误差的反馈环节表示为:ubi(t,k+1)=2(yd(t)-yi(t,k+1)=2ei(t,k+1)(9)其中:2表示系统的反馈增益,对于不能直接
18、获得领导者信息的跟随者,设2=0。综合式(7)(9),迭代学习一致性控制算法为:ui(t,k+1)=ubi(t,k+1)+ufi(t,k+1)=2ei(t,k+1)+j Niaijufj(t,k)+diufi(t,k)j Niaij+di+1i(t+1,k)(10)3.2收敛性分析定理1 对于多自主体系统(1),系统的拓扑结构满足假设1,每次迭代过程的初始条件满足假设2,且迭代学习控制算法由式(10)给出。那么,若不等式(11)成立,则随着迭代次数k的增加,所有自主体的跟踪误差收敛到0。=A+D2D Im-(L+S)1CB 1(11)证明 将ui(t,k),ei(t,k)和自主体的一致性误差i
19、(t,k)写成以下向量形式:u(t,k)=u1(t,k)T,u2(t,k)T,uN(t,k)TTe(t,k)=e1(t,k)T,e2(t,k)T,eN(t,k)TT(t,k)=1(t,k)T,2(t,k)T,N(t,k)TT(12)式(7)可以写为:(t,k)=(L+S)Im)e(t,k)(13)其中:S=diags1,s2,sN;L是有向图-G的拉普拉斯矩阵。同理,迭代学习算法(10)可以表示为:u(t,k+1)=ub(t,k+1)+uf(t,k+1)=(In 2)e(t,k+1)+(A+D2D Im)uf(t,k)+(In 1)(t+1,k)=(In 2)e(t,k+1)+(A+D2D I
20、m)uf(t,k)+(L+S)1)e(t+1,k)(14)为了方便证明,参考文献 23,定义ui(t,k)=ud(t)-ui(t,k),ufi(t,k)=ud(t)-ufi(t,k),xi(t,k)=xd(t)-xi(t,k),且由式(1)(2)可得:xi(t+1,k)=Axi(t,k)+Bui(t,k)(15)ei(t,k)=yd(t)-yi(t,k)=Cxi(t,k)(16)定义以下3个向量:u(t,k)=u1(t,k)T,u2(t,k)T,uN(t,k)TTuf(t,k)=uf1(t,k)T,uf2(t,k)T,ufN(t,k)TTx(t,k)=x1(t,k)T,x2(t,k)T,xN(
21、t,k)TT(17)式(15)和式(16)写成向量形式如下:x(t+1,k)=(In A)x(t,k)+(In B)u(t,k)(18)e(t,k)=(In C)x(t,k)(19)由式(15)和式(9)推导可得:xi(t+1,k)=Axi(t,k)+Bui(t,k)=Axi(t,k)+B(ud(t)-ui(t,k)=Axi(t,k)+B(ud(t)-ubi(t,k)-ufi(t,k)=Axi(t,k)+B(ufi(t,k)-ubi(t,k)=Axi(t,k)+Bufi(t,k)-B2ei(t,k)(20)将式(20)写为向量形式,并把式(19)代入,可得x(t+1,k)=(In A)x(t,
22、k)+(In B)uf(t,k)-(In B2)e(t,k)=(In A)x(t,k)+(In B)uf(t,k)-(In B2C)x(t,k)=()In(A-B2C)x(t,k)+(In B)uf(t,k)(21)由式(14)、(19)和(21)可以推出:uf(t,k+1)=ud(t)-uf(t,k+1)=ud(t)-(A+D2D Im)uf(t,k)-(L+S)1)e(t+1,k)=(A+D2D Im)uf(t,k)+(L2D Im)ud(t)-(L+S)1)e(t+1,k)=(A+D2D Im)uf(t,k)-(L+S)1C)x(t+1,k)=(A+D2D Im)uf(t,k)-(L+S
23、)1CB)uf(t,k)-(L+S)1C)(In(A-B2C)x(t,k)=(A+D2D Im-(L+S)1CB)uf(t,k)-(L+S)1C)(In(A-B2C)x(t,k)(22)为了方便证明,记=A+D2D Im-(L+S)1CB1=(L+S)1C2=In(A-B2C)(23)对式(22)两端同时取范数,可得uf(t,k+1)uf(t,k)+12x(t,k)(24)根据式(21)推出:x(t,k)=(In(A-B2C)x(t-1,k)+(In B)uf(t-1,k)=(In(A-B2C)tx(0,k)+l=0t-1(In(A-B2C)t-l-1(In B)uf(l,k)(25)对式(2
24、5)两边取范数,并且代入式(24)可得uf(t,k+1)uf(t,k)+12(t2x(0,k)+)l=0t-1t-l-12buf(l,k)(26)其中b=In B。然后,在式(26)两边同乘e-t,取范数可得:uf(t,k+1)uf(t,k)+12(t2x(0,k)+)supt 0,Te-tl=0t-1t-l-12beluf(t,k)=(+1b(e-tt2-11-e-12)uf(t,k)+1t+12x(0,k)=uf(t,k)+(27)其中:=+1b(e-tt2-11-e-12),=1t+12x(0,k)。因为系统的迭代初始条件相同,则=0。由定义1可知,可以取2632第 8 期王嘉欣等:具有
25、反馈控制的多自主体系统迭代学习输出一致性任意大于零的值,故选取足够大的使1b(e-tt2-11-e-12)无限趋近于0。如果满足条件(11),即 1,则可使 1。那么,当迭代次数趋于无穷大时,uf(t,k+1)可以收敛到0。与以上证明相似,对式(19)两边同时取范数,可得e(t,k)=cx(t,k)=c(t2x(0,k)+l=0t-1t-l-12buf(l,k)(28)其中c=In C。对式(28)两边同时乘e-t,可得e(t,k)ct2x(0,k)+cb-12(e-tt2-11-e-12)uf(t,k)(29)由 以 上 推 导 可 知,当 迭 代 次 数 趋 于 无 穷 大 时,uf(t,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 具有 反馈 控制 主体 系统 学习 输出 一致性
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。