![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于半监督学习的输电线路状态预测.pdf
《基于半监督学习的输电线路状态预测.pdf》由会员分享,可在线阅读,更多相关《基于半监督学习的输电线路状态预测.pdf(8页珍藏版)》请在咨信网上搜索。
1、电 力 系 统 及 其 自 动 化 学 报Proceedings of the CSU-EPSA第 35 卷 第 7 期2023 年 7 月Vol.35 No.7Jul.2023基于半监督学习的输电线路状态预测王艳芹1,徐宁1,董祯2,王勇2,张洪珊1(1.国网河北省电力有限公司经济技术研究院,石家庄 050000;2.国网河北省电力有限公司,石家庄 050000)摘要:输电线路状态评估及预测对于合理制定运维策略、提高运维水平具有重大意义。针对现有模型无法兼顾鲁棒性和数据需求量的问题,本文提出一种基于半监督学习的状态预测方法。首先,对拓展后的特征向量,利用正则矩阵填补缺失数据,并通过表征学习解
2、决稀疏编码问题。然后,借助少量标注样本初步确定线路区段在不同缺陷状态下的类别中心。最后,使用未标注样本对模型估计参数进行修正。算例分析表明,该方法与现有模型相比,识别准确率大幅提升且数据使用效率更高。关键词:输电线路;缺陷状态预测;缺失数据填补;表征学习;半监督学习中图分类号:TM75文献标志码:A文章编号:1003-8930(2023)07-0129-08DOI:10.19635/ki.csu-epsa.001135State Prediction of Transmission Lines Based on Semi-supervised LearningWANG Yanqin1,XU N
3、ing1,DONG Zhen2,WANG Yong2,ZHANG Hongshan1(1.Economic and Technological Research Institute,State Grid Hebei Electric Power Company,Shijiazhuang050000,China;2.State Grid Hebei Electric Power Company,Shijiazhuang 050000,China)Abstract:The state evaluation and prediction of transmission lines are of si
4、gnificance for the formulation of operationand maintenance strategies and the improvement of operation and maintenance levels.Aimed at the problem that the existing models cannot take both the robustness and data demand into account,a state prediction method based on semi-supervised learning is prop
5、osed in this paper.For the extended feature vectors,regular matrix is used to fill the missingdata,and the sparse coding problem is solved by means of embedding learning.A small number of labeled samples areused to preliminarily determine the class centers of line sections in different defect states
6、,and then the estimated parameters are modified using the unlabeled samples.The results of an example show that compared with the existing models,the proposed method has a much higher recognition accuracy and a higher data utilization efficiency.Key words:transmission line;defect state prediction;mi
7、ssing data filling;embedding learning;semi-supervisedlearning输电线路作为电力系统的主要组成部分,其运行状态对系统安全稳定性有着重要影响1-3。部分线路由于长期受环境因素影响,易出现绝缘状态下降等缺陷。尽管一般性缺陷初期不影响线路运行,但随着时间的积累,其严重程度可能不断增加而引发故障。因此,有必要对线路进行定期巡检和状态评估,及时解决安全隐患以避免事故发生。与单一设备不同,架空输电线路跨度广、状态参数分散,故其缺陷研究主要关注整体状态,同时评价结果往往也决定了检修策略的选择。目前,输电线路状态评估相关研究主要集中在评价指标的选择及评
8、价方法的建立上,而对线路缺陷相关因素分析及其预测方法的研究相对较少。文献4通过挖掘线路历史缺陷、故障情况和基础参量间的关联规则,利用主成分分析法获取关键参量;文献5构建输电线路状态量体系,并基于随机森林算法建立分类模型,同时优化了相关参数;文献6采用模糊综合评价方法评估输电线路状态,通过改进隶属度函数对评价指标的权重进行合理调整。此外,目前的研究大多忽略线路不同区段间的差异,外界环境和线路自身的不同往往会使缺陷状态出现变化7。为了提高输电线路运维水平,需综合多源历史数据,分析各区段缺陷状态与不同特征量之间的关系,进而实现状态预测8。差异化评价收稿日期:2022-08-09;修回日期:2022-
9、10-01网络出版时间:2022-10-25 10:36:20基金项目:国网河北省科技项目(5204JY20000K)王艳芹等:基于半监督学习的输电线路状态预测电 力 系 统 及 其 自 动 化 学 报130第 7 期和基于相关特征量的精确状态预测可以使运维人员重点关注缺陷较为严重的区段,合理制定运维策略,提高线路检修效率9-10。现有预测模型主要分为传统算法和深度学习算法两大类。传流算法更多地依赖人工经验,具有较强主观性,预测准确率存在较大差异。文献11基于关联规则置信度和支持度人为选择输入特征;文献12采用合成少数类过采样技术 SMOTE(Synthetic Minority Over-S
10、ampling)和决策树算法预测电力设备状态,其中的每个部件状态量需要人为选择;文献13利用自身部件和气象因素预测线路故障率,其中的不同指标隶属度函数及权重的确定需要大量专业知识。深度学习算法需要大量数据,文献14-15利用深层神经网络模型,通过检修记录、实验信息、运行参量等多源数据,自主学习预测规则,尽管减轻了算法设计上的负担,但模型对数据的需求量显著增加,难以推广。本文参考评价导则,利用输电线路多源数据分段构建历史缺陷状态库;在此基础上,充分考虑各种缺陷相关因素,构建拓展特征向量,并利用正则矩阵和表征学习 EL(embedding learning)分别解决部分数据缺失及稀疏编码等问题;针
11、对传统方法鲁棒性差、深度学习算法数据需求量大等问题,引入半监督学习 SSL(semi-supervised learning)技术,使用标注数据初步获取类别中心,再利用未标注样本对模型估计参数进行修正,有效缓解了模型过拟合现象;以某地区多条架空输电线路为例,验证了本文所提算法在准确率方面的优越性,且样本使用效率更高。1输电线路历史状态综合评价输电线路历史状态综合评估参考相关评价导则,数据来源包含历史故障和缺陷记录、巡检记录等,评估方式为对不同单元状态进行计分并综合。由输电线路运行特点及文献 14,16 的研究建立图1所示的全面评价体系,整体指标包含2级。其中,第1级为8大基本设备单元,即,基础
12、及防护设施、杆塔、金具、绝缘子、导地线、防雷及接地装置、附属设施、通道环境;第2级为针对各个基本单元的具体指标量。评分步骤如下。步骤1针对图1中的具体状态量,根据历史记录,判断各状态量的状态程度,进行相应缺陷扣分。步骤2由各状态量的扣分值和相应权重系数,计算不同设备单元的得分情况,即Mi=k=1piwikuik(1)式中:Mi为考虑全部pi个指标量后第i个设备单元得分,i=1,2,pi;wik、uik分别为第i个设备单元中的第k个指标量的权重系数和基本扣分。步骤3由各设备单元的得分情况,计算线路总体得分并判断线路区段整体所处的状态,即N=100-i=18iMi(2)式中:N为考虑8个设备单元后
13、的线路区段总体得分;i为第i个设备单元的权重系数。上述权重系数由层次分析法获得判断矩阵,即两两比较法分析不同设备的重要性。通过特征值分解、归一化和一致性检验最终得到权重向量为0.062,0.198,0.198,0.110,0.110,0.062,0.062,0.198。不同分值区间对应不同状态等级,其中,(0,75为严重状态;(75,85为异常状态;(85,95为注意状态;(95,100为正常状态。2输电线路状态预测特征集构建2.1基于多源数据的拓展特征向量输电线路缺陷状态分析需要同时考虑内部因素和外部环境。其中内部因素即线路自身特征,包括电压等级、导线情况、杆塔情况和投运年限等。图 1输电线
14、路评价体系Fig.1Assessment system for transmission lines基础及防护设施杆塔导地线绝缘子金具防雷及接地装置附属设施通道环境线路对下方各类杆线、树木及建筑的交跨距离,通道内建筑、树木情况杆号牌缺损情况,在线监测装置缺损情况,防鸟设施损坏情况,爬梯护栏缺损情况,附属通信设施缺损情况接地引下线断开基数,接地电阻不合格基数,接地引下线损伤直径,接地体埋深占设计值比重,防雷间隙不合格率,避雷器预防性试验不合格率形变情况,保护金具情况,接续金具情况,裂纹情况,地线绝缘子放电间隙偏差倾斜情况,复合绝缘子检测情况,瓷质盘悬式绝缘子检测情况,外观检查,清扫情况,污秽情况
15、腐蚀、断股、损伤和闪络等损伤情况,弧垂对地距离,覆冰舞动倾斜度,挠度,歪斜度,主材弯曲度,混凝土杆裂纹拉线基础埋深低于设计值的深度,拉线棒锈蚀直径减少的长度,杆塔基础上拔,基础护坡及防护设施损坏情况设备单元评价指标王艳芹等:基于半监督学习的输电线路状态预测131第 35 卷在不同特征下的线路缺陷情况存在明显差异,因此上述信息应当包含在状态评估模型中。外部环境则指能引起缺陷发生的外界因素,以气象特征和时空量特征为主,包括温度、湿度、风速、降雨量、季节、地形和区段等。引入上述外部特征能有效提升评估模型的精细化程度,实现输电线路的差异化运维。目前,关于线路状态评价的研究往往只考虑线路自身特征,而忽略
16、环境因素对线路的影响,因此本文构建引入外界环境特征的扩展特征向量,即x=s1,s8,e1,e6,t1,t4(3)式中:x为拓展后的特征向量;s1,s8分别为电压等级、导线分裂数、导线型号、杆塔呼高、全高、档距、杆塔型式和投运年限等线路自身特征;e1,e6分别为气象特征,包括温度、湿度、风速、降雨量、雷电等级和雾霾等级;t1,t4分别为季度信息、地形信息、海拔和特殊区段信息等时空量特征。上述特征量的主要来源包含线路台账信息、缺陷记录、空间信息系统 GIS(geographic informationsystem)和当地气象数据等。对于原始数据,其量化规则如下:由于自身特征和时空量特征在一段时间内
17、相对固定,可分别对不同特征进行分级编码;气象特征变化更加频繁,且由于缺陷的产生和发展往往会持续一段时间,需要综合考虑该时段内的气象特征,故原始气象数据为一系列高维时间序列。表1给出了一条缺陷记录中某时间段内的气象特征,其中,时间的分辨率为天,t为当前时刻。在有限样本条件下使用高维特征向量无法保证模型的准确率,相比于原始数据,气象特征所处的模式在输电线路状态评估中更为重要。因此,本文首先使用主成分分析对原始特征向量进行降维;然后使用K-means方法对数据进行分类;最后将分类后的模式信息作为模型输入。2.2基于正则矩阵的缺失数据填补由式(3)所述的拓展后输电线路特征向量xRn,R为实数,n为特征
18、向量维度,需要做进一步处理。在实际应用场景下,部分特征缺失难以避免,因此本文采用基于正则矩阵的补全策略17。对于特征向量构成的原始矩阵,利用低秩分解获取近似矩阵作为填充值,该方法的核心思想为通过优化迭代目标函数,获取最佳近似矩阵作为后续模型的输入,即XUV=X(4)J=i=1mj=1nXij-UTiVj+2()U22+V22(5)式中:X=xT1,xTi,xTmT为原始特征矩阵;xi为第i条案例对应的拓展特征向量,i=1,2,m,m为案例总数;U、V分别为分解得到的低秩矩阵;Ui为U矩阵的第i列;Vj为V矩阵的第j列;X为近似矩阵;J为优化目标函数;Xij为原始特征矩阵中已知的特征量;为正则项
19、系数。对于原始特征矩阵中的缺失量,使用X对应位置的元素代替,并将填补后的拓展特征向量写作x。2.3基于 EL 的特征映射拓展特征向量的本质为高维离散随机向量,其中,各维度分别代表不同特征量所处的类别。在有限样本的条件下,直接使用第2.2节所述的稀疏编码方式无法保证运算效率和预测精度,因此本文引入 EL18。EL 的核心思想是利用多层感知机 MLP(multilayer perceptron)将原始高维离散向量转化为低维连续特征,即vl+1=f(Wlvl+bl)(6)式中:vl为第l层特征向量;f为激活函数;bl、Wl分别为第l层的偏置向量和权重矩阵。对于输电线路状态预测问题,模型底层输入为填补
20、后的拓展特征向量,即v0=x R18,经过层数为L的MLP模型,最终输出特征vLR6。3半监督条件下的输电线路状态预测输电线路状态预测的核心思想是根据历史数据,挖掘线路缺陷的发展模式,进而预测未来时刻的线路状态。其本质为聚类问题,即将不同模式下的历史数据划分为不同类别,而同一模式下的线路在未来时刻往往状态相同。聚类的基础是相似度计算,相比于分别计算不同样本与当前样本相似度的方法,它首先获取类别中心,再计算不同类别中心与当前样本的相似度,其更为合理高效。在实际应用场景中,数据标注耗时耗力,且往往需要专业人员的指导和帮助。因此,本文研究的关键问题之一即为表 1缺陷记录中的原始气象数据Tab.1Or
21、iginal meteorological data in defect records特征温度/相对湿度/%风速等级降雨量/mm雷电等级雾霾等级时间/dt-428.486.2389.3123t-327.660.3323.401t-225.465.3134.502t-126.482.3282.411t22.372.6429.102电 力 系 统 及 其 自 动 化 学 报132第 7 期如何合理使用未标注数据提升模型预测准确率,即SSL19。本文提出的算法核心思想为首先利用标注数据确定初步的聚类中心,然后根据聚类中心判断未标注数据对应的类别,即,设所有训练样本数量为N,其中的有标注的样本数量为
22、Ns,未标注的样本数量为Nq。样本点集合包含已标注点(vs,m,ym),m1,Ns;未 标 注 点vq,n,nNs+1,N;ym1,2,3,4为该区段整体状态,分别为正常、注意、异常、严重共计4类。根据有标注数据,可以确定不同区段整体状态对应的类别中心,即ck=1|Skmm:ym=kvs,m(7)式中:ck为区段整体状态类别k对应的聚类中心;Sk为已标注样本的类别k的集合;|Sk为集合大小。计算获得4个类别中心分别为c1、c2、c3、c4,(vs,m,ym)为已标注点集合。利用类别中心对未标注点进行分类,即zn=argmaxkP()zn=k|vq,n(8)P()zn=k|vq,n=exp()-
23、d(vq,n,ck)k=14exp()-d(vq,n,ck)(9)d(vq,n,ck)=vq,n-ck2(10)式中:zn为根据有标注样本获得的预测结果;P为条件概率;zn为未标注样本vq,n对应的区段整体状态;d为欧氏距离。至此,由未标注数据的区段整体状态预测结果,可以对聚类中心进行调整,从而克服小样本条件下类别中心估计结果可靠性较低的问题。考虑到使用的是未标注数据的预测标签,引入置信度参数,则修正后的类别中心ck可表示为ck=ck+(1-)1|Sknn:zn=kvq,n(11)式中:Sk为未标注样本的预测类别k的集合;|Sk为集合大小。置信度可由交叉验证确定,本文中取值为0.15。至此SS
24、L完成,对于新的样本vx,其类别的判断方式可表示为P()hx=k|vx=exp()-d(vx,ck)k=14exp()-d(vx,ck)(12)式中:P()hx=k|vx为区段整体状态属于类别k的概率;hx为样本vx对应的区段整体状态。模型训练时采用交叉熵函数,图2给出了SSL类别中心估计可视化结果,其中,可视化方式采用主成分分析,图中横坐标PC1表示第一主成分,纵(a)正常PC11.00.1 0.21.00.80.60.40.2PC20.3 0.40.500.6 0.7 0.8 0.9(b)注意PC11.00.1 0.21.00.80.60.40.2PC20.3 0.40.500.6 0.7
25、 0.8 0.9(c)异常PC11.00.1 0.21.00.80.60.40.2PC20.3 0.40.500.6 0.7 0.8 0.9(d)严重PC11.00.1 0.21.00.80.60.40.2PC20.3 0.40.500.6 0.7 0.8 0.9(e)未标注PC11.00.1 0.21.00.80.60.40.2PC20.3 0.40.500.6 0.7 0.8 0.9(f)类别中心估计PC11.00.1 0.21.00.80.60.40.2PC20.3 0.40.500.6 0.7 0.8 0.9有监督半监督图 2SSL 中类别中心估计可视化结果Fig.2Visualiza
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 监督 学习 输电 线路 状态 预测
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。