智能电网环境下窃电行为检测_张芸.pdf
《智能电网环境下窃电行为检测_张芸.pdf》由会员分享,可在线阅读,更多相关《智能电网环境下窃电行为检测_张芸.pdf(6页珍藏版)》请在咨信网上搜索。
1、计算机与现代化JISUANJI YU XIANDAIHUA2023年第3期总第331期文章编号:1006-2475(2023)03-0060-06收稿日期:2021-09-27;修回日期:2021-12-05基金项目:国家自然科学基金面上项目(61772246)作者简介:张芸(1983),女,陕西西安人,高级工程师,硕士,研究方向:计算机技术,E-mail:;白开峰(1979),男,山西运城人,高级工程师,硕士,研究方向:电子信息,E-mail:;王星(1978),男,四川遂宁人,高级工程师,硕士,研究方向:信息系统工程,E-mail:;仓甜(1983),女,陕西西安人,高级工程师,硕士,研究
2、方向:网络安全,E-mail:;周通(1987),男,陕西西安人,工程师,本科,研究方向:计算机科学,E-mail:;段锦文(1978),女,陕西长安人,高级工程师,本科,研究方向:通信工程,E-mail:;苏晗(1990),女,陕西宝鸡人,工程师,硕士,研究方向:软件工程,E-mail:。0引言伴随着经济模式的演化以及技术产业的升级,近年来国内外各类窃电情况频发,并且严重侵犯了用电用户财产、危害到供电系统运行以及人身安全。因此,通过各类有效的技术模型对用电行为进行用电异常可能性的监测判断,对治理各类用电异常事件,维护国家电网运行安全具有重要意义。在电力损耗研究领域中,损耗被分为非技术性损耗(
3、Non-Technical Losses,NTL)以及技术性损耗(Technical Losses,TL)。通过非法篡改线路等方式引发的电力能源损耗是本文重点描述的各类检测算法的应用场景。据不完全统计,我国每年存在15万起左右窃电事件并造成超过200亿元人民币的经济损失1。而愈发隐蔽和复杂化的恶意窃电方式给防范和监测工作带来巨大挑战2。无独有偶,国外的各类窃电事件所造成的经济损失也金额庞大。比如美国每年的窃电事件造成经济损失40亿美金3。而在巴基斯坦,恶意窃电甚至使整个国家陷入电力供应短缺的困境4。这类恶意的异常用电行为不仅给电网公司和国家带来了巨大的经济损失,且对电网运行安全造成了极大的隐患
4、,如电网施工事故、局部区域的供电瘫痪、电气设备设施的异常损坏、电气火灾5等。由于窃电事件常发生于人口居住密集的城中村、城乡结合等区域,所以可能引发的一系列连锁反应将造成重大的安全性和经济性事件。得益于智能化电力设备的推广和应用,针对异常用电行为的监测手段已由人工抽检的方式逐渐过渡到基于数据挖掘的离群点检测、机器学习、深度学习以及混合模式。智能电网环境下窃电行为检测张芸,白开峰,王星,仓甜,周通,段锦文,苏晗(国网陕西省电力公司西安供电公司,陕西 西安 712042)摘要:用户恶意窃电造成的用电侧非技术性损失一直是全球各国电力公司期望解决的问题之一。随着人工智能算法的快速发展和智能电表的普及,通
5、过对窃电行为建模和检测将有效减少这类情况的发生。本文首先介绍用电行为数据收集、处理、采样手段。其次,就面向用电异常行为挖掘的离群点检测、机器学习方法和深度学习方法,分析对比各类算法的特点,对已有工作进行总结。最后,通过讨论智能化手段在窃电检测研究中出现的问题和未来研究工作为该领域的研究人员提供一些借鉴。关键词:智能化电网;窃电行为检测;机器学习;深度学习中图分类号:TP311文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.03.011Review of Electricity Theft Detection in Smart Grid EnvironmentZ
6、HANG Yun,BAI Kai-feng,WANG Xing,CANG Tian,ZHOU Tong,DUAN Jin-wen,SU Han(State Grid Xi an Electric Power Supply Company,Xi an 712042,China)Abstract:The non-technical loss(NTL)on the power consumption side caused by malicious power theft by users has alwaysbeen one of the problems that power companies
7、 around the world expect to solve.With the rapid development of artificial intelligence algorithms and the popularization of smart meters,modeling and detection of electricity theft will effectively reduce the occurrence of such situations.Firstly,this article introduces the methods of collecting,pr
8、ocessing,and sampling electricity consumption behavior data.Secondly,it analyzes and compares the characteristics of various algorithms and summarizes existingwork on outlier detection,machine learning methods,and deep learning methods for mining abnormal electricity behavior.Finally,by discussing t
9、he problems of intelligent methods in the research of electricity theft detection and future research works,itprovides some reference for researchers in this field.Key words:smart grid;electricity theft detection;machine learning;deep learning2023年第3期本文主要就用电行为数据特征和预处理手段以及窃电行为建模检测方法3个方面展开详细描述,并在文章的最后
10、简述该项工作未来的发展方向。1用电数据采样及处理手段经过多年的应用和发展,信息采集系统作为保障我国电网公司运行安全的关键系统,它由电网智能调度管理系统、电网营销系统、故障信息管理系统、电网通信管理系统、智能电表系统、电网运维管理系统6-7组成,主要涉及电流电压监控数据、系统日志数据、用户数据、电力设备数据等。鉴于电网的巨大规模、持续化长期运营、繁杂环节、复杂运行条件等因素,由此产生了海量的电力运行数据。因此,通过充分学习数据特征,并采用机器学习和深度学习方法对历史数据和实时数据的分析和挖掘,实现监测预防用户窃电成为可能。1.1数据特征及采集经过大量的调研,本文将目前的电力运行数据分为3类:电网
11、运行日志数据、营销系统数据以及企业管理数据。以上数据的特征可概括为以下4点:1)数据规模庞大。由于目前自动化采集和计量设备在电力管理领域的应用以及电网的实时运行,可以说每一秒产生的电力数据量都是巨大的。2)数据分散。由于我国电网公司各部门各层级之间分工明确,但是涉及多平台、多部门、多层级、多系统。因此数据的先期收集并不容易,需要跨部门跨系统的通力合作和一致协调。这对解决用电异常行为检测提出了更高的要求。3)用电异常数据密度低。目前电网运行总体平稳、正常,因此要在大规模的异常数据中筛选出有效的用电异常数据显得尤为困难。4)数据形式、情况多样。由于用电异常行为检测研究过程中所需数据来源于多系统、多
12、部门、多环节和多设备,因此数据形式不仅多样,而且存在缺失、重复、错误的数据问题。在我国,针对窃电行为的检测研究工作主要是由国家电网公司以及各省市公司联合各高校和科研院所合作展开的,从电力、电气工程以及计算机科学的角度入手进行针对性的区域用电异常行为研究。因此,研究所涉数据集主要来源于国家电网公司(SGCC)。在国际上,如印度、美国、加拿大等国家,由于研究中所需的电力运行和营销数据涉及国家安全和个人隐私问题,获取这些数据并不容易。因此,研究人员会使用公开的数据集,比如获得广泛应用的来自爱尔兰电力和可持续能源管理局于2012年1月发布的能源消费数据8,它包含了2009年和2010年超过5000家的
13、爱尔兰本地家庭用户和小型商业用户所安装的来自于智能电表536天的用电消费信息,其数据采集周期是30 min一个点位。众所周知,深度学习模型的训练工作大多依赖于足够的训练数据集,因此在实际数据有限的情况下,研究者们也会通过一些有效的手段获得更多的模拟数据。Kong等人 9 便采用了通过将一维Wasserstein生成对抗网络得到的模拟数据应用于低电压用电异常行为检测的工作中。文献 10 基于筛选后数据也模拟了短时间跨度用户用电记录并用于后续的模型训练和测试。1.2数据处理及采样无论是公开数据集还是源于电网公司的用户实际用电消费原始数据,都存在相当一部分数量的“脏数据”,即数据缺失、数据错误、数据
14、为空或是数据不平衡。数据缺失、错误问题会出现在数据清洗前后。一般可通过设置筛选规则,实现数据的检验工作。然而完成数据清洗之后,该情况可能依然存在,包括空值数据。因此,为了使得预测方法或模型更好地实现对用户用电行为数据的特征表示,常需要分析比较采用线性插值、拉格朗日插值、最邻近插值等数据补全方法的结果,并根据实际情况确定适合的数据补全方案。对于零值数据,需要研究人员根据实际情况,决定数据采纳、数据模拟或是不处理等方式,最大程度降低对建模或是特征学习过程中的影响。此外,数据集不平衡即正负样本比例失调导致的数据倾斜问题也会对建模过程中的特征学习造成影响。因此,在采样过程中,会考虑采用欠采样和过采样的
15、方式使数据及内部达到相对平衡11-13。2类方法均有优缺点,欠采样简单,但易丢失关键信息,而过采样处理易引发过拟合问题。所以,在实际应用场景中,需要综合考量真实数据情况,并制定适合的采样方案和机制。文献 14 设计了一种基于K-means算法 改 进 的 K-SMOTE(Synthetic Minority Oversampling Technique)方法,实现对用电异常数据的插值,以达到平衡整个数据集的目的。2窃电行为检测算法目前,常见的窃电行为检测算法主要是基于人工抽检和基于数据挖掘的方法。人工抽检方法是在小范围数据内,通过熟悉片区用电情况的专业人员或简单的数据判读方式,检出疑似窃电用户
16、,并派遣网格协查员实地考察验证,所耗人力、财力成本高,已不太适用于智能化电网的发展需求。基于数据挖掘的检测算法主要涉及基于离群点检测算法、传统的机器学习、深度学习、混合模型。本章将重点就这部分的内容进行详细介绍。2.1基于离群点检测的窃电行为检测方法离群点检测在数据挖掘领域扮演着重要的角色,如图1所示的局部离群因子表示,其核心思想是从所有被检对象中寻找与绝大多数对象显著不同的若干个体。由于其相对稳定的表现,发展至今,技术成熟,并且在各工作领域得到广泛推广,应用包括网络安全、体育竞技、金融风险评估等工作。目前,应用程度较高的方法可大致归为4类:统计方法检测、临近度检测、密度检测和聚类检测。张芸,
17、等:智能电网环境下窃电行为检测61计算机与现代化2023年第3期图1局部离群因子表示基于统计模型的能源盗窃行为检测方法主要通过对数据集可能遵循的统计规则进行假设验证,并建立对应的模型,通过寻找与模型拟合程度低的个体筛选出异常点。文献 15 在引入了分类变量和检测系数后,设计了基于线性回归的算法实现对能源盗窃的评估。通过该模型可检测到被恶意篡改的智能电表。此类方法存在异常点的显著不同,当出现用电异常行为事实存在,但历史数据未覆盖情况下或是显著性不明显时,该方法易失效。基于矩阵分解的检测方法是根据线性代数理论建立的基于用电异常行为的数据分解手段。文献16 中采用分布式QR求解用电用户诚信系数,用1
18、表示用户诚实,系数大于1则标记为可疑。上述方法一般适用于对小规模用电数据中的可疑用电异常对象的筛查,无法满足电力大数据背景下的工作需求,并且这类方法一般需要涉及部分用户隐私,不符合数据安全和个人隐私信息保护的新要求。基于密度和基于聚类的离群点检测方法也常被应用于电能盗窃巡检工作中。前者主要通过计算被检对象的局部密度并与其临近点做比较分析,检出异常点,包括使用局部离群因子(LOF)等方法,其在不同密度区域的用电数据检测中表现良好。后者则通过K-means、临近传播算法等距离表示被检对象间的相似度实现对整体数据的簇分类,从而寻找到用电异常用户,受数据集内分布影响较大。因此,Zheng等人17将两者
19、结合提出了一种基于密度聚类的窃电行为检测方法,在分别与K-means聚类、高斯混合模型以及基于密度的带噪声应用空间聚类(DBSCAN)比较后,验证了其有效性。综合熵和密度聚类的窃电检测方法如图2所示,主要通过获取用户用电曲线集合和非技术性损失数据、电量相关性强弱的衡量指标和每条用电曲线的形状异常指标,并通过K-均值聚类划分用电曲线类别,得到用户的电量异常排名和形状异常排名,并根据其算术平均值得到综合异常排名,进而完成对用电异常模式的检测,提高了各种窃电模式下检测的准确率,实现了用电异常行为的非监督式检测,增大适用范围。图2综合熵和密度聚类的窃电检测方法流程图由于上述方法属于无监督学习,其优点在
20、于不需要带标签数据集即可展开工作,可被应用于前期的数据分析工作中,而缺点是对参数依赖程度高,制定合适的参数方案将直接影响模型预测的效果。此外,基于离群点的窃电行为的鲁棒性较差,当数据发生变化时,已训练获得的模型无法复用,需要重新选取参数和模型训练。2.2基于机器学习的窃电行为检测方法基于传统的机器学习方法已被验证在窃电行为检测工作中具有良好的效果,其普遍的异常分类流程如图3所示。图3异常分类流程文献6主要针对短期用电异常(Short-termFraud Detection,SF),基于机器学习的方法,提出了一套SF-SVM方法,通过计算区域电网耗电量与用户侧电表耗电量差值,判断用户的用电异常可
21、疑程度。实验表明,该方法在低误警率情况下效果良好。随着检测技术地日益进步,为了精确地检测、定位和掌握输配电各环节的实时情况,最大程度降低误报率,Jindal等人18通过混合使用决策树和支持向量机的方式实现了对用户侧能耗消费数据的分级处理和分析。文献 19 首先根据包括平均耗电量等5项属性通过C均值模糊聚类锁定相似用电行为用户群体,并计算欧几里得距离筛选出疑似窃电用户。该方法虽然实验效果良好,但是该方法依赖于长期的历史用电数据,在检测上存在延迟。针对上述问题,康宁宁等人20通过对用户耗电特性曲线做模糊C均值聚类圈定可以范围,并使用经过粒子群算法优化的支持向量机算法进行用电异常判断。从一定程度上也
22、克服了样本匮乏的问题。梁跃21则通过分层最近邻采样算法,依据比例和距离采样,提升了在不平衡数据集分类的准确率;对数据集进行了预处理及特征提取和评估,删除重复时间序列信息,突出特征间的高阶关系性关系,提升分类结果的准确性。Qu等人14根据获取的原始数据情况对采样过程A获取用电曲线以及区域观察表M天数据计算区域的非技术性损失与所有用电曲线之间的最大信息系数使用基于快速搜索密度峰值的聚类方法计算各曲线的形状异常指标计算2个异常排名的算数平均值,计算综合异常排名使用K-均值聚类将每个用户对应的M个电量和M个形状异常指标,给出异常排名基于有序森林筛选高可靠数据,计算最优的聚类簇数抽取用户负荷数据数据预处
23、理抽取用户典型负荷曲线平衡数据集采用WSCVI确定最佳聚类数使用FCM算法对用户负荷曲线进行分类用户日负荷特征曲线分析用户用电行为按比例和距离进行采样,获得类间平衡数据集构建协同森林异常检测模型分析用户用电行为622023年第3期张芸,等:智能电网环境下窃电行为检测进行了改进,并提出了一种改进随机森林的方法,并与支持向量机和反向传播神经网络进行对比实验,ACC和AUC系数分别达到了94.53%和95.13%,证明了其良好的精度和稳定性。2.3基于深度学习的窃电行为检测方法近年来,随着智能化电网的发展,为了满足电力海量数据挖掘的需求,一系列深度学习模型被广泛应用到用电异常行为检测工作中。上海交通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 电网 环境 下窃电 行为 检测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。