基于多表合一的居民水电异常使用行为分析.pdf
《基于多表合一的居民水电异常使用行为分析.pdf》由会员分享,可在线阅读,更多相关《基于多表合一的居民水电异常使用行为分析.pdf(7页珍藏版)》请在咨信网上搜索。
1、第 43 卷 第 8 期2023 年 8 月电 力 自 动 化 设 备Electric Power Automation EquipmentVol.43 No.8Aug.2023基于多表合一的居民水电异常使用行为分析黄书俊1,刘鑫2,苏盛3,郑应俊3,汪干3,周文晴3(1.广东电网有限责任公司东莞供电局,广东 东莞 523000;2.国网湖南供电服务中心(计量中心),湖南 长沙 410116;3.长沙理工大学 电气与信息工程学院,湖南 长沙 410114)摘要:结合Copula分布函数分析居民用户的水电用量之间的相关性,在此基础上提出基于日水、电用量距离相关系数的密度聚类水电异常使用行为分析方
2、法,计算逐日用电量与用水量的距离相关系数来衡量其信息相关度。利用具有噪声的基于密度的聚类(DBSCAN)算法对台区用户的距离相关系数进行聚类,将水、电使用数据距离相关系数曲线与其他用户差异较大的识别为异常用户。基于实际低压台区用户水电数据的测试算例验证了所提方法的有效性。关键词:多表合一;水电二元联合分布;行为分析;水电异常;距离相关系数;DBSCAN中图分类号:TM715 文献标志码:ADOI:10.16081/j.epae.2022120050 引言低压居民用户中潜藏着水、电使用异常用户12,尽管单个用户的水、电异常用量有限,但在庞大用户基数累加作用下仍可对市政服务企业造成严重的利益流失,
3、且低压用户用电异常是电气火灾与人身触电伤亡事故的重要诱因。因此,如何准确识别水、电使用异常的低压居民用户,具有重要的实际意义。居民用户数量庞大,住宅居住模式和对应的水、电使用行为模式复杂多样,很难基于单一的用电或用水数据提炼准确标识异常的特征项3。为提高居民水、电使用异常用户的检出率,传统上供电和供水企业主要都是面向高损居民小区进行用电和用水稽查。利用用户窃电可能调整电表电压线圈的特点,文献 4 引入智能电表记录的入户电压信息,根据电压异常识别窃电用户。近年来得到普及应用的同期线损系统,可以提供台区供电量、线损电量和各用户用电量,不但能够利用异常用户窃电量与线损电量存在关联性的特点,采用归因分
4、析识别异常用户56;还可根据异常用户用电量与线损电量同步变化的特性来识别异常7。需要指出的是,相当比例的低压居民用户绕表用电,对应的电表电压数据正常而用电量计量为0,其行为与空置房类似,并不能利用它与线损电量之间的关联性识别异常,因而很难采用前述2类方法进行此类用户的检测识别。由于居民用户日常生活中的水、电消费存在潜在关联,有可能利用水电消费数据的关联分析识别异常用户。国内城镇供水、供电多由不同市政企业提供服务,相互间存在信息壁垒,难以实现基于水电联合分析的异常使用行为检测。近年来,物联网、大数据等新技术的渗透应用催生了智慧城市810。为推动和规范智慧城市发展,城乡住房建设部要求探索建设多表合
5、一系统,以用电信息采集系统为基础实现水、电等分系统数据的集中抄表1112。多表合一系统可有效实现水、电等领域采集信息资源共享,建成跨行业能源运行动态数据集成平台,为低压居民用户异常行为检测提供具有关联性的基础数据,从更高维度判断用户是否存在异常行为1314。为解决仅采用电力计量数据难以从行为模式复杂多样的居民用户中准确刻画异常用户特征的问题,本文在居民用户窃电检测中引入多表合一系统采集的水、电计量数据,利用水电数据存在相关性的特点,提出基于多表合一的居民水、电异常使用行为分析方法:首先分析了用电量与用水量在不同时间尺度上的距离相关系数,然后利用具有噪声的基于密度的聚类(density-base
6、d spatial clustering of applications with noise,DBSCAN)算法对台区用户日用电量与用水量的距离相关系数(distance correlation coefficient,DCC)进行聚类,将水电使用行为相异较大的用户识别为异常用户;最后用低压台区的实际算例验证了所提方法的可行性。1 居民用户水电量相关性分析1.1水电相关性的定性分析结合某中部地区省会城市多表合一示范台区记录的某典型正常用户的水、电消费数据,分析用户水、电用量之间的关联关系。系统按15 min间隔采集水电消费数据,将其累加得到小时尺度与日尺度的水、电消费数据,绘制逐时和逐日的水
7、、电数据如图1所示。收稿日期:20220721;修回日期:20221130在线出版日期:20221209基金项目:国家自然科学基金资助项目(51777015);湖南省教育厅重点项目(19A011)Project supported by the National Natural Science Foundation of China(51777015)and the Key Project of Hunan Provincial Education Department(19A011)第 8 期黄书俊,等:基于多表合一的居民水电异常使用行为分析图1(a)中,用户小时用电量集中于0.53 kW
8、h范围内,小时用水量集中于060 L范围内。水、电使用曲线存在明显差异:用水量曲线在夜间有较明显的零用量区,而受电器待机等因素影响,用电并没有明显的零用量区;用电和用水的波动并不同步,由于在沐浴时受用电量不变而用水量骤增等因素影响,其在波动幅度上也有明显差异。因此,小时时间尺度上的水、电消费行为仅具有并不明显的关联性。图1(b)中,用户日用电量集中于1040 kW h范围内,而日用水量集中于1001 200 L范围内,水电使用量均具有一定的周期性,且日用电量与用水量曲线变化具有明确的同步性,在波动幅值上也大致具有比例关系。由此可见,低压居民用户在日尺度的水、电用量上具有明显相关性,有可能利用这
9、种关联性进行水、电异常使用检测。1.2水电相关性的定量分析与单独的用电计量数据相比,居民用户的水、电消费数据不但包含用水和用电两方面的信息,还可借助两者之间关联关系提供第 3 个维度的隐含信息,能更好地刻画用户行为模式。为进一步分析用户水、电使用行为的关联性,本节采用Copula分布函数定量分析水、电使用数据的二元联合分布。1.2.1二元Copula联合分布函数Copula函数用于描述变量间的相关特性,近年来在金融风险评估、水利洪峰影响分析等方面得到了成功应用1516。Copula函数C(u1,u2,uN)是多维随机变量联合分布函数F(x1,x2,xN)与各自边缘分布函数F1(x1)、F2(x
10、2)、FN(xN)的连接函数,使F(x1,x2,xN)=C(F1(x1),F2(x2),FN(xN)。二元随机变量联合分布对应的二元Copula函数C(u,v)定义(定义1)如下:1)C(u,v)的定义域为0,12;2)在 闭 区 间0,12上 任 取 变 量(u,v),则 有C(u,1)=u,C(1,v)=v;3)在 闭 区 间0,12上 任 取 变 量(u,v),则 有C(u,0)=C(0,v)=0,即C(u,v)存在零基面;4)在闭区间0,12上任取变量(u1,v1)、(u2,v2),在u1,u2 v1,v2中有C(u2,v2)-C(u2,v1)-C(u1,v2)+C(u1,v1)0,即
11、C(u,v)是二维递增的;5)对于0,12上任取变量(u,v),假定F(x)、G(y)是连续一元分布函数,令u=F(x)、v=G(y),若u、v均服从0,1上的均匀分布,即C(u,v)是一个边缘分布服从均匀分布的二元分布函数,且对定义域内任意一点(u,v),均有0C(u,v)1。1.2.2Copula模型拟合与分析采用该地区2个正常台区的300个正常用户共27 000 d的日用水、电量数据作为数据集进行分析,该数据集包含了4个季度,每个季度约6 750 d。采用Copula分布函数分析用户日用水量X和日用电量Y之间的关联关系。1)用水、用电量边缘概率分布函数确定。为了确定日用水量X和日用电量Y
12、的分布类型,利用非参数估计法17近似估计日用电量与日用水量的累积分布函数,其结果如附录A图A1所示。经验分布函数能有效逼近实际分布函数,可将估计的累计分布函数与其对比来判断估计的精度。由图A1可见,非参数估计的结果与经验分布函数的差别非常微小。2)Copula函数选取。确定X与Y的经验分布与核分布估计后,可根据图 2 所示二元频率直方图(Ui,Vi)(i=1,2,N)的形状选取恰当的 Copula 函数结构。图中日用水、用电量为标幺值,后同。频率直方图可作为(U,V)联合密度函数(即Copula 密度函数)的估计。Copula 函数分为正态Copula、t-Copula、Gumbel Copu
13、la、Clayton Copula 和Frank Copula函数5类18,由于(U,V)联合密度函数(即Copula密度函数)具有对称尾部,可选择式(1)所示的二元正态 Copula 或式(2)所示的二元 t-Copula描述日用水量X和用电量Y的相关结构。CGa(u,v,)=-1(u)-1(v)121-2 exp -s2-2 st+t22(1-2)dsdt(1)图1用户水电量使用曲线图Fig.1Curve of user s water and electricity usage图2X与Y的频率直方图Fig.2Frequency histogram of X and Y电 力 自 动 化
14、设 备第 43 卷Ct(u,v;,k)=-t-1k(u)-t-1k(v)121-2 1+s2-2 st+t2k(1-2)-k(k+2)2dsdt(2)式中:-1()表示标准正态分布的分布函数逆函数;为变量间线性相关系数;k为自由度;t-1k()表示自由度为k的一元t分布函数的逆函数。3)参数估计与模型评价。根据日用水量X和用电量Y历史数据,采用极大似然法估计二元正态Copula和二元t-Copula的参数。表1为模型估计所得的参数。为判断选取何种Copula函数更适合水电联合分布,引入经验Copula函数的概念以及平方欧氏距离指标进行拟合优度检测19。样本经验函数 Copula 定义(定义 2
15、)如下。设(xi,yi)(i=1,2,N)为选自二维序列(X,Y)的样本,记X、Y的经验分布函数分别为FN(x)和GN(y),定义:CN(u,v)=1Ni=1NIFN(xi)uIGN(yi)v u,v0,1(3)式中:I 为示性函数,当FN(xi)u时,IFN(xi)u=1,否则IFN(xi)u=0。定义的平方欧氏距离如下:d2Ga=i=1N|CN(ui,vi)-CGa(ui,vi)2d2t=i=1N|CN(ui,vi)-Ct(ui,vi)2(4)根据式(4)比较二元正态Copula(CGa)和二元t-Copula(Ct)与经验Copula(CN)函数。二元正态Copula与经验 Copula
16、 的平方欧氏距离为 4.072 2,二元 t-Copula与经验Copula的平方欧氏距离为3.427 2。因此,可判定二元 t-Copula与经验 Copula模型能更好地拟合日用水量X和日用电量Y之间的相关性。根据二元 t-Copula 分布函数及其分布参数,可绘制居民用户水电联合分布的拟合概率密度函数C(u,v)如图3所示。二元t-Copula概率密度分布图中,坐标u、v分别为日用水量X和日用电量Y的累积分布函数,而坐标C(u,v)为日用水量X和日用电量Y下的概率密度。为利于辨识,将概率密度较大的电、水组合标识为黄色,而将概率密度较小的组合标识为蓝色。对图3的具体分析如下。1)图3(a)
17、中:多数观测点落在日用电量与用水量的主对角线两侧,表明用电与用水序列间具有较强的正相关关系;左右两端呈明显翘起态势,居民用户离家时,对应表现为左端的用水用电同步缩减;节假日期间多人在家时,则易表现为右端的用水用电同步扩张。因为这样的日数相对集中,在二元概率密度图上也就容易表现为隆起态势。2)图3(b)中,除对角线隆起部外,左右两侧迅速下落,表明正常用户日用水用电量关联性较强,用电多而用水少或用水多而用电少这两种水电消费组合的概率很低,也从侧面反映出正常用户用电与用水量之间存在正相关关系。基于以上居民用户日常用水、用电行为具有强相关性与同步性的分析,可利用用户用电、用水行为的强相关性检测是否存在
18、水、电异常使用行为。2 水电异常使用行为检测方案设计本文采用距离相关系数和密度聚类进行水电异常使用行为检测。根据第1节的分析结果,首先计算高损台区所有用户的自身用电量与用水量之间的距离相关系数,然后绘制距离相关系数曲线,再采用DBSCAN算法进行聚类,将距离相关系数偏离正常用户类簇的用户识别为水电使用行为具有弱相关性的异常用户。2.1距离相关系数距离相关系数Dcor由皮尔逊相关系数改进而来,其可以衡量变量间的非线性相关关系2021。由统计学理论可知,分布函数代表着随机变量自身的特有表1极大似然法估计模型参数Table 1Parameters by maximum likelihood esti
19、mation函数类型正态Copulat-CopulaSpearman 10.862 40.862 41 10.864 90.864 91kendall 10.875 30.875 31 10.880 10.880 11拟合参数=0.872 7=0.932 5 k=4图3水电二元t-Copula概率密度分布Fig.3Distribution of hydroelectric binaryt-Copula probability density第 8 期黄书俊,等:基于多表合一的居民水电异常使用行为分析性质,而条件分布函数代表着某个随机变量在满足某一定条件下的分布性质。要衡量X和Y的相关关系,可以
20、比较Y的分布函数F(Y)与Y在X条件下的条件分布函数F()Y|X,两者相似程度越高,说明用电量受用水量的影响越小,用水量和用电量的相关性越弱。为方便计算,采用以下特征函数替代分布函数:fXY(s,t)=Eexpi s,X+i t,Y(5)fX(s)=fXY(s,0)=Eexpi s,X(6)fY(t)=fXY(0,t)=Eexpi t,Y(7)式中:E为数学期望;i为虚数单位;s、t为实数向量;,为点积运算。当且仅当 fXY(s,t)-fX(s)fY(t)=0 时,X和Y不相关,反之则具有相关性。结合欧氏范数来定义如下距离协方差和方差:D2cov(X,Y)=fXY(s,t)-fX(s)fY(t
21、)2(8)D2cov(X)=fXX(s,t)-fX(s)fX(t)2(9)D2cov(Y)=fYY(s,t)-fY(s)fY(t)2(10)由式(8)(10)构造距离相关系数的表达式为:Dcor=D2cov(X,Y)D2cov(X)D2cov(Y)D2cov(X)D2cov(Y)00 D2cov(X)D2cov(Y)=0(11)Dcor取值范围为 0,1,依次算出所有用户用水量与用电量间的距离相关系数。用户用水量与用电量间的距离相关系数越接近1,表明水电消费量的相关性越强;用户用水量与用电量间的距离相关系数越接近0,表明其水电消费量的相关性越弱。在正常用户水、电消费量存在强相关性的前提下,水、
22、电使用行为异常会减小用水量与用电量的耦合强度,使两者趋于差异化而减小相关度,因而异常用电用水用户的距离相关系数会低于正常用户。Dcor考虑的是变量间的信息相关度,在样本量足够多的情况下,能够捕获到广泛的关系而不限定于特定形式的关系。在水电异常用户检测中,Dcor能独立分析用户用电量和用水量2个时间序列的耦合强度而不需考虑其他用户的影响,具有广泛的工程应用价值22。低压居民用户的日用电量与日用水量间存在较强的相关关联,它们构成了多用户变量线性系统。智能电表计量的电量数据与智能水表计量的水量数据中包含了大量用电、用水信息,利用Dcor对度量其信息,剔除冗余信息、提取有用信息,能更好地识别水、电异常
23、用户,提高水电异常用户稽查的靶向性。值得注意的是,仅通过Dcor识别水电异常用户还存在一些缺陷。首先,异常用户正常用电、用水时的Dcor值与正常用户无异,人工根据曲线形态判断容易混淆;其次,用水、用电异常时间段及持续徐时长的不同均会造成用户Dcor值变化,难以简单设定具体阈值来区分异常用户;最后,当台区中接入大量用户时,不一定能根据 Dcor曲线简单判别异常用户。因此,还需结合聚类来区分筛选异常用户。聚类算法种类繁多,常见的有系统聚类、划分聚类、层次聚类、密度聚类等。其中,以DBSCAN算法为代表的密度聚类算法具有无需预设类簇数的优点,可以依据样本在空间的密度自动识别类簇数量,适用于具有任意形
24、状的数据集2324。算法中各类样本点定义及说明如附录A图A2及其下方对应的文字说明所示。2.2整体检测流程以台区接入用户的用电及用水数据为例,结合附录A图A3对水、电异常用户的识别流程说明如下:1)基于多表合一管理系统采集用户用水、用电数据,并对接入用户的用水、用电数据进行预处理,避免零电量、零水量空置房的干扰,处理后的用电数据记为Yi、用水数据记为Xi,其中,i表示第i个用户;2)构建台区各用户的水、电数据的距离相关系数模型,计算得到不同时间长度下的用户用电量与用水量的距离相关系数;3)利用 DBSCAN 算法对距离相关系数进行聚类,将偏离正常用户类簇的识别为水电用量具有弱相关性的异常嫌疑用
25、户。3 算例分析因用水异常与用电异常用户的检测原理相同,以下仅通过对某实际高损台区进行仿真分析为例。3.1构建距离相关系数模型该台区接入42个居民用户,线损在8.9%左右,超过一般正常台区5%的线损阈值,可认为存在窃电等用电异常。采集该台区2021年1月1日至2021年4月5日间共95 d的台区供电量和接入用户日用水、电量数据,并对取得的水、电数据进行数据预处理。将用户 1 42的日用电量定义为时间序列Y1 Y42,对应用户用水量定义为时间序列X1 X42。对该台区用户用电量与用水量构建距离相关系数模型,为更准确地反映各时间段内的用户信息,从不同的时间长度(分别取时间序列的第 1 30天、第1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 合一 居民 水电 异常 使用 行为 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。