![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于关联规则的电力系统调用规则全链路生成方法.pdf
《基于关联规则的电力系统调用规则全链路生成方法.pdf》由会员分享,可在线阅读,更多相关《基于关联规则的电力系统调用规则全链路生成方法.pdf(7页珍藏版)》请在咨信网上搜索。
1、信息技术XINXIJISHU2023年第9 期基于关联规则的电力系统调用规则全链路生成方法樊涛,武亚光,江帆?(1.国家电网有限公司互联网部,北京10 0 0 31;2.国家电网有限公司客户服务中心,天津30 0 30 0)摘要:为解决电力系统网络入侵、攻击等现象频发的问题,安全生成电力系统调用规则,研究基于关联规则的电力系统调用规则全链路生成方法。采用基于关联规则的决策树构造方法,利用新属性生成与新属性评价,获得近似精确规则集,构建电力系统全链路决策树,运用基于AR-C4.5的电力系统调用规则全链路生成方法,通过电力系统调用序列预处理,生成规则以及匹配规则,全链路生成电力系统调用规则。算例分
2、析结果表明:该方法构建的全链路决策树规模较小;错误率和漏报率仅分别为1.8%,0.4%;全链路正常攻击和变种攻击的误报数量均低于5。关键词:关联规则;电力系统调用;规则全链路;C4.5算法;决策树中图分类号:TP302.8D0I:10.13274/ki.hdzj.2023.09.022Full link generation method of power system calling rules based on association rulesFAN Tao,WU Ya-guang,JIANG Fan?(1.Internet Department of State Grid Corpor
3、ation of China,Beijing 100031,China;2.State Grid CustomerService Centre,Tianjin 300300,China)Abstract:In order to solve the problem of frequent network intrusion and attack in power system,and safe-ly generate the power system calling rules,the full link generation method of power system calling rul
4、esbased on association rules is studied.The decision tree construction method is used based on associationrules,and the approximate accurate rule set is obtained by using new attribute generation and new attributeevaluation,and the full link decision tree of power system is constructed.The full link
5、 generation method ofpower system calling rules based on AR-C4.5 is used,and through power system calling sequence prepro-cessing,the rules,matching rules and the full link generates power system call rules are generated.The ex-ample analysis results show that the scale of the full link decision tre
6、e constructed by this method is small,and the error rate and false alarm rate are only 1.8%and 0.4%respectively.The number of false positivesof full link normal attack and variant attack is less than 5.Key words:association rules;power system calling;regular full link;C4.5 algorithm;decision tree文献标
7、识码:A文章编号:10 0 9-2 552(2 0 2 3)0 9-0 132-0 60引 言电力系统是社会发展和人们生产生活必不可作者简介:樊涛(19 7 1),男,硕士,教授级高级工程师,研究方向为电力市场营销、电力营销信息化。一132 一少的能量来源,有着地理分布广阔、设备数量庞大等特点,随着电力系统信息化与智能化进程的不断加快,电力系统网络安全问题日益突出。访问控制、加密技术等是解决该问题的重要方法,对网络中已知非法访问具有很好的抵御作用,但仅能基于关联规则的电力系统调用规则全链路生成方法通过模糊的规则抵御未知访问,无法满足电力系统B=,其中,系统调用规则前件用 A 表示,结果用的所有
8、安全要求2 。B表示,且A、BC I。位于D内,上述表达式成立,将电力系统内进程的系统调用当作区分正常其支持度为AUB存在于D内的占比,用概率P(自我)与异常(非我)程序的标准,可以达到防御(A U B)表示,相当于某规则的频率。网络人侵、攻击等安全问题的目标3,确定正常位于D内,系统调用规则置信度用confi-与异常程序的电力系统调用规则是影响电力系统dence表示,其是指A和B的事务同时存在于 D运行质量的关键因素,其安全生成模式的确认更内的比重,用条件概率P(BIA)表示,相当于某系是电力系统调度效率提升的重要一步,因此,研究统调用规则的强度。通常使用0 1之间的值表电力系统内所有链路的
9、系统调用规则生成方法,示support 和 confidence,两者的计算过程分别如成为当前电力行业关注的热点4。范华丽等5公式(1)-(2)所示:和薛辉等6 ,分别使用遗传规划技术与Bayes 混support(A=B)=P(A U B)合先验分布技术生成电力系统调用规则,均能有confidence(A=B)=P(B I A)效应用于系统调用,且生成效率较高,但对于未知关联规则是指support 和confidence 分别与用样本点的判断能力有待提升。户指定阈值相符合的规则,两者是评价电力系统关联规则能够从大量数据中挖掘出数据间的调度效率重要性与可靠性的关键指标。最小支持联系,所得结果便
10、于理解,且不受变量约束,对多度阈值用min_sup表示,最小置信度阈值用min_维变长数据具有优良的处理效果;决策树是最常conf表示,强规则为同时符合两个阈值的关联规则。用的归纳学习方法之一,其形成的分类模型简单1.2基于C4.5算法的电力系统调用规则属性易懂,且拥有精度高、数据处理快等优势。因此,分析本文提出基于关联规则的电力系统调用规则全链电力系统调用规则属性样本集与变量分别用路生成方法,其创新之处在于使用关联规则结合T、表示,内调用规则属性数量用n表示,设C4.5决策树算法,生成用于电力系统调用的所有a,a2,,代表规则属性取值,与相匹配的取链路规则,以期为电力系统网络安全防护提供可值
11、用;表示,其呈现的样本数量用n;表示,如果靠、全面的方法指导。电力系统调用规则属性样本数量总和为n,可得1电力系统调用规则全链路生成方法研究到:n+n2+.+n=n。1.1电力系统调用规则定义属性的熵值用H(X,)表示,获得样本中关联规则能够表示某事物和其他事物之间的与相关的信息而产生的代价可通过该值进行联系,假设电力系统内全部进程项目集合用=定义7 ,具体用公式(3)表示:li,i2,,im 表示,单独项集用A表示,项目为其组成部分。调用事务用T表示,其属于I的子集,各事务均存在独有的调用事务标记,用TID表示。如果满足ACT,则表明项集A包含于调用事务T内。k项集是指有数量为k的项目存在于
12、项集A中。调用事务数据库用D表示,项集的支持度用support表示,它是指A在D内呈现的频率占D内总事务的比例。若想表明某项集为频繁项集,则该项集的support应大于最小支持度阈值,设置L代表频繁k项集的集合。关联规则的表达式用A=B表示,并满足An樊涛等(1)(2)H(X,a)=-Zp(a,)logap(a,)i=1一平均互信息和H(X,)的比值,即信息增益率,表达式如下所示:E(X,a)=I(X,a)H(X,a)单位代价下,获得的信息量为信息增益率,用于衡量信息量不确定性,如果某属性的熵值最大,则将其当作测试属性8-9 一13 3 一ni1og2nn;nn(3)(4)基于关联规则的电力系
13、统调用规则全链路生成方法1.3基于关联规则的电力系统全链路决策树构造方法电力系统调用规则生成数据集后,采用关联规则构造全链路决策树,树内各节点即电力系统中的调度网络链路。1.3.1新属性生成关联规则算法可以获得大量的挖掘结果,过于穴余,这将严重影响整个电力系统调用规则环节的生成效果,因此,通过以下约束,选择生成新属性的关联规则:数据集内的分类属性包含所得规则的后件。生成的新属性必须和分类属性具有密切关联,需对较高置信度的近似精确规则进行重点关注10-11。因此可得,以后件为分类属性,使其具有较高的置信度的规则,即目标规则。假设R:A 一B代表电力系统全链路决策的关联规则,若想表明R是近似精确规
14、则,则应满足sup(A)-sup(AUB)8,且为自然数。在规则前件出现的情况下,后件出现的概率极大,两者具有较大的相关性,即近似精确规则,下述为其挖掘过程。每一层的频繁项集可通过关联规则算法采用宽度优先搜索方案顺次生成,(k+1)项集可利用k-项集检索得到。1-频繁项集的集合用Fl表示,可在最小支持度阈值的基础上获得。根据F,获得2-候选集,用C表示,2 频繁项集的集合用F,表示,仍可在最小支持度值的基础上获得。重复上述过程,停止条件为无法获得频繁k一项集。将以上挖掘过程所得规则前件当作新属性,并保存至数据集内。假设A=nA=21A=31=B=bi 代表获得的近似精确规则,待选新属性用AN,
15、=A,A,A,表示,则可以得到公式(5)所示表达式:lo,else1.3.2新属性评价根据信息增益理论,结合关联规则获得的支一13 4一一樊涛等持度与置信度,提出用于评价新属性的近似信息增益,以提升所选属性对构造决策树的价值。1.3.1小节所得需要评价的备选属性用AN;表示,与其相匹配的近似精确规则用R,表示,表示为AN一B=bi,下述为具体评价过程。选择AN,当作某决策树的根结点,其信息量的计算过程用公式(6)表示:(6)式中,分类属性取值的个数用n表示;数据集内的总事务数量用N表示;分类属性中,次序为j的取值用n,表示。在采用备选属性分割数据的过程中,当AN,=1时,相应数据记录的数量计算
16、过程如公式(7)所示:Ni=N sup(R,)conf(R,)以上数据记录内,类别属性B中取值等于b;的记录个数计算方法用公式(8)表示:N2=N*sup(R,)以上数据记录内,无法获取B中取值不等于b,的记录个数。在规则前件出现的情况下,可将规则后件不出现时拥有的信息量忽略12 ,此时,满足AN;=1的数据记录拥有的信息量计算过程用公式(9)表示:(9)不满足AN,=1的数据记录个数计算过程如公式(10)所示:假设类别属性值用b表示,且h=1,2,,n,其在不满足AN,=1的数据记录内的记录个数用Ns表示13,此类记录拥有的信息量计算过程如下所示:(11)(5)综合以上步骤,可采用公式(12
17、)表示新属性的近似信息增益表达式:Gain(AN,)=Gror-G,-G2(7)(8)conf(R,)基于关联规则的电力系统调用规则全链路生成方法1.4.2电力系统调用规则生成合并上述两个库,使其变为训练集D的样本,各样本由特征属性和类属性构成,数量分别为(12)7、1,其中类属性用C=(C1,C2)表示,各特征属如果上式所得结果大于0,将属性AN,留存,性包含多个一样的属性值。若某系统内核拥有的如果不符合该条件,将属性AN,丢弃。电力系统调用数量为2 38,则该系统中各特征属1.3.3电力系统全链路决策树构造流程性的属性值个数都为2 38。各样本表示库内一行1.3.1小节获得的近似精确规则集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 关联 规则 电力系统 调用 全链路 生成 方法
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。