数字孪生平台下基于随机森林算法的电网风险预测研究.pdf
《数字孪生平台下基于随机森林算法的电网风险预测研究.pdf》由会员分享,可在线阅读,更多相关《数字孪生平台下基于随机森林算法的电网风险预测研究.pdf(5页珍藏版)》请在咨信网上搜索。
1、Microcomputer Applications Vol.39,No.8,2023文章编号:10 0 7-7 57 X(2 0 2 3)0 8-0 153-0 5数字李生平台下基于随机森林算法的电网风险预测研究(广西电网有限责任公司南宁供电局,广西,南宁530 0 2 8)摘要:为了进一步提高光伏功率的预测精度,降低电网风险,基于传统随机森林模型提出一种峰值修正法,以解决正午时段预测失准的问题。采用随机森林模型对待测样本进行初步预测,并将待测样本的初步预测结果分为上午和下午两个时段分别进行修正。在对上午时段的光伏集群功率进行修正时,采用DGM(1,1)对实际值与初步预测结果之间的相位关系进
2、行调整,由此得到修正后的预测结果;在对下午时段的光伏集群功率进行修正时,采用已产生的当前最大出力点进行修正。对光伏集群功率进行准确预测能够降低大规模接入电网对电力系统的安全稳定所带来的冲击,是保障电力系统安全的重要技术手段。关键词:随机森林模型;电网风险预测;光伏集群;功率预测;误差分析中图分类号:TP393Based on Random Forest Algorithm under Digital Twin Platform(Nanning Power Supply Bureau of Guangxi Power Grid Co.,Ltd.,Nanning 530028,China)Abst
3、ract:In order to further improve the prediction accuracy of PV power and reduce the risk of power grid,based on the tradi-tional random forest model,a peak correction method is proposed to solve the problem of inaccurate prediction at noon.Therandom forest model is used to make a preliminary predict
4、ion of the test samples,and the preliminary prediction results of thetest samples are divided into two periods of morning and afternoon for revision,respectively.In correcting the photovoltaiccluster power in the morning period,DGM(1,1)is used to adjust the phase relationship between the actual valu
5、e and the pre-liminary prediction result,thus we can obtain the revised prediction result.When the photovoltaic cluster power in the after-noon period is corrected,the current maximum output point is used for correction.Accurate prediction of photovoltaic clusterpower can reduce the impact of large-
6、scale access to the grid on the security and stability of the power system,which is an im-portant technical means to ensure the security of the power system.Key words:random forest model;power grid risk prediction;photovoltaic cluster;prediction of power;error analysis0引言2010年,数字李生这一概念出现于美国国家航空航天局的技
7、术报告中,这一报告中指出“数字李生”是指集成多概率、多学科、多物理量能的仿真过程或系统。在此之后,“数字李生”这一概念就正式进入人们的视野,并得到了各界学者的关注。数字李生的关键技术主要包括云计算、仿真、边缘计算、人工智能、建模及物联网等11。目前,我国光伏功率超短期预测仍存在光伏电站系统所采集的数据准确性较低、预报结果的时空分辨性不高等问题。因此,本文基于随机森林算法提出一种解决正午时段预测失准问题的方法,并分为上下午两个时段进行分段修正。上午时段采用离散灰色预测模型对实际功率的上升趋势进行预测,下午时段采用最大出力点进行修正,以进一步提高光伏功率的预测精度。1模型构建方法1.1随机森林模型
8、的初步研究作者简介:符华(198 0 一),男,硕士,高级工程师,研究方向为数字化技术应用、数据分析及应用、网络安全。研究与设计符华文献标志码:AResearch on Power Grid Risk PredictionH(x)=arg max)Y式中,H()为所构建的随机森林模型,h;为已完成生长的第153微型电脑应用2 0 2 3年第39 卷第8 期FU Hua21世纪初,统计学家利奥布莱曼提出了一种数据挖掘方法,并将其命名为随机森林算法(RF)。随机森林是一种由多个决策树构建而成的集成学习智能体。决策树是一种基本的分类器,构建好的决策树呈树形结构,可以将其视作if-then规则的集合。
9、而随机森林则是将所有决策树集合起来构成的森林,通过对森林中的每个子部分的输出结果进行打分,进而对森林中各个特征的重要程度进行评估2 。随机森林智能体的生成过程如图1所示。从图1可以看出,随机森林智能体的生成过程主要包括4个步骤。为了提升随机森林模型的统计能力,可以通过增加分类树的数量以增加数据集的差异。从原始序列中抽取k个样本后得到序列(hi(X),h z(X),h s(X),此时构成的随机森林模型中共含决策树k棵,本文预测结果通过多数投票法得出,如式(1):(1)I(h;()=Y)LD:/G p2(D,)Microcomputer Applications Vol.39,No.8,2023i
10、棵决策树,Y为预测结果,I()为示性函数。图1随机森林智能体训练要点序列(hi(X),h(X),h(X)中的数据都是从原始数据集(X,Y)中进行抽样得到,因此可以得到余量函数:mg(X,Y)=au,I(h(X)=Y)-maxavsI(he(X)=j)(2)通过式(2)得到正确与错误分类之间的差值,因此得到的函数值越小,表明分类效果越差。随机森林模型在生成决策树树枝时,所依靠的量度为Gini指数,CART决策树依靠Gini指数对样本集进行分割,使其形成完整的决策树。如果对数据集D进行分割后所形成的种类为m,那么该数据集的Gini指数如式(3):随机森林模型的统计学优点图3随机森林模型的统计学优点
11、1.2预测修正模型中参数=p 的最小二乘估计见式(10)式由于随机森林模型在进行预测时可能会出现失准的问(12):题,因此为了解决这一问题,本文将待测日分为上午和下午两个部分进行峰值修正。具体方法如下。(1)上午上升区域功率修正由于上午出现峰值的时间在预测时间之后,因此在对上午功率进行修正时采用趋势预测法。太阳光在上午的辐射强度随时间推移不断增强,上午的光伏功率也因此呈现不断上升的趋势,所以无法准确得到某一时刻的实际出力峰值,随机森林模型的初始预测结果也无法根据实际出力峰值进行调整3。白化响应式与白化模型之间所引起的误差可以通过离散灰色模型DGM(1,1)避免,因此本文在对上午功率进行预测时采
12、用新陈代谢的离散灰色模型。离散灰色模型具体是指将最老的(o)(1)替换为最新信息(o)(k 十1),不断进行信息更新以对新的数据进行预测4。随着时间的变化,离散灰色模型也会不断发生改变。将式(5)设为原始序列:X(0)=(0)(1),(0)(2),(0)(n)则DGM(1,1)模型可以用式(6)表示:()(k+1)=(k)+p将(1)设为一次累减算子,则可以得到式(7)、式(8):)2()=(k)2(k 1),k=2,2(1)(k)=i=1式(9)为离散灰色模型的白化方程:dt2研究与设计开始M建模与数据预处理M设定子集属性数决策树训练判定结果汇总M结束J-R2(i),k=1,2,nd(1)d
13、t微型电脑应用2 0 2 3年第39 卷第8 期Gp=1-2p(3)式中,Gp为Gini指数,pi为i类数据在数据集中所出现的次数。将数据集依据所得出的Gini指数进行划分,若依靠特征A将数据集D进行划分,使其形成子集Di、D 2,那么此次依靠特征A进行划分的Gini指数如式(4):GD.AD.GDI(Di)+D依靠特征A进行划分的Gini指数值越大,则表明此次划分效果越差。使用随机森林模型进行决策的过程如图2所示。决策树分类结果1决策树分类结果2决策树分类结果K投票决定最优分类图2 随机森林模型原理随机森林模型的统计学优点如图3所示。仅需对决策树数目及分裂特征数进行调整能够对大规模数据进行准
14、确估计,且不会出现过拟合现象使用Bagging法抽取子数据集可以降低泛化误差Y=L(1)(n)最终得到式(5)所对应的数学模型,如式(13):2()=)(1)(k)=(-1)(1)-11-当t=4时,采用离散灰色模型对集群功率的时间序列进行预测,翻转时间序列后输入离散灰色模型进行预测,得(5)到(tz,Yi2),将其与横坐标之间的夹角设为9。单次预报的最大值点与预测起始点t,构成另一条直线,将两条直线平(6)移后的交点设为(t4,Y4),当两条直线的斜率一致时会获得最大精度。因此,使用随机森林算法对上午功率进行预测得(7)到预测值的修正公式如式(14)式(16):(8)tan(min(,0)Y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 孪生 平台 基于 随机 森林 算法 电网 风险 预测 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。