基于自适应Kmeans和LSTM的短期光伏发电预测.pdf
《基于自适应Kmeans和LSTM的短期光伏发电预测.pdf》由会员分享,可在线阅读,更多相关《基于自适应Kmeans和LSTM的短期光伏发电预测.pdf(6页珍藏版)》请在咨信网上搜索。
1、精准的光伏发电功率预测是电网日常调度管理与安全稳定运行的关键。文中提出了一种基于自适应Kmeans和长短期记忆(LSTM)的短期光伏发电功率预测模型。根据短期光伏发电特性,选取了预测模型的初始训练集。采用自适应Kmeans对初始训练集以及预测日的光伏发电功率进行聚类。在各类别的初始训练集数据上分别训练LSTM,结合训练完成的LSTM进行发电功率的预测。考虑三种典型天气类型,采用所提方法进行仿真分析。结果表明,与其他三种方法相比,文中提出的方法的精度有了明显提升,误差更小。关键词:光伏发电功率;预测;自适应Kmeans;LSTM;聚类D0I:10.19753/j.issn1001-1390.20
2、23.07.015中图分类号:TM615Prediction of short-term photovoltaic power generation based on(School of Electrical Engineering and Automation,Anhui University,Hefei 230601,China)Abstract:Accurate prediction of photovoltaic power generation is the key to daily dispatch management,and safe and sta-ble operation
3、 of the power grid.Therefore,a short-term photovoltaic power generation prediction model based on adaptiveKmeans and long short-term memory(LSTM)is proposed in this paper.According to the short-term photovoltaic powergeneration characteristics,the initial training set of the prediction model is sele
4、cted.The adaptive Kmeans is adopted tocluster the photovoltaic power generation of the initial training set and the prediction day.A LSTM is trained on the initialtraining set data of each category,and combining the trained LSTM to predict the power generation.Finally,consideringthree typical weathe
5、r types,the proposed method is used for simulation analysis.The results show that,compared with theother three methods,the accuracy of the proposed method is improved significantly,and the error is smaller.Keywords:photovoltaic power,prediction,adaptive Kmeans,LSTM,clustering0引 言太阳能已被证明是最清洁,最丰富的可再生能
6、源之一。许多大型太阳能光伏(PhotoVoltaic,PV)电站在世界许多国家被广泛应用,以减少由化石能源引起的环境污染和碳排放。然而,光伏发电的时变性、间歇性,会给光伏并网带来不利影响,甚至严重影响整个电力系统的稳定运行2。准确预测光伏发电功率对于提高电力系统的稳定性并确保最佳机组投人和经济调度至关重要3-4近年来,光伏发电引起了国内外研究人员的极大兴趣。预测光伏发电功率方法可分为物理法、统计法、机器学习法、深度学习法等。物理方法是通过数值天气预报,卫星遥感测量和地面测量设备获得气象和地质参数。但是需要具有合适且频繁校准的服务设施和相关设备5。统计方法是一种数据驱动的方法,可从一9 4一文献
7、标识码Aadaptive Kmeans and LSTMChen Yao,Chen Xiaoning文章编号:10 0 1-139 0(2 0 2 3)0 7-0 0 9 4-0 6历史样本中提取特征以通过最小化误差来预测光伏输出功率的未来行为6。机器学习法以神经网络7-10 和支持向量机(SupportVectorMachine,SVM)1-3为代表。文献11采用Kmeans对训练样本和测试样本分别进行聚类,再根据聚类的结果结合SVM进行预测,取得了良好的预测效果。深度学习(Deep Learning,DL)在语音识别、图像分类等方面逼近甚至超越人类14。而深度学习模型中的长短期记忆(Lon
8、g ShortTermMemory,LST M)【15-16 模型是对循环神经网络(R e c u r r e n t Ne u r a lNe t w o r k,R NN)的优化,恰好具有记忆能力,可以有效地学习历史序列数据中的规律信息。基于上述分析,本文提出基于自适应Kmeans 和LSTM的光伏输出功率预测方法。首先,根据短期光伏发电特征,选取了初始训练集。考虑传统Kmeans 聚类数目k 难以准确估定,引人Davies-Bouldin 指数对第6 0 卷第7 期2023年7 月15日Kmeans聚类进行评估,实现自动设置聚类的个数,得到自适应Kmeans。然后,根据总辐射、湿度和温度
9、,采用自适应Kmeans对初始训练集以及预测日的光伏发电功率进行聚类。最后,在各类别的初始训练集数据上分别训练LSTM,结合训练完成的LSTM进行发电功率的预测。在晴天、多云、雨天情形下基于实测数据进行算例分析,并与Kmeans-LSTM、LST M 和BP模型进行对比,验证了本文模型的准确性和有效性。1光伏发电的研究方法1.1 自适应 Kmeans在三种典型天气类型情形下,对光伏输出功率分别进行聚类,可以更有针对性的构建预测模型,进一步提高预测精度。传统的Kmeans在不了解数据集的情况下无法主动确定聚类的个数,因此不适合直接对输入数据集进行聚类,因此,本文引人一种自适应Kmeans,它可以
10、根据输人数据集自动设置聚类的个数,其主要思想是一种基于距离的迭代过程17。Kmeans 算法步骤为:(1)从数据集中随机选择k个样本作为初始聚类中心M,22,2;(2)计算剩余样本到聚类中心的欧氏距离,并将其分配到最近的聚类中心,形成k个簇,距离的度量公式在式(1)中给出:D(a,b)=/(as-br)2=式中n表示空间的维数;,和b分别是和b的第k个属性;(3)通过距离度量方法更新聚类中心,更新为隶属电测与仪 表Electrical Measurement&Instrumentation速、总辐射、气压等因素对光伏发电有着不同程度的影响。因此,选择准确、与光伏发电相关性强的影响因素,
11、对于聚类有效性的提高有重要意义。文献18 计算了光伏输出功率与各因素之间的皮尔逊相关系数,结果表明,总辐射的相关系数最大,湿度和温度的相关系数较小,风速的相关系数最小。因此,选择总辐射、湿度和温度三个因素作为自适应Kmeans聚类的输人数据,进行聚类。输入数据集,设k=2,设置kmax值运行Kmeans,计算集群的DBI更新k=k+1Nkkmax?IY计算最小DBI输出,kbest结束图 1自适应 Kmeans 聚类流程图Fig.1Flow chart of adaptive Kmeans clustering1.2 LSTM如图2 所示,RNN的输入x,结合RNN当前的状(1)态A,得到输出
12、ht。而当前的状态A,是上一时刻的状态A,-1和当前的输入x,共同作用决定的。因此,这种结构适合解决与时间序列相关的问题。hoVol.60 No.7Jul.15,2023开始立h该簇的全部样本的均值;(4)重复步骤(2)和步骤(3),直到算法收敛为止。为了减少人工选择聚类数k所带来的误差,引人定量指标来搜索样本的最佳聚类,实现自动确定最佳聚类数k。提出的自适应过程的关键是聚类评估,与此相关指标众多,而Davies-Bouldin 指数使用数据集固有的数量和特征,适用于Kmeans 聚类的评估。定义如下:1DBI台ji式中C,和C分别表示i和j样本到相应簇中心的距离的平均值;D,表示集群i的中心
13、到集群j之间的欧氏距离;DBI越小,则集群性能越好,可以得到最佳聚类数kibest o为了避免生成过多的簇,利用阈值限制簇的数量,记为kmax,自适应Kmeans聚类过程如图1所示。光伏发电功率之所以随机性强、波动幅度大,很大程度上与气象以及环境因素有关。而温度、湿度、风AX图2 RNN网络结构框图Fig.2 Network structure block diagram of RNNC;+C)然而太长的时间序列会导致当前节点对历史节点max(2)DijX0的感知能力不足,出现梯度消失问题。同时当前预测和所需信息之间的跨度长短不一,这种长期依赖(Lo n g-T e r m D e p e n
14、 d e n c i e s)问题是传统循环神经网络不能解决的。因此,LSTM作为一种特殊的循环神经网络被提出。LSTM具有的特殊的记忆单元与门结构,能够很好地解决RNN的梯度消失以及长期依赖问题,有效学习时间序列中的相关性特征。LSTM的结构如图3所示。一9 5一第6 0 卷第7 期2023年7 月15日hi-1,Fig.3LSTM unit structure具体原理如下:遗忘门f(t)通过当前的输人x,和上一时刻的输出h,-1,对上一时刻状态C,-1中的元素设置权重,权重取值范围从0 到1。如式(3)所示:f(t)=(W,ht-1,x,+by)新状态的更新由输人门(t)完成,输入门根据x
15、,,h,-1决定C,-1状态的哪些部分写人当前时刻的状态C,中去。如式(4)所示:i(t)=g(W,h-1,x,+b,)同时,新状态的候选值g,由tanh函数产生,计算g,的公式如下:g(t)=(W,ht-1,x,+bg)新状态C,由f(t)、t)、g,、C,-1共同决定,如式(6)所示:C(t)=f,Ct-1+itgt类似地,输出门0,表示如式(7)所示:O,=(W,ht-1,x,+bo)而LSTM最终的 h,是由输出门O,与C,决定的,如(8)所示:h,=O,tanh(C,)式(3)式(8)中,W是权重矩阵;b是偏置项。2整体预测框架由于在相似的天气情形下光伏输出功率曲线存在明显的相似性特
16、征,故本文对三种典型天气下的光伏输出功率进行预测。首先,考虑待预测日的天气状况,选择历史相似日数据作为初始训练集;其次,对所有数据归一化,得到训练集和测试集。然后,对每种天气下的历史数据和预测日数据采用自适应Kmeans进行聚类分析,结合LSTM进行训练与预测。最后得到本文光伏发电功率预测模型的结果,具体流程见图4。3实例分析考虑天气类型,对晴天、多云、雨天的光伏功率运用本文的预测模型分别进行预测。数据来源于安徽省某一地市的现场实测数据,包含总辐射、湿度、温度以及光伏发电功率。数据为2 0 19 年8 10 月份的数据,一9 6 一电测与仪 表Electrical Measurement&am
17、p;Instrumentationht-1,Xihi1,xi输出门记忆单元gtC,f遗忘门h-1,xt图3LSTM 单元结构Vol.60 No.7Jul.15,2023选取的时间段为6:30 到17:30,采样间隔为15min,即一天的采样点数目为45。预测日为10 月2 9 日(晴天),10 月31日(多云),10 月12 日(雨天)。相邻时间段内气象因素所导致功率的波动性较小19。因此,h选择与预测日相近的相同天气的相似日数据作为初始训练集。根据预测日的类型,分别选取相近的10 天作为初始训练集,如表1所示。预测步骤k-2.10部分参数设置根据DBI的值确定最佳k值隐含层数-2Units=
18、50Dropout=0.5(3)batch_size=16图4光伏输出功率的预测过程(4)Fig.4 Prediction process of PV output power表1相似日以及预测日Tab.1Similar day and forecast day(5)特征(6)(7)(8)输入气象数据和光伏发电功率(归一化)生成初始训练集、测试集自适应Kmeans聚类建立LSTM模型训练模型预测结果晴天多云9月7 日9月2 5日9月8 日10月1日9月9 日10月2 日9月2 2 日10月4日9月2 7 日10月8 日相似日9月2 8 日9月2 9 日10月3日10月18 日10月19 日预测
19、日10月2 9 日3.1聚类分析以相似日、预测日的总辐射、湿度和温度为输入,分别对三种天气类型下的光伏发电功率进行聚类。初始训练集为450 个时间采样点,加上预测日的数据,一共49 5个数据。按照之前的分析,采用自适应Kmeans进行聚类。考虑数据的长度,kmx设置为10。以10 月29日(晴天)为例进行分析。k的取值范围为2,10。k取不同值时的DBI如图5所示。由图5可得,k取9 时,DBI最大,为1.6 6 53;k取3时,DBI最小,为1.39 57。此时,聚类效果最佳。因雨天9月5日9月14日9月2 0 日9月2 4日9月2 6 日10月9 日9月30 日10月15日10月5日10月
20、17 日10月7 日10月2 0 日10月10 日10月2 7 日10月11日10 月31 日10月12 日第6 0 卷第7 期2023年7 月15日此,晴天时初始训练集和预测日的数据分为3类,这里称为类1、类2、类3。类似地,分别对多云和雨天时的初始训练集和预测日的数据运用自适应Kmeans进行聚类。多云时k取3时,DBI最小,为1.12 8 7。雨天时k取3,DBI最小,为1.52 34。1.81.6中1.41.2123456 78910聚类数k图5不同k值的DBIFig.5 DBI with different k values3.2预测结果及分析在对LSTM神经网络之前必须对所有数据(
21、相似日、预测日的气象数据和光伏发电功率)进行归一化处理,则各数值统一取值为0 到1之间。对输人数据进行归一化可避免神经元饱和,增加LSTM网络模型预测的准确性,其公式为:yi-yminZ;=Ymax-Ymin式中y,为最初数据;ymax,Y mi n 分别为最大值和最小值;z,为最终的结果。由3.1节可知,晴天、多云、雨天时分别使用自适应Kmeans 进行聚类,将每类初始训练集进行 LSTM神经网络的训练,进而对该类下的预测日的光伏发电功率作出预测。最后,按照时间点合成预测日的预测值。基于python的keras包提供的layers.LSTM搭建LSTM网络。预测模型的输入为总辐射、湿度和温度
22、。以晴天为例,类0 的LSTM的参数设置及其对应训练误差和测试误差情况如表2,采用式(10)计算误差EMAPE。由表2 可知,隐含层数为2,每层神经元数为50。经测试,3个类的LSTM的参数相同。为了防止过度拟合,Dropout设置为0.5。为了避免出现很容易收敛和陷人局部最优解,需要选择合适的batch_size。这里,batch_size=16。采用Kmeans-LSTM模型(模型二)、LSTM模型(模型三)和BP模型(模型四)与本文预测模型(模型一)进行对比。在模型二、模型三和模型一中,LSTM和Kmeans参数设置相同,BP为单隐含层,采用误差反向传播学习算法。在三种典型天气下四种方法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 自适应 Kmeans LSTM 短期 发电 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。