基于Stacking集成学习的福建省火电行业碳足迹情景预测.pdf
《基于Stacking集成学习的福建省火电行业碳足迹情景预测.pdf》由会员分享,可在线阅读,更多相关《基于Stacking集成学习的福建省火电行业碳足迹情景预测.pdf(8页珍藏版)》请在咨信网上搜索。
1、提出一种基于Stacking集成学习的福建省火电行业碳足迹情景预测方法.首先,基于扩展Kaya恒等式识别火电行业碳排放的主要影响因素;然后,以决定系数和平均绝对百分比误差作为评价指标优选模型的初级学习器与元学习器,构建融合不同学习器优势的Stacking集成学习碳足迹预测模型;最后,设置4种不同的碳达峰行动情景,以福建省为例对其2 0 2 1一2 0 35年火电行业的碳达峰进行计算.结果表明,所提方法能够准确预测火电行业的碳足迹,并得出在低碳发展情景下该省可在2 0 2 7 年实现碳达峰战略目标的结论.关键词:碳足迹;火电行业;Stacking集成学习;情景预测;碳达峰;福建省中图分类号:TM
2、61;X2 2Scenario prediction of carbon footprint for thermal power industry inFujian Province based on Stacking ensemble learningXIANG Kangli,CHEN Jinchun,CHEN Simin(Economic and Technological Research Institute,State Grid Fujian Electric Power Co.,Ltd.,Fuzhou,Fujian 350012,China)Abstract:A carbon foo
3、tprint scenario prediction method based on Stacking ensemble learning isproposed.Firstly,the main influencing factors of carbon emissions in thermal power industry areidentified based on the extended Kaya constant equation.And then,the decision coefficient and themean absolute percentage error are s
4、elected as the primary learners and meta-learners of the evaluationindex model,and the Stacking ensemble learning model for carbon footprint forecasting that integratesthe advantages of different learners is established.Finally,four carbon peaking action scenarios are setup to calculate the carbon p
5、eaking of thermal power industry in Fujian Province from 2021 to 2035.The results show that the proposed method can accurately predict the carbon footprint of the thermalpower industry.It is concluded that the province can achieve the strategic goal of carbon peak in 2027under the low-carbon develop
6、ment scenario.Keywords:carbon footprint;thermal power industry;Stacking ensemble learning;scenario forecast;carbon peaking;Fujian Province0引言为应对全球气候变化,中国将碳达峰、碳中和目标纳人生态文明建设的整体布局 1 火电是消耗化石能源的主要行业 2 ,因此,科学预测火电行业碳足迹、碳达峰时间和峰值对中国实现碳中和、碳达峰目标具有重要意义.目前,碳足迹预测方法主要分为两类.第一类是基于碳排放历史数据实现,如文献 3针对交通、建筑、废物行业提出数据驱动时间序
7、列的离散灰色碳足迹预测模型,其预测准确率达到95%以上.文献 4 以中国2 0 0 0 一2 0 19年的碳排放量数据为基础,建立了自适应调节的灰色滚动宏观碳足迹预测模型,预测平均相对误差为2.44%.这类方法的优点是对数据规模要求小,但预测结果难以反映碳排放相关政策与环境因素变化等的影响.第二类是考虑多方面因素建立碳足迹预测模型.文献 5 考虑人口、GDP、城镇化率等因素建立了岭回归的可拓展随机性环境影响评估模型,预测系数(coefficient of detemination,R)收稿日期:2 0 2 2-0 9-2 2通信作者:项康利(1990-),工程师,主要从事碳足迹分析与应用方面的
8、研究,基金项目:国家电网公司管理咨询项目(SGFJ0000BGWT2200306)文献标识码:A第4期可达0.96 9;文献 6 考虑了产业结构、能源消费总量、技术水平等因素建立了基于鲸鱼算法优化极限学习机的中国碳足迹预测模型,预测误差(mean absolute percentage error,M A PE)低于0.12 6.这类方法能够结合未来政策规划进行碳足迹预测,但存在单一模型学习性能弱、预测精度低的缺陷.为了弥补预测方法中单一模型的不足,众多学者开发了组合模型 7 和集成学习 8 相关算法.研究表明,组合模型和集成学习将多个模型以不同的形式融合,可有效地提高融合模型的预测精度.在众
9、多行业,碳足迹预测方法得以研究.但火电行业作为减排的重点行业之一,其碳足迹预测的研究却鲜有报道.因此,本研究提出一种基于Stacking集成学习的火电行业碳足迹情景预测方法.首先,根据扩展Kaya恒等式识别出与火电碳排放相关的影响因素;然后,基于影响因素数据,采用R与MAPE作为评价指标优选模型的初级学习器与元学习器,形成多模型融合的Stacking集成碳足迹预测模型;最后,基于Stacking集成预测模型对未来不同情景模式下福建省的火电行业碳排放量进行预测,并分析该省火电行业的碳达峰情况.相关研究为中国火电行业碳达峰预测提供理论依据与借鉴价值.1基于扩展Kaya碳足迹影响因素分析Kaya 恒
10、等式 9 是由学者Kaya于198 9 年提出,用于识别二氧化碳排放因素,其表达式为CEGC=XPEGP式中:C为CO,排放总量,亿t;E为能源消费总量,万t;G 为生产总值,亿元;P为人口规模总数,万人.Kaya恒等式具有开放性和拓展性.火电行业碳足迹扩展Kaya恒等式为C=Z C;=2i=1式中:C,为第i类能源(能源包括煤、石油、天然气)碳排放总量;E,为第i类能源消耗总量;G,为火电生产总值;M,为碳排放系数;N为能源消费结构(火电发电量占全部电力发电比重);S为能源消费强度(火电能源消费总量/火电发电量);T为产业结构(第二产业生产总值占比);R为经济产出(地区生产总值,亿元).城镇
11、化水平L(城镇人口/常驻总人口)是人口规模P的另一种表现形式,推动着产业结构的变革,是实现城乡共同富裕的根本途径,为碳排放关键影响因素之一 52基于Stacking集成学习的碳足迹预测模型2.1Stacking集成学习模型原理Stackingl01集成学习的思想在于组合多个弱监督模型以得到一个强监督模型,充分发挥不同学习器的优势,从而提高整个模型的预测准确率.研究表明,两层结构的Stacking模型既能强化学习效果又不会导致模型的复杂化 .因此,本研究构建基于两层Stacking集成学习的碳足迹预测模型,其结构如图1所示.项康利,等:基于Stacking集成学习的福建省火电行业碳足迹情景预测C
12、EEGGE;EGP=Z(M,NSTRP)XGP559(1)3(2)i=1初级学习器1初级学习器2初始数据集预测1预测2初级学习器n预测n第一层:初级学习图1Stacking集成学习的模型结构Fig.1 Structure of the Stacking ensemble learning modelhttp:/碳排放元学习器预测元数据集第二层:元学习 5602.2Stacking集成学习模型的构建流程基于Stacking集成学习的碳排放预测模型流程如下:1)确定初级学习层.初级学习器可以根据“好而不同”的原则确定,考虑从机器学习中的符号主义、连接主义和统计学习中常见的K近邻(k-nearest
13、 neighbor,K NN)、线性回归(linear regression,L R)、BP神经网络、决策树(decision tree,D T)、支持向量机(supportvector machine,SVM),以及基于串、并集成代表的随机森林(random forest,R F)、自适应提高算法(adaptiveboosting,A d a Bo o s t)、梯度提升决策树(gradientboostingdecision tree,G BD T)和极限梯度提升树(extreme gradient boostin,XG Bo o s t)中筛选.分别训练以上9种机器学习模型,并以R和MA
14、PE作为评价指标,以衡量各个模型的预测能力.2)确定元学习层.在已确定的初级学习层基础上,将以上9个学习器分别作为元学习器进行R和MAPE评价指标的对比分析,确定元学习器,形成Stacking集成学习预测模型结构.3)应用收集的数据集训练Stacking集成学习模型,实现碳足迹预测.3学习器的基本原理3.1线性回归LR是一种广义线性模型 12 .具有计算速度快、显示性强等特点.LR的计算公式为式中:P为预测结果;X(i=1,2,n)为自变量;为逻辑回归系数.3.2梯度提升决策树GBDT是基于Boosting串行集成代表,在计算过程中通过基函数线性组合不断减少残差,达到数据回归(分类)的目的 1
15、6 .算法步骤如下:1)假设GBDT的数据集为D=(1,yi),(2,y2),(n,y n)。估计一个使损失函数极小化的常数值c,初始化模型可表示为(4)=1式中:f(x)为初始化模型;L(yi,c)为损失函数;c为常数.2)迭代环节.首先构建M棵树,对样本i=1,2,n 计算损失函数的负梯度为afm-1(x,)式中:m为负梯度,亦为残差.3)利用(xi,m)拟合第m棵回归树,得到第m棵树的叶子节点区域Rm(j=1,2,Jm),Jm为第m棵回归树的叶子节点数.计算每个叶子节点的最佳拟合值,使损失函数极小化.(6)x;eRmj式中:y:为第j个叶子节点的样本x,观测值;fm-1(x.)为第j个叶
16、子节点的样本x;在上一棵树上的预测值;cm为第j个叶子节点的y;与fm-(x)之间的最小误差.4)更新本轮模型为(xE5)进行迭代,直到达至所预期的基学习器个数,得到最终的强学习器F(X)为MmF(X)=fo(x)+Z2cmlmjm=1 j=13.3极限梯度提升树不同于GBDT,XCBo o s t 在更新学习器的过程中采用了二阶泰勒展开,可快速且精确地实现学习器的迭代 14.XGBoost 通过多棵决策树的预测结果相加得到最终预测结果,其表达式为福州大学学报(自然科学版)eP=fo(x)=arg,min Z L(yi,c)aL(yi,fm-I(x,)TmiCm=arg min Z L(yi,
17、fn-I(x;)+c)mhttp:/第51卷(3)(5)1,x;在 Rm 上(7)(o,x;不在Rm上(x Rm)(8)第4期式中:为预测结果;f表示第1棵树;L为决策树数量;x,表示第j个输人样本;F为树模型集合.模型所采用的目标函数和正则项为(10)j=1TQ(f.)=T+20=1式中:0)为构建第t棵树的目标函数;L)为损失函数;-1为前t1棵树计算的预测值;c为常数;Q(f.)为第t棵树的正则项;入和和为正则项系数;T为某棵树所有叶子节点的数量;w。为某棵树中第0个叶子节点的权重。对式(10)泰勒展开得0 言(y,/-1)+g.f(a)+hij;(a)+0(f)+cg,=,(t-1)(
18、y,3/-),h,=;(t-1)(y,)/-1)式中:所有h,的和为所需调节的叶子节点最小样本权重之和.4基于Stacking集成学习的碳足迹预测算例分析基于Stacking集成学习的碳足迹预测方法技术路线图如图2 所示.本研究以福建省火电行业为例,其碳足迹预测主要分为3个阶段,数据集获取、Stacking集成学习模型构建和情景分析.扩展Kaya恒等式数据集获取影响因素数据碳排放量数据个碳排放系数法4.1数据集来源4.1.1影响因素的数据来源基于扩展Kaya恒等式分析得出6 个影响火电碳排放因素,包括:人口规模(常驻总人口P、城镇化水平L)、经济产出R、产业结构T、能源消费结构N和能源消费强度
19、S.参考统计年鉴151(2 0 0 5一2 0 2 0)可以直接或者间接计算出2 0 0 5一2 0 2 0 年间的6 个影响因素数值.4.1.2碳排放量的数据测算将福建省火电行业的煤、石油、天然气消耗所排的二氧化碳作为碳排放总量,采用碳排放系数法计算,其中,M,可由2 0 0 6 IPCC国家温室气体清单指南 19 获得.碳排放总量计算式为(14)i=1i=14.2Stacking集成学习模型的构建4.2.1模型评价指标以R?和MAPE作为评价预测模型性能优劣的指标,R值越接近1,MAPE值越接近,模型的预测精度越高.R和MAPE(M A PE以EMAp表示)的表达式分别为项康利,等:基于S
20、tacking集成学习的福建省火电行业碳足迹情景预测00=L(y,/-)+J.(a,)+(f.)+cStacking不同发展集成学习评价指标模型构建元学习器图2 算例分析技术路线Fig.2 Technical route of case analysis344C=Z C.=ZE:M,12http:/ 561=f(x,)L初级学习器3(fi=F)(9)(11)(12)(13)基准场景产业优化情景情景下碳排放预测技术突破情景低碳情景 562福州大学学报(自然科学版)2(3-y.)2m第51卷(16)i=1R2mi=1式中:m为测试样本数;,为测试样本预测值;y为实际值;ymean为m个样本实际值的
21、平均值。4.2.2初级学习器的选取以2 0 0 5一2 0 2 0 年的6 个碳排放影响因素为特征变量,碳排放量为目标变量构成数据集,并按7:3比例划分为训练集和测试集,采用K折交叉验证及网格参数寻优的方法,分别建立上述9个学习器的碳足迹预测模型,结果如图3所示.2.5一真实值RF预测值2.322.11.91.71.51.31.120062008201020122014201620182020(a)RF预测结果2.5真实值GBDT预测值2.322.11.91.51.31.120062008201020122014201620182020(d)GBDT预测结果2.5真实值AdaBoost预测值2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Stacking 集成 学习 福建省 火电 行业 足迹 情景 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。