基于HW-EEMD-SVM模型的民航客运量预测.pdf
《基于HW-EEMD-SVM模型的民航客运量预测.pdf》由会员分享,可在线阅读,更多相关《基于HW-EEMD-SVM模型的民航客运量预测.pdf(16页珍藏版)》请在咨信网上搜索。
1、数量经济研究The Journal of Quantitative Economics第 14 卷 第 2 期Vol.14 No.22023 年2023基于 HW-EEMD-SVM 模型的民航客运量预测李 轩1 周新苗2 吴晓峰3*(1.东北财经大学 公共管理学院,辽宁 大连 116000;2.宁波大学 商学院,浙江 宁波 315211;3.北京交通大学 经济管理学院,北京 100044)摘要:作为国民经济和社会发展的重要行业之一,民用航空业在交通运输领域有着重要的作用。本文在把握中国民航客运量数据特征的条件下,基于集成组合预测的思想,将传统时间序列预测方法与机器学习相结合,利用 EEMD 方
2、法建立了一个 HW-EEMD-SVM 误差修正组合预测模型。之后,选取 2008 2019 年的中国民航客运量月度数据作为考察样本进行建模及验证模型预测效果,并将之与 HW 模型、BP 模型、SVM 模型、EEMD-BP 模型、EEMD-SVM 模型、HW-EEMD-BP 模型的预测效果进行比较,结果表明本文所选的组合预测模型可以为中国民航客运量波动特征下的数据变化趋势提供较为有效的预测。最后,本文还对疫情发生以来中国民航客运量的变化情况进行了影响分析,对疫情可能造成的冲击进行了量化测算。关键词:民航客运量 集成经验模态分解 支持向量机 组合预测中图分类号:F562.3 文献标识码:A*作者简
3、介 李轩(1998-),女,内蒙古呼伦贝尔人,东北财经大学公共管理学院博士研究生,研究方向为行政管理。周新苗(1977-),通讯作者,女,浙江宁波人,博士,宁波大学商学院教授,研究方向为绿色金融、金融风险、数量经济学。吴晓峰(1991-),男,河北邢台人,北京交通大学经济管理学院博士研究生,研究方向为数量经济与技术经济。Forecast on Passenger Traffic Volume of CivilAviation Based on HW-EEMD-SVM ModelLi Xuan1 Zhou Xinmiao2 Wu Xiaofeng3(1.School of Public Admi
4、nistration,Dongbei University of Finance andEconomics,Dalian 116000,China;2.Business School,Ningbo University,Ningbo 315211,China;3.School of Economics and Management,Beijing Jiaotong University,Beijing 100044,China)Abstract:As one of the important industries of national economic and social developm
5、ent,civil aviation industry has developed rapidly in recent years.After understanding the character-istics of passenger traffic volume data of Chinas civil aviation,based on the idea of integratedcombination forecast,this paper combines the traditional forecasting method of time series withmachine l
6、earning,and establishes a HW-EEMD-SVM error correction combination forecastingmodel,with the use of EEMD method.Then,it selects the monthly passenger traffic volumedata of Chinas civil aviation from 2008 to 2019 as the inspection sample to construct model andverify the prediction effect of the model
7、,and compares them with that of HW,BP,SVM,EEMD-BP,EEMD-SVM,HW-EEMD-BP models.The results show that the combination fore-casting model selected in this paper can provide a more effective prediction of the data changetrend underthefluctuationcharacteristicsofChinascivilaviationpassengertrafficvolume.F
8、inally,it also analyzes the impact of changes in Chinas civil aviation passenger traf-fic volume since the COVID-19 epidemic happens,and quantifies the impact it may cause.Keywords:Passenger Traffic Volume of Civil Aviation EEMD SVM CombinationForecast引 言作为国民经济和社会发展的重要行业之一,民用航空业近年来发展迅速。随着我国人民生活水平的提升
9、,民航业与经济发展的关系越发密切,民航不再只是一种传统的交通运输方式,而是在旅游需求快速增加的情况下,形成了更加复杂的产业链。民航业的运行情况对当地市场活跃度和经济发展都产生了至关重要的影响。民航旅客运091数量经济研究 输量直接影响着机场的建设、飞机的采购和航线的规划发展,更为准确地对客运量做出预测,有助于航空公司了解未来的航空出行需求,并做出相应的决策,及时有效地规划运力和时间表,更为科学地规划基础设施建设,合理开发新航线并服务潜在市场。因此,为了使航空事业在我国国民经济发展中充分发挥作用,促进航空客运快速、高效发展,同时也为民航企业的管理等相关工作提供科学依据,十分必要开展对民航客运量的
10、研究与预测(张蕾,2019)。目前,国内外学者已在航空客运量预测方面做了大量的工作,使用的预测模型或方法不尽相同,传统的时间序列分析方法有自回归移动平均模型(autoregressive inte-grated moving average model,ARIMA 模型)(Bohyoun et al.,2017;Suk,2019;Kim etal.,2019;Suk,2018)、指数平滑(Holt-Winters,HW)模型等(Dantas et al.,2017;Sharma et al.,2019)。Lee 等(1999)比较了四种时间序列模型在短期高速公路交通量预测中的表现。结果表明,A
11、RIMA 模型在他们的实证研究中提供了最稳定和准确的结果。随着人工智能的发展,神经网络(back propagation,BP)和支持向量机(supportvector machines,SVM)的方法得到了推广和应用(Xie et al.,2014;Sun et al.,2019)。随着技术手段的发展和多学科融合方法的成熟,学者对波的拆分有了更深入的研究,预测方法也不再局限于原始序列。由于单一模型的预测效果具有随机性和不稳定性的特点,越来越多的学者倾向使用组合预测的方法对交通运输客运量进行预测(梁小珍等,2020)。Xiao 等(2014)提出了一种新的混合方法,基于自适应网络的模糊推理系统
12、(ANFIS)和改进的粒子群算(IPSO)方法的结合,将奇异频谱分析(SSA),用于短期航空客运需求分析。实证结果表明,他们使用的模型在航空运输需求预测分析中具有巨大的潜力。Jin 等(2020)建立了 VMD-ARMA/KELM-KELM 模型试图解决对航空客运需求的预测问题,并引入了北京、广州和浦东机场的旅客需求以测试其性能。结果表明,就准确性和稳健性分析而言,该模型比其他基准模型具有更明显的优势,因此可以用于航空客运需求预测。Xu 等(2019)提出了一种 SARIMA-SVR模型来预测航空业中的统计指标,该模型可用于以后的容量管理和规划。此模型首先由 SARIMA 模型分析时间序列,然
13、后反向计算高斯白噪声。他们构建了四种混合模型并将之应用于预测航空业的未来统计指标。实证结果证明 SARIMA-SVR3 比其他方法预测效果更优,并证明了采用高斯白噪声能够增强预测的准确性。目前,专家学者对交通客流量预测方法进行了大量研究和改进(周建红等,2020;张健等,2020)。Rodriguez-Deniz 等(2022)为了研究相关网络组成部分的时间演化,揭示直接检查数据不容易发现的复杂依赖关系,提出了一种最先进的概率潜在网络模型来预测交通运输中日益常见的多层动态图,并提出了基于社区的扩展以减少计算负担。通过潜在高斯过程对顶点之间的边概率进行建模,得到柔性时间序列。研究利用美国航空运输
14、系统内四家主要航空公司的 10 年样本数据,发现来自模型的估计潜在参数与航空公司的连通性动态相关。Korkmaz 和 Akgungor(2021)应用花卉授粉算法(FPA)、人工蜂群算法(ABC)、乌鸦搜索算法(CSA)、磷虾群算法(KH)和蝴蝶优化算法(BOA)五种不同的元启发式算法,建立了不同的预测模型,对土耳其的航空191基于 HW-EEMD-SVM 模型的民航客运量预测 运输需求进行预测。在建立模型时,选择了燃料价格、人均国内生产总值、座位容量和年燃料消耗作为模型参数。研究结果表明,虽然使用不同方法开发的每个模型都适用,但使用 CSA 开发的二次型和幂型模型表现出最强的性能。另外,研究
15、结果将有助于评价目前的投资计划和制定满足需求的战略计划,帮助航空公司引入一些必要的规定,以确保收入和费用的平衡,提高航空公司的效率。Gudmundsson 等(2021)预测了经济冲击的强度与世界航空运输业的复苏时间之间的关系,研究结果认为全球客运需求恢复到新冠疫情发生前的水平估计需要 2.4 年(到 2022 年底恢复),最乐观的估计需要 2 年(到 2022 年中恢复),最悲观的估计需要 6 年(到 2026 年恢复)。世界各地区差异较大,亚太地区估计平均恢复时间最短,为2.2 年,其次为北美2.5 年,欧洲2.7 年。另外,与客运需求相比,航空货运需求的全球平均恢复时间较短,为 2.2
16、年。在区域层面,欧洲和亚太地区平均复苏时间相近,而北美预计复苏更快,时间为 1.5年,不同来源的经济冲击以可预测的短暂方式影响客货运量的线性增长和行业的复苏时间。近年来,以经验模态分解为代表的数据分解预测集成的组合预测方法已被广泛应用于多个领域,然而,虽然它们对数据的拟合程度较高但预测效果仍有待改进。为此,本文利用 EEMD 方法构建了误差修正组合预测模型,即将传统时间序列预测方法与机器学习方法相结合(吴晓峰等,2021),在传统时间序列预测方法的基础上,引入 EEMD 方法,将初始预测得到的误差分解成不同频率的模态分量,运用 SVM 方法对这些分量的合成项进行拟合训练,并合成得到误差的预测项
17、,用它来修正初始预测值。该模型使用 EEMD 误差修正的方法解决了误差趋势逐渐增强的问题,从而提高了预测精度。选取2008 2019 年中国民航客运量月度数据进行实证分析,并将该方法与多种方法的预测效果进行对比,实证结果充分体现了本文构建的模型对预测中国民航客运量的适用性及优越性。最后,还对疫情发生以来中国民航客运量的变化进行了影响分析。1 模型设计1.1 集成经验模态分解(EEMD)1998 年,Huang 等人提出了基于瞬时频率信号处理的经验模态分解(empiricalmode decomposition,EMD)方法(梁小珍等,2017;涂锦等,2020;Huang et al.,199
18、8)。从本质来说,该方法是对一个原始信号进行平滑处理的过程,在这个过程中,按照一定的要求,逐级分解、筛选出原始数据序列中本就存在的、不同时间尺度的波动或趋势,生成一系列具有不同波频的数据序列。每个序列都称为一个本征模态函数(intrinsic mode function,IMF),最低频率的 IMF 称为残余项 rn,包含原始数据的趋势或平均值的信息,通过对该残余项和主本征模态函数的综合判断,可以得到原始信号的趋势、走向等信息。每一个 IMF 都突出了原始数据序列的局部特征,具有明显的物理意义,如最高频率的 IMF 携带了最多的原始数据序列信息,称之为主本征模态函数。291数量经济研究 通过
19、EMD 方法分解得到的每一个 IMF 可以是线性的也可以是非线性的,但都必须符合以下条件:(1)原始数据序列曲线的极值点(极大值点、极小值点)和与横坐标交叉点的数量相同或至多差一个;(2)在任何时候,极大值点定义的上包络线和极小值点定义的下包络线的平均值为零,信号的上下包络线围绕时间轴对称。分解结果如式(1)所示:x(t)=ni=1ci(t)+rn(t)(1)式中,ci(t)代表原始信号的若干个 IMF。传统的 EMD 方法存在一定的缺陷。表现为在 EMD 分解过程中首先要获取数据序列局部的极大、极小值点,然后利用三次样条线将这些点连接形成包络线,从而得到均值曲线即 IMF。但是在这个过程中,
20、一个 IMF 中可能含有不同频率的波形或相同频率的波形,同样的,相同频率的波形也可能出现在不同的 IMF 中,这会在一定程度上使得到的拆分波携带有噪声的信息。集合经验模态分解(ensemble empirical mode de-composition,EEMD)是由 Wu 和 Huang(2011)提出的一种数据分析方法,它利用噪声作为辅助条件来弥补 EMD 方法的不足。EEMD 在待分解信号中加入白噪声以平滑异常事件,并利用白噪声声谱的均匀分布将不同时间尺度的信号自动分布到合适的参考尺度,同时利用白噪声的零均值特性进行多次平均,使噪声相互抵消,从而抑制甚至完全消除噪声的影响。EEMD 在本
21、质上是一种叠加了高斯白噪声的多重的 EMD 分解,在体现波动分解方法能够深度挖掘原始数据序列信息的优点基础上,既能尽可能保留原始数据序列的有效信息,也能消除原本存在的模式混合问题。EEMD 分解的具体步骤如下。(1)在原始信号 x(t)中多次加入服从正态分布的白噪声 ni(t),即:xi(t)=x(t)+ni(t)(2)式中,xi(t)是加入 i 次白噪声后的最新、待分解原始信号波。(2)对得到的多个新序列 xi(t)分别进行 EMD 分解,得到 i 组含有 k 的 IMF 组合,记为 cij(t)(j=1,2,k),残余项记为 ri(t)。(3)将得到的 IMF 进行总体平均处理,以消除高斯
22、白噪声的影响,最终得到 EE-MD 分解后的 IMF cj(t),即:cj(t)=1MMi=1cij(t)(3)1.2 Holt-Winters 模型指数平滑(HW)模型是由 Brown 提出的并经过多年发展已经比较成熟的时间序列预测模型(桂文林,2011)。HW 模型一般分为无季节模型、加法模型和乘法模型三类,本文采用了在航空客运量预测方面较为常用的 HW 乘法模型作为时间序列预测模型进行预测,其结构如下:391基于 HW-EEMD-SVM 模型的民航客运量预测 Ft+k=(At+Btk)St+k-sAt=yt/St-s+(1-)(At-1+Bt-1)Bt=(At-At-1)+(1-)Bt-
23、1St=yt/At+(1-)St-s(4)式中,Ft+k代表 yt在第 t+k 期的预测值,St代表季节因子,s 代表季节长度。1.3 支持向量机(SVM)原理SVM(support vector machines)是由 Cortes 和 Vapnik(1995)提出的既可以解决分类问题,也可以用来解决回归问题的基于统计学理论的机器学习方法。它的机理是通过构造一个超平面来实现样本之间的划分,而 SVM 的核心要义就是构造一个最优超平面,使得两类样本与超平面之间的最短距离最大化。其训练集是 xi,yi,其中 xiRD(xi包含 D 个特征属性),i=1,2,n,是 n 个 D 维向量,yiRD,
24、F=f f:RDR。因此,SVM 的优势在于,对于无法满足线性可分要求的非线性分类问题,SVM 可以将低维的原始训练样本数据映射到一个高维空间,以做到线性可分。如下条件:yi(xi+b)-1+i0,i0,i=1,2,n(5)i称为松弛变量,当 0 i1 时,表示样本 xi的分类是正确的;当 i1 时,表示样本xi的分类是不正确的。为此,在最小化目标122中加入惩罚项 Cni=1i,引入以下目标函数:(,)=122+Cni=1(6)C 表示惩罚因子,用于平衡松弛变量和分类间隔大小,并控制异常样本的容忍度。C 越大,表明对该项的重视程度越高,对异常样本的容忍度越低。这样一来,求解分类样本与超平面之
25、间的最短距离最大化问题就转化成了解决如下最优化问题:min122+Cni=1s.t.yi(xi+b)-1+i 0,i 0,i=1,2,n(7)上式的解为最优最终判别函数:f(x)=sgnni=1a*yiK(xi,x)+b*(8)K(xi,x)为核函数,核函数的作用包括:(1)将低维的原始训练样本数据映射到一个高维的空间,来保证非线性数据可以做到线性可分;(2)维度上升会使样本之间内积计算的复杂度提高,而它的另一个作用就是在高维空间中,仍然使其计算量是低维容量,但输出还是能保证在高维空间。本文选用径向基函数作为核函数:491数量经济研究 K(xi,x)=exp-xi-x22 ,i=1,2,n(9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 HW EEMD SVM 模型 民航 客运量 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。