![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于SARIMA和ARIMA-GARCH模型的共享单车用户量预测——以哈啰出行为例.pdf
《基于SARIMA和ARIMA-GARCH模型的共享单车用户量预测——以哈啰出行为例.pdf》由会员分享,可在线阅读,更多相关《基于SARIMA和ARIMA-GARCH模型的共享单车用户量预测——以哈啰出行为例.pdf(4页珍藏版)》请在咨信网上搜索。
1、THE BUSINESS CIRCULATE|商业流通MODERN BUSINESS现代商业46基于SARIMA和ARIMA-GARCH模型的共享单车用户量预测以哈啰出行为例董敏1娄峰21.中国社会科学院大学应用经济学院北京1024882.中国社会科学院数量经济与技术经济研究所北京100732摘要:共享单车作为共享经济中典型的商业创新模式,成为公共交通的重要补充,近年来蓬勃发展。哈啰出行是当前共享单车行业市场占有率最高的企业,本文采取哈啰出行月活跃用户量(MAU)数据,分别建立 SARIMA和 ARIMA-GARCH 模型预测其用户规模,研究发现两个模型的 MAPE 值均小于 5%,预测偏差较
2、小,预测效果较好,其中 ARIMA-GARCH 模型更好地捕捉到了月活跃用户量的波动聚集特征,取得了更高的预测精度,能更好地反映短期内共享单车用户规模的变化。本文为共享单车企业及相关政府部门预测用户规模变动提供了科学有效的方法,最后从共享单车企业和政府两方面提出针对性建议。关键词:共享单车;月活跃用户量;SARIMA 模型;ARIMA-GARCH 模型;哈啰出行中图分类号:F272.1文献识别码:A文章编号:1673-5889(2023)17-0047-04一、引言随着城市化进程的加快,交通拥堵已成为困扰城市的普遍难题。根据国家统计局数据,2021 年全国民用汽车拥有量已达 2.9亿辆,比 2
3、015 年增加 1.3 亿辆,年平均增长率达 10.4%。高速增长的汽车保有量引发了道路拥堵、空气污染等一系列问题。共享单车的普及在一定程度上能减少交通拥堵,解决用户出行“最后一公里”的问题,其出行方式绿色环保、低耗能、零排放,在城市慢交通体系中发挥了积极的作用。自 2014 年首个共享单车项目 ofo 小黄车诞生开始,共享单车迅速在中国众多城市推广开来,出行量和用户量迅速增长。新冠疫情期间,由于公共交通对乘客出行的限制,共享单车也成为满足公共出行需求的重要保障。2020 年末,共享单车已在全国 360 多个城市投入运营,投入车辆达到 1945 万辆,日均订单量超过 4570 万单。但共享单车
4、也面临着企业为抢夺市场过度投放、对调度与运营管理不善、车辆无序停放占道、车损高、坏车多等问题。在经历快速扩张与洗牌阶段之后,共享单车行业已进入精细化、智能化运营时期,对于出行需求进行科学预测,有助于综合衡量车辆投放与使用效率的问题,并减缓过量投放带来的负面影响。本文通过分析共享单车的用户规模数据,并运用模型进行预测,能为企业和政府制定政策提供相应的依据。二、文献综述国外学者在共享单车政府政策、定价策略、需求影响因素、模型预测等方面的文献较为丰富。Pucher 等(2010)1等研究了政策在鼓励公共自行车骑行方面的关键作用,基础设施、土地使用规划、对汽车的使用限制等干预政策可促进骑行出行量的快速
5、增长。Suzuki 和 Nakamura(2017)2介绍了日本公共自行车的现状和发展策略,指出应在人口密集的城市增设共享单车停放点,对于私人及公共自行车停放区域应实行混合管理模式。Pfrommer 等(2014)3研究了车辆动态分布与网络价格激励结合系统,通过实时变动的价格激励消费者将车辆停放在未充分利用的站点,来降低运维人员的运营成本。Raux 等(2017)4学者采用离散选择模型研究了影响注册成为公共自行车会员的因素,更高的社会经济地位以及更便利的站点位置均对成为会员起到积极作用。在模型预测方面,Kaltenbrunner 等(2010)5运用 ARMA 模型对巴塞罗那社区可用的公共自行
6、车数量进行了预测,基于运营商网站数据,挖掘城市时间和地理的流动模式,用于预测短期内站点的可用自行车数量。Rixey(2013)6研究了美国三大公共自行车系统,指出人口密度、失业率、收入、教育水平、站点网络等对骑行量有显著的影响,给出了站点设置的建议并预测了站点的规模。国内方面对于共享单车方面的研究较为广泛且深入,包含了商业模式、共享经济、模型预测等多方面的研究。在模型预测方面,陈植元等(2021)7通过聚类分析的方法将具有相似时空属性的单位区域聚合为调度集群,在成本最小的目标函数中增加因集群划分不合理产生的惩罚成本,通过 k-means 聚类方法构建了共享单车调度路径优化模型。曹旦旦等(202
7、1)8则采用随机森林、极端随机树、支持向量机、人工神经网络、XGBoost 这 5 种机器学习方法,对共享单车短时需求量进行了预测,得出极端随机树的预测效果最优的结论。王玖河等(2021)9将共享助力车的电池配送与车辆调度相结合,通过AP 算法实现电子围栏的区域划分,在确定调度中心选址和助力车服务范围的基础上,利用遗传算法对各区域进行调度路线最小成本的求解,以减少调度所需时间及成本。徐长兴(2021)10基于北京市摩拜单车骑行数据,分析共享单车出行需求的时空THE BUSINESS CIRCULATE|商业流通MODERN BUSINESS现代商业47特征及天气等外部因素的影响,建立了基于 S
8、tacking 策略的出行需求组合预测模型以及共享单车调度路径优化模型。综上所述,国内外对于共享单车的预测,从研究方法来看,主要聚焦在机器学习方法,较少运用时间序列分析等计量经济分析方法。从使用的数据来看,较多使用模拟数据,对真实数据的运用较少。从数据的覆盖面来看,多数针对某单一城市或地区开展研究,缺乏更广泛的全国性数据。本文针对共享单车行业当前的“领头羊”哈啰出行,研究其月活跃用户量的未来增长趋势,具有较强的理论适用性和现实意义:从企业角度而言,可为共享单车企业调整经营策略、科学制定投放车量、提高车辆调度效率、降低运营成本提供决策依据;从政府角度而言,可为相关部门制定政策提供决策参考,如制定
9、与调整城市的共享单车车辆配额总量、投放点位数量等政策,推动共享单车行业实现长期可持续发展。三、共享单车出行月活跃用户量预测的模型构建(一)理论说明1.SARIMA 模型如时间序列 Xt仅存在趋势,且经过 d 阶逐期差分可以平稳,ARIMA(p,d,q)称为差分自回归移动平均模型,其中,AR 是自回归,p 为自回归过程滞后的阶数;MA 为移动平均,q 为移动平均过程滞后的阶数,d 为时间序列平稳时所做的差分次数。其公式表达为:00pqtit itit iiixcx=+(1)其中 xt是平稳序列,c 是常数,i是自回归滞后项的系数,t表示残差,i是移动平均滞后项的系数。如时间序列 Yt同时包含季节
10、和趋势,能通过逐期差分 和 季 节 差 分 使 序 列 平 稳 化,则 可 以 建 立 SARIMA 模 型(seasonalARIMAmodel),形式为 ARIMA(p,d,q)(P,D,Q)s,P 是季节自回归阶数,D 是季节性差分的阶数,Q 是季节移动平均阶数,s 表示季节性的时间跨度。模型的一般形式如下:()()()()()()11DdsssttBBBBYBB=(2)其中 (Bs)是季节自回归算子,()sB是季节移动平均算子。2.ARIMA-GARCH 模型一般情况下,ARIMA 模型的残差项 ut为高斯白噪声序列。若 ut呈现明显的条件异方差特征,可以用广义自回归条件异方差模型即
11、GARCH 模型来描述。GARCH 模型是 ARCH 模型的拓展形式,可用于调整时间序列波动中的序列相关性。GARCH 模型的一般形式为 GARCH(q,p),其公式表达为:(3)22211qptjtjit ijiu=+(4)式 中:()12,tttktxxx=x为 解 释 变 量 向 量;()12,k=为 系 数 向 量。p 为 ARCH 项 的 阶 数;q为 GARCH 项的阶数。为保证2t非负,一般要求 i 0 和j 0。GARCH(q,p)将经济变量的波动来源划分为两部分:外部冲击2t iu和变量过去的波动性2tj,而 i和 j分别反映了他们对本期变量波动的作用强度。(二)数据来源根据
12、易观千帆移动互联网产品与用户分析数据库,2022 年10 月哈啰出行在共享单车领域行业独占率为 82.05%。通过分析哈啰出行的月活跃用户量增长情况,能了解到共享单车行业的用户规模增长情况。本文选取 2017 年 1 月至 2022 年 6 月哈啰出行 App 的月活跃用户量 MAU(单位:万人)的实际月度数据,共 66 期数据,来预测 2022 年 7 月至 10 月共 4 期的数据,数据来源于易观千帆数据库。(三)建立 SARIMA 模型1.平稳化处理图1MAU的时序图对哈啰出行 App 的月活跃用户量 MAU 进行初步分析,从图1 可以看出,序列有明显的上升趋势,经 ADF 检验,结果不
13、拒绝存在单位根的假设,说明序列是非平稳的。此外,由于共享单车的季节性,用户量在冬季有明显的下滑趋势,对数据进行一阶差分和 12 步季节差分,即作 d(MAU,1,12)变换,得到新序列 DSMAU,该序列的长期趋势和季节波动已消除,经 ADF检验(如表 1 所示),在 5%的显著性水平下拒绝存在单位根的原假设,序列为平稳序列。表1MAU和DSMAU的ADF单位根检验序列t统计量5%临界值P值MAU0.516476-1.9459870.8944DSMAU-5.115706-1.9472480.00002.模型的参数估计根据 DSMAU 序列的自相关图和偏自相关图(如图 2 所示),该序列一阶自相
14、关系数和偏自相关系数显著不为零,并且数据存在一定的季节相关,其滞后 12 阶的自相关及偏自相关系数显著异于零。图2DSMAU的自相关和偏自相关图THE BUSINESS CIRCULATE|商业流通MODERN BUSINESS现代商业48通过 DSMAU 的自相关图和偏自相关图来判断模型的阶数,并通过信息函数最小准则来对月活跃用户量 MAU 进行模型选取。结果显示 ARIMA(1,1,0)(1,1,0)12模型的 AIC、SC 和 HQ统计量最小,选择该模型进一步进行残差检验。经 ADF 检验,残差序列的 t 统计量值为-6.8023,小于显著性水平为 1%的临界值-2.6102,拒绝存在单
15、位根的假设。同时观察残差序列的相关图和偏自相关图,系数均接近于 0,结合 Q 检验结果,模型残差序列不存在明显的自相关,残差序列为白噪声序列,通过检验。因此选择 ARIMA(1,1,0)(1,1,0)12模型为最佳模型,其数学表达式为:()()()()12121 0.39281 0.552311ttBBBBMAU+=()()t2.71055.0954=20.41,1.90,12.95RDWAIC=(四)建立 ARMA-GARCH 模型1.建立 ARIMA 模型原序列为非平稳序列,在不进行季节性差分的情况下,对一阶差分后的月活跃用户量序列 DMAU 进行 ADF 检验,t 值为-4.2603,P
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 SARIMA ARIMA GARCH 模型 共享 单车 用户 预测 出行
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。