分享
分销 收藏 举报 申诉 / 13
播放页_导航下方通栏广告

类型R语言在时间序列中的应用.doc

  • 上传人:快乐****生活
  • 文档编号:4330360
  • 上传时间:2024-09-06
  • 格式:DOC
  • 页数:13
  • 大小:208.01KB
  • 下载积分:8 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    语言 时间 序列 中的 应用
    资源描述:
    时间序列分析在人口预测问题中的应用 摘 要 时间序列分析是研究动态数据的动态结构和发展变化规律的统计方法。以 1949 年至 2004 年中国大陆人口自然增长率为例, 用时间序列分析和统计学软件R建立模型, 并对人口进行预测, 取得较好的效果。说明时间序列分析在人口预测问题上是有效的。 关键词: ARMA 模型; R软件; 平稳性; 可逆性 Application of time series analysis in population prediction Abstract Time series analysis is a statistic method studying dynamic structure of dynamic data and the law of de-velopment and change. Based on the example of population growth rate between 1949 and 2004 in the mainlandof China, mathematic models were established with time series analysis method and statistic software R,and population was predicted with it. It received a good result. Therefore the application of time series analysisis effective in population prediction. Key words: ARMA model; R software; stability; invertibility 一.时间序列概述 1. 概念 所谓时间序列就是按照时间的顺序记录的一列有序数据。对时间序列进行观察、研究.找寻它变化发展的规律.预测它将来的走势就是时间序列分析时间序列分析有着非常广泛的应用领域。 2. 定义 在统计研究中.常用按时间序列排列的一组随机变量 …,,… 来表示一个随机事件的时间序列.简记为或。 3. 主要分析方法 时间序列分析方法主要有描述性时序分析和统计时序分析。 描述性时序分析主要通过直观数据比较或绘图测绘.统计时序分析主要有频域分析方法以及时域分析方法。常用的是时域分析法.时域分析法的基本思想是源于事件的发展通常具有一定的惯性.这种惯性用统计语言来描述就是序列值之间存在一定的相关关系.而这种关系具有某种统计规律。我们分析的重点就是找寻这种规律.选取合适的数学模型拟合.进而预测该事件发展走向。 4. 研究意义 事件序列分析具有现实意义.在金融经济、气象水文、信号处理、机械振动等众多领域具有广泛的应用。 二.时间序列的预处理 通常得到一个观察值序列后首先要对其进行平稳性以及纯随机性进行检验。根据检验结果的不同我们有不同的处理方法 1. 平稳性 时间序列的平稳性分为严平稳与宽平稳 (1)严平稳定义 设一时间序列。对任意整数.任取.对任意整数.有.则称序列为严稳序列。其中为分布函数。 (2)宽平稳定义 如果满足:①任取.有; ②任取.有.为常数; ③任取.且.有; 则称为宽平稳序列。其中表示与的自相关系数。 (3)平稳性的检验 平稳性检验主要有时序图检验以及自相关图检验。 2. 纯随机性 (1) 纯随机性定义 如果时间序列满足以下性质: ① 任取.有.为常数; ② 任取.有 则称序列为纯随机序列.也称为白噪声(white noise)序列。 (2) 纯随机性检验 构造检验统计量.主要是Q统计量以及LB统计量。 三.时间序列分析的主要方法及模型 1. 平稳时间序列分析的模型 (1) AR模型(auto regression model) 具有如下结构的模型称为p阶自回归模型.记为AR(p): (2) MA模型(moving average) 具有如下结构的模型称为q阶移动平均模型.记为MA(q): (3)ARMA模型(auto regression moving average) 具有如下结构的模型称为自回归移动平均模型.记为ARMA(p,q): 若.该模型称为中心化ARMA(p,q)模型。 2. 非平稳序列分析 事实上在自然界中绝大部分序列都是非平稳的.因而对非平稳序列的分析更普遍更重要。 对非平稳时间序列的分析法通常分为确定性时序分析和随机时序分析。这里简要介绍常用确定性时序分析方法。 (1) 趋势分析 有些时间序列具有非常显著的趋势.我们分析的目的就是要找到序列中的这种趋势.并利用这种趋势对序列对序列的发展做出合理的预测。 (2) 季节效应分析 在日常生活中我们可以看到许多有季节效应的时间序列.如四季气温等等。凡是呈现出固定的周期性变化的时间.我们都称其有季节效应。 (3) 综合分析 既有趋势起伏变动又有季节效应的复杂序列的分析方法.常用模型有: ① 加法模型 ② 乘积模型 ③ 混合模型 a. b. 式中.代表序列的长期趋势波动;代表序列的季节性(周期性)变化;代表随机波动。 3. 非平稳序列的模型 事实上.许多非平稳序列差分后会显示出平稳序列的性质.称之为差分平稳序列。对差分平稳序列可以用ARIMA模型拟合。 具有如下结构的模型称为求和自回归移动平均(autoregressive integrated moving average)模型.简记为ARIMA(p,d,q)模型: 式中: ;.为平稳可逆ARMA(p,q)模型的自回归系数多项式;.为平稳可逆ARMA(p,q)模型的移动平滑系数多项式;{}为零均值白噪声序列。 由上式可知ARIMA模型的实质就是差分运算与ARMA模型的组合。 当序列具有非常显著的确定性趋势或季节效应时.人们会怀念确定性因素分解方法对各种确定性效应的解释.但又因为它对残差信息的浪费而不敢轻易使用。为了解决这个问题人们构造了残差自回归(auto-regressive)模型。 Auto-Regressive模型的构造思想是首先通过确定性因素分解方法提取序列中主要的确定性信息: 式中.为趋势效应拟合.为季节效应拟合。 考虑到因素分解方法对确定性信息的提取可能不够充分.因而需要进一步检验残差序列的相关性。如果检验结果显示残差序列自相关性不显著.说明确定性回归模型对信息提取比较充分.可以停止分析。如果检验结果显示残差序列自相关性显著.这时可以考虑对残差拟合自回归模型.进一步提取相关信息: 这样构造的模型: 称为残差自回归模型。 四.实例 本文以中国大陆人口自然增长率(1949—2004年)为样本进行分析,数据(数据来自2005年统计年鉴)见表1。 表1中国大陆人口自然增长率 年份 人口自然增长率 % 1940 16 1950 19 20 20 23 24 20.32 20.5 23.23 17.24 10.19 1960 -4.74 3.78 26.99 33.33 27.64 28.38 26.22 25.53 27.38 26.08 1970 25.83 23.33 22.16 20.89 17.48 15.69 12.66 12.06 12 11.61 1980 11.87 14.55 15.68 13.29 13.08 14.26 15.57 16.61 15.73 15.04 1990 14.39 12.98 11.6 11.45 11.21 10.5 10.42 10.06 9.14 8.18 2000 7.58 6.95 6.45 6.01 5.87 第一步:原数据的平稳性检验 为判断一个序列是否平稳.我们主要通过时序图以及自相关图进行检验。因为用到ARIMA模型的拟合和检验.所以在程序的开头会载入tseries。 首先绘出时序图、自相关图、偏自相关图(如下): 图1 原数据的时序图、自相关图、偏自相关图 通过观察时序图.序列有递减趋势.所以我们基本可以判断该序列非平稳。 第二步:差分并检验新序列的平稳性.完成序列的定阶 图2 1阶差分后的时序图、自相关图、偏自相关图 为了增加说服力.我们再次使用单位根检验对1阶差分后的的序列进行验证。结果如下: Augmented Dickey-Fuller Test data: d Dickey-Fuller = -4.8992, Lag order = 3, p-value = 0.01 alternative hypothesis: stationary Warning message: In adf.test(d) : p-value smaller than printed p-value 从上可以看出.p值等于0.01.远远小于0.05.因此拒绝原假设。所以可以认定1阶差分后的序列基本平稳.模型定阶结束。 第三步:拟合模型并通过AIC准则检验 在ARIMA模型拟合过程中中.模型为一阶差分.p和q分别取0到3并依次验证.取AIC值最小者。 P Q AIC 0 1 308.89 0 2 309.62 0 3 303.79 1 0 319.71 1 1 310.5 1 2 304.96 1 3 305.31 2 0 305.87 2 1 307.67 2 2 305.57 2 3 307.14 3 0 307.83 3 1 308.85 3 2 307.41 3 3 309.12 从上面的表格可以看出.当p取0.q取3的时候.AIC函数的值最小。因此.模型初步定为ARIMA(0,1,3)。 第四步:残差检验 图3 残差的时序图 Box-Pierce test data: r X-squared = 0.0017, df = 1, p-value = 0.9673 由于p值远大于0.05.则该序列为白燥声.故模型最终定为ARIMA(0,1,3)。 第五步:画出qq图 从qq图的效果可以看出.二者还是比较吻合的.但是右侧头部和左侧尾部偏离期望的正态分布。 第六步:预测并比较 结果如下: $pred Time Series: Start = 57 End = 58 Frequency = 1 [1] 6.646174 7.601378 $se Time Series: Start = 57 End = 58 Frequency = 1 [1] 3.521358 6.133766 因此我的未来2年预测结果分别是6.646174. 7.601378。 原论文的预测结果为: 年份 2003 2004 实际值 6.01 5.87 预测值 6.16626 5.8761 两个预测结果进行比较.略有差距.其中的原因可能是拟合的问题.也可能是软件的差异。 参考文献 [1] 王燕 应用时间序列分析.北京:中国人民大学出版社.2005 [2] 何书元 应用时间序列分析. 北京:北京大学出版社.2003 [3] Paul Teetor R语言经典实例. 北京:机械工业出版社.2013 完整的程序如下: library(tseries) pr<-read.table('D:\\1.txt') par(mfrow=c(2,2));plot.ts(pr);acf(pr);pacf(pr) d=diff(ts(pr)) par(mfrow=c(2,2));plot.ts(d);acf(d);pacf(d) adf.test(d) nihe=arima(pr,order=c(0,1,1),method="ML") nihe r=nihe$residuals plot.ts(r) Box.test(r) qqnorm(r) qqline(r) pr.fore = predict(arima(pr, order = c(0,1,3)), n.ahead =2) pr.fore 欢迎您的光临,Word文档下载后可修改编辑.双击可删除页眉页脚.谢谢!希望您提出您宝贵的意见,你的意见是我进步的动力。赠语; 1、如果我们做与不做都会有人笑,如果做不好与做得好还会有人笑,那么我们索性就做得更好,来给人笑吧! 2、现在你不玩命的学,以后命玩你。3、我不知道年少轻狂,我只知道胜者为王。4、不要做金钱、权利的奴隶;应学会做“金钱、权利”的主人。5、什么时候离光明最近?那就是你觉得黑暗太黑的时候。6、最值得欣赏的风景,是自己奋斗的足迹。 7、压力不是有人比你努力,而是那些比你牛×几倍的人依然比你努力。 . .
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:R语言在时间序列中的应用.doc
    链接地址:https://www.zixin.com.cn/doc/4330360.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork