SPSS主成分分析和因子分析.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 成分 分析 因子分析
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十章,主成分分析和因子分析,主要内容,10.1,主成分分析和因子分析简介,10.2,主成分分析,10.3,因子分析,10.1,主成分分析和因子分析简介,10.1.1,基本概念和主要用途,(,1,)基本概念,主成分分析,就是考虑各指标之间的相互关系,利用降维的方法将多个指标转换为少数几个互不相关的指标,从而使进一步研究变得简单的一种统计方法。主成分分析是由,Hotelling,于,1933,年首先提出的,是利用“降维”的思想,在损失很少信息的前提下把多个指标转化为几个综合指标,称为主成分。每个主成分均是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。,因子分析,是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的分析方法,最早是由心理学家,Chales Spearman,在,1904,年提出的,它的基本思想是将实测的多个指标,用少数几个潜在指标(因子)的线性组合表示。,10.1,主成分分析和因子分析简介,(,2,)主要用途,解决共线性问题;,评估问卷的结构效度;,寻找变量之间的潜在结构;,内在结构证实。,(,3,)常用术语,因子载荷,变量共同度,公共因子的方差贡献,10.1,主成分分析和因子分析简介,3,常用术语,(,1,),因子载荷,(,2,)变量共同度,(,3,)公共因子的方差贡献,主要内容,10.1,主成分分析和因子分析简介,10.2,主成分分析,10.3,因子分析,10.2,主成分分析,10.2.1,统计原理与分析步骤,(1),统计原理,10.2,主成分分析,(1),统计原理,10.2,主成分分析,10.2.1,统计原理与分析步骤,(,2,)分析步骤,第,1,步 原始数据的标准化处理。,第,2,步 计算相关系数矩阵。,第,3,步 计算特征值及单位特征向量。,第,4,步 计算主成分的方差贡献率和累积方差贡献率。,第,5,步 计算主成分。,10.2,主成分分析,10.2.2 SPSS,实例分析,【,例,10-1】,为了从总体上反映世界经济全球化的状况,现选择了具有代表性的,16,个国家的数据,这些国家参与经济全球化的程度指标值如下表所示。试分析一个国家参与经济全球化的程度主要受哪些因素的影响。,编号,国家,x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,1,中国,3.205,54.5,28.53,0.878,1.409,0.894,11.6,2.305,0.547,2.932,4.818,9.003,2.7,3.914,1.472,2,印度,1.449,31.1,0.279,0.339,0.272,0.1,2.7,0.128,0.193,0.825,2.318,5.127,0.6,4,0.218,3,日本,14.079,52.3,0.653,10.254,11.769,1.097,0,1.967,1.3,6.178,14.746,27.297,30.9,57.734,15.125,4,韩国,1.318,136.3,1.011,1.6,0.42,1.838,1.3,0.77,0.78,2.267,23.32,42.875,9.1,12.129,0.452,5,新加坡,0.275,739.5,3.572,27.841,0.884,13.314,28.6,0.622,0.143,1.885,169.772,319.907,54.2,917.328,0.718,6,美国,29.641,46.1,3.682,6.429,20.563,4.808,5.4,24.253,29.941,15.638,10.784,24.555,13.6,24.495,21.274,7,加拿大,2.056,101.5,0.898,8.276,2.313,5.369,10.5,2.444,5.145,3.854,34.691,67.047,15.1,21.83,1.362,8,巴西,2.434,27.1,1.584,2.327,0.962,2.905,6.8,1.953,2.3,0.857,4.716,10.101,6.7,5.498,1.104,9,墨西哥,1.567,151.4,1.657,2.837,0.797,1.471,10.9,0.67,0.212,2.186,18.485,37.986,4.5,4.887,0.468,10,英国,4.67,118.4,0.497,26.151,12.456,22.137,11.2,16.552,19.642,5.542,28.434,58.7,66.1,278.968,11.289,11,法国,4.639,120.6,1.84,9.242,4.492,10.848,8.5,8.282,5.841,5.21,28.46,54.052,29.2,56.453,8.889,12,德国,6.84,132.9,2.252,9.558,6.646,7.747,2.2,8.589,8.971,8.843,32.121,63.174,36,51.514,12.18,13,意大利,3.792,104.5,0.321,8.153,3.724,1.059,2.5,0.77,1.913,4.032,22.869,43.924,27,17.776,5.678,14,俄罗斯,1.3,58.6,1.533,1.499,0.552,0.499,2.5,0.31,0.298,0.987,7.77,12.581,1.1,2.001,0.469,15,澳大利亚,1.309,94.5,0.502,5.773,0.941,1.987,18.9,0.527,1.371,1.131,15.745,33.795,13.2,24.117,0.797,16,新西兰,0.177,110.5,0.218,7.374,0.179,3.04,31.5,0.126,0.338,0.248,23.221,47.387,19.8,41.274,0.215,10.2,主成分分析,第,1,步 分析:,从数据来看,一共有,15,个因素,但有些因素是存在相关性的,同时各因素对全球化影响的程度也是不一样的,故可采用主成分分析。,第,2,步 数据组织:,按如教材所示的“指标”一列定义变量,输入数据并保存。,第,3,步 主成分分析的设置:,按“分析降维因子分析”顺序打开“因子分析”对话框,将,x1,x15,这,15,个变量移入“变量”对话框中,并按如下所示的图形进行设置。,10.2,主成分分析,10.2,主成分分析,说明:,由于在,SPSS,中并没有完整的主成分分析过程,其主成分分析过程是集成在,“,因子分析,”,过程中的,但并不完善。由于主成分的得分需要对因子得分情况进行进一步计算,故不需设置,“,得分,”,子对话框,即不需保存因子得分情况,即使保存了,因子得分也不是各主成分得分的结果。,对于提取因子的个数问题,一般遵循两个标准,其一是累计方差贡献率在,80%,以上,其二是其特征值大于,1,。本例之所以设置为,3,,是因为通过预先分析,发现前,3,个主成分可以解释总体信息的,86.7%,。,10.2,主成分分析,第四步 因子分析的结果:,特征值和方差贡献表,成分,初始特征值,提取平方和载入,合计,方差的,%,累积,%,合计,方差的,%,累积,%,1,6.049,40.325,40.325,6.049,40.325,40.325,2,5.813,38.755,79.080,5.813,38.755,79.080,3,1.142,7.616,86.696,1.142,7.616,86.696,4,.876,5.842,92.538,5,.599,3.996,96.534,6,.326,2.174,98.709,7,.119,.796,99.505,8,.041,.272,99.776,9,.018,.121,99.897,10,.010,.063,99.961,11,.004,.027,99.988,12,.001,.009,99.997,13,.000,.002,99.999,14,.000,.001,100.000,15,4.080E-7,2.720E-6,100.000,提取方法:主成分分析。,从表中可以看出前,3,个主成分已经解释了总方差的近,86.7%,,故可以选择前,3,个主成分进行分析。,10.2,主成分分析,第四步 因子分析的结果:,主成分的碎石图,该图从另一个侧面说明了取前三个主成分为宜。,10.2,主成分分析,第四步 因子分析的结果:,旋转前的因子载荷矩阵,成分,1,2,3,x1,.407,.805,.268,x2,.596,-,.727,.209,x3,-,.147,.016,.821,x4,.895,-,.333,-,.181,x5,.614,.763,.028,x6,.826,-,.124,-,.281,x7,.273,-,.627,.184,x8,.636,.703,.041,x9,.619,.703,.008,x10,.552,.766,.196,x11,.654,-,.691,.172,x12,.666,-,.685,.166,x13,.863,-,.191,-,.297,x14,.728,-,.632,.144,x15,.579,.760,.005,提取方法,:,主成分。,a.,已提取了,3,个成分。,说明:,教材中公式,10.7,中的 是标准化正交向量,并不是,SPSS,输出“因子载荷矩阵”中的系数。而“因子载荷矩阵”中各分量的系数为单位特征向量乘以相应的特征值的平方根的结果,其公式为 。故需进一步利用因子分析的结果进行主成分分析。,10.2,主成分分析,第五步 利用因子分析的结果进行主成分分析。,10.2,主成分分析,第六步 主要结果:,编号,国家,y,1,y,2,y,3,1,中国,-,2.19,0.07,3.01,-,0.63,2,印度,-,2.56,-,0.11,-,0.46,-,1.11,3,日本,0.45,1.85,-,0.27,0.88,4,韩国,-,1.69,-,0.46,-,0.27,-,0.88,5,新加坡,5.28,-,6.26,1.19,-,0.20,6,美国,3.30,6.07,1.46,3.80,7,加拿大,-,0.43,-,0.47,-,0.31,-,0.38,8,巴西,-,1.91,-,0.06,-,0.43,-,0.83,9,墨西哥,-,1.68,-,0.68,0.03,-,0.94,10,英国,4.46,0.98,-,1.75,2.05,11,法国,0.87,0.46,-,0.52,0.49,12,德国,1.40,1.34,-,0.26,1.06,13,意大利,-,0.61,0.10,-,0.54,-,0.25,14,俄罗斯,-,2.35,-,0.20,-,0.30,-,1.05,15,澳大利亚,-,1.36,-,0.92,-,0.30,-,0.93,16,新西兰,-,0.99,-,1.73,-,0.28,-,1.09,过综合得分的高低可知各国参与国际化水平的高低,其中美国最高,印度最低。,主要内容,10.1,主成分分析和因子分析简介,10.2,主成分分析,10.3,因子分析,10.3,因子分析,10.3.1,统计原理与分析步骤,(,1,)统计原理,其中,x,1,,,x,2,x,p,为,p,个原有变量,是均值为零,标准差为,1,的标准化变量,,F,1,,,F,2,,,,,F,m,为,m,个因子变量,,m,小于,p,,表示成矩阵形式为:,10.3,因子分析,10.3.1,统计原理与分析步骤,(,2,)分析步骤,第,1,步 将原始数据进行标准化;,第,2,步 确定待分析的原有若干变量是否适合于因子分析;,第,3,步 构造因子变量;,第,4,步 利用旋转使得因子变量更具有可解释性;,第,5,步 计算因子变量的得分。计算因子得分和模型为:,j=1,2,m,10.3,因子分析,10.3.2 SPSS,实例分析,【,例,10-2】,为了研究几个省市的科技创新力问题,现取了,2005,年,8,个省市的,15,个科技指标数据,试分析一个省的科技创新能力主要受哪些潜在因素的影响?,省市,x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,北京,229,80.26,48.5,24.49,3.55,5.55,10.23,44774.45,25.02,24.1,779.24,226.01,34.42,3183.29,2.12,天冿,87,67.48,36.82,14.08,2.62,1.96,4.49,35451.77,33.59,21.38,410.34,73.15,25.06,495.78,1.82,辽宁,44,65.69,35.94,8.34,2.32,1.56,2.45,18974.2,11.29,5.57,263.35,22.32,15.21,204.98,1.78,上海,104,74.06,35.98,17.84,4.78,2.28,4.8,51485.83,39.72,19.08,654.31,112.32,15.85,1303.32,2,江苏,50,60.79,34.07,6.8,2.13,1.47,3.17,24489.18,43.13,17.99,206.68,16.6,9.14,134.89,1.41,浙江,53,63.48,31.08,5.42,3.95,1.22,1.83,27435.38,7.94,7.63,257.65,22.66,5.82,79.01,1.72,山东,30,64.59,33.22,4.44,1.81,1.05,1.59,20022.57,9.17,5.69,117.73,9.76,8.41,106.36,1.34,广东,35,69.64,37.27,5.81,3.66,1.09,2.18,24327.32,35.67,24.99,117.51,20.4,5.08,122.33,1.47,10.3,因子分析,第,1,步 分析:,如题所述,要分析一个省的科技创新能力受哪些潜在因素的影响,可用因子分析法进行分析。,第,2,步 数据组织:,建立,x1,x15,共,15,个数据变量和一个“省市”字符型变量,将北京、天津等,8,个省市作为个案数据输入并保存。,第,3,步 因子分析设置:,按“分析降维因子分析”打开“因子分析”对话框,将,x1,x15,这,15,个变量移入“变量”对话框中,表示对这,15,个变量数据进行因子分析。,10.3,因子分析,“得分”对话框的设置:单击“得分(,S,),”,按钮,弹出此子对话框,选择“保存为变量”,即将因子得分保存下来。,第,4,步主要结果及分析:,特征值与方差贡献表,可以看出前,3,个特征值大于,1,,同时这,3,个公共因子的方差贡献率占了,93.924%,,说明提取这,3,个公共因子可以解释原变量的绝大部分信息。,10.3,因子分析,旋转前的因子载荷矩阵,表的底部表明使用的是主成分分析法,,3,个主成分被抽取出来。,成分,1,2,3,x1,.973,-,.158,.052,x2,.919,.036,-,.090,x3,.883,-,.161,.334,x4,.985,-.004,-,.022,x5,.482,.497,-,.664,x6,.947,-,.242,.131,x7,.972,-,.108,.178,x8,.849,.340,-,.301,x9,.300,.834,.386,x10,.611,.637,.399,x11,.955,-,.001,-,.211,x12,.992,-,.091,-,.001,x13,.876,-,.282,.205,x14,.968,-,.156,.032,x15,.859,-,.092,-,.385,提取方法,:主成分。,a.,已提取了,3,个成分。,10.3,因子分析,旋转后的因子载荷矩阵,是按照前面设定的“方差极大法”对因子载荷矩阵旋转的结果。在表,10.10,所示未经旋转的载荷矩阵中,因子变量在许多变量上均有较高的载荷,从旋转后的因子载荷矩阵可以看出,因子,1,在,1,、,3,、,4,、,6,、,7,、,12,、,13,、,14,上有较大载荷,反映科技投入与产出情况,可以命名为创新水平因子;因子,2,在指标,5,、,8,、,15,上有较大载荷,反映地区经济发展及财政科教投入水平,可以命名为创新环境因子;因子,3,在指标,9,和指标,10,上有较大载荷,可以命名为高技术产业发展因子。,成分,1,2,3,x1,.936,.286,.130,x2,.776,.459,.202,x3,.924,.016,.251,x4,.867,.413,.221,x5,.068,.940,.180,x6,.966,.177,.095,x7,.944,.202,.235,x8,.541,.726,.327,x9,.018,.137,.956,x10,.377,.172,.876,x11,.794,.558,.118,x12,.913,.365,.161,x13,.937,.071,.084,x14,.926,.301,.119,x15,.705,.626,-,.069,提取方法:主成分。旋转法:具有,Kaiser,标准化的正交旋转法。,a.,旋转在,5,次迭代后收敛。,10.3,因子分析,因子转换矩阵表,表明因子提取的方法是主成分分析,旋转的方法是方差极大法。,成分,1,2,3,1,.884,.403,.239,2,-,.405,.400,.822,3,.236,-,.823,.517,提取方法:主成分。旋转法:具有,Kaiser,标准化的正交旋转法。,因子得分及综合因子得分情况,省市,F1,F2,F3,F,综合排序,山东,-,0.344,-,1.001,-,0.945,-,0.536,8,浙江,-,0.791,0.905,-,1.223,-,0.473,7,江苏,-,0.488,-,1.024,1.073,-,0.342,6,广东,-,0.791,-,0.104,1.202,-,0.327,5,辽宁,-,0.002,-,0.500,-,1.206,-,0.269,4,天冿,0.248,-,0.275,0.572,0.177,3,上海,-,0.136,1.947,0.481,0.366,2,北京,2.305,0.053,0.045,1.406,1,The End,第十一章,时间序列分析,主要内容,11.1,时间序列的建立和平稳化,11.2,指数平滑法,11.3 ARIMA,模型,11.4,时序序列的季节性分解,11.1,时间序列的建立和平稳化,11.1.1,填补缺失值,时间序列分析中的缺失值不能采用通常删除的办法来解决,因为这样会导致原有时间序列周期性的破坏,而无法得到正确的分析结果。,按“转换替换缺失值”打开“替换缺失值”对话框,缺失值替换示例,11.1,时间序列的建立和平稳化,11.1.2,定义日期变量,定义日期模块可以产生周期性的时间序列日期变量。使用“定义日期”对话框定义日期变量,需要在数据窗口读入一个按某种时间顺序排列的数据文件,数据文件中的变量名不能与系统默认的时间变量名重复,否则系统建立的日期变量会覆盖同名变量。系统默认的变量名有:年份,年份、季度,年份、月份,年份、季度、月份,日,星期、日,日、小时等。,按“数据定义日期”顺序打开“定义日期”对话框,定义日期变量示例,11.1,时间序列的建立和平稳化,11.1.3,创建时间序列,时间序列分析建立在序列平稳的条件上,判断序列是否平稳可以看它的均数方差是否不再随时间的变化而变化,自相关系数是否只与时间间隔有关而与所处时间无关。在时间序列分析中,为检验时间序列的平稳性,经常要用一阶差分、二阶差分,有时为选择一个合适的时间序列模型还要对原时间序列数据进行对数转换或平方转换等。这就需要在已经建立的时间序列数据文件中,再建立一个新的时间序列变量。,按“转换创建时间序列”顺序打开“创建时间序列”对话框,创建时间序列示例,11.1,时间序列的建立和平稳化,11.1.3,创建时间序列,时序图举例,按“分析预测序列图”顺序打开“序列图”对话框,时序图示例,主要内容,11.1,时间序列的建立和平稳化,11.2,指数平滑法,11.3 ARIMA,模型,11.4,时序序列的季节性分解,11.2 指数平滑法,11.2.1,基本概念及统计原理,(,1,)基本概念,指数平滑法的思想来源于对移动平均预测法的改进。指数平滑法的思想是以无穷大为宽度,各历史值的权重随时间的推移呈指数衰减,这样就解决了移动平均的两个难题。,(,2,)统计原理,11.2 指数平滑法,11.2.1,基本概念及统计原理,(,2,)统计原理,简单模型,Holt,线性趋势模型,11.2 指数平滑法,11.2.2 SPSS,实例分析,【,例,11-4】,为了研究上海市的人口情况,某研究小组提取了,1978,2004,年上海市的人口数据,其中有,3,个统计指标,即,x1,:年末人口数(万人),,x2,:非农业人口数(万人),,x3,:人口密度(人,/,平方千米),具体数据如下表所示。试用指数平滑法对上海市的“年末人口数”进行预测分析。,年份,x,1,x,2,x,3,年份,x,1,x,2,x,3,1978,1098.28,645.23,1776,1992,1289.37,875.55,2034,1979,1132.14,687.38,1830,1993,1294.74,893.46,2042,1980,1146.52,702.43,1854,1994,1298.81,910.49,2048,1981,1162.84,715.08,1880,1995,1301.37,921.7,2052,1982,1180.51,731.31,1908,1996,1304.43,932.14,2057,1983,1194.01,745.86,1930,1997,1305.46,943.03,2059,1984,1204.78,760.75,1948,1998,1306.58,953.65,2061,1985,1216.69,776.37,1967,1999,1313.12,969.63,2071,1986,1232.33,802.56,1944,2000,1321.63,986.16,2084,1987,1249.51,822.31,1971,2001,1327.14,999.07,2093,1988,1262.42,838.93,1991,2002,1334.23,1018.81,2104,1989,1276.45,855.84,2013,2003,1341.77,1041.39,2116,1990,1283.35,864.46,2024,2004,1352.39,1097.6,2133,1991,1287.2,869.88,2030,11.2 指数平滑法,第,1,步 数据组织:,将数据组织成,4,列,一列是“年份”,另外,3,列是,3,个人口数据的变量,输入数据并保存。,第,2,步 分析:,看用指数平滑法处理是否恰当。按,11.1.3,节所述创建年末人口数的时序图,如下图所示。,从此图可以看出,年末人口数呈逐年增加趋势,开始增长较快,然后变慢,近似线性趋势,也可以说呈衰减的线性趋势,或者用指数趋势描述更准确。所以选用指数平滑法进行处理。,11.2 指数平滑法,第,3,步 定义日期变量:,按,11.1.2,节所述将“年份”定义为日期变量。,第,4,步 指数平滑法设置:,按“分析预测创建模型”顺序打开“时间序列建模器”对话框。具体设置如几下几张图所示:,11.2 指数平滑法,11.2 指数平滑法,第,5,步 主要结果及分析:,模型的描述表,模型类型,模型,ID,年末人口数,模型,_1,Holt,表示对“年末人口数”变量进行指数平滑法处理,使用的是“,Holt”,模型。,模型的拟合情况表,拟合统计量,均值,SE,最小值,最大值,百分位,5,10,25,50,75,90,95,平稳的,R,方,-,.005,.,-,.005,-,.005,-,.005,-,.005,-,.005,-,.005,-,.005,-,.005,-,.005,R,方,.995,.,.995,.995,.995,.995,.995,.995,.995,.995,.995,RMSE,4.811,.,4.811,4.811,4.811,4.811,4.811,4.811,4.811,4.811,4.811,MAPE,.243,.,.243,.243,.243,.243,.243,.243,.243,.243,.243,MaxAPE,1.632,.,1.632,1.632,1.632,1.632,1.632,1.632,1.632,1.632,1.632,MAE,3.001,.,3.001,3.001,3.001,3.001,3.001,3.001,3.001,3.001,3.001,MaxAE,18.707,.,18.707,18.707,18.707,18.707,18.707,18.707,18.707,18.707,18.707,正态化的,BIC,3.386,.,3.386,3.386,3.386,3.386,3.386,3.386,3.386,3.386,3.386,包含了,8,个拟合情况度量指标,其中“平稳的,R,方”值为,0.005,,“,R,方”值为,0.995,,并给出了每个度量模型的百分位数。,11.2 指数平滑法,模型统计量表,从中可以看出模型的决定系数为,0.995,,说明拟合模型可以解释原序列,99.5%,的信息量,正态化的,BIC,值也比较小,说明模型的拟合效果是很好的,另外还给出了拟合统计量及,Ljung-Box,统计情况。此外,所有数据中没有离群值(孤立点)。,指数平滑法拟合的模型参数表,模型,预测变量数,模型拟合统计量,Ljung-Box Q(18),离群值数,R,方,正态化的,BIC,统计量,DF,Sig.,年末人口数,-,模型,_1,0,.995,3.386,5.871,16,.989,0,模型,估计,SE,t,Sig.,年末人口数,-,模型,_1,无转换,Alpha,(水平),1.000,.157,6.351,.000,Gamma,(趋势),.799,.300,2.659,.013,11.2 指数平滑法,预测表,表中给出了,2005,2009,年“年末人口”变量的预测值、上区间和下区间值。,模型,2005,2006,2007,2008,2009,年末人口数,-,模型,_1,预测,1362.36,1372.34,1382.31,1392.28,1402.26,UCL,1372.27,1392.73,1415.15,1439.30,1465.02,LCL,1352.45,1351.94,1349.47,1345.26,1339.49,对于每个模型,预测都在请求的预测时间段范围内的最后一个非缺失值之后开始,在所有预测值的非缺失值都可用的最后一个时间段或请求预测时间段的结束日期(以较早者为准)结束。,观测值与预测值的时序图,11.2 指数平滑法,数据文件中保存情况,主要内容,11.1,时间序列的建立和平稳化,11.2,指数平滑法,11.3 ARIMA,模型,11.4,时序序列的季节性分解,11.3 ARIMA,模型,11.3.1,基本概念及统计原理,(,1,)基本概念,在预测中,对于平稳的时间序列,可用自回归移动平均(,AutoRegres-sive Moving Average,ARMA,)模型及特殊情况的自回归(,AutoRegressive,AR,)模型、移动平均(,Moving Average,MA,)模型等来拟合,预测该时间序列的未来值,但在实际的经济预测中,随机数据序列往往都是非平稳的,此时就需要对该随机数据序列进行差分运算,进而得到,ARMA,模型的推广,ARIMA,模型。,ARIMA,模型全称综合自回归移动平均(,AutoRegressive Integrated Moving Average,)模型,简记为,ARIMA(p,d,q),模型,其中,AR,是自回归,,p,为自回归阶数;,MA,为移动平均,,q,为移动平均阶数;,d,为时间序列成为平稳时间序列时所做的差分次数。,ARIMA(p,d,q),模型的实质就是差分运算与,ARMA(p,q),模型的组合,即,ARMA(p,q),模型经,d,次差分后,便为,ARIMA(p,d,q),。,11.3 ARIMA,模型,11.3.1,基本概念及统计原理,(,2,)统计原理,ARMA,过程,则,ARMA(,p,q,),模型简记为,或,11.3 ARIMA,模型,11.3.1,基本概念及统计原理,(,2,)统计原理,ARMA模型的识别,设,ACF,代表,xt,的自相关函数,,PACF,代表,xt,的偏自相关函数。根据,Box-Jenkins,提出的方法,用样本的自相关函数(,ACF,)和偏自相关函数(,PACF,)的截尾性来初步识别,ARMA,模型的阶数。,具体如下表所示。,模 型,自相关函数(,ACF,),偏自相关函数(,PACF,),AR(,p,),拖尾,p,阶截尾,MA(,q,),q,阶截尾,拖尾,ARMA(,p,q,),拖尾,拖尾,11.3 ARIMA,模型,11.3.1,基本概念及统计原理,说明:,所谓拖尾是自相关系数或偏相关系数逐步趋向于,0,,这个趋向过程有不同的表现形式,有几何型的衰减,有正弦波式的衰减;而所谓截尾是指从某阶后自相关或偏相关系数为,0,。,11.3 ARIMA,模型,11.3.1,基本概念及统计原理,(,2,)统计原理,非平稳时间序列ARIMA过程,11.3 ARIMA,模型,11.3.1,基本概念及统计原理,(,2,)统计原理,季节ARIMA模型,时间序列常呈周期性变化,或称为季节性趋势。用变通的,ARIMA,模型处理这种季节性趋势会导致参数过多,模型复杂。季节性乘积模型可以得到参数简约的模型。季节性乘积模型表示为,ARIMA(p,d,q,sp,sd,sq),(或,ARIMA(p,d,q)(sp,sd,sq),k,)。其中,,sp,表示季节模型的自回归系数;,sd,表示季节差分的阶数,通常为一阶季节差分;,sq,表示季节模型的移动平均参数。如是月度资料,要描述年度特征,则,sd=12,;如是日志资料,要描述每周特征,则,sd=7,。,11.3 ARIMA,模型,11.3.1,基本概念及统计原理,(,3,),ARIMA,建模步骤,ARIMA,建模实际上包括,3,个阶段,即模型识别阶段、参数估计和检验阶段、预测应用阶段。其中前两个阶段可能需要反复进行。,ARIMA,模型的识别就是判断,p,,,d,,,q,,,sp,,,sd,,,sq,的阶,主要依靠自相关函数(,ACF,)和偏自相关函数(,PACF,)图来初步判断和估计。一个识别良好的模型应该有两个要素:一是模型的残差为白噪声序列,需要通过残差白噪声检验,二是模型参数的简约性和拟合优度指标的优良性(如对数似然值较大,,AIC,和,BIC,较小)方面取得平衡,还有一点需要注意的是,模型的形式应该易于理解。,11.3 ARIMA,模型,11.3.2 SPSS,实例分析,【,例,11-5】,表是某加油站,55,天的燃油剩余数据,其中正值表示燃油有剩余,负值表示燃油不足,要求对此序列拟合时间序列模型并进行分析。,天,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,燃油数据,92,-85,80,12,10,3,-1,-2,0,-90,100,-40,-2,20,78,-98,-9,75,65,天,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,燃油数据,80,-20,-85,0,1,150,-100,135,-70,-60,-50,30,-10,3,-65,10,8,-10,10,天,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,燃油数据,-25,90,-30,-32,15,20,15,90,15,-10,-8,8,0,25,-120,70,-10,11.3 ARIMA,模型,第,1,步 数据组织:,将数据组织成两列,一列是“天数”,另一列是“燃油量”,输入数据并保存,并以“天数”定义日期变量。,第,2,步 观察数据序列的性质:,先作时序图,观察数据序列的特点。,按“分析预测序列图”的顺序打开“序列图”对话框,将“油料量”设置为变量,并将所生成的日期新变量“,DATE_”,设为时间标签轴,生成如下图所示的时序图。,可以看出数据序列在,0,上下振荡,且无规律,可能是平稳的时间序列。,11.3 ARIMA,模型,再做自相关图和偏自相关图进一步分析。,按“分析预测自相关”顺序打开“自相关”对话框,并在“输出”选项组中将“自相关”和“偏自相关”同时选上,输出结果如下面两图所示。,从上左图可以看出,自相关函数呈现出比较典型的拖尾性,说明数据自相关性随时间间隔下降。从上右图可以看出,除了延迟,1,阶的偏自相关系数在,2,倍标准差范围之外,其他除数的偏自相关系数都在,2,倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列偏自相关函数,1,阶截尾。,综合该序列自相关函数和偏自相关函数的性质,根据前表的模型识展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




SPSS主成分分析和因子分析.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12558767.html