分享
分销 收藏 举报 申诉 / 57
播放页_导航下方通栏广告

类型第9章-SPSS-线性回归分析PPT.ppt

  • 上传人:快乐****生活
  • 文档编号:11264855
  • 上传时间:2025-07-13
  • 格式:PPT
  • 页数:57
  • 大小:1.34MB
  • 下载积分:14 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    SPSS 线性 回归 分析 PPT
    资源描述:
    单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,9,章,SPSS,的线性回归分析,9.1,回归分析概述,9.2,线性回归分析和线性回归模型,9.3,回归方程的统计检验,9.4,多元回归分析中的其他问题,9.5,线性回归分析的基本操作,9.6,线性回归分析的应用举例,1,学习的内容与目标,掌握线性回归分析的主要指标,了解最小二乘法的基本思想,熟练掌握线性回归分析的具体操作,读懂分析结果;掌握计算结果之间的数量关系,写出回归方程,对回归方程进行各种统计检验,了解多元回归分析中自变量筛选的策略,以及对应结果的分析,了解,SPSS,残差分析和多重共线检测的基本操作,并能分析结果,2,9.1,回归分析概述,9.1.1,什么是回归分析,“回归”一词最初源于英国统计学家,F.Galton,(高尔顿)描述父亲的身高和其成年儿子身高之间的关系,发现成年儿子的身高会趋向于子辈身高的平均值,,F.Galton,称这种现象为“回归”。,用于分析事物之间的统计关系,并通过回归方程的形式描述变量间的数量变化规律,帮助人们准确把握变量受一个或多个变量的影响程度,进而为预测提供依据。,3,回归分析和相关分析,1.,相关分析,变量性质:都是随机变量且关系对等,分析方法:图表法(散点图)和相关系数,分析目的:判定变量之间相关方向和关系的密切程度,2.,回归分析,变量性质:自变量(确定型变量)和因变量(随机变量)的关系且不对等,分析方法:建立回归模型,分析目的:研究变量间数量依存关系,4,9.1.2,如何得到回归线,函数拟合,首先,通过散点图观察变量之间的统计关系,得到对回归线的感性认知,并据之确定最简洁的数学函数(回归模型);,其次,利用样本数据在一定的拟合准则下,估计回归模型中各个参数,得到确定的回归方程;,最后,由于回归参数是在样本数据的基础上得到的,存在随机性。因此需要进行各种检验。,5,9.1.3,回归分析的一般步骤,确定回归方程中的解释变量(父亲身高,x,)和被解释变量(儿子身高,y,),确定回归模型(线性与非线性),建立回归方程,并估计出模型中的参数,对回归方程进行各种检验,利用方程进行预测,6,9.2,线性回归分析和线性回归模型,观察被解释变量,y,和一个或多个解释变量,x,i,的散点图,当发现,y,与,x,i,之间呈现出显著的线性关系时,应采用线性回归分析的方法,建立,y,关于,x,i,的线性回归模型。,线性回归模型可分为:,一元线性回归模型,多元线性回归模型,7,9.2.1,一元线性回归模型(只有,1,个解释变量),数学模型为:,y=,0,+,1,x+,上式表明:,y,的变化可由,两部分解释,:第一,由解释变量,x,的变化引起的,y,的线性变化部分,即,y=,0,+,1,x,;第二,由其他随机因素引起的,y,的变化部分,即,。,0,、,1,都是模型中的未知参数,,0,为回归常数,,1,为,y,对,x,回归系数(即,x,每变动一个单位所引起的,y,的平均变动),。,称为随机误差。且满足:,E(,)=0,,,Var(,)=,2,。,8,一元线性回归方程:,E,(,y,),=,0,+,1,x,表明,x,和,y,之间的统计关系是在平均意义下表述的。,估计的一元线性回归方程:,估计方程是平面上的一条直线,即回归直线。,参数分别代表回归直线的截距和斜率。,c,b,b,1,0,+,=,y,9,9.2.2,多元线性回归模型,多元数学模型:,y=,0,+,1,x,1,+,2,x,2,.+,p,x,p,+,多元线性回归方程:,E,(,y,),=,0,+,1,x,1,+,2,x,2,.+,p,x,p,估计,多元线性回归方程,:,y=,0,+,1,x,1,+,2,x,2,.+,p,x,p,10,9.2.3,回归参数的最小二乘估计,(,ordinary least square estimation,OLSE,),估计思想:,使每个样本点(,x,i,y,i,)与回归线上的对应点(,x,i,E,(,y,i,)在垂直方向上偏差距离的二次方总和达到最小的原则来估计参数,即,,(,y,i,-E,(,y,i,),),2,=,最小,一元二乘估计,:,多元二乘估计(略),11,9.3,回归方程的统计检验,拟合优度检验,回归方程的显著性检验,回归系数的显著性检验,残差分析,12,9.3.1,回归方程的拟合优度检验,用于检验样本数据点聚集在回归线周围的密集程度,从而评价回归线对样本数据的代表程度。,思想,:因变量,y,(儿子身高)取值的变化受两个因素的影响:自变量,x,(父亲身高)不同取值的影响,其他因素(环境、饮食等)的影响。,可表示如下,:,因变量总变差,=,自变量引起的,+,其他因素引起的,即因变量总变差,=,回归方程可解释的,+,不可解释的,即,因变量总离差平方和,SST,=,回归平方和,SSA,+,剩余平方和,SSE,13,Y,i,图示:,14,15,一、一元线性回归方程,拟合优度的检验采用,R,2,统计量,称为判定系数,R,2,=SSA,/SST=1-SSE/SST,.,R,2,体现了回归方程所能解释的因变量变差的比例,;1-R,2,体现了回归方程所无法解释的变差比例。,16,R,2,越接近于,1,,则说明回归平方和占了绝大部分比例,因变量,y,的变差主要由自变量,x,的取值造成,回归方程对样本数据点拟合得好,在一元线性回归中,判定系数,R,2,=,相关系数,r,2,;,因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。,说明,17,二、多元线性回归方程,多元线性回归方程的拟合优度检验采用统计量 ,称为调整的判定系数,调整的判定系数:判定系数受解释变量,X,的个数,p,的影响,在,p,的个数不同的模型之间进行比较时,判定系数必须进行调整。,18,9.3.2,回归方程的显著性检验,用于检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关系是否恰当,即,检验模型对总体的近似程度,。,SST,=,回归平方和,SSA,+,剩余平方和,SSE,回归方程的显著性检验中采用,方差分析,的方法,研究在,SST,中,SSA,相对于,SSE,来说是否占有较大比例。如果比例较大,表明,y,与,x,全体的线性关系明显,则利用线性模型反映,y,与,x,的关系是恰当的;反之,不恰当。,19,原假设,H,0,:,1,=0.,即,:,回归系数与,0,无显著差异,利用,F,检验,构造,F,统计量:,F,F(1,n-2),判断:若,p,a,,则拒绝,H,0,,模型的线性关系是显著的,;,反之,模型的线性关系不显著,.,一、一元线性回归方程显著性检验,20,原假设,H,0,:,1,=,2,=.=,p,=,0.,即,:,各个回归系数同时与,0,无显著差异,利用,F,检验,构造,F,统计量:,F,F(p,n-p-1),判断:若,p,a,,则拒绝,H,0,,模型的线性关系是显著的,;,反之,模型的线性关系不显著,.,二、多元线性回归方程的显著性检验,21,R,2,检验与,F,检验的关系,F,是,R,2,的单调增函数,,F,与 一一对应,。,R,2,F,F,图,1 F,统计量与,R,2,的关系,22,9.3.3,回归系数的显著性检验,主要目的是研究回归方程中每个解释变量与被解释变量之间是否存在显著的线性关系。,即研究每个解释变量能否有效的反映被解释变量的线性变化,它们能否保留在线性回归方程中。,回归系数的显著性检验是围绕回归系数估计值的抽样分布展开的,构造统计量,并进行检验。,23,一、一元线性回归方程显著性检验,回归,系数的显著性检验,:,t,检验,H,0,:,1,=0,,即,:,回归系数与,0,无显著差异,利用,t,检验:,24,若,pa,不能拒绝,H0,,,y,和,x,线性关系不显著。,一元线性回归方程的检验和回归系数的检验是等效的,。,25,需要对回归系数是否为零逐一进行检验。,原假设,H,0,:,i,=0,,即,:,第,i,个偏回归系数与,0,无显著差异,利用,t,检验统计量(略),若与,t,统计量的概率,伴随,p,a,,则拒绝,H,0,多元线性回归中回归系数的检验与整体回归方程的检验不能相互替代。,二、多元线性方程回归系数的检验,26,9.3.4,残差分析,残差指由回归方程计算所得的预测值与实际样本值之间的差距,即模型中,i,的估计值,:,回归模型要求:残差序列中不含明显的规律性和趋势性,均值为零、正态分布、等方差,且序列是独立的。,27,一、残差均值为零的正态分析,可以通过绘制残差散点图来观察:如果残差的均值为零,残差图中的点应在纵坐标为零的横线上下随机散落,如下图。,28,二、残差的独立性分析(非自相关),残差是独立的,则残差序列应满足,cov,(,i,j,),=0,(,ij,),表示残差序列前期和后期之间不存在相关关系,即不存在自相关。独立性检验方式:,第一、绘制残差序列图(下图残差随时间的推移,呈有规律变化,表明残差序列存在一定的正或负自相关),29,自相关系数用于测定序列自相关强弱,其取值范围,-1,+1,,接近,1,表明序列存在正自相关,第二、计算残差的自相关系数,30,DW,检验用于推断小样本序列是否存在自相关的方法。其原假设为:总体自相关系数,与零无显著差异。采用统计量为:,DW,取值在,0,4,之间:,=,(,-1,0,)时,,DW=,(,2,,,4,)残差序列负自相关,=0,时,,DW=2,,残差序列无自相关,=,(,0,1,)时,,DW=,(,0,,,2,)残差序列正自相关,残差存在自相关表明遗漏了解释变量,或变量取值存在滞后性,或线性模型不适合,第三、,DW,(,durbin-watson,)检验,31,三、残差异方差分析,回归分析要求残差的方差相等,如果存在异方差,则参数的最小二乘估计不再是最小方差的无偏估计。因此需要检验残差是否存在异方差。其方法:,第一,绘制残差图(下图残差的方差随解释变量值的增加呈现增加趋势,表明存在异方差),32,第二,计算等级相关系数,得到残差序列后首先取其绝对值,然后分别计算出,残差,和,解释变量,的 秩,最后计算,spearman,等级相关系数,进行等级相关分析。若,p,值小于给定显著性水平,,则拒绝原假设,认为解释变量与残差间存在显著相关,出现了异方差现象。,33,9.4,多元回归分析中的其它问题,9.4.1,解释变量的筛选问题,多元回归分析中,模型选中应引入多少解释变量呢?少了难以解释对解释变量的变化,多了会引起多重共线。,一、,向前筛选策略,指解释变量不断进入回归方程的策略。,首先引入与被解释变量线性相关系数最高的解释变量进入方程,并进行回归方程的各种检验;,然后,引入与被解释变量偏相关系数最高并通过检验的解释变量,并对新方程进行各项检验;,直到没有可引入的变量为止。,34,二、向后筛选策略,指解释变量不断剔除出回归方程的过程。,首先,将所有解释变量引入方程,并检验;,然后剔除,t,检验值不显著(最小)的一个或多个变量,重新建立回归方程并进行各种检验。,如果回归系数都显著,则方程建立结束。否则,接着依次删除最不显著的解释变量。,三、逐步筛选策略,指向前向后筛选的综合策略。,在向前筛选过程中,随着变量不断引入方程,需要再次判断是否存在可剔除的解释变量,如有,则剔除。,35,9.4.2,变量的多重共线性问题,变量的多重共线:,指解释变量之间存在线性相关关系的现象。,若存在多重共线,则会造成偏回归系数估计困难、估计的方差增大、估计值的不稳定性增强、偏回归系数假设检验的结果不显著等问题。,测度多重共线的方法如下:,36,一、容忍度,解释变量,x,i,的容忍度,:Tol,i,=1-R,i,2,,其中,:R,i,2,是解释变量,x,i,与方程中其他解释变量间复相关系数的平方,,,表明了解释变量之间的线性相关程度。,容忍度大表示与其他自变量的共线性低,应进入方程。容忍度很小的变量,spss,才会给出警告,不应进入方程,(,T0.1,一般认为具有多重共线性),37,二、方差膨胀因子,方差膨胀因子,(VIF):,容忍度的倒数,方差膨胀因子取值,大于等于,1,。,R,i,2,接近,0,,解释变量间,多重共线性越弱,,,VIF,i,越接近于,1,。,如果,VIF,i,大于等于,10,,说明解释变量,x,i,与方程中其余解释变量之间有,严重的多重共线性,。,另外,也可以采用方差膨胀因子的均值来测度多重共线性。,38,三、特征值与方差比,如果最大特征值远大于其它特征值,表明该解释变量能刻画所有解释变量绝大部分信息(方差),意味着解释变量间存在较强的线性相关关系。,常以某特征值占,70%,左右。,39,四、条件指数,条件指数是在特征值的基础上定义的,它能反映解释变量间多重共线性指标。定义如下:,K,i,为第,i,个解释变量的条件指标,它是最大特征值,m,与第,i,个特征值比的平方根。,第,i,个条件指数,K,i,越大,表明解释变量间信息重叠的越多,多重共线越严重。,K,i,小表明共线不明显。,0K,i,10,认为多重共线弱;,10 K,i,【regression】-【linear】,选择被解释变量进入,【,dependent,】,框中,选择一个或多个解释变量进入,【,independent,】,框,在,【method】,中选择解释变量的筛选策略,enter:,所选解释变量强行进入回归方程(默认方法,常用于一元回归),remove:,从回归方程中剔除所选变量,stepwise:,逐步筛选策略;,backward:,向后筛选;,forward:,向前筛选,41,【block】,表示设置解释变量不同的筛选策略块。可以按,next,和,previous,按钮设置多组解释变量和变量的筛选策略,并放在不同的块中。,SPSS,将按每一指定策略逐一进行回归。其中,【remove】,方法只能放在第二个以后块中。块设置便于作各种探索性分析。,【selection variable】,为设置的条件变量框。,Rule,表示给定的判定条件。只有满足条件的样本数据才参与回归分析。,【case labels】,是指定某变量为样本数据点的标记变量,将再图形中标出。,42,9.5.2,线性回归的其它操作,一、,statistics,选项,该窗口提供用户可选择的统计量,【estimates】,是,SPSS,默认输出项,,输出与回归系数相关的统计量。包括回归系数(偏回归系数)、回归系数标准误差、标准化回归系数(如果各解释变量单位不一致,如希望比较对被解释变量的影响时,可采用)、回归系数显著性检验,t,统计量和,P,值、各解释变量的容忍度。,【confidence intervals】,输出每个非标准化回归系数的,95%,置信区间,43,【descriptives】,:输出各解释变量和被解释变量的均值、标准差、相关系数矩阵及单侧检验概率值。,【model fit】,为,SPSS,默认输出项,,输出判定系数、调整的判定系数,回归方程的标准误差、回归方程显著性检验的方差分析表。,【R squared change】,表示每个解释变量进入方程后引起判定系数的变化量(,R,ch,2,)和,F,值的变化量,44,【Part and partial correlation】,输出方程中各解释变量与被解释变量间的简单相关系数、偏相关系数和部分相关系数。,【covariance matrix】,输出各解释变量间的相关系数、协方差和回归系数的方差。,【Collinearity dignostics】,多重共线性诊断。,输出各解释变量的容忍度、方差膨胀因子、特征值、条件指标、方差比率等。,在,【residuals】,框中:,【durbin-watson】,表示输出,DW,检验值(异方差检验),;,【casewise diagnostics】,表示输出标准化残差绝对值大于等于,3,的样本数据相关信息。,45,二、,option,选项,该窗口提供解释变量筛选的标准以及缺失值处理方式。,【,use probability of F,】SPSS,默认项,表示,以偏,F,统计量的概率值为标准判断解释变量能否进入或剔除出回归方程。一个解释变量的,F,值显著性水平小于,entry,(,0.05,)则该解释变量可以进入方程,;,大于,removal,(,0.1,)则剔除出方程。,【use F value】:,以偏,F,统计量的临界值来判断解释变量能否进入(默认大于,3.84,,线性影响显著)方程;还是剔除出(默认小于,2.71,,不能拒绝原假设,线性影响不显著)方程。,46,三、,plot,选项,该窗口用于对残差的序列分析,包括分析残差散点图、正态分布累计概率图等。,窗口左边,dependent,表示被解释变量、,zpred,表示标准化预测值、,dresid,表示标准化残差、,adjpred,表示剔除异常点后调整的新预测值、,sresid,表示学生化残差。,绘制多对变量散点图需要在,【scatter 1 of 1】,框中定义散点图的纵坐标和横坐标变量。,在,【standardized residual plots】,中选,【histogram】,表示绘制标准化残差序列直方图;选,【normal probability plot】,表示绘制标准化残差序列正态分布累计概率图;选,【produce all partial plots】,项,表示一次绘制被解释变量与各个解释变量的散点图。,47,四、,save,选项,表示将回归分析结果保存到数据编辑窗口中(略讲),【predicted value】,:保存非标准化预测值,unstandardized,、标准化预测值,standardized,、调整的预测值,adjusted,,解释变量,x=x,0,下预测值的均值标准差。,【prediction intervals】:,保存均值,mean,、保存个体值的预测值,individual,及其,95%,的上下限。,【residuals】,:保存非标准化残差,unstandardized,、标准化残差,standardized,、学生化残差,studentized,、剔除化残差,deleted,48,9.6,线性回归分析的应用,问题:利用,31,个省属地区高校科研方面数据,进行多元回归分析(高校科研研究),分二步。,(,1,)先采取强制进入策略模型,并作多重共线检验,【analyze】-【regression】-【linear】,选择被解释变量立项课题数,x,5,进入,【,dependent,】,中,,选择多个解释变量投入年数,x,2,、投入高级职称的人年数,x,3,、投入科研事业费,x,4,专著数,x,6,、,论文数,x,7,、获奖数,x,8,进入,【,independent,】,框,49,在,【method】,中选择上述被解释变量强制进入策略,【enter】,,并在,【statistics】,中选择,【Collinearity dignostics】,进行多重共线性诊断和,【durbin-watson】,进行,DW,检验(异方差检验)。,50,图示一:,51,图示二:,52,一、方程拟合优度检验(因多元,采用调整拟合优度,0.924,,较高,被解释变量被解释的多。,DW=1.838,,显示残差序列弱正自相关,不独立),53,二、回归方程的显著性检验,(,p,值很小,方程线性关系显著),54,三、偏回归系数与多重共线检验,(多数,P,值较大表明它们与被解释变量关系不显著,不应留在方程中。从容忍度和方差膨胀因子看,多重共线也很严重),55,四、多重共线检验,(第,7,个特征值能解释投入人年数方差的,84%,、职称,98%,、专著数,44%,,可以认为这些变量间存在多重共线。,5,、,6,、,7,条件指数大于,10,也说明这点。总结论应重建方程),56,9.6.2,向后筛选策略模型(剔除),57,
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:第9章-SPSS-线性回归分析PPT.ppt
    链接地址:https://www.zixin.com.cn/doc/11264855.html
    页脚通栏广告

    Copyright ©2010-2025   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork