分享
分销 收藏 举报 申诉 / 46
播放页_导航下方通栏广告

类型第12讲 回归概念、回归系数.ppt

  • 上传人:pc****0
  • 文档编号:13166321
  • 上传时间:2026-01-28
  • 格式:PPT
  • 页数:46
  • 大小:885.50KB
  • 下载积分:10 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第12讲 回归概念、回归系数 12 回归 概念 系数
    资源描述:
    单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,SPSS,基础与,Access,数据库,姓 名,:,电 话,:,E-mail:,上课时间,:,上课程点,:,答疑地点,:,答疑时间,:,商务信息学院计算机教学部,1,相关分析,相关分析就是描述两个或两个以上变量间关系密切程度的统计方法,有效地揭示事物之间相关关系的强弱程度。,二元变量分析,偏相关分析,距离相关分析,上节回顾,2,第,13,讲,回归分析,3,基本概念,4,一、“回归”起源,“,回归,”,一词是英国生物学家、统计学家高尔顿(,F.Galton,)在研究父亲身高和其成年儿子身高关系时提出的。,从大量父亲身高和其成年儿子身高数据的散点图中,,Galton,发现了一条贯,穿,其中的,直线,,它能描述父亲身高和其成年儿子身高的关系,并可以用于根据父亲身高,预测,其成年儿子身高。,Galton,通过上述研究发现儿子的平均身高一般总是介于其父亲与其种族的平均高度之间,即儿子的身高在总体上有一种,“,回归,”,到其所属种族高度的趋势,这种现象称为,回归现象,,贯穿数据的直线称为,回归线,。,回归概念产生以后,被广泛应用于各个领域之中,并成为研究,随机变量,与,一个或多个自变量,之间变动关系的一种统计分析技术。,5,二、回归分析的基本概念,回归分析的概念,回归分析就,是研究,一个或多个,变量的,变动,对,另一个,变量的,变动,的,影响程度,的方法。,相关分析与回归分析的关系,相关分析是根据统计数据,通过计算分析变量之间,关系的方向,和,紧密程度,,而不能说明变量之间相互关系的,具体形式,,无法从一个变量的变化来,推测,另一个变量的变化情况。,回归分析能够确切说明变量之间相互关系的具体形式,可以通过一个相关的,数学表达式,,从一个变量的变化来,推,测另一个变量的变化情况,使,估计和预测,成为可能。,相关分析是回归分析的,基础和前提,,回归分析是相关分析的,深入和继续,。,相关与回归,6,二、回归分析的基本概念,回归分析的目的,根据已知的资料或数据,找出变量之间的,关系表达式,(,找到回归方程,),,用自变量的已知值去,推测,因变量的值或范围,(,进行预测,),,实际上是研究,因果关系,。,(,例如:,),回归分析的基本过程,确定自变量,选择回归分析的模型,估计模型中的参数,模型检验,模型应用,7,二、回归分析的基本概念,回归分析可以,解决的问题,确定,因变量,与若干个,自变量,之间联系的,定量表达式,,即回归方程或数学模型,通过控制可控变量的数值,借助数学模型来,预测,或,控制,因变量的取值和精度,进行,因素,分析,从影响因变量变化的自变量中区分出,重要因素,和,次要因素,分类,根据变量之间相关关系的,表现形式,分为,线性,回归分析:变量之间的相关关系是,线性,关系,非线,性回归分析:变量之间的相关关系是,非线性,关系,根据影响因变量的,自变量的多少,分为,一元,回归分析,多元,回归分析,8,二、回归分析的基本概念,回归分析的功能,实现回归分析的功能主要在,“,Analyze,Regression,”,命令菜单中,主要分为:,线性回归分析,曲线估计分析,二维逻辑分析,多维逻辑分析,顺序分析,概率分析,非线性回归分析,加权估计分析,两阶最小二乘分析,9,线性回归分析,10,三、线性回归分析,线性回归的,概念,线性函数,是变量之间存在的各种关系中最简单的形式,具有这种关系的回归叫做线性回归。,线性回归根据自变量多少分为,一元回归,和,多元回归,对数据的要求:,自变量和因变量必须是,数值型,变量,标志或范畴变量,如专业、性别,必须记录为二元的哑变量,(,虚拟变量,),或者其他类型的对立变量,对于,因变量,的所有观测值(样本)应该认为是来自相互独立的等方差,(,方差齐性,),的,正态总体,(,正态分布,),,并且因变量和各自变量之间应有一定的,线性关系,11,三、线性回归分析,线性回归的模型,下面以,一元线性回归,为例,解析线性回归模型。,一元线性回归的数学模型为:,在数学模型中 分别称为,回归常数,和,回归系数,,称为,随机误差,。,从数学模型可以看出因变量,y,的变化由,两部分,组成,自变量,x,的变化所引起的,y,的线性变化,即,其他,随机因素,引起的,y,的变化,即,如果随机误差的,期望为,0,,那么数学模型可以转化为:,称为,一元线性回归方程,从几何意义上讲,一元线性回归方程是一条,直线,,即,回归线,。,从一元线性回归方程可以看出,,一元线性回归分析,是在,不考虑随机因素,条件下进行分析的,所以是在比较理想状态下的分析,12,三、线性回归分析,线性回归方程的统计检验,通过样本数据建立的回归方程,不能立即用于对实际问题的分析和预测,还需要进行各项,统计检验,。,回归方程的,拟合优度检验,拟合优度检验采用,判定,(,决定,),系数,和,调整判定,(,决定,),系数,,来检验。其中 是,自变量,x,和因变量,y,之间的相关系数。,和 取值范围是,01,,越接近,1,表示,拟合优度越高,,反之就,越低,。,13,三、线性回归分析,线性回归方程的统计检验,回归方程和回归系数的显著性检验,1.,显著性检验,H,0,假设是:,回归系数与,0,无显著性差异。,2.,检验采用,F,统计量,和,t,统计量,,,SPSS,自动计算统计量的观测值和对应的伴随概率。,3.,如果伴随概率,小于,显著性水平,(,0.05,),,,拒绝,H,0,假设,回归系数与,0,有显著性差异,,表明自变量,x,和因变量,y,之间,有线性关系,,,回归方程有实际意义,。,反之,,接受,H,0,假设,回归系数与,0,无显著性差异,,表明自变量,x,和因变量,y,之间,线性关系不显著,,回归方程,无实际意义。,14,三、线性回归分析,线性回归方程的统计检验,残差分析,残差是指由回归方程计算所得的,预测值,与,实际样本值,之间的差距。,残差分析是回归方程检验的重要组成部分,如果回归方程能够较好地反映变量之间的变化规律,那么残差中不包含明显的,规律性和趋势性,。,15,三、线性回归分析,线性回归方程的统计检验,残差分析的主要内容,(1),残差,均值为,0,的,正态性分析,对应的残差有正负,但总体上应服从以,0,为均值的正态分布。可以通过绘制标准化,(,或学生化,),残差的累计概率图来分析。,(2),残差的,独立性,分析,回归方程要求前期和后期的残差数值之间不存在相关关系,即不存在自相关。可以通过绘制残差的序列图、计算残差的自相关系数和,DW(Durbin,-Watson),检验来分析,16,三、线性回归分析,线性回归方程的统计检验,残差分析的主要内容,(3),异方差,分析,无论变量的取值如何变化,对应的残差分析的方差都应相等,(,齐性,),,否则认为出现了,,异方差,现象。可以通过绘制残差图和等级相关分析来分析。,(4),探测样本中的,异常值,异常值对回归方程影响较大,可以利用残差分析探测样本中的异常值,加以排除。,对于探测,因变量,y,中的异常值方法:标准化残差、学生化残差和剔除残差,对于探测,自变量,x,中的异常值方法:杠杆值、库克距离、标准化回归系数和标准化预测值的变化,17,三、线性回归分析,SPSS,操作及案例分析,例一:一元线性回归分析,一家地产公司调查了某城市的房地产,销售价格,与,房产的评估价值,的数据,请用一元线性回归分析,能否用房产的评估价值来,预测,房地产销售的价格。,分析:,自变量,x,:,房产的评估价值;,因变量,y,:,房地产销售价格,散点图分析,一元线性回归结果分析,18,三、线性回归分析,SPSS,操作及案例分析,操作步骤:,(1),根据数据建立散点图,进行初步分析,(2),Analyze,Regression,Linear,数据文件:,9-linear_one.sav,保存文件:,9-linear_one.spo,1,2,自变量,因变量,19,三、线性回归分析,SPSS,操作及案例分析,结果分析:,从建立的散点图来看,自变量,x,和因变量,y,之间存在,一定的线性关系,,而且相关,程度较高,。,20,表,1,表,2,三、线性回归分析,SPSS,操作及案例分析,结果分析:,(1),表,1,:变量进入,/,移出表,Enter,表示选定变量,全部进入,模型,(2),表,2,:模型综述表,相关系数,R=0.916,、判定系数,R,2,=0.839,、调整判定系数,R,2,=0.830,,说明变量之间相关,程度高,,回归方程的,拟合优度高,。,21,三、线性回归分析,SPSS,操作及案例分析,结果分析:,(3),表,3,方差分析表,F,检验统计量得观测值,=93.567,,伴随概率,=0.0000.05,,,拒绝,零假设,说明自变量,x,和因变量,y,之间,线性关系显著,,可以建立,线性模型,。,(4),模型系数表,常数项,Constant=895.020,,,回归系数,=1.351,;回归系数的伴随概率,=0.000,,,拒绝,零假设,说明自变量,x,和因变量,y,之间,线性关系显著,,可以建立,线性模型,。,结论:,根据上述分析结果,可以得到,回归方程,用该方程来进行分析和,预测实际问题,结果较为,准确,。,表,3,表,4,22,三、线性回归分析,SPSS,操作及案例分析,例二:一元线性回归分析,Nambe Mills,公司生产,5,种金属餐具产品,分别是,Bowl(,碗,),、,Casserole(,焙盘,),、,Dish(,碟,),、,Tray(,托盘,),、,Plate(,盘子,),。在生产过程中都有一个抛光的过程。为了有助于安排生产,记录了,59,个产品的抛光时间,(time),、产品类型,(type),和产品直径,(,diam,),。,用一元线性回归分析能否用产品的,直径,来预测产品的,抛光时间,。,23,三、线性回归分析,SPSS,操作及案例分析,操作步骤:,(1),绘制抛光时间和产品直径的散点图,(2)Analyze,Regression,Linear,数据文件:,9-polishing.sav,保存文件:,9-polishing.spo,1,2,24,三、线性回归分析,SPSS,操作及案例分析,结果分析:,从建立的散点图来看,自变量,x,和因变量,y,之间存在一定的线性关系,但数据分布较为,分散,,所以相关程度,不是很高,。,25,三、线性回归分析,SPSS,操作及案例分析,结果分析,(1),变量进入,/,移出方式表,表示选定变量,全部进入,模型,(2),模型综述表,反映了因变量和自变量之间的线性相关系数,R=0.700,,判定系数,R,2,=0.490,,说明自变量可以解释因变量,49%,的变异性,。说明自变量与因变量之间的相关程度,一般,,回归方程的拟合优度,不高,。,26,三、线性回归分析,SPSS,操作及案例分析,结果分析,(3),方差分析表,F,检验统计量的观测值为,54.865,,,F,分布的伴随概率为,0.000,,从而,拒绝,零假设,说明因变量和自变量的线性关系是,显著,的,可以建立,线性模型。,(4),模型系数表,回归模型的常数项为,-1.955,,自变量回归系数为,3.457,回归方程为:,time=3.457*diam-1.955,回归系数的伴随概率,=0.000,,应,拒绝,t,检验的零假设,说明因变量和自变量的线性关系是,显著,的,可以建立,线性模型,27,三、线性回归分析,SPSS,操作及案例分析,例三:,多元,线性回归分析,为了研究某公司职工当前工资水平,收集了影响职工当前工资水平的,6,个因素的数据。这些影响因素是:职工的开始工资,salbegin,($),、受教育时间,educ,(,年,),、来公司工作时间,jobtime,(,月,),、工种,jobcat,、来本公司前的工作经验,prevexp,(,月,),、是否为少数民族,minority,。,试用多元线性回归过程对该公司职工当前工资水平寻求一个恰当的回归模型。,28,三、线性回归分析,SPSS,操作及案例分析,操作步骤,Analyze,Regression,Linear,数据文件:,9-Employee.sav,保存文件:,9-Employee.spo,1,3,2,变量筛选,Enter,:所选变量全部进入方程,(,一元回归,),Fordward,:按照所选变量对因变量影响大小顺序依次引入,每引入一个变量,建立一个方程,Backward,:先将所选变量一次引入,然后逐步剔除对因变量影响小的变量,每剔除一个变量,建立一个方程,Stepwise,:结合上述两种方法,先引入对因变量影响大的变量,然后马上剔除对因变量影响小的变量,每一步建立一个方程,(,多元回归,),依次输入自变量,Educ,(,受教育时间,),Jobcat,(,工种,),Salbegin,(,开始工资,),Jobtime,(,工作时间,),Prevexp,(,工作经验,),Minority(,少数民族,),29,三、线性回归分析,SPSS,操作及案例分析,结果分析,:,(1),变量进入,/,移出方式表,从表中可以看出依次引入的变量:,salbegin,、,jobcat,、,prevexp,、,jobtime,、,educ,在依次引入的变量过程中,剔除了,Minority(,少数民族,),变量。,变量引入的顺序,与输入顺序不同,30,三、线性回归分析,SPSS,操作及案例分析,结果分析,:,(2),模型综述表,从表中可以看出引进变量后,,相关系数,R,分别由,0.880,增加到,0.898,、,0.909,、,0.914,、,0.917,同时,估计标准误差,由,$8,115.356,减少到,$6,856.795,31,三、线性回归分析,SPSS,操作及案例分析,结果分析,:,(3),方差分析表,:,从表中可以看出,,F,分布的显著性概率为,0.000,,说明因变量和自变量的线性关系是,显著,的,可建立,线性模型,32,三、线性回归分析,SPSS,操作及案例分析,结果分析,:,(4),模型系数表,表中显示回归模型中的常数项,(,Constant,),非标准化,的回归系数,(,Unstandardized,Coefficients)B,值及其标准误差,(Std.Error),标准化,的回归系数,(standardized,Coefficients)Beta,值、,t,值以及显著性水平,(Sig.),33,三、线性回归分析,SPSS,操作及案例分析,结论:,从表中可以得到,5,个回归模型的方程,第,5,个回归方程为,回归系数的伴随概率为,0.000,,相关系数为,0.917,,判定系数为,0.84,,说明回归方程解释了整个因变量变异程度的,84%,,说明变量之间相关,程度高,,回归方程的,拟合优度高,。,对当前工资影响较大的依次为:开始工资、工种、来本公司前的工作经验、来公司工作时间和受教育时间,主要考虑的是,Beta,值,的大小。,34,曲线估计,35,四、曲线估计,曲线估计的,概念,现实生活中,变量之间的关系,并非都是线性相关,,实际上非相关关系更为常见,除了可以通过绘制散点图的方式粗略地考察这种非线性关系,还可以用曲线估计来进行拟合。,曲线估计,(,曲线拟合、曲线回归,),是指,选定一种用方程表达的曲线,,使得实际数据与理论数据之间的差异尽可能地小。,曲线选择得好的话,那么可以揭示因变量与自变量的内在关系,并对因变量的预测有一定意义。,曲线估计中需要解决的问题,一是,选用哪种理论模型,,即用哪种方程来拟合观测值,二是当模型确定后,,如何选择合适参数,,使得理论数据和实际数据的差异最小,36,四、曲线估计,曲线估计的基本研究方法,(1),做散点图来观察曲线形状,变量之间关系分线性相关和非线性相关,非线性相关分为本质线性关系和本质非相关关系,SPSS,对本质线性关系采用,曲线估计,子模型;对本质非相关关系采用,非线性,子模型,(2),结合专业知识,或从长期积累的数据中找出变量之间的函数类型,在,SPSS,中提供了,11,中本质线性模型,(P166,表,9.10),应用,SPSS,进行曲线估计时,,可以,先选择几种模型,,然后自动完成模型的参数估计,输出回归方程显著性检验的,F,值和概率,p,值、判定系数,R,2,等统计量,以判定系数为主要依据,选择其中的最优模型,,进行预测分析,37,四、曲线估计,SPSS,操作及案例分析,例四:某产品零售商为某种产品,做广告的投入,资金,advert(,百万元,),和因此而获得的,销售额,sales(,百万元,),的相关数据,试找出一种合适的回归函数。,38,四、曲线估计,SPSS,操作及案例分析,操作步骤:,绘制散点图初步确定可能的曲线估计回归模型,Graphics,Scatter/Dot,Analyze,Regression,Curve Estimation,数据文件:,9-advert.sav,保存文件:,9-advert.spo,1,3,2,11,中本质线性模型,(P166,表,9.10),39,四、曲线估计,SPSS,操作及案例分析,结果分析:,(1),散点图,从图中可以看出,曲线近似于直线、二次曲线或三次曲线,直线,二次曲线,三次曲线,40,四、曲线估计,SPSS,操作及案例分析,结果分析:,(2),曲线回归估计结果表,表中给出三种模型的最优拟合结果,可以通过比较相关系数的平方值,(,R Square,),来比较各个模型的优劣。相关系数的平方值较大的可能是样本数据拟合曲线中的最优者。,从表中可以看出,二次曲线,(Quadratic),和三次曲线,(Cubic),的相关系数的,平方值较大,,并且伴随概率都为,0.000,,这两种曲线都能,较好的拟合,样本数据。,常数与回归系数,41,四、曲线估计,SPSS,操作及案例分析,结果分析:,从拟合曲线图上,也可以看出二次曲线和三次曲线能较好拟合样本数据,42,四、曲线估计,SPSS,操作及案例分析,结论:,二次曲线方程为,b2(=-0.245),是一个,负值,,意味着广告投入,不可以,无限增加,当广告投入增加到一定值后,销售额反而会降低。,广告投入的最大值是,2.854/(2*0.245)=5.824,万元,说明广告投入超过,5.824,万元,不会得到预期的销售额。,三次曲线方程为,b2(=-0.442),是一个,负值,,当广告投入增加到一定值后,销售额反而会降低。,广告投入的最大值是,5.424,万元,说明广告投入超过,5.424,万元,不会得到预期的销售额。,43,思考题,P179,第,1,题,数据文件:,9-sk_1.sav,保存文件:,9-sk_1.sav,第,2,题,数据文件:,9-sk_2.sav,保存文件:,9-sk_2.sav,44,SPSS,应用,下节展望,45,谢,结束,谢,46,
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:第12讲 回归概念、回归系数.ppt
    链接地址:https://www.zixin.com.cn/doc/13166321.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork