《应用统计学》(06)第6章利用变量间的关系进行预测.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用统计学 应用 统计学 06 利用 变量 关系 进行 预测
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,应用统计学,Applied Statistics,6-,*,*,yyyy-M-,应用,统计,应,用,统,计,学,Applied Statistics,yyyy-M-,世界上所有的模型都只是对现实世,界的某种近似。没有完美的模型。,所有的模型都命中注定要被修正、,改进以至于被替代。,吴喜之,统计名言,yyyy-M-,怎样解决下面的问题?,子女的身高与其父母身高有关系吗?,个人的收入水平同他受教育程度有关系吗?,农作物的单位面积产量与降雨量和施肥量有关系吗?,股票价格与企业的盈利能力有关系吗?,工资收入中有性别歧视吗?,怎样根据广告费用的支出来预测销售额?,yyyy-M-,统计应用,看手相,资料来源:,Mario F.Triiola,著,初级统计学,一些人相信他们的手掌的生命线,的长度可以用来预测他们的生命。,M.E.Wilson,和,L.E.Mather,在,美国医学协会学报,发表的一封信中,他们对死者尸体的研究对此予以了驳斥。死亡时的年龄与手掌生命线的长度被一起记录下来。作者得出死亡时的年龄与生命线的长度不存在显著相关的结论,首相术失传了,手掌也就放下来了,yyyy-M-,统计应用,预测大学足球比赛的获胜得分差额,为检验一场大学足球比赛中“争球码数”、“传球码数”、“回传次数”、“控球时间”以及“主场优势”等变量对比赛最后得分的影响,分析人员建立了一个多元回归模型。该模型的因变量是“比赛获胜得分的差值”,它等于胜方的最后得分减去负方的最后得分,从高校体育协会前,20,名球队的比赛中随机抽取了,90,场,收集到自变量和因变量的数据并进行多元回归分析,得到的回归结果如下,预测变量,系数,t,值,截距,3.22,2.06,争球码数差,0.11,12.50,传球码数差,0.09,10.19,回传次数差,-2.80,-5.75,控球时间差,-0.01,-3.94,主场优势变量,3.04,1.68,因变量:获胜得分差,修正的,R,2,=0.72,第,6,章 利用变量间的关系进行预测,6.1,变量之间有什么样的关系?,6.2,建立变量之间的数学表达式,6.3,拟合效果的度量和回归检验,6.4,所有自变量都有必要放进模型中吗?,6.5,用自变量预测因变量,6.6,含有定性自变量的回归,6.1,变量间关系的度量,6.1.1,用散点图描述变量间的关系,6.1.2,用相关系数度量关系的强度,6.1.3,总体中也存在这样的关系吗?,第,6,章 利用变量间的关系进行预测,6.1.1,用散点图描述变量间的关系,6.1,变量间关系的度量,yyyy-M-,相关关系,(,correlation,),一个变量的取值不能由另一个变量唯一确定,父亲身高,y,与子女身高,x,之间的关系,当变量,x,取某个值时,变量,y,的取值可能有几个,商品销售额,y,与广告费支出,x,之间的关系,各观测,点分布在直线周围,y,x,yyyy-M-,散点图,(scatter diagram),不相关,负线性相关,正线性相关,非线性相关,完全负线性相关,完全正线性相关,yyyy-M-,散点图,(,例题分析,),【,例,】,一家商业银行在多个地区设有分行,根据所抽取的,25,家分行,2002,年的有关业务数据绘制散点图,用,Excel,绘制散点图,yyyy-M-,散点图,(,不良贷款对其他变量的散点图,),yyyy-M-,散点图,(5,个变量的散点图矩阵,),不良贷款,贷款余额,累计应收贷款,贷款项目个数,固定自产投资,6.1.2,用相关系数度量关系的强度,6.1,变量间关系的度量,yyyy-M-,相关系数,(correlation coefficient),度量变量之间线性关系强度的一个统计量,若相关系数,是根据总体全部数据计算的,称为总体相关系数,记为,若,是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为,r,也称为线性相关系数,(linear correlation coefficient),或称为,Pearson,相关系数,(Pearsons correlation coefficient),用,Excel,计算相关系数,yyyy-M-,相关系数的性质,性质,1,:,r,的取值范围,是,-1,1,|,r,|=,1,,,为完全相关,r,=,1,,为完全正相关,r,=,-1,,为完全负正相关,r,=0,,,不存在,线性,相关,关系,-1,r,0,,,为负相关,0,t,,拒绝,H,0,yyyy-M-,相关系数的显著性检验,(,需要注意的问题,),即使统计检验表明相关系数在统计上是显著的,并不一定意为着两个变量之间就存在重要的相关性,因为的大样本情况下,几乎总是导致相关系数显著,比如,,r,=0.1,,在大样本情况下,也可能使得,r,通过检验,但实际上,一个变量取值的差异能由另一个变量的取值来解释的比例只有,10%,,这实际上很难说明两个变量之间就有实际意义上的显著关系,6.2,建立变量间的数学表达式,6.2.1,涉及一个自变量的线性回归,6.2.2,涉及多个自变量的线性回归,第,6,章 利用变量间的关系进行预测,6.2.1,涉及一个自变量的线性回归,6.2,建立,变量间的数学表达式,yyyy-M-,一元线性回归,涉及一个自变量的回归,因,变量,y,与自变量,x,之间为线性关系,被预测或被解释的变量称为因变量,(dependent variable),,用,y,表示,用来预测或用来解释因变量的一个或多个变量称为自变量,(independent variable),,用,x,表示,因变量与自变量之间的关系用,一个线性方程来表示,yyyy-M-,一元线性回归模型,描述因变量,y,如何依赖于自变量,x,和,误差项,的方程称为,回归模型,一元线性,回归模型可表示为,y,=,b,0,+,b,1,x,+,e,y,是,x,的线性函数,(,部分,),加上误差项,线性部分反映了由于,x,的变化而引起的,y,的变化,误差项,是随机变量,反映了除,x,和,y,之间的线性关系之外的随机因素对,y,的影响,是不能由,x,和,y,之间的线性关系所解释的变异性,0,和,1,称为模型的参数,yyyy-M-,回归模型中为什么包含误差项,理由,1,:,理论的含糊性。,即使有决定,y,的行为的理论,而且常常是不完全的,影响,y,的变量不是无所知就是知而不确,因此不妨设,作为模型所排除或忽略的全部变量的替代变量,误差项,是未包括在模型中而又影响着,y,的全部变量的替代物,但为什么不把这些变量引进到模型中来?换句话说,为什么不构造一个含有尽可能多个变量的复回归模型?古扎拉蒂在,计量经济学,一书中列出了,7,点理由,yyyy-M-,回归模型中为什么包含误差项,理由,2,:,数据的欠缺。,即使我们明知被忽略变量中的一些变量,并因而考虑用一个复回归而不是一个简单回归,我们却不一定能得到关于这些变量的数量信息,理由,3,:,核心变量与周边变量。,影响,y,的全部或其中的一些变量,合起来的影响如此之小,充其量是一种非系统的或随机的影响。从实际考虑以及从成本上计算,把它们一一引入模型是划不来的。所以人们希望把它们的联合效应当作一个随机变量来看待,yyyy-M-,回归模型中为什么包含误差项,理由,4,:,人类行为的内在随机性。,即使我们成功地把所有有关的变量都引进到模型中来,在个别的,y,中仍不免有一些“内在”的随机性,无论我们花了多少力气都解释不了的。随机项,也许能很好地反映这种随机性,理由,5,:,糟糕的替代变量。,虽然经典回归模型假定变量,y,和,x,能准确地观测,但实际上数据会受到测量误差的扰乱。由于这些变量不可直接观测,故实际上我们用替代变量。这时误差项,又可以用来代表测量误差,yyyy-M-,回归模型中为什么包含误差项,理由,6,:,节省原则。,我们想保持一个尽可能简单的回归模型。如果我们能用两个或三个变量就“基本上”解释了,y,的行为,并且如果我们的理论完善或扎实的程度还没有达到足以提出可包含进来的其他变量,那么为什么要引进更多的变量?让,去代表所有的其他变量好了。当然,我们不应该只为了保持回归模型简单而排除有关的和重要的变量,yyyy-M-,回归模型中为什么包含误差项,理由,7,:,错误的函数形式。,即使我们有了解释一种现象的在理论上正确的变量,并且我们能获得这些变量的数据,我们却常常不知道回归子,(,因变量,),和回归元,(,自变量,),之间的函数形式是什么形式。在双变量模型中,人们往往能从散点图来判断关系式的函数形式,而在多变量回归模型中,由于无法从图形上想像一个多维的散点图,要决定适当的函数形式就不容易,yyyy-M-,一元线性回归模型,(,基本假定,),因变量,x,与自变量,y,之间具有,线性关系,在重复抽样中,自变量,x,的取值是固定的,即,假定,x,是非随机的,误差,项,是一个期望值为,0,的随机变量,即,E,(,)=0,。对于一个给定的,x,值,,y,的期望值为,E,(,y,)=,0,+,1,x,对,于所有的,x,值,,的方差,2,都,相同且相互独立,误差,项,是一个服从,正态分布,的随机变量,,即,N,(0,2,),独立性意味着对于一个特定的,x,值,它所对应的,与其他,x,值所对应的,不相关,对于一个特定的,x,值,它所对应的,y,值与其他,x,所对应的,y,值也不相关,yyyy-M-,估计的回归方程,(estimated regression equation),一元线性回归中估计的回归方程为,用,样本统计量 和 代替回归方程中的未知参数 和 ,就得到了,估计的回归方程,总体,回归参数 和,是未知的,必须利用样本数据去估计,其中:是估计的回归直线在,y,轴上的截距,是直线的斜率,它表示对于一个给定的,x,的值,是,y,的估计值,也表,示,x,每变动一个单位时,,y,的平均变动值,yyyy-M-,参数的最小二乘估计,(method of least squares),德国科学家,Karl Gauss(1777,1855),提出用最小化图中垂直方向的误差平方和来估计参数,使因变量的观察值与估计值之间的误差平方和达到最小来求得 和 的方法。即,用最小二乘法拟合的直线来代表,x,与,y,之间,的关系与实际数据的误差比其他任何直线都小,yyyy-M-,Karl Gauss,的最小化图,x,y,(,x,n,y,n,),(,x,1,y,1,),(,x,2,y,2,),(,x,i,y,i,),e,i,=,y,i,-,y,i,yyyy-M-,用,Excel,进行回归分析,第,1,步:,选择,【,工具,】,下拉菜单,第,2,步:,选择,【,数据分析,】,选项,第,3,步:,在分析工具中选择,【,回归,】,,选择,【,确定,】,第,4,步:,当对话框出现时,在,【,Y,值输入区域,】,设置框内键入,Y,的数据区域,在,【,X,值输入区域,】,设置框内键入,X,的数据区域,在,【,置信度,】,选项中给出所需的数值,在,【,输出选项,】,中选择输出区域,在,【,残差,】,分析选项中选择所需的选项,用,Excel,进行回归,yyyy-M-,不良贷款对贷款余额的回归,(,例题分析,),6.2.2,涉及多个自变量的线性回归,6.2,建立,变量间的数学表达式,yyyy-M-,多元回归模型,(multiple regression model),一个因变量与两个及两个以上自变量的回归,描述因,变量,y,如何依赖于自变量,x,1,,,x,2,,,,,x,k,和误差项,的方程,称为多元回归模型,涉,及,k,个自变量的多元回归模型可表示为,b,0,,,b,1,,,b,2,,,,,b,k,是参数,是被称为误差项的随机变量,y,是,x,1,,,x,2,,,,,x,k,的线性函数加上误差项,包含在,y,里面但不能被,k,个自变量的线性关系所解释的变异性,yyyy-M-,估计的多元回归的方程,(estimated multiple regression equation),是,估计值,是,y,的估计值,用样本统计量 估计回归方程中的 参数,时得到的方程,由最小二乘法求得,一般形式为,用,Excel,进行回归,6.3,拟合效果的度量和回归检验,6.3.1,回归方程拟合的好吗?,6.3.2,因变量与自变量之间有线性关系吗?,第,6,章 利用变量间的关系进行预测,6.3.1,回归方程拟合的好吗?,6.3,拟合效果的度量和回归检验,yyyy-M-,回归方程拟合的好吗?,(,误差分解,),x,y,y,yyyy-M-,回归方程拟合的好吗?,(,误差平方和的关系,),SST,=,SSR,+,SSE,总平方和,(,SST,),回归平方和,(,SSR,),残差平方和,(,SSE,),yyyy-M-,决定系数,R,2,(,coefficient of determination,),回归平方和,占总误差平方和的比例,反映回归直线的拟合程度,取值范围在,0,1,之间,R,2,1,,说明回归方程拟合的越好;,R,2,0,,说明回归方程拟合的越差,决定系数,平方根等于相关系数,用,Excel,进行回归,yyyy-M-,调整的多重决定系数,(,adjusted multiple coefficient of determination,),用样本量,n,和自变量的个数,k,去修正,R,2,得到,计算公式为,避免增加自变量而高估,R,2,意义与,R,2,类似,数值小于,R,2,用,Excel,进行回归,yyyy-M-,估计标准误差,(standard error of estimate),实际观察值与回归估计值误差平方和的均方根,反映实际观察值在回归直线周围的分散状况,对,误差项,的标准差,的估计,是在排除了,x,对,y,的线性影响后,,y,随机波动大小的一个估计量,反,映用估计的回归方程预测,y,时预测误差的大小,计算公式为,用,Excel,进行回归,6.3.2,因变量与自变量之间有线性关系吗?,6.3,拟合效果的度量和回归检验,yyyy-M-,因变量与自变量之间有线性关系吗?,(,线性关系检验,),提出,假设,2.,计算,检验统计量,F,作,出决策:若,F,F,(,或,P,),拒绝,H,0,用,Excel,进行回归,yyyy-M-,每个自变量对因变量都有显著影响吗,(,回归系数检验,),检验自变量,x,i,对因变量,y,的影响是否显著,提出假设,计算检验的统计量,决策,用,Excel,进行回归,6.4,所有自变量都有必要放进模型中吗?,6.4.1,自变量之间相关对模型有什么影响?,6.4.2,剔除不必要的自变量,6.4.3,模型有多好?,第,6,章 利用变量间的关系进行预测,6.4.1,自变量之间相关对模型有什么影响?,6.4,所有自变量都有必要放进模型中吗?,yyyy-M-,多重共线性,(,multicollinearity,),回归模型中两个或两个以上的自变量彼此相关,多重共线性带来的问题有,可能会使回归的结果造成混乱,甚至会把分析引入歧途,可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同预期的正负号相反,用,Excel,进行回归,yyyy-M-,多重共线性的识别,检测多重共线性的最简单的一种办法是计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验,若有一个或多个相关系数显著,就表示模型中所用的自变量之间相关,存在着多重共线性,如果出现下列情况,暗示存在多重共线性,模型中各对自变量之间显著相关,当模型的线性关系检验,(,F,检验,),显著时,几乎所有回归系数的,t,检验却不显著,回归系数的正负号与预期的相反,用,Excel,进行回归,yyyy-M-,多重共线性问题的处理,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关,如果要在模型中保留所有的自变量,则应,避免根据,t,统计量对单个参数进行检验,对因变量值的推断,(,估计或预测,),的限定在自变量样本值的范围内,用,Excel,进行回归,yyyy-M-,提示,在建立多元线性回归模型时,不要试图引入更多的自变量,除非确实有必要,在社会科学的研究中,由于所使用的大多数数据都是非试验性质的,因此,在某些情况下,得到的结果往往并不令人满意,但这不一定是选择的模型不合适,而是数据的质量不好,或者是由于引入的自变量不合适,6.4.2,剔除不必要的自变量,6.4,所有自变量都有必要放进模型中吗?,yyyy-M-,奥克姆剃刀,(Occams Razor),模型选择可遵循奥克姆剃刀的基本原理,最好的科学模型往往最简单,且能解释所观察到的实事,对于线性模型来说,奥克姆剃刀可表示成简约原则,一个模型应包括拟合数据所必需的最少变量,如果一个模型只包含数据拟合所必需的变量,这个模型就称为简约模型,(parsimonious model),实际中的许多多元回归模型都是对简约模型的扩展,yyyy-M-,变量选择过程,在建立回归模型时,对自变量进行筛选,选择自变量的原则是对统计量进行显著性检验,将一个或一个以上的自变量引入到回归模型中时,是否使得残差平方和,(,SSE,),有显著地减少。如果增加一个自变量使,SSE,的减少是显著的,则说明有必要将这个自变量引入回归模型,否则,就没有必要将这个自变量引入回归模型,确定引入自变量是否使,SSE,有显著减少的方法,就是使用,F,统计量的值作为一个标准,以此来确定是在模型中增加一个自变量,还是从模型中剔除一个自变量,变量选择的方法主要有:向前选择、向后剔除、逐步回归、最优子集等,yyyy-M-,向前选择,(forward selection),从模型中没有自变量开始,对,k,个自变量分别拟合对因变量的一元线性回归模型,共有,k,个,然后找出,F,统计量的值最高的模型及其自变量,并将其首先引入模型,分别拟合引入模型外的,k,-1,个自变量的线性回归模型,如此反复进行,直至模型外的自变量均无统计显著性为止,yyyy-M-,向后剔除,(backward elimination),先对因变量拟合包括所有,k,个自变量的回归模型。然后考察,p,(,p,k,),个去掉一个自变量的模型,(,这些模型中在每一个都有的,k,-1,个自变量,),,使模型的,SSE,值减小最少的自变量被挑选出来并从模型中剔除,考察,p-1,个再去掉一个自变量的模型,(,这些模型中每一个都有,k,-2,个的自变量,),,使模型的,SSE,值减小最少的自变量被挑选出来并从模型中剔除,如此反复进行,一直将自变量从模型中剔除,直至剔除一个自变量不会使,SSE,显著减小为止,yyyy-M-,逐步回归,(stepwise regression),将向前选择和向后剔除两种方法结合起来筛选自变量,在增加了一个自变量后,它会对模型中所有的变量进行考察,看看有没有可能剔除某个自变量。如果在增加了一个自变量后,前面增加的某个自变量对模型的贡献变得不显著,这个变量就会被剔除,按照方法不停地增加变量并考虑剔除以前增加的变量的可能性,直至增加变量已经不能导致,SSE,显著减少,在前面步骤中增加的自变量在后面的步骤中有可能被剔除,而在前面步骤中剔除的自变量在后面的步骤中也可能重新进入到模型中,yyyy-M-,用,SPSS,进行逐步回归,(stepwise regression),用,SPSS,进行回归,第,1,步:,选择,【,Analyze,】,下拉菜单,并选择,【,Regression-linear,】,选项进入主对话框,第,2,步:,在主对话框中将因变量选入,【,Dependent,】,,将,所有自变量选入,【,Independent(s)】,;在,【,Method,】,下选择,【,Stepwise,】,第,3,步,(,需要预测时,),点击,【,Save,】,,在,【,Prediction,interval,】,下选中,【,Mean,】,和,【,Individual,】,,点,击,【,Continue,】,回到主对话框。点击,【,OK,】,yyyy-M-,逐步回归,(,例题分析,SPSS,输出结果,),Variable Entered/Removed,a,model,Variable Entered,Variable Removed,method,1,各项贷款余额,x1,Stepwise(Criteria:Probability-of-F-to-enter=.050,Probability-of-F-to-remove=.100).,2,固定资产投资额,x4,Stepwise(Criteria:Probability-of-F-to-enter=.050,Probability-of-F-to-remove=.100).,a Dependent variable:,不良贷款,y,yyyy-M-,逐步回归,(,例题分析,SPSS,输出结果,),Model summary,model,R,R-Square,Adjusted R-Square,Std.Error of the Estimate,1,.844,a,.712,.699,1.9799,2,.872,b,.761,.739,1.8428,a Predictors:(Constant),各项贷款余额,x1,b Predictors:(Constant),各项贷款余额,x1,固定资产投资额,x4,含,x,1,和,x,4,的模型,只含,x,1,的模型,yyyy-M-,逐步回归,(,例题分析,SPSS,输出结果,),ANOVA,c,model,Sum of Squares,df,Mean Square,F,Sig.,1 Regress,Residual,Total,222.486,90.164,312.650,1,23,24,222.486,3.920,56.754,.000,a,2 Regress,Residual,Total,237.941,74.709,312.650,2,22,24,118.971,3.396,35.034,.000,b,a Predictors:(Constant),各项贷款余额,x1,b Predictors:(Constant),各项贷款余额,x1,固定资产投资额,x4,c Dependent variable:,不良贷款,y,yyyy-M-,逐步回归,(,例题分析,SPSS,输出结果,),Model,Unstandardized,Coefficients,Unstandardized,Coefficients,t,Sig.,B,Std.Error,Beta,1 (Constant),贷款余额,x1,-.830,.038,.723,.005,0844,-1.147,7.534,.263,.000,2 (Constant),贷款余额,x1,固定资产投资,x4,-.443,.050,-.032,.697,.007,.015,1.120,-.355,-.636,6.732,-2.133,.531,.000,.044,a Dependent variable:,不良贷款,y,Coefficients,a,yyyy-M-,模型有多好?,建立的模型是否合适?或者说,这个拟合的模型有多“好”?可以从以下几个方面入手分析,所估计的回归系数,的符号是否与理论或事先,预期相一致,回归模型在多大程度上解释了因变量,y,取值的差异?可以用判定系数,R,2,来,回答这一问题,考察关于误差项,的,正态性假定,是否成立。因为在对线性关系进行,F,检验和回归系数进行,t,检验时,都要求误差项,服从正态分布,否则所用的检验程序将是无效的。,正态性的简单方法是画出残差正态概率图,6.5,用自变量预测因变量,第,6,章 利用变量间的关系进行预测,yyyy-M-,用自变量预测因变量,根据自变量,x,的取值,利用估计的回归方程预测因变量,y,的取值,点估计,对于自变量,x,的一个给定值,x,0,,根据回归方程得到因变量,y,的一个估计值,区间估计,对于自变量,x,的一个给定值,x,0,,根据回归方程得到因变量,y,的一个估计区间,y,的平均值的,置信区间,(,confidence interval,),y,的个别值的,预测区间,(prediction,interval,),yyyy-M-,用,SPSS,求置信区间和预测区间,用,SPSS,进行回归,第,1,步:,选择,【,Analyze,】,下拉菜单,并选择,【,Regression-linear,】,选项进入主对话框,第,2,步:,在主对话框中将因变量选入,【,Dependent,】,,将,所有自变量选入,【,Independent(s)】,;在,【,Method,】,下选择,【,Stepwise,】,(,一元回归略去此步,),第,3,步,(,需要预测时,),点击,【,Save,】,,在,【,Prediction,interval,】,下选中,【,Mean,】,和,【,Individual,】,,点,击,【,Continue,】,回到主对话框。点击,【,OK,】,6.6,含有定性自变量的回归,第,6,章 利用变量间的关系进行预测,yyyy-M-,虚拟自变量,(,dummy variable,),用数字代码表示的定性自变量,虚拟自变量可有不同的水平,只有两个水平的虚拟自变量,比如,性别,(,男,女,),有两个以上水平的虚拟自变量,贷款企业的类型,(,家电,医药,其他,),虚拟变量的取值为,0,,,1,yyyy-M-,含有定性自变量的回归,回归模型中使用虚拟自变量时,称为虚拟自变量的回归,当虚拟自变量只有两个水平时,可在回归中引入一个虚拟变量,比如,性别,(,男,女,),一般而言,如果定性自变量有,k,个水平,需要在回归中模型中引进,k,-1,个虚拟变量,yyyy-M-,含有定性自变量的回归,(,例题分析,),【,例,】,为研究工资水平与工作年限和性别之间的关系,在某行业中随机抽取,10,名职工,所得数据如右表,用,Excel,进行回归,yyyy-M-,虚拟自变量的回归,(,例题分析,),引进虚拟变量时,回归方程写为,E,(,y,)=,0,+,1,x,1,+,2,x,2,女,(,x,2,=0),:,E,(,y,|,女性,)=,0,+,1,x,1,男,(,x,2,=1),:,E,(,y,|,男性,)=(,0,+,2,)+,1,x,1,0,的含义表示:女性职工的期望月工资收入,(,0,+,2,),的含义表示:男性职工的期望月工资收入,1,含义表示:工作年限每增加,1,年,男性或女性工资的平均增加值,2,含义表示:男性职工的期望月工资收入与女性职工的期望月工资收入之间的差值,(,0,+,2,)-,0,=,2,案例讨论,1,、案例背景:,经济增长理论是宏观经济学的重要组成部分,经济增长的源泉一直是宏观经济学研究的核心问题。制度,-,经济增长理论认为物质资本、人力资本、劳动力和技术的增长本身就是经济增长的一部分,而不是引起经济增长的根本原因。有效率的制度和经济组织才是各种生产要素投入增长以及总体经济产出增长的关键。因为有效率的组织和制度可以确立和界定人们的权利,以形成合理的激励与约束机制,使经济主体的的利益目标与与社会目标接近,从而使各种资源得到有效率的配置,使人们努力的进行创新、资本积累、教育投入以促进规模经济的形成,最后表现为经济的增长。在转轨过程中,制度变迁和制度建设对经济增长显得尤为重要。,自,1978,年改革开放以来,中国经济已经经历了,30,多年的高速增长。这种持续高速增长的一个核心因素就是改革开放导致的中国制度变革。然而,中国的制度变革如何及在何种程度上引起经济增的增长?中国经济的这种增长能否持续下去?经济增长的潜力何在?这些都成为近年来经济学研究的热门问题。对这些问题的研究是中国进一步推进改革开放和制定宏观经济政策的基础。,案例讨论,2,、指标设定与数据来源,(,1,)制度变迁指标的选取,本案例应用以下指标作为中国经济制度变迁的替代指标。,1,)开放程度,(KFC),,用对外贸易依存度表示即进出口总额与国内生产总值的比率。,2,)工业化水平,(GYH),,用工业总产值占国内生产总值的比重表示。,3,)城镇化水平,(CZH),,用第二和第三产业就业人数占总就业人数的比重表示。,4,)经济增长用,GDP,可比价格定比增长指数表示(,1980,年,=100,)。,(,2,)数据来源,本案例数据根据,1993-2012,年,中国统计年鉴,。,案例讨论,3,、案例分析要求,通过本案例,使学生掌握以下内容:(,1,)使学生掌握回归分析的基本原理和基本思想,理解回归分析的基本假设条件。(,2,)能够应用统计软件进行统计分析,并解释回归结果。(,3,)残差分析的意思和作用。(,4,)能够用回归方程进行估计和预测。,yyyy-M-,本章小结,6.1,考虑变量间的关系,6.2,建立变量之间的回归模型,6.3,拟合效果的度量和回归检验,6.4,变量筛选与建模,6.5,用自变量预测因变量,6.6,含有定性自变量的回归,结 束,THANKS,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




《应用统计学》(06)第6章利用变量间的关系进行预测.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12558923.html