计量经济学——虚拟解释变量模型.ppt
《计量经济学——虚拟解释变量模型.ppt》由会员分享,可在线阅读,更多相关《计量经济学——虚拟解释变量模型.ppt(96页珍藏版)》请在咨信网上搜索。
1、计量经济学计量经济学虚拟解释变量模虚拟解释变量模型型 在经济计量模型中除了有量的因素外在经济计量模型中除了有量的因素外还有质的因素,质的因素包括被解释变量还有质的因素,质的因素包括被解释变量为质的因素和解释变量为质的因素。如果为质的因素和解释变量为质的因素。如果被解释变量为质的因素,主要是逻辑回归被解释变量为质的因素,主要是逻辑回归要涉及的内容。本章就解释变量为质的因要涉及的内容。本章就解释变量为质的因素也就是存在虚拟解释变量时如何进行参素也就是存在虚拟解释变量时如何进行参数估计等一系列问题进行讨论。数估计等一系列问题进行讨论。1.第一节 引 言 在经济计量分析中,经常会碰到所建模型的被解释变
2、量不仅受诸如收入、产量、价格、成本、需求、投资等数量变量的影响,而且也受到诸如战争、自然灾害、国际环境、季节变动以及政府经济政策变动等质量变量的影响。建立经济计量模型若不考虑这些质量变量的影响作用,显然是不适宜的。2.所以,在建立经济计量模型时,即要考虑数量变量,也要考虑质量变量。但是,质量变量和数量变量不同,数量变量可以在事前规定好的尺度上,用不同的数值表现出来,质量变量却只能以属性、种类的不同具体形式表现出来。3.例例如如,性性别别可可表表现现为为男男或或女女;人人种种可可表表现现为为白白种种人人和和非非白白种种人人;宗宗教教信信仰仰可可表表现现为为教教徒徒和和非非教教徒徒;政政府府的的经
3、经济济政政策策可可表表现现为为改改革革开开放放前前和和改改革革开开放放后后,如如此此等等。等等。4.显然,这种不同的具体形式是无法直接引入经济计量模型中去的。但由于这类变量通常表现为品质、属性、种类的出现或者未出现,所以我们可以根据质量变量的这一特征将其数量化。给定某一质量变量某属性的出现为1,未出现为0,称这样的变量为虚拟变量。5.当然,把哪种情况取0,哪种情况取1要视研究情况而定。0和1只是一个符号而已,不代表他们有高低的意义。我们可以把男性设为1,也可以设为0,得到的结果是一致的。这样就可以把量化的质量变量引入经济计量模型中,以便进一步进行数学处理。6.需需需需要要要要指指指指出出出出的
4、的的的是是是是,虚虚虚虚拟拟拟拟变变变变量量量量主主主主要要要要是是是是用用用用来来来来代代代代表表表表质质质质的的的的因因因因素素素素,但但但但是是是是有有有有些些些些情情情情况况况况下下下下也也也也可可可可以以以以用用用用来来来来代代代代表表表表数数数数量量量量因因因因素素素素。例例例例如如如如在在在在建建建建立立立立储储储储蓄蓄蓄蓄函函函函数数数数时时时时,“收收收收入入入入”显显显显然然然然是是是是一一一一个个个个重重重重要要要要解解解解释释释释变变变变量量量量,虽虽虽虽然然然然是是是是“数数数数量量量量”因因因因素素素素,但但但但是是是是为为为为了了了了方方方方便便便便也也也也可可可
5、可以用虚拟变量表示。以用虚拟变量表示。以用虚拟变量表示。以用虚拟变量表示。7.虚拟解释变量模型的设定因为质的因素的多少和这些因素特征的多少而引入的虚拟变量也会不同。第二节第二节 虚拟解释变量的设定虚拟解释变量的设定8.以一个最简单的虚拟变量模型为例,如果只包含一个质的因素,而且这个因素仅有两个特征,则回归模型中只需引入一个虚拟变量。如果是含有多个质的因素,自然要引入多个虚拟变量。9.如果只有一个质的因素,且具有如果只有一个质的因素,且具有m个特个特征,那么如果是含有截距项的,就要引入征,那么如果是含有截距项的,就要引入m-1个虚拟变量;不含有截距项的,个虚拟变量;不含有截距项的,应该应该引入引
6、入m个虚拟变量,这就是虚拟变量的设个虚拟变量,这就是虚拟变量的设定原则。定原则。10.一一、截距变动模型和斜率变动模型、截距变动模型和斜率变动模型 (一)包含一个虚拟变量的截距变动模型(一)包含一个虚拟变量的截距变动模型 首先从最简单的例子入手,假设只有一首先从最简单的例子入手,假设只有一个定性因素影响被解释变量的变化,而且这个定性因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候只需要引入一个因素仅有两种特征,这时候只需要引入一个虚拟变量。个虚拟变量。11.【例8.1】假设有一个包括正常年份和非正常年份(亚洲金融危机或SARS的影响)居民消费的样本,并打算用这些数据估计消费函数。由于
7、在正常年份和非正常年份居民在消费水平上存在明显差异,所以一些外界的影响是一个重要的解释变量。12.用一个虚拟变量来表示这个质的因素,用一个虚拟变量来表示这个质的因素,消费函数为消费函数为 式中,式中,Yi=第个居民的消费水平,第个居民的消费水平,Xi=第个第个居民的收入水平,居民的收入水平,D为虚拟变量。我们用为虚拟变量。我们用D=1表示正常年份这一特征,用表示正常年份这一特征,用D=0来表来表示非正常年份示非正常年份(8.1)13.假设E(u i)=0,式(8.1)可以写成(8.3)(8.28.2)14.式(8.2)和式(8.3)分别为正常年份和非正常年份的居民消费水平。二者具有相同的斜率,
8、但是截距不同。15.对对 1 1 作作t t 检验,若检验,若 1 显著地不为显著地不为0,我们就认为正常年份和非正常年份居民在我们就认为正常年份和非正常年份居民在消费行为上的差异是明显的。若消费行为上的差异是明显的。若 1 0,则,则正常年份的居民消费水平高于非正常年份正常年份的居民消费水平高于非正常年份的居民消费水平。的居民消费水平。利用最小二乘法对利用最小二乘法对式(式(8.1)进行估计,可得到进行估计,可得到(8.4)16.通过例8.1,我们可以找出虚拟变量模型的一些特征。用用用用“1”“1”“1”“1”来代表质的因素的哪个特征来代表质的因素的哪个特征来代表质的因素的哪个特征来代表质的
9、因素的哪个特征是可以任意设定的。我们一般认为,是可以任意设定的。我们一般认为,是可以任意设定的。我们一般认为,是可以任意设定的。我们一般认为,“1”“1”“1”“1”代表具有某些特征,但没有具体规定。在上代表具有某些特征,但没有具体规定。在上代表具有某些特征,但没有具体规定。在上代表具有某些特征,但没有具体规定。在上例中,也可以指定例中,也可以指定例中,也可以指定例中,也可以指定D=1D=1时为非正常年份,而时为非正常年份,而时为非正常年份,而时为非正常年份,而D=0D=0就必然为正常年份。在这种情况下,正就必然为正常年份。在这种情况下,正就必然为正常年份。在这种情况下,正就必然为正常年份。在
10、这种情况下,正常年份和非正常年份的消费函数分别为常年份和非正常年份的消费函数分别为常年份和非正常年份的消费函数分别为常年份和非正常年份的消费函数分别为17.如果我们绘制图形,得到的结果仍然如果我们绘制图形,得到的结果仍然是一样的。此时,是一样的。此时,1 1,非正常年份的,非正常年份的线低于正常年份的线,代表非正常年份的线低于正常年份的线,代表非正常年份的消费水平低于正常年份的消费水平。消费水平低于正常年份的消费水平。18.虚拟变量D=0所代表的特性或状态通常称为基础类型。和其它特征或状态比较的意义上说,基础类型为对比的基础,在式(8.)和式(8.)中,非正常年份就是基础类型,而在式(8.5)
11、和式(8.6)中,正常年份就是基础类型。模型中的系数0 为基础类型的截距项,称为公共截距项;系数1 称为差别截距系数,指的是D取1时截距系数和基础类型的截距系数的差异。19.如果一个回归模型有截距项,而如果一个回归模型有截距项,而且这个质的因素又有两种特征,也就是且这个质的因素又有两种特征,也就是将其分两类,则我们只需要引入一个虚将其分两类,则我们只需要引入一个虚拟变量。如我们的拟变量。如我们的例例8.1所示。如果一个所示。如果一个回归方程有截距项,回归方程有截距项,只有一个质的因素只有一个质的因素影响被解释变量,它有个影响被解释变量,它有个m特征,我们特征,我们就要引入就要引入m-1个虚拟变
12、量;个虚拟变量;20.如果回归方程没有截距项,那么这个质的因素有多少个特征就要设多少个虚拟变量,这就是虚拟变量的使用原则。如果虚拟变量设定不当,会使最小二乘法无解,称这种情况为虚拟变量陷阱。21.下面就用线性代数中的知识来说明这一下面就用线性代数中的知识来说明这一点。同样点。同样用例用例8.1,引入两个虚拟变量对有,引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。截距项和没有截距项的情况分别讨论。(1)对有截距项的情况,我们如果设两个对有截距项的情况,我们如果设两个虚拟变量,则回归模型为虚拟变量,则回归模型为(8.7)22.式式(8.7)也可表示为也可表示为其中,其中,显然如下等式成立。
13、,显然如下等式成立。(8.8)(8.9)23.式(8.9)表明模型(8.8)即原模型(8.7)中有完全的多重共线性,将导致最小二乘估计无解。我们称该情景为掉入虚拟变量陷阱。所以,在有截距项的情况下,如果一个质的因素有多少个特征就引入多少个虚拟变量是行不通的。24.(2)对没有截距的情况,我们如果设两个虚对没有截距的情况,我们如果设两个虚拟变量,拟变量,显然显然模型模型(8.10)中,解释变量中,解释变量D1,D2和和X之间之间无完全的多重共线性。可以使用普通最小二乘无完全的多重共线性。可以使用普通最小二乘法估计法估计式(式(8.10)的参数。的参数。(8.10)25.(二)斜率变动模型 在实际
14、问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速率也就是弹性。例如城镇居民家庭与农村居民家庭的消费函数,在边际消费倾向(斜率)上可能会有所不同,假设它们的消费函数在截距项没有区别。26.那么回归模型可记为那么回归模型可记为(8.11)其中,其中,Yi=第个家庭的消费水平,第个家庭的消费水平,Xi=第个家庭的收入水平,第个家庭的收入水平,27.式(8.11)可以表示为(8.12)(8.13)28.(三)包含多个虚拟变量的截距变动模型(三)包含多个虚拟变量的截距变动模型 如果一个质的因素仅有两种特征,只如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但是,很多质的因素需引入一个
15、虚拟变量。但是,很多质的因素往往不只具有两个特征,例如全世界的国家往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国可以分为发达国家、发展中国家、不发达国家家。29.我国少数民族在很多问题上有差异,所以当把民族作为虚拟变量时,不能简单将其分为汉族和非汉族;季节因素是我们最常见的质的因素,它具有四个特征,按照前面的原则,我们要引入三个虚拟变量。30.例如,我们用季度资料研究各种商品消费额在季节上有没有什么区别?可以建立模型如下:(8.14)其中,其中,其中,其中,YYtt=季度的消费,季度的消费,季度的消费,季度的消费,XXtt=季度的收入,季度的收入,季度的收入,季度
16、的收入,对于四个季度,我们引入了三个虚拟变量:对于四个季度,我们引入了三个虚拟变量:对于四个季度,我们引入了三个虚拟变量:对于四个季度,我们引入了三个虚拟变量:31.这里,第四季度为基础类型,其截距项为这里,第四季度为基础类型,其截距项为0 。而其它三个季度的截距项分别为。而其它三个季度的截距项分别为 0+1,0+2 ,0+3 。1,2,3 代表季代表季节变动引起的消费差异。节变动引起的消费差异。32.四个季度的回归模型分别为(8.15)(8.16)(8.17)(8.18)33.(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对回归在多数情况下,质的因素不但
17、对回归模型的截距有影响,而且还会改变模型的模型的截距有影响,而且还会改变模型的斜率。例如城镇居民和农村居民的消费函斜率。例如城镇居民和农村居民的消费函数不但在斜率上有差异,在截距上也是有数不但在斜率上有差异,在截距上也是有可能不一致的,将两个问题同时考虑进来可能不一致的,将两个问题同时考虑进来,我们可以得到回归方程,我们可以得到回归方程 34.(8.19)式中,式中,Yi=第个家庭的消费水平,第个家庭的消费水平,Xi=第个第个家庭的收入水平家庭的收入水平,35.1和 3 分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。式(8.19)可以表示为(8.208.20)(8.218.
18、21)36.我们一般通过我们一般通过t t 检验来判定它们之间是否有检验来判定它们之间是否有差异。差异。1.1.若若10 0,300,则为截距和斜率同时,则为截距和斜率同时变动模型;变动模型;2.2.若若 10,0,3=0=0,则为截距变动模型;,则为截距变动模型;3.3.若若 1=0=0,3=0,=0,则表示城镇居民家庭和则表示城镇居民家庭和农村居农村居 民家庭有着完全相同的消费模式;民家庭有着完全相同的消费模式;4.4.若若 1=0=0,30,0,则为斜率变动模型,这则为斜率变动模型,这种情况在现实中出现得不是很多。种情况在现实中出现得不是很多。37.下面,以我国的农村和城市的消费样本为例
19、,实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。【例8.2】已有数据资料为我国城镇居民家庭1955年至1985年人均收入和人均储蓄。根据经验,也就是先验信息,再通过某些检验,我们发现储蓄和收入有很强的相关关系而且收入的变化会引起储蓄的变化。38.假定它们之间为线性关系,我们可以建立假定它们之间为线性关系,我们可以建立储蓄模型如下储蓄模型如下 式中,式中,St=人均储蓄,人均储蓄,Xt=人均收入,人均收入,t=年年份(份(t=1955=1955,19561956,19851985)。)。(8.22)39.把把19551955年作为基期并把该期的价格水平年作为基期并把该期的价格水
20、平定为定为100,再分别扣除包含在和中的物价,再分别扣除包含在和中的物价上涨因素。用最小二乘法估计上涨因素。用最小二乘法估计式(式(8.22),),得到得到 R2=0.833=0.833,DW=0.398=0.398 (8.22)40.模型(8.23)包含了这样一个假定,那就是在1955到1985年期间我国城镇居民家庭的储蓄行为大体保持不变。这一假定实际上是行不通的,因为在十一届三中全会召开之后,居民的收入大大增加,而且与居民储蓄有关的许多重要因素在1979年以后发生了明显变化。在改革开放之前,我国居民的收入水平仅仅能够维持温饱水平,根本不可能有多少储蓄;41.1979年以后,我国居民的收入水
21、平大幅度提高,同时,居民储蓄也在大幅度增长。从这些可以看出来,1979年前后两个时期,我国居民的边际储蓄倾向有显著性差异。42.在改革开放前的大多数年份,我国的消费市场常常是供不应求,许多商品要国家下达计划指标,居民凭票证购买,经常出现的问题是顾客即使有钱也难买到需要的商品,就不得不把钱存起来。这时候的储蓄就带有非自愿的性质。43.而在而在19791979年以后年以后,物资逐渐丰富物资逐渐丰富,商商品的买卖也取消了票证的限制品的买卖也取消了票证的限制,消费者消费者储蓄的主要目的之一是购买高档耐用储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有消费品,储蓄不再具有“被迫被迫”的性的性质。质。
22、44.为了验证城镇居民的储蓄行为是否有显著变化,可以建立下面的截距和斜率同时变动模型。(8.248.24)式中式中,St和和Xt仍代表人均储蓄和人均收入仍代表人均储蓄和人均收入,D D为虚拟变量,为虚拟变量,45.用最小二乘法估计用最小二乘法估计式式(8.24),可以得到可以得到(8.258.25)46.其中,参数估计值下面括号中的数字为统计值。显然,在1979年前后储蓄模型的截距和斜率有明显差异。式(8.25)可以写为两个方程(8.268.26)(8.278.27)47.由以上模型可知,我国城镇居民的边际储蓄倾向在1979年以前仅为0.004,也就是收入增加1元,储蓄平均增加4厘;而从197
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 虚拟 解释 变量 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。