张晓峒老师蒙特卡罗摸底.doc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 张晓峒 老师 蒙特卡罗 摸底
- 资源描述:
-
专题5 蒙特卡罗模拟的有关问题 大家知道,只有当经典回归模型满足所有的假定条件时,参数的估计量才具有最佳线性无偏特性,即有限样本特性,同时也具有渐近特性。当假定条件不成立时(比如存在异方差、自相关等),所采用的广义最小二乘法,以及对联立方程模型的估计,动态分布滞后模型的估计,向量自回归模型的估计所得参数的估计量只具有渐近特性。也就是说,只有当样本容量相当大时,渐近特性才起作用。而当样本容量不是很大,甚至很小时,仍然不知道估计量的有限样本分布特征。 另外通过对非平稳过程的研究知单位根检验式和非平稳变量之间回归参数和t统计量不服从正态分布。他们都是渐近地服从Wiener过程函数的分布。参数估计量和统计量的有限样本特性不能用解析的方法求解。 对于上述两种情形,若要研究这些估计量和统计量的有限样本分布特征,通常采用两种方法。一种为数值计算法。也称为有限样本近似法(finite-sample approximation)。这种方法要用到许多数学知识,专业性很强,使没有受过专门训练的人员运用此方法受到限制。(2)蒙特卡罗模拟方法。又称随机模拟法。Boot strap 1.蒙特卡罗(Monte Carlo)模拟和自举(Boost trap)发展过程 这是一种通过设定随机过程(数据生成系统),反复生成时间序列,并计算参数估计量和统计量,进而研究其分布特征的方法。蒙特卡罗在欧洲的摩那哥,以著名赌城而得名。据说这个术语是Metropolis 在1949年提出的。若再晚些时候,蒙特卡罗模拟也许就称作Las Vegas(在美国的Nevada州,著名赌城)模拟方法了。 自举模拟与蒙特卡罗模拟既有联系,又不相同。自举(Boost trap,亦称靴襻)这个名词是Efron在1979年提出的。“自举”一词来源于儿童故事。指一个人落水时,试图用自提鞋扣儿的方法自救。20世纪80,90年代发展很快。自举,即采用从总体中反复抽取样本的方法计算参数估计量的值,置信区间或相应统计量的值并估计这些量的分布。这里介绍的远不是自举模拟的全貌,而是参数估计方面的应用。 因为这些方法的实现是以高容量和高速度的计算机为前提条件,所以只是在近年才得到广泛推广。 2.蒙特卡罗模拟和自举模拟原理 进行蒙特卡罗模拟和自举模拟首先要设定数据生成系统。而设定数据生成系统的关键是要产生大量的随机数。例如模拟样本为100的随机趋势过程的DF统计量的分布,若试验1万次,则需要生成200万个随机数。 计算机所生成的随机数并不是“纯随机数”,而是具有某种相同统计性质的随机数。计量经济学中蒙特卡罗模拟和自举模拟所用到的随机数一般是服从N(0,1)分布的随机数。计算机生成的随机数称作“伪随机数”(pseudo-random number)。生成的随机数的程序称作“伪随机数生成系统”。实际上计算机不可能生成纯随机数。 在进行蒙特卡罗模拟时一般要给定多种条件。例如样本容量要选择50,100,200等多种。有时模型形式也要选择多种。从而研究参数估计量和统计量在各种条件下的分布特征。当只需要这几个特定条件下的模拟结果时,把结果纪录下来就可以了。当需要很多条件下的模拟结果时,一般采用估计响应面函数(response surface function)的方法研究之。例如Dicky-Fuller的DF检验表中只给出了样本容量为25,50,100,250,500几个点的DF分布特征。显然对25至500间每个样本容量都进行DF分布模拟是不实际的,也是无必要的。可以把上述几个条件下得到的DF分布百分位数看作样本点,然后采用回归的方法从而得到每个样本容量所对应的DF分布百分位数。这条回归直线称为响应面函数。麦金农的协整检验临界值表就是用这种方法得到的。 一个简单的估计回归参数估计量分布的蒙特卡罗模拟流程图见图1。 生成xt, yt 设定xt, yt 估计和 t()统计量 设定循环 次数N 分析和 t()的分布 达到N 未达到N 图1 蒙特卡罗模拟过程示意图 自举方法的原理是从独立同分布(IID)总体X中确定T个随机变量{x1, x2, …, xT}。则第一个自举样本是 X1* = {x11, x12, …, x1T} 现在随机得到N个自举样本, X2* = {x11, x12, …, x1T} X3* = {x11, x12, …, x1T} ... XN* = {xN1, xN2, …, xNT} 假设关心的是统计量(X),那么用N个自举样本可以得到一个容量为N的(X)的估计值序列, {(X1*), (X2*), …, (XN*)} 通过这个序列,可以研究(X)的分布特征,(X)的特征数,百分位数,(X)的平均数与真值q 的差以及用(X)的第a/2、(1-a/2)百分位数构造q 的(1-a)的置信区间。 一个简单的分析t()分布特征的自举模拟流程图见图2。 设定xt,生成xt, 估计和 t()统计量 设定循 环次数 生成 yt 分析和 t()的分布 达到 设定b0, b1 未达到 图2 自举模拟过程示意图 3.计算机高级语言(Mathematica和EViews介绍) 蒙特卡罗模拟和自举模拟的实现要通过计算机编程来实现。常用的软件有Mathematica,Gauss,Ox,EViews等。其原理基本一样。 下面主要介绍EViews和Mathematica。Mathematica由Wolfram Research公司1991年推出。是一种计算机高级语言。具有计算与画图等多种功能。若干例子见图。 图3 随机游走序列 图4 带趋势项的随机游走序列 图5 三维图圆环 图6 空间曲面 图7 投币1000次的概率值模拟 图8 生长曲线 图9 二元正态分布 图10 蒲丰问题 4.蒙特卡罗模拟框图与Mathematica、EViews程序。 (1)两个I(1)变量相关系数分布的蒙特卡罗模拟。 估计相关 系数r 分析r的 分布 生成 xt, yt~I(1) 设定 xt, yt ~I(1) 设定循环 次数N 达到N 未达到N 图11 蒙特卡罗模拟过程示意图 Mathematica程序如下: corre2[t_,f_]:= Module[{x,y,xx,yy,Exx,Eyy,Sxxyy,Sxx,Syy,rr}, Table[ x=Table[Random[NormalDistribution[0,1]],{t}]; y=Table[Random[NormalDistribution[0,1]],{t}]; xx=FoldList[Plus,0,x];xx=Rest[xx]; yy=FoldList[Plus,0,y];yy=Rest[yy]; Exx=Apply[Plus,xx]/t; Eyy=Apply[Plus,yy]/t; Sxxyy=(xx-Exx).(yy-Eyy); Sxx=Sqrt[(xx-Exx).(xx-Exx)]; Syy=Sqrt[(yy-Eyy).(yy-Eyy)]; rr=Sxxyy/(Sxx Syy), {f} ] ] r2=corre2[100,10000]; histg4[r2,0,1,0.1] 图12 两个非相关I(1) 序列的相关系数的分布 EViews程序如下: workfile corr u 1 500 series result for !i=1 to 500 smpl 1 100 series x=nrnd series y=nrnd series xx series yy scalar sum1=0 scalar sum2=0 for !counter=1 to 100 sum1=sum1+x(!counter) sum2=sum2+y(!counter) xx(!counter)=sum1 yy(!counter)=sum2 next scalar r=@cor(xx,yy) result(!i)=r next result.hist 定义一个非时间序列(u)工作文件,corr,容量为500。 定义一个空序列result,用来存储相关系数的计算结果。 !i为控制变量,通过一个for循环语句使计算进行500次。 把样本范围设置成100。 生成两个互不相关的白噪声序列x、y,样本容量100。 定义两个空的序列xx和yy,样本容量也是100。 定义两个标量sum1和sum2,初始值为0。 !counter为控制变量,在这个for循环中,分别对序列x和y进行一次累加生成两个一阶单整的序列,将结果分别放到序列xx和yy中。 累加一次。 计算序列xx和yy的相关系数,并将结果放到标量r中。 将相关系数计算结果放到序列result中,在这个for循环中,这个操作要进行500次。 显示序列result的直方图以及有关统计量。 图13 两个非相关I(1) 序列的相关系数的分布 (2) t()分布的蒙特卡罗模拟。 数据生成过程如下, yt = yt-1 + ut , ut ~ IID(0, 1) 估计的方程式如下: yt = m +b yt-1 + ut , 检验统计量 t()= 图14 t()统计量分布的蒙特卡罗模拟(T =50,模拟1万次) (3)DW统计量分布的蒙特卡罗模拟 生成T=50的相互独立的IN(0,1)序列ut 和vt 用ut 和vt分别生成两个相互独立的I(1)序列 yt = yt-1 + ut , y0 = 0, xt = xt-1 + vt , x0 = 0, 估计模型yt = b0 + b1xt + wt 并计算残差 用残差计算DW统计量的值 存储2000个DW值 画DW频数分布直方图。记录T=50条件下DW分布的均值、标准差和第90、95、99百分位数。 分别估计DW均值、标准差和第90、95、99百分位数值对(1/T )的响应面函数 图15 (2)DW统计量分布蒙特卡罗模拟的Mathematica程序 DWvalue[t_,f_]:= Module[{x1,y1,xx,yy,x0,x,A,B,para,u,sig,u1,Su1,DW}, Table[x1=Table[Random[NormalDistribution[0,1]],{t}]; xx=FoldList[Plus,0,x1];xx=Rest[xx]; y1=Table[Random[NormalDistribution[0,1]],{t}]; yy=FoldList[Plus,0,y1];yy=Rest[yy]; (* to estimate regression parameters *) x0=Table[1,{t}]; x={x0,xx}; A=Transpose[x]; B=Inverse[x.A]; para=B.x.yy; (* to calculate the residuals and DW value *) u=yy-A.para; sig=u.u; u1=Table[u[[i]]-u[[i-1]],{i,2,t}]; Su1=u1.u1; DW=Su1/sig,{f}] ] w5=DWvalue[100,10000]; histg4[w5,0.,2.8,0.1] 下面以论文《小样本DW统计量的分布特征》(《南开经济研究》1999第6期)为例介绍蒙特卡罗模拟流程。小样本I(1)变量的DW分布的蒙特卡罗模拟框图如上。以样本容量T = 10, 20, 30, 40 50为条件,生成相互独立的两个I(1)序列,xt, yt。每生成一对xt, yt序列,用yt对xt,回归,计算DW值。在每一个固定的样本容量条件下,模拟2000次。画DW分布直方图,计算DW分布的均值、标准差和第90、95、99百分位数值。 T = 50,模拟2000次,计算机输出结果如下: Percentiles and Descriptive Statistics histogram: DW 频率 频数 1 percentile = 0.0458583 1 0.00784 0.588 47. 5 percentile = 0.0900878 2 0.0878 2.08 166. 10 percentile = 0.123749 3 0.168 2.25 180. 90 percentile = 0.591274 4 0.248 2.18 174. 95 percentile = 0.708273 5 0.328 1.8 144. 99 percentile = 0.982932 6 0.408 1.3 104. Min value = 0.0158392 7 0.488 0.813 65. Max value = 1.2754 8 0.568 0.6 48. Mean = 0.332274 9 0.648 0.35 28. Standard Dev. = 0.196302 10 0.728 0.188 15. Skewness = 1.16207 11 0.808 0.188 15. Kurtosis = 4.67025 12 0.888 0.0375 3. Jarque-Bera = 341.307 13 0.968 0.1 8. 14 1.05 0.0125 1. 15 1.13 0.0125 1. 16 1.21 0.0125 1. 17 1.29 0 0 图16 T = 50条件下DW的分布 5.自举模拟过程框图(模型误差项非自相关、回归参数0.8的的分布) 设定样本容量T=100 T= 40 生成序列xt ~ I(1) + t 设定 b0=0.5, b1=0.8 生成ut设定f1 =0 生成yt = 0.5 + 0.8 xt + ut OLS估计 否循环次数f达5000 ? 是 估计分布的特征数 图17 模拟结果分析。模型(3)是在xt, yt非平稳条件下的OLS回归结果。具有超一致性。见表1。 表1 误差项非自相关条件下OLS估计量的分布 模型 模型条件设定与估计方法 T 分布的特征数 m s S K JB 3 ut非自相关,xt, yt非平稳+趋势。 wt, ut~IID(0,1), xt, yt ~I(1)+t xt = 0.2 t +xt-1 + wt yt = 0.5 + 0.8 xt + ut OLS法 10 0.8227 0.2938 0.215 5.67 1541.9 20 0.7967 0.1440 -0.026 5.38 1181.3 30 0.8003 0.0922 -0.097 6.28 2244.7 40 0.8005 0.0682 -0.055 6.00 1882.7 50 0.8005 0.0532 -0.288 6.94 3297.4 100 0.8003 0.0215 0.019 858 6485.6 注:(1)每个模型每个样本容量条件下各模拟5000次,估计=+xt 5000次,得5000个值。 (2)T是样本容量。m, s, S, K, 分别是分布的均值、标准差、偏度、峰度。JB是正态检验统计量。 图16是模型(3)T=40与T=100条件下,分布的比较。可见实际估计中,样本容量越大越好。 图18 T=40, 100条件下的分布 6.模拟中应注意的问题 画统计量的分布直方图时,组距的选择要恰到好处,才能充分展示出统计量的分布特征。图19,20,21画的是同一组数据。图20的组距过宽。图21的组距过窄。图19的组距恰到好处。 图19 组距适中 图20 组距过宽 图21 组距过窄 9 / 9展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




张晓峒老师蒙特卡罗摸底.doc



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/2669826.html