对数正态多层贝叶斯模型的参数估计.pdf
《对数正态多层贝叶斯模型的参数估计.pdf》由会员分享,可在线阅读,更多相关《对数正态多层贝叶斯模型的参数估计.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 35 卷第 3 期湖南文理学院学报(自然科学版)Vol.35 No.32023 年 9 月Journal of Hunan University of Arts and Science(Science and Technology)Sep.2023doi:10.3969/j.issn.16726146.2023.03.003对数正态多层贝叶斯模型的参数估计 王志凯,黄介武(贵州民族大学 数据科学与信息工程学院,贵州 贵阳,550025)摘要:为了更好地捕捉呈偏态分布数据的变化,提高统计推断的精确度,将对数正态多层先验分布的构造方法与贝叶斯定理结合建立了对数正态多层贝叶斯模型。利用Gibbs
2、抽样算法对各未知参数进行贝叶斯估计,并对使用 Gibbs 算法所生成的迭代链进行收敛性诊断。随机模拟结果显示,在相对误差、均方误差(MSE)准则下,贝叶斯估计的效果较似然估计更优。最后,通过实证分析证明了所建立的模型是切实可行的。关键词:正态多层贝叶斯模型;对数正态多层贝叶斯模型;贝叶斯估计;Gibbs 算法中图分类号:O 212.8文献标志码:A文章编号:16726146(2023)03001208Parameter estimation of lognormal multilayer Bayesian modelWang Zhikai,Huang Jiewu(School of Data
3、Science and Information Engineering,Guizhou Minzu University,Guiyang 550025,China)Abstract:In order to better capture the changes of skewed distribution data and improve the accuracy of statisticalinference,this paper combines the construction method of lognormal multilayer prior distribution with B
4、ayesiantheorem to establish a lognormal multilayer Bayesian model.The Gibbs sampling algorithm is used to estimate theunknown parameters,and the convergence of the iterative chain generated by the Gibbs algorithm is diagnosed.Therandom simulation results show that the Bayesian estimation is better t
5、han the maximum likelihood estimation underthe relative error and MSE(mean square error)criteria.Finally,the empirical analysis proves that the establishedmodel is feasible.Key words:normal multilayer Bayesian model;lognormal multilayer Bayesian model;Bayesian estimation;Gibbsalgorithm多层贝叶斯模型是具有结构化层
6、次的统计模型,它可以用来为复杂的统计问题建立多层模型从而避免参数过多导致的过拟合问题,其应用非常广泛,特别是在水文统计12、数据处理34、金融经济预测、地震强度预测等领域。在现实生活中,服从或近似于正态分布的数据具有不同的层次结构。针对不存在组内和组间异质性的数据,利用正态单层贝叶斯模型对其进行统计推断得到的结果较好。针对具有嵌套和分层结构的数据,若再用正态单层贝叶斯模型来拟合这些数据,会出现过多的参数导致过拟合的问题。因此,AndrewGelman5为了解决这些数据过拟合的问题,首次提出两层正态贝叶斯模型,并讨论了均值参数、方差参数的先验分布选择问题。此外,国内外学者还进一步对正态多层贝叶斯
7、模型进行了很多研究。例如,刘金山等67将 Andrew Gelman 提出的两层正态贝叶斯模型进行扩充到多层正态贝叶斯模型,并基于正态多层混合贝叶斯模型研究大脑 FMRI 图像分割;针对小样本情况,Yang 等8用极大似然方法和贝叶斯方通信作者:黄介武,。收稿日期:20221026基金项目:贵州省科技计划基金项目(黔科合基础20171083 号);贵州省基础研究计划(软科学)(黔科合支201920001)。第 3 期王志凯,等:对数正态多层贝叶斯模型的参数估计13法对正态多层贝叶斯模型中的未知参数进行了估计,并用迭代轨迹图对所得的贝叶斯估计进行了收敛性诊断;朱彬彬9基于 MCMC 算法对正态多
8、层贝叶斯模型中的未知参数进行了估计,使用图像判别、遍历均值和方差法对所得的贝叶斯估计进行了收敛性诊断;Haydar Demirhan 等10研究了正态多层贝叶斯模型中方差参数的联合先验分布。上面提到的研究都是在数据服从正态分布的假设下进行讨论的,而实际的数据呈现严格对称分布的情况非常的少,特别是经济学、气候科学和生态学等领域中的实际数据常常会呈现偏态分布。此时,如果再继续基于正态假设下用这些数据作统计推断,可能会获得不合理甚至错误的结论。为了更好的捕捉到这些呈偏态分布数据的变化,进而提高统计推断的精确度。常用的数据处理方法是对这些数据进行取对数,这种数据处理方法可以在一定程度上修正数据的偏态分
9、布问题,使其更加接近于正态分布。因此,本文为了解决实际中一些数据呈偏态分布而不适用于正态多层贝叶斯模型的问题,将对数正态多层先验分布的构造方法与贝叶斯定理结合,建立对数正态多层贝叶斯模型,利用贝叶斯方法对对数正态多层贝叶斯模型进行参数估计,并通过实证分析说明该模型能更好的对呈偏态分布的数据进行统计推断。1 模型1.1多层贝叶斯模型多层贝叶斯方法是一种以贝叶斯原理为基础,应用多层先验分布法确定各层次的先验分布,再进行统计推断的贝叶斯建模方法。多层贝叶斯方法最核心的思想就是将多层先验分布的构造方法与贝叶斯定理进行结合,从而完成对多层贝叶斯模型的构建。假设=(1,2,k)为一组待估计的未知参数,是的
10、参数空间,X=(X1,X2,Xk)为通过观察或试验所获得的分层样本数据集,其中12(,),1,2,iiiiinXxxxik。如果在观察这些分层样本数据之前,根据以往的经验或历史资料获得参数的总体分布信息,且该总体分布需要通过引入与相关的另外一个未知参数来描述。那么对多层贝叶斯模型的构建包括以下几个步骤:(1)构建的先验分布12(,|)k ,其中为超参数;(2)利用其他可利用的信息 h 构建超参数的先验分布(|)h,其中 h 为已知信息;(3)通过贝叶斯定理,将先验分布与似然函数相乘,求得模型参数的后验分布。通过以上描述的构造过程,即得到多层贝叶斯模型:总体分布|(),xp x;xX第一层先验|
11、1(),参数;第二层先验2(|),h超参数,h为已知信息。1.2正态多层贝叶斯模型给定一个分层数据集 X=(X1,X2,Xn),其中12(,),(1,2,)iiiiinXxxxim,假设该分层数据集满足多层贝叶斯模型:2,221122022233(,),1,2,1,2,;(,),(,),1,2,;(,),(,);(,)i jiiixNjn imNIGa a bimNIGa a bIGa a b (1)则称该模型为正态多层贝叶斯模型。其中,(,)iiIGa a b表示参数为(,)iia b的逆伽马(IGamma)分布,0,ia(1,2,3)ib i 是给定的超参数。1.3对数正态多层贝叶斯模型为
12、了解决实际中一些数据呈偏态分布而不适用于正态多层贝叶斯模型的问题,本文将对数正态多层先验分布的构造方法与贝叶斯定理结合,建立如下所示的对数正态多层贝叶斯模型。给定一个分层数据集 Y=(Y1,Y2,Yk),其中12(ln,ln,ln),iiiiinYxxx假设该分层数据集满足以下的多层贝叶斯模型:14湖南文理学院学报(自然科学版)2023 年222112200222033ln(,),1,2,1,2,;(,),(,),1,2,;(,),(,);(,)ijiiixNjn ikNIGaikNIGaIGa (2)则称该模型为对数正态多层贝叶斯模型。其中,(,)iiIGa 表示参数为(,)ii 的逆伽马(
13、IGamma)分布,2220,i 是未知的参数,0,1,2,3iii 是给定的超参数。2 模型的参数估计2.1对数正态多层贝叶斯模型参数的极大似然估计设12(,)kYY YY是来自模型(2)的观测数据,则有似然函数为2222/22/2200222221100()11111(|,)()exp(ln)()exp()exp()222inknkijiijiL Yx 31211131222222200111()exp()()exp()()exp(),1,2,ik(3)其中:12(ln,ln,ln)iiiiinYxxx,12(,)k,1kiinn。对式(3)两边取对数,可得样本的对数似然函数为222220
14、222221100111111ln(|,)ln()(ln)ln()()ln()(22222inkijiijinkL Yx 2312012322222200111)(1)ln()(1)ln()(1)ln(),1,2,ik。(4)再根据式(4),在固定时,对i,2,2,20求极大似然估计,得2201111,11(ln)/(1),()/(1),(ln)/(1)22inkiijiiijijii jnxnkx,(5)22222200331111()/(1),()/(1),2222kiik(6)其中,1,2,ik。2.2对数正态多层贝叶斯模型参数的贝叶斯估计由模型(2)可知,设12(,)kYY YY是来自
15、对数正态分布2(,)N 的观测数据,其中12(,12),(ln,ln,ln)ikiiiinYxxx,1,2,ik。此样本的联合密度函数为2222/2220,11(|,)()exp(ln)/2),1,2,knijiii jip Yxik nn 。(7)得到参数2220,的条件后验密度分别为:(1)22222200(|,)(|,)(|iiYp Y 22222222222222222111,)exp(ln)exp()exp(),222iniiijiiiijiinnxYnn 1,2,ik其中,111,ln,inkiiijijinnYxn2(|,)i 是i的先验分布。(2)2220(|,)(Y 2222
16、222200000222222221000011|,)(|)exp()exp()exp(222kiikkkk 2),其中,1()/,kiik20(|)是的先验分布。(3)22222200(|,)(|,)(Yp Y 第 3 期王志凯,等:对数正态多层贝叶斯模型的参数估计15111/212/22221122222,1,11111)()exp(ln)()exp()()exp(ln)/(2),2nnijiijii ji jxx其中,2()是2的先验分布。(4)22222202111(|,)(|,)()exp()2kiiY 221/212222222111()exp()()exp()/(2),kkii其
17、中,2()是2的先验分布。(5)20(|33122112222030320022222000000()()111,)(|)()exp()()exp()()exp(),22Y 其中,20()是20的先验分布。进而得到各参数的条件后验分布为:222222220222222(|,)(,),iiiiiinYNYnnn 1,2,;ik22222220000222222000(|,)(,)kYNkkk ;2220(|,)(2nYIGa 211,11,(ln)2ijii jx;222202211(|,)(,()22kiikYIGa ;2220(|,)Y 2303(1/2,()/2)IGa。由于所得到的各未知
18、参数的条件后验分布为标准分布,可直接用Gibbs抽样进行抽样,得到每个未知参数条件后验分布的平稳分布。Gibbs 抽样是 MCMC 方法里最简单且应用最广泛的抽样方法11,则Gibbs 抽样算法的具体步骤如下:(1)给定目标平稳分布2220(,)(1,2,)iik ,假设需要进行N次迭代得到 Gibbs样本量为N,在第 A 次迭代时的 Gibbs 抽样开始收敛;(2)给定初始值为(0)(0)2(0)2(0)2(0)0,1,2,iik;(3)对于1,2,tAN,假设第1t 次迭代的估计值为(1)(1)2(1)2(1)2(1)0(,)ttttti,则第t次迭代的步骤为:(a)从条件后验分布(1)2
19、(1)2(1)2(1)0(|,)ttttiY (1,2,)ik随机抽取()ti,用()ti更新i;(b)从条件后验分布(1)2(1)2(1)2(1)0(|,)ttttY 随机抽取()t,用()t更新;(c)从条件后验分布2(1)(|,ti(1)2(1)2(1)0,)tttY随机抽取2()t,用2()t更新2;(d)从条件后验分布2(1)(1)2(1)2(1)0(|,)ttttiY 随机抽取2()t,用2()t更新2;(e)从条件后验分布2(1)(1)0(|,tti 2(1)2(1),)ttY随机抽取2()0t,用2()0t更新20;(4)重复以上第(3)过程,迭代 N 次,得到(1)(1)2(
20、1)2(1)2(1)(2)(2)2(2)2(2)2(2)00(,),(,),ii()()2()2()2()()()2()2()2()00(,),(,),AAAAANNNNNii1,2,ik,即为根据 Gibbs 抽样获得的样本集。假设得到各参数的Gibbs样本容量为N,且在第A次迭代时开始收敛,则把后面NA个样本的均值作为各未知参数的贝叶斯估计值。即()()22()2111111,NNNtttiitAtAtANANANA2()22()001111,NNtttAtANANA其中,1,2,ik。3 模拟研究基于上述对对数正态多层贝叶斯模型参数的极大似然估计和贝叶斯估计的理论研究,下面利用 R软件进
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对数 多层 贝叶斯 模型 参数估计
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。