基于HL-MAD组合估计量的常规控制图稳健改进.pdf
《基于HL-MAD组合估计量的常规控制图稳健改进.pdf》由会员分享,可在线阅读,更多相关《基于HL-MAD组合估计量的常规控制图稳健改进.pdf(8页珍藏版)》请在咨信网上搜索。
1、收稿日期:基金项目:国家社会科学基金项目(B G L );广东省普通高校特色创新类项目(K T S C X )作者简介:李熠玲(),女,湖北黄冈人,硕士研究生,主要从事稳健时间序列分析的研究.通信作者:王志坚,E m a i l:q q c o m.基于HLMAD组合估计量的常规控制图稳健改进李熠玲,任凯亮,王志坚李熠玲,任凯亮,王志坚(广东财经大学 统计与数学学院,广东 广州 ;康涅狄格大学 文理学院,美国 康涅狄格州 )摘要:常规控制图的控制中心及控制限是不稳健的,易受离群值影响而导致监控失效.采用HLMA D组合估计量对控制中心、控制限进行稳健改进,构建出稳健控制图.数值模拟与金融实证分
2、析均表明,相比于传统控制图,稳健控制图能更好地对受控过程的异常现象进行识别及克服“漏报警”现象,且在大样本、高污染率下效果更优.另外,通过估计量的相对效比较研究发现:在控制图的稳健估计量选择问题上,组合估计量比单个估计量具有显著的优良性.关键词:统计过程控制;HLMA D组合估计量;稳健估计;相对效中图分类号:O 文献标识码:A文章编号:()D O I:/j i s s n 引言 引言统计过程控制是一项建立在数理统计学原理基础之上的过程质量管理技术.从诞生至今,经过近 年的发展与完善,统计过程控制技术已经被广泛应用于社会经济发展的各个领域,包括物流、数字经济、服务业等,取得了良好的社会和经济效
3、益,其监控的过程也从传统单变量过程拓展到各种多变量场景.而在实际工作中,控制图则是常被用来对受控过程进行质量管理的工具之一,通过使用控制图,能够对过程绩效及其波动原因进行直观而实时的监控和分析,帮助人们及早地发现和识别异常现象并找出异常原因,从而提高产品或服务质量.质量控制图的基本原理主要包含以下四个方面:受控过程服从正态分布的假定;控制限的准则;在一次试验中小概率事件不发生的原理;数理统计学中的统计推断基本思想.受控过程的正态性假定是指受控过程在正常状态下,其相关的特性指标数据服从正态分布假定.控制限的准则是指当某个过程特性数据服从正态分布N(,)时,可以利用正态分布的准则得出控制图的设计原
4、理即控制上限U C L,控制中心线C L,控制下限L C L.小概率事件不发生原理是指在一次观测试验中,正常情况下小概率事件通常认为不发生.统计推断的基本思想认为,若在过程控制中一旦出现了“小概率事件发生”的现象,则可以认为受控过程出现异常.同时,应注意到,一方面,统计过程控制技术的理论基础之一,控制限的准则即为常规控制图的控制设计原理,其中控制上限U C L、控制中心线C L、控制下限L C L所采用的统计量,均值与标准差对离群值敏感,缺乏稳健性;另一方面,在离群值存在时,过程质量特性数据很难满足正态分第 卷第期 年 月 上 饶 师 范 学 院 学 报J OUR NA LO FS HAN G
5、 R AONO RMA LUN I V E R S I T YV o l ,N o J u n 布假定.因此,常规控制图在对过程异常情况识别时,易受离群值干扰,常出现“遮蔽效应”或“漏报警”现象,从而极大地降低了控制图监测性能,如何解决此类问题即是本研究的出发点.文文献献综综述述近 年,稳健统计技术在各领域的过程控制中应用越来越多,包括经济、金融、工业制造、服务业等.刚开始多是对单变量控制图采用不同的稳健方法进行设计,如均值X b a r控制图.维贾雅(V i j a y a)和墨蒂(M u r t y)讨论了采用基于风险的方法来找到X b a r控制图的最佳参数对X b a r控制图进行稳健
6、经济设计.周纯光等提出了一种基于小波的预分析稳健控制图,用于监测第一阶段过程控制中的均值漂移.吴纯杰和王兆军分析了休哈特X b a r控制图的不稳健性,并对其进行了稳健修正.阿卜秋勒(A b d u l)等研究了利用考虑不确定参数区间估计的稳健优化方法进行X b a r控制图的经济统计设计(E S D),开发了一种启发式算法来获得控制图的稳健方案,效果优于传统E S D.萨利赫(S a l i h)等对因素选择控制图的最优稳健设计进行了研究.随后,越来越多的学者开始关注多变量控制图的稳健性.哈布沙(H a b s h a h)和阿什坎(A s h k a n)提出了稳健多元C U S UM图和
7、多元EWMA图,以解决散点异常值变化小的问题.范(F a n)等基于分层聚类树原理开发了一种新的稳健多变量控制图,该图可以有效地检测多维数据中的潜在异常值,同时控制遮蔽和淹没效应.阿索坎(A s o k a n)和贾亚尚卡尔(J a y a s a n k a r)提出了监测第一阶段多变量个体观测过程均值的稳健控制图.张(Z h a n g)等提出了一种无分布的多变量统计过程控制图(M S P C),以检测多变量过程变量的一般分布变化.安杰尼丝(A n g e l l y s)等 将截尾均值应用于稳健多变量控制图的异常值诊断.拉吉(R a j i)等 基于S t a h e lD o n o
8、h o稳健估计量(S D R E)构建了一种稳健多变量控制图,同时从第一阶段估计过程参数.卡丽纳(C a b a n a)和利洛(L i l l o)基于稳健重加权收缩估计,提出了一种用于个体观测的稳健多变量质量控制技术.萨巴诺(S a b a h n o)和塞拉诺(C e l a n o)用可变参数控制图监测存在自相关的多变量变异系数.近年来,也有学者研究自相关过程残差控制图的稳健性.王志坚 通过权重函数对A RMA模型与GA R CH模型进行稳健建模,最后构建稳健残差控制图.王志坚等 通过构建稳健A R模型,为自相关过程残差控制图的设计提供了理论依据.萨里阿提(S h a r i a t
9、i)提出了一种适用于自相关序列的稳健控制图新方法,该图对污染数据的影响具有稳健性.萨拉赫(S a l a h)等 研究了伽马回归模型下残差控制图的剖面监测.通过梳理文献发现,不少学者从控制图控制限的位置参数、尺度参数角度采用稳健估计量来构建稳健控制图.哈菲兹(H a f i z)等 建立了稳健S h e w h a r t位置参数控制特征的逐步筛选方法.纳迪娅(N a d i a)和沙希德(S h a h i d)比较了文献中的六种不同稳健尺度估计下的EWMA控制图性能,模拟研究结果表明,基于估计量Q_n的控制图在非正常过程中表现相对较好.吴纯杰等、庄芳等 分别分析了稳健似然比累积和控制图及E
10、WMA方差控制图的不稳健性,并给出了稳健改进的方法.王志坚、苏拥英等 对常规过程控制图的敏感性进行了分析并给出了稳健化方法.卡奥(K a o)认为,当存在污染数据时,标准偏差的估计会由于其高偏差性而降低控制图的检测能力,于是提出了基于不同筛选的平方A估计量,该估计量在抗干扰方面表现相对最好.与前人不同的是,本研究尝试采用估计量H o d g e s L e h m a n n(简写HL)与中位绝对离差(MA D)相结合的方式对常规控制图控制中心及控制限进行稳健改进,并通过改进前后对比的研究方法验证稳健控制图的可行性和有效性.相相关关理理论论与与方方法法常规控制图的不稳健性研究常规休哈特控制图设
11、计原理,主要包括控制中心、上下控制限,相应表达式如()式所示:第期李熠玲,等:基于HLMA D组合估计量的常规控制图稳健改进常规控制图U C L:k C L:L C L:k()()式中的k通常取,显然U C L、C L、L C L所采用的统计量缺乏稳健性,导致整个控制图对离群值过于敏感,当受控过程出现异常情况时会使得控制中心、控制限的值不能反映大多数样本数据的特征,因此控制图常会出现“漏报警”现象.接下来通过举例论证在对异常现象监控时常规控制图如何“失控”.先采用R软件生成 个服从N(,)分布的随机数作为过程的特性指标数据,再通过随机抽样技术在 个随机数里面随机抽取一个数用去代替之,我们将作为
12、 个随机数里面的异常值.接下来基于不含异常值及含个异常值的序列构建两个常规控制图,第一个是不含异常值常规控制图,第二个是含个异常值常规控制图,两个控制图的监测结果如图所示.图不含异常值的常规控制图(左)与含个异常值的常规控制图(右)从图可以看出,两个控制图的中间实线为控制中心线,上下两条虚线为控制上下限.由于图左图中的受控过程不含异常值,所有的点均在上下控制限以内,没有出现“虚假报警”或者“漏报警”现象,监控成功.而图右图中的受控过程含有一个异常值,但从图右图中可以看出,异常值在上下控制限内,控制图并没有对异常值进行报警,而是将异常值误判正常值,监控失败.显然,监控失败的原因是由于控制限对异常
13、值敏感,异常值的存在导致控制上下限间距拉大所致.因此,对常规控制图的控制中心及控制限进行稳健改进具有重要意义.稳健常规控制图构建的基本原理寻找均值、标准差的稳健组合估计量来改进控制中心及控制限,对构造稳健控制图具有重要作用.研究表明构建稳健控制图是一个较为复杂的系统工作,并不是仅仅寻找均值与标准差的稳健估计量.由于均值与标准差在控制图中是有机整体,若将两者分开研究有可能会导致控制图过于稳健或者缺乏稳健,其后果是:过于稳健会出现虚假报警,缺乏稳健会出现漏报警现象.常用的均值稳健估计量有:中位数(M e d i a n)、切尾均值(T r i mm e dM e a n)、缩尾均值(W i n s
14、 o r i z e dM e a n)、三均值(T r i p l eM e a n)以及H o d g e sL e h m a n n(HL、HL、HL)等.常用的标准差稳健估计量有:缩尾标准差(WS D)、中位绝对离差(M e d i a na b s o l u t ed e v i a t i o n)、平均绝对离差(M e a na b s o l u t ed e v i a t i o n)、四分位数间距(I Q R)以及S h a m o s估计量等.本研究经过反复模拟实验比较后,采用昌世凯(C h a n s e o k)等 提出的H o d g e s L e h m
15、a n n估计量作为均值稳健估计量,选取中位绝对离差(MA D)作为标准差稳健估计量,该两个估计量组合在一起,称为HLMA D组合估计量.研究表明,采用该组合估计量来稳健改进常规控制图能得到相对最优的稳健监测效果.H o d g e s L e h m a n n估计量具有种形式,可分别简写为HL、HL 及HL,其表达式分别为:上 饶 师 范 学 院 学 报 (第 卷)HLm e d i a nij(XiXj),HLm e d i a nij(XiXj),HLm e d i a n(i,j)(XiXj),在此,经比较后选HL,其中位绝对离差(MA D)表达式为:MADME D|XME D(X)
16、|,将该两个估计量作为控制图的稳健组合估计量来改进控制中心与控制限,可得到如下稳健控制图(图):常规控制图U C L:(x)k(x)(x)C L:(x)L C L:(x)k(x)(x)异常值干扰稳健控制图U C L:m e d i a nij(xixj)ME D xME D(x)C L:m e d i a nij(xixj)L C L:m e d i a nij(xixj)ME D xME D(x)图基于HLMA D组合估计量的稳健常规控制图构建原理模拟研究下面通过数值模拟仿真研究来说明稳健改进的可行性和有效性.分别模拟随机产生样本量为、的标准正态分布N(,)随机数,目的是从小样本、中样本和大
17、样本三种情形来观测改进效果.三种情形的污染率分别为、,即分别覆盖轻污染、中污染、重污染.需要说明的是,在小样本 的情形下,当污染率为 时,异常值不足个,为保证各样本量、各污染率下至少有个异常值,本研究将小样本 的轻污染率由原来的 增加到,其他情形不变.污染分布选择均匀分布,污染分布构造过程如()式所示:P()N(n;,)U n i f(n;,)()其中为污染率,N(n;,)表示标准正态分布,U n i f(n;,)表示最小值为、最大值为的均匀分布.根据研究需要,有时要产生负异常值,这时可将污染分布()式变形为()式:P()N(n;,)U n i f(n;,)()基于()式和()式产生的随机数,
18、得到各样本量、各污染率下的监控效果如表所示.从表可以看出,当样本量为 时,常规控制图在各污染率下的监控正确率全部为,稳健控制图为 .当样本量为 与 时,常规控制图与稳健控制图的报警正确率均随着污染率的增加而减少,但稳健控制图报警正确率一直显著高于常规控制图且数值相对稳定.表不同样本量不同污染率下的常规与稳健控制图监控效果对比表样样本本量量污污染染率率()异异常常点点个个数数常常规规控控制制图图正正确确率率()稳稳健健控控制制图图正正确确率率()实实证证检检验验为进一步检验本研究所提出的基于HL MA D组合估计量所改进的稳健控制图对含异常值序列的监第期李熠玲,等:基于HLMA D组合估计量的常
19、规控制图稳健改进控效果,本文选取 年月 日 年月 日泰山石油(代码:S Z)收益率作为受控对象.数据来源于英为财情网站(h t t p s:/c n i n v e s t i n g c o m),有效样本量为 .泰山石油数据的探索性分析结果如图所示.图显示:第一,泰山石油的收盘价图波动幅度很大;第二,泰山石油的收益率图呈现异方差性且存在多个绝对值较大的数,这一特征与本研究目标相吻合.至于绝对值较大的数是否为异常值,则需要通过统计检验进行识别.图泰山石油股票收盘价图(左)与收益率图(右)采用王志坚、汪志红和王斌会等提出的时间序列异常值稳健检测法 对泰山石油样本数据进行异常值检测,结果为表所示
20、.表泰山石油收益率异常值检测结果表序序号号日日期期类类型型序序号号日日期期类类型型 /I O /I O /AO /I O /AO /AO /I O /AO /I O /I O从表可以看出,稳健检测法检测到异常值共 个,其中,个为I O型,个为AO型.而泰山石油收益率的正态性检验结果显示为:W ,pv a l u e e ,即拒绝服从正态分布的原假设.可见,异常值的存在导致序列违背了受控过程满足正态分布假定.接下来,采用常规控制图与稳健改进控制图分别对收益率序列进行监控,试图通过监控将序列中异常值“报警”出来,监控结果见图.从图可以看出,常规控制图出现个异常值报警,序号分别是:、.稳健控制图出现
21、 个异常值报警,序号分别是:、.常规控制图漏报警个异常值,报警正确率,稳健控制图所报警异常值个数与稳健检测法检测到异常点个数一致,报警正确率 .泰山石油收益率的实证结果进一步验证了稳健控制图的可行性与有效性.上 饶 师 范 学 院 学 报 (第 卷)图常规控制图(左)与稳健控制图(右)监控结果图相相对对效效比比较较一个估计量的有效性,通常用相对效率来进行评价,相对效率的概念在各种估计量进行评估比较时非常有用.关于的相对效定义为:R E(|)V a r()V a r()()()式中分子为估计量的最小方差,分母为实际方差,通常当该比值为或者接近时,才认为该估计量是有效的,或者称为相对最优.泰山石油
22、样本量为 ,据此算出泰山石油收益率常用的位置参数与尺度参数估计量的相对效,结果如表所示.表各估计量的相对效比较估估计计量量相相对对效效估估计计量量相相对对效效位置估计m e a nm e d i a n HL HL HL 尺度估计s dr a n g e m a d s h a m o s 注:表中“”表示不存在从表可以看出,位置估计量相对效最小的是中位数m e d i a n,尺度估计量相对效最小的是极差r a n g e.显然中位数是位置估计量的一个很好的稳健估计,而极差并不是尺度估计量的一个好的估计量,但表显示,极差相对效最小.本文通过对比研究发现,由于控制图的构建涉及到样本均值与标准差
23、两个统计量,仅仅考虑单个统计量的相对效难以构建一个监控效果满意的控制图.因此,需要将位置与尺度统计量两者结合起来构建组合估计量才能得到一个相对最优的稳健控制图.因此,在控制图的稳健估计量的选择问题上,研究者不能仅仅用单个估计量的相对效比较来作为稳健估计量的唯一选取标准,从某种意义上讲,此发现亦是本研究的学术贡献之一.第期李熠玲,等:基于HLMA D组合估计量的常规控制图稳健改进结结束束语语常规休哈特控制图的控制限表达式为,其中的样本均值、标准差是不稳健.离群值会导致控制中心、控制限发生改变,以此设置的控制图容易引起“漏报警”现象,从而严重影响人们对受控过程质量的判断.本研究通过比较并选取均值的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 HL MAD 组合 估计 常规 控制 稳健 改进
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。