临床医学总体均数的估计与假设检验.pptx
《临床医学总体均数的估计与假设检验.pptx》由会员分享,可在线阅读,更多相关《临床医学总体均数的估计与假设检验.pptx(177页珍藏版)》请在咨信网上搜索。
1、第四章第四章总体均数的估计与假设检验总体均数的估计与假设检验第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 一、抽样误差与标准误一、抽样误差与标准误 概概念念:抽抽样样研研究究的的目目的的就就是是要要用用样样本本信信息息来来推推断断总总体体特特征征。由由于于存存在在变变异异,抽抽样样后后各各个个样样本本均均数数往往往往不不等等于于总总体体均均数数,且且各各样样本本均均数数间间也也不不一一定定相相等等。这这种种由由抽抽样样造造成成的的样样本本均均数数与与总总体体均均数数的的差差异异或或各各样样本本均均数数之之间间的的差差异异称称为为抽抽样样误误差差,抽抽样样误误差是不可避免的。差是不
2、可避免的。抽抽 样样总体总体样本样本统计量统计量 参参 数数 统计推断统计推断 若某市某年若某市某年14岁健康女生身高资料服从岁健康女生身高资料服从=155.4cm,=5.30cm的的正正态态分分布布。从从该该正正态态分分布布N(155.4,5.32)的的总总体体中中随随机机抽抽样样,每每次次样样本本含含量量n=10,共共抽抽取取100次次,得得到到100个个样样本本的的样样本本均均数数和和标标准准差差,频频数数分分布布见表。见表。组组 段段 频频 数数 151 1152 6153 15 154 19 155 27 156 16 157 8 158 5 159 3 合计合计100100个样本均
3、数的分布个样本均数的分布 样样本本均均数数的的频频数数分分布布图图,提提示示样样本本均均数数的抽样分布具有如下特点的抽样分布具有如下特点:1.样本均数未必等于总体均数样本均数未必等于总体均数;2.各样本均数间存在差异各样本均数间存在差异;3.样本均数围绕总体均数样本均数围绕总体均数,呈正态分布呈正态分布;4.样样本本均均数数的的变变异异范范围围较较原原变变量量的的变变异异范围大为缩小。范围大为缩小。(100个样本均数的均数为个样本均数的均数为155.52cm,标准差为标准差为1.63cm)理论可以证明理论可以证明:若从正态总体若从正态总体 中中,反复多次随机抽取样本含量固定为反复多次随机抽取样
4、本含量固定为n 的样本的样本,这些样本均数这些样本均数 也服从正态分也服从正态分 布布,即即 的总体均数仍为的总体均数仍为 ,样本均数样本均数 的标准差为的标准差为 。1.从正态总体中重复随机抽取样本含量为从正态总体中重复随机抽取样本含量为n的样本的样本,样本均数也服从正态分布;样本均数也服从正态分布;2.从偏态总体中重复随机抽样从偏态总体中重复随机抽样,当样本含当样本含量量n足够大时足够大时(n 50),样本均数也近似服样本均数也近似服从正态分布;从正态分布;3.样本均数的总体均数样本均数的总体均数 等于原总体均等于原总体均数数 ;数理统计推论与中心极限定理数理统计推论与中心极限定理 抽样分
5、布抽样分布 抽样分布示意图抽样分布示意图 抽样分布抽样分布 抽样分布示意图抽样分布示意图 4.样本均数的样本均数的标准差比原个体值的标准差标准差比原个体值的标准差要小要小,标准差为:标准差为:(理论值)(理论值)(估计值)(估计值)标准误的意义(标准误的意义(SE):即样本均数的标准差即样本均数的标准差,反映样本均数间反映样本均数间 的离散程度的离散程度,也反映样本均数与总体均数也反映样本均数与总体均数 间的差异间的差异,说明均数抽样误差的大小。标说明均数抽样误差的大小。标 准误越大准误越大,说明抽样误差越大说明抽样误差越大,用样本统计用样本统计 量作为总体参数估计值的可靠程度越差。量作为总体
6、参数估计值的可靠程度越差。二、标准误的用途二、标准误的用途 1.表示抽样误差的大小表示抽样误差的大小:标准误越小说明标准误越小说明 抽样误差越小抽样误差越小,样本均数与总体均数越样本均数与总体均数越 接近接近,用样本均数推论总体均数的可靠用样本均数推论总体均数的可靠 性越大性越大;2.用于估计总体均数的可信区间用于估计总体均数的可信区间;3.用于均数的假设检验。用于均数的假设检验。例例:为了解某地为了解某地1岁婴儿的血红蛋白浓度岁婴儿的血红蛋白浓度,从该地随机抽取从该地随机抽取36名名1岁婴儿岁婴儿,算得血红蛋白的平均浓度为算得血红蛋白的平均浓度为121.3g/L,标准标准差为差为8.2g/L
7、。计算该次抽样的标准误。计算该次抽样的标准误。(g/L)大量研究资料显示大量研究资料显示,当地当地1岁婴儿血红蛋白的平均浓度为岁婴儿血红蛋白的平均浓度为123.7g/L,标准差为标准差为11.9g/L。计算该次抽样的标准误。计算该次抽样的标准误。(g/L)三、标准差与标准误的区别和联系三、标准差与标准误的区别和联系 区别区别:1.意义意义:标准差标准差:描述观察值之间的离散程度描述观察值之间的离散程度,标准标准差越小差越小,表示观察值围绕均数的分布比较集表示观察值围绕均数的分布比较集中中,说明均数的代表性较好说明均数的代表性较好;标准误标准误:描述样本均数的离散程度描述样本均数的离散程度,表示
8、表示抽样误差的大小抽样误差的大小,标准误小标准误小,表示抽样误差小表示抽样误差小,样本均数与总体均数较接近样本均数与总体均数较接近,用样本均数推用样本均数推断总体均数的可靠性大。断总体均数的可靠性大。2.表示方法表示方法:标准差标准差:标准误标准误:3.计算公式计算公式:标准差标准差:标准误标准误:4.用途用途:标准差标准差:用于估计变量值的分布范围用于估计变量值的分布范围,制定制定医学参考值范围。医学参考值范围。标准误标准误:用于估计总体均数的可信区间、用于估计总体均数的可信区间、假设检验。假设检验。5.与样本含量的关系与样本含量的关系:标准差标准差:随着样本含量的增多随着样本含量的增多,逐
9、渐趋于稳逐渐趋于稳定定(一般一般200例以上例以上)。标准误标准误:随着样本含量的增多随着样本含量的增多,逐渐减少逐渐减少.若样本含量趋近于总体观察单位的数量若样本含量趋近于总体观察单位的数量,则标准误趋近于则标准误趋近于0,抽样误差几乎消失。抽样误差几乎消失。联系联系:1.两者均是表示变异程度大小的指标两者均是表示变异程度大小的指标:说明观察值之间的变异程度用标准差说明观察值之间的变异程度用标准差,说明统计量之间的变异程度用标准误。说明统计量之间的变异程度用标准误。2.标准误与标准差的大小成正比标准误与标准差的大小成正比,当样本当样本含量不变时含量不变时,标准差越大标准误也越大。标准差越大标
10、准误也越大。第二节第二节 t 分布分布一、一、t 分布的概念分布的概念随机变量XN(m,s2)标准正态分布uN(0,12)s0m1 N(m,s2/n)标准正态分布uN(0,12)m01 N(m,s2/n)标准正态分布uN(0,12)m01 在实际工作中在实际工作中,通常未知通常未知,常用常用S作作为为 的的估估计计值值,但但 已已不不再再服服从标准正态分布从标准正态分布,而是服从自由度为而是服从自由度为=n-1的的 t 分布。分布。二、二、t 分布的图形与特征分布的图形与特征 不同自由度下的不同自由度下的 t 分布图分布图 1.t 分布的图形分布的图形 t 分布曲线是一簇曲线分布曲线是一簇曲线
11、。当自由度。当自由度不同不同时时,曲线的形状不同。当曲线的形状不同。当时时,t分布趋近分布趋近于标准正态分布于标准正态分布,但当自由度较小时但当自由度较小时,t分布分布与标准正态分布的差异较大。与标准正态分布的差异较大。t分布曲线的分布曲线的形状随自由度的大小而变化。形状随自由度的大小而变化。2.t 分布的特征分布的特征 .单峰分布单峰分布,以以0为中心为中心,左右对称左右对称;.自由度自由度 越小越小,则则t 值越分散值越分散,t分布的分布的峰部越矮而尾部翘得越高峰部越矮而尾部翘得越高;因此因此,t分布曲线分布曲线下面积为下面积为95%或或99%的界值不是一个常量的界值不是一个常量,而是随自
12、由度大小而变化的而是随自由度大小而变化的;.当当时时,t分布逼近标准分布逼近标准正态分布正态分布,故标准正态分布是故标准正态分布是t分布的极限分分布的极限分布布(特例特例)。.t分布的唯一参数是自由度。分布的唯一参数是自由度。t 分布界值表分布界值表自由自由度度概率,概率,P单侧单侧0.250.200.100.050.0250.010.0050.00250.0010.0005双侧双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657401000.6770.8451.2901.660
13、1.9842.3642.6262.8713.1743.3902005000.6750.8421.2831.6481.9652.3342.5862.8203.1373.31010000.6750.8421.2821.6461.9622.3302.5812.8133.0983.3000.67450.84161.28161.64491.96002.32632.57582.80703.09023.2905-t 0 tt 分布界值表分布界值表自由自由度度概率,概率,P单侧单侧0.250.200.100.050.0250.010.0050.00250.0010.0005双侧双侧0.500.400.200.
14、100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657401000.6770.8451.2901.6601.9842.3642.6262.8713.1743.3902005000.6750.8421.2831.6481.9652.3342.5862.8203.1373.31010000.6750.8421.2821.6461.9622.3302.5812.8133.0983.3000.67450.84161.28161.64491.96002.32632.57582.80703.09023.2905表示方法:单尾
15、概率表示方法:单尾概率t值:值:t,双双尾概率尾概率t值:值:t/2,3.t界值表的特点界值表的特点:(1).在同一自由度下在同一自由度下,|t|值越大值越大,概率概率P值越值越 小小;(2).在相同在相同|t|值时值时,双侧概率双侧概率P值为单侧概值为单侧概 率率P值的两倍值的两倍;(3).概率概率P值一定的情况下值一定的情况下,自由度越大自由度越大,|t|值越小值越小;自由度越小自由度越小,|t|值越大值越大;(4).当当100时时,双侧双侧t的界值接近标的界值接近标准正态分布的准正态分布的u值值,=时时,t 值值=u值。值。(5).表示方法表示方法:单尾概率单尾概率t值值:t,双双尾概率
16、尾概率t值值:t/2,。三、三、t分布的应用分布的应用 1.总体均数的区间估计总体均数的区间估计;2.t 检验。检验。第三节第三节 总体均数的估计总体均数的估计一、可信区间一、可信区间(CI)的概念的概念 1.点值估计点值估计:用相应样本统计量直接作为用相应样本统计量直接作为 其总体参数的估计值。其总体参数的估计值。优点优点:估计方法简单易行估计方法简单易行;缺点缺点:没有考虑抽样误差的大小没有考虑抽样误差的大小;缺乏概率的保证。缺乏概率的保证。2.区间估计区间估计:按按预先给定的概率预先给定的概率,所确定所确定 的包含未知总体参数的可能范围。该范围的包含未知总体参数的可能范围。该范围 称为总
17、体参数的可信区间或置信区间称为总体参数的可信区间或置信区间;预先预先 给定的概率给定的概率1称为可信度或置信度称为可信度或置信度,常取常取 95%或或 99%。若无特别说明。若无特别说明,一般取双侧一般取双侧 95%。.可信区间确切涵义可信区间确切涵义:从总体中作随机抽从总体中作随机抽样样,根据每个样本可算得一个可信区间根据每个样本可算得一个可信区间,如如95%的可信区间的可信区间,意味着作意味着作100次抽样次抽样,算得算得100个可信区间个可信区间,有有95个可信区间包含总体均个可信区间包含总体均数数(估计正确估计正确),有有5个可信区间不包含总体均个可信区间不包含总体均数数(估计错误估计
18、错误)。5%是小概率事件是小概率事件,对一次抽对一次抽样而言出现的可能性很小样而言出现的可能性很小,因此因此,在实际应用在实际应用中中,就认为总体均数在算得的可信区间内。就认为总体均数在算得的可信区间内。图图4-2 4-2 模拟抽样成年男子红细胞数模拟抽样成年男子红细胞数100100次的次的95%95%可信区间示意图可信区间示意图 *.可信区间通常由两个数值即可信限构可信区间通常由两个数值即可信限构成成,较小的称下限较小的称下限,较大的称上限较大的称上限,可信区间是可信区间是开区间。开区间。.可信区间是随机的可信区间是随机的,总体参数是固定的总体参数是固定的,所以可信区间包含总体参数的可能性为
19、所以可信区间包含总体参数的可能性为1-.可信区间的两个要素可信区间的两个要素 1.准确度准确度:反映在可信度的大小反映在可信度的大小,1-越接越接 近近1,可信区间包含可信区间包含的概率越大。的概率越大。2.精密度精密度:反映在区间的宽度反映在区间的宽度,区间宽度愈区间宽度愈 窄窄,精密度越高。精密度越高。若在样本量确定的情况下若在样本量确定的情况下,两者是矛盾的两者是矛盾的,视情况而定。但不能笼统地认为视情况而定。但不能笼统地认为99%可信区可信区间比间比95%可信区间好可信区间好,一般一般95%较为常用。要较为常用。要同时提高准确度和精密度同时提高准确度和精密度,须增加样本含量。须增加样本
20、含量。二、总体均数可信区间的计算二、总体均数可信区间的计算95%0 1.未知未知,n较小较小:按按t 分布计算:分布计算:双侧:双侧:单侧:单侧:例例:为了解某地为了解某地1岁婴儿的血红蛋白浓度岁婴儿的血红蛋白浓度,从该地随机抽取从该地随机抽取25名名1岁婴儿岁婴儿,测得其测得其 血红蛋白平均数为血红蛋白平均数为123.7g/L,标准差标准差 为为11.9g/L。估计该地。估计该地1岁婴儿血红蛋岁婴儿血红蛋 白的平均浓度。白的平均浓度。2.已知或已知或未知未知,但是但是n足够大足够大(100)时时,按正态分布原理计算可信区间。按正态分布原理计算可信区间。已知已知:未知未知,但但n足够大足够大:
21、双侧:双侧:双侧:双侧:单侧:单侧:单侧:单侧:例例:某地抽得正常人某地抽得正常人200名名,测得其血清测得其血清 胆固醇的均数为胆固醇的均数为3.64mmol/L,标准标准 差为差为1.20mmol/L,试估计其试估计其95%可可 信区间。信区间。三、可信区间与医学参考值范围的区别三、可信区间与医学参考值范围的区别1.意义意义:医学参考值范围医学参考值范围:绝大多数正常人的解剖、生理、生化等指绝大多数正常人的解剖、生理、生化等指标的波动范围标的波动范围;个体值的波动范围个体值的波动范围 总体均数的可信区间总体均数的可信区间:按预先给定的概率按预先给定的概率,确定的未知总体参数确定的未知总体参
22、数可能所在的范围可能所在的范围;总体均数可能所在的范围。总体均数可能所在的范围。医学参考值范围医学参考值范围:双侧:双侧:百分位数法:百分位数法:单侧:单侧:2.计算公式计算公式:已知或已知或未知未知,但但n足够大足够大:未知未知,n较小较小:双侧:双侧:双侧:双侧:或或:总体均数的可信区间总体均数的可信区间:3.应用应用:医学参考值范围医学参考值范围:进行统计描述;进行统计描述;绝大多数观察对象某项指标的分布范围;绝大多数观察对象某项指标的分布范围;判断某项指标正常与否判断某项指标正常与否 总体均数的可信区间总体均数的可信区间:进行统计推断;进行统计推断;估计未知的总体均数所在范围估计未知的
23、总体均数所在范围;进行均数的假设检验。进行均数的假设检验。第四节第四节 假设检验假设检验(hypothesis testing)一、假设检验的基本思想一、假设检验的基本思想:根据研究目的根据研究目的,先对总体的参数或分布先对总体的参数或分布做出某种假设做出某种假设,然后用适当的统计方法然后用适当的统计方法,根根据样本提供的信息据样本提供的信息,对所做出的假设进行对所做出的假设进行检验检验,依据检验结果做出是否拒绝该假设依据检验结果做出是否拒绝该假设的判断的判断,这种方法称为假设检验这种方法称为假设检验(又称显著又称显著性检验性检验)。是利用小概率反证法思想是利用小概率反证法思想,从问题的对立从
24、问题的对立面面H0出发出发,间接判断要解决的问题间接判断要解决的问题H1是否成是否成立。然后在立。然后在H0成立的条件下计算检验统计成立的条件下计算检验统计量量,最后通过所获得的最后通过所获得的P值加以判断。当值加以判断。当P值值小于或等于预先规定的概率值小于或等于预先规定的概率值,即是小概即是小概率事件。根据小概率事件的原理率事件。根据小概率事件的原理:小概率事小概率事件在一次抽样中发生的可能性很小件在一次抽样中发生的可能性很小,如果它如果它发生了发生了,则有理由怀疑原假设则有理由怀疑原假设H0,认为其对认为其对立面立面H1成立成立,该结论可能犯大小为该结论可能犯大小为的错误的错误.例例:根
25、根据据大大量量调调查查,已已知知健健康康成成年年男男子子的的脉脉搏搏均均数数为为72次次/分分。某某医医生生在在某某山山区区随随机机调调查查25名名健健康康成成年年男男子子,求求得得脉脉搏搏均均数数为为74.2次次/分分,标标准准差差为为6.0次次/分分,能能否否认认为为该该山山区区的的成成年年男男子子的的脉脉搏搏均均数数高高于于一一般般成成年年男男子子的的脉脉搏搏均数?均数?由于样本均数有抽样误差由于样本均数有抽样误差,对一对一个样本均数个样本均数X与一个已知的或假设与一个已知的或假设的总体均数的总体均数 0 0作比较作比较,它们之间差它们之间差别可能有两种原因造成:别可能有两种原因造成:1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 临床医学 总体 估计 假设检验
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。