生物统计学—卡方检验.ppt
《生物统计学—卡方检验.ppt》由会员分享,可在线阅读,更多相关《生物统计学—卡方检验.ppt(31页珍藏版)》请在咨信网上搜索。
1、第五章 卡方检验应用统计学应用统计学 卡方(c2)分布设设总总体体服服从从正正态态分分布布N (,2),X1,X2,Xn为为来来自自该该正正态态总总体体的的样样本本,则则样样本本方差方差 s2 的分布为的分布为将将 2(n 1)称为自由度为称为自由度为(n-1)的卡方分布的卡方分布 主要适用于对拟合优度检验和独立性主要适用于对拟合优度检验和独立性检验,以及对总体方差的估计和检验等检验,以及对总体方差的估计和检验等 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2=(n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同
2、容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 m m m ms s s s总体总体卡方(c2)分布卡方(c2)分布的特点不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=201 1、2分布是一个以自由度分布是一个以自由度n为参数为参数的分布族,自由度的分布族,自由度n决定了分布的决定了分布的形状,对于不同的形状,对于不同的n有不同的卡方有不同的卡方分布分布2 2、卡方分布于区间、卡方分布于区间0,)0,),是一种,是一种非对称分布。一般为正偏分布非对称分布。一
3、般为正偏分布3 3、卡方分布的偏斜度随自由度降低而增大,当自由度、卡方分布的偏斜度随自由度降低而增大,当自由度为为1 1时,曲线以纵轴为渐近线;当自由度增大的时,时,曲线以纵轴为渐近线;当自由度增大的时,分布曲线渐趋近左右对称,当自由度大于等于分布曲线渐趋近左右对称,当自由度大于等于3030的的时候,卡方分布接近正态分布时候,卡方分布接近正态分布4、卡方分布具有、卡方分布具有“可加性可加性”X、Y 独立,独立,X 2(n1),Y 2(n2)则则 X+Y 2(n1+n2)卡方(c2)分布的函数CHIDIST:自由度为:自由度为n的卡方分布在的卡方分布在x点处的单尾概率点处的单尾概率CHIINV:
4、返回自由度为返回自由度为n的卡方分布的单尾概率函数的逆函数的卡方分布的单尾概率函数的逆函数CHIDISTX 需要计算分布的数字需要计算分布的数字(X0)Degrees_freedom 自由度自由度 CHIINV Probability 卡方卡方分布的分布的单尾单尾概率概率Degrees_freedom 自由度自由度 2检检验验是是以以 2分分布布为为基基础础的的一一种种假假设设检检验验方方法法,主主要要用用于于分分类类变变量量,根根据据样样本本数数据据推推断断总总体体的的分分布布与与期期望望分分布布是是否否有有显显著著差差异异,或或推断两个分类变量是否相关或相互独立。推断两个分类变量是否相关或
5、相互独立。卡方检验基础卡方检验基础 2值的计算:值的计算:由英国统计学家由英国统计学家Karl Pearson首次提出,故被首次提出,故被称为称为Pearson 2。卡方检验基础卡方检验基础 检检验验某某个个连连续续变变量量的的分分布布是是否否与与某某种种理理论论分分布布一一致致,如如是是否否符符合合正正态态分布等分布等 检验某个分类变量各类的出现概率是否等于指定概率检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检检验验控控制制某某种种或或某某几几种种分分类类变变量量因因素素的的
6、作作用用之之后后,另另两两个个分分类类变变量量是是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检检验验两两种种方方法法的的结结果果是是否否一一致致,如如两两种种诊诊断断方方法法对对同同一一批批人人进进行行诊诊断断,其诊断结果是否一致其诊断结果是否一致卡方检验基础用途卡方检验基础用途卡方检验的用途卡方检验的用途一个样本方差和一个样本方差和总体方差是否相同总体方差是否相同同质性检验同质性检验适合性检验适合性检验独立性检验独立性检验观察值和理论观察值和理论值是否符合值是否符合两个或两个以两个或两个以上因素之间是上因素之间是否相
7、关否相关计数计数资料资料和和属性属性资料资料一个样本方差的同质性检验 从从标标准准正正态态总总体体中中抽抽取取k个个独独立立u2之之和和为为卡卡方方 2其其 2服从自由度为服从自由度为(k-1)的卡方分布的卡方分布当用样本平均数估计总体平均数时,有:当用样本平均数估计总体平均数时,有:将样本方差代入,则:将样本方差代入,则:卡方函数的使用卡方函数的使用假设假设假设假设假设假设例:已知某农田受到重金属污染,经抽样测定铅浓度分别为例:已知某农田受到重金属污染,经抽样测定铅浓度分别为:4.2,4.5,3.6,4.7,4.0,3.8,3.7,4.2(ug/g4.2,4.5,3.6,4.7,4.0,3.
8、8,3.7,4.2(ug/g),),方差为方差为0.150,0.150,试检验受到试检验受到污染的农田铅浓度的方差是不是和正常浓度铅浓度的方差污染的农田铅浓度的方差是不是和正常浓度铅浓度的方差(0.0650.065)相同)相同分析:分析:1 1)一个样本方差同质性检验)一个样本方差同质性检验 2 2)事先不知道受污染的农田与正常农田的铅浓度事先不知道受污染的农田与正常农田的铅浓度 方差的大小,故双尾检验方差的大小,故双尾检验 (2 2)选取显著水平)选取显著水平解:(解:(1 1)假设)假设 即受到污染的农田铅浓度的方差与即受到污染的农田铅浓度的方差与正常农田铅浓度的方差相同,对正常农田铅浓度
9、的方差相同,对 (3 3)检验计算)检验计算 (4 4)推断:当)推断:当df8-18-17 7,由,由CHIINV(0.025,7)16.01,即,即 否定否定H H0 0,接受,接受H HA A,即样本方差与总体方差,即样本方差与总体方差试不同质的,认为受到污染的农田铅浓度的方差与正试不同质的,认为受到污染的农田铅浓度的方差与正常农田的方差有显著差异常农田的方差有显著差异卡方检验的原理和方法卡方检验的原理和方法Pearson定理定理:当(:当(P1 1,P2 2,,Pk k)是总体的真)是总体的真实概率分布时,统计量实概率分布时,统计量 随着随着n的增加渐近于自由度的增加渐近于自由度df=
10、k-1的卡方分布。其中的卡方分布。其中P1 1,P2 2,,Pk k为为k种不同属性出现的频率,种不同属性出现的频率,n为样为样本容量,本容量,ni i为样本中第为样本中第i种属性出现的次数,是观种属性出现的次数,是观测值,记为测值,记为O Oi i,pi i为第为第i i种属性出现的概率,种属性出现的概率,npi i则则可以看成理论上该样本第可以看成理论上该样本第i种属性出现的次数,理种属性出现的次数,理论值记为:论值记为:Ei i,即,即卡方检验的原理和方法卡方检验的原理和方法Pearson定理的基本含义定理的基本含义:如果样本确实是抽自由(如果样本确实是抽自由(P1 1,P2 2,,Pk
11、 k)代)代表的总体,表的总体,Oi i和和Ei i之间的差异就只是随机误差,之间的差异就只是随机误差,则则Pearson统计量可视为服从卡方分布统计量可视为服从卡方分布 反之,如果样本不是抽自由(反之,如果样本不是抽自由(P1 1,P2 2,,Pk k)代表的总体,)代表的总体,Oi i和和Ei i之间的差异就不只是是随之间的差异就不只是是随机误差,从而使计算出的统计量有偏大的趋势机误差,从而使计算出的统计量有偏大的趋势 因此,对因此,对Pearson统计量进行单尾检验(即统计量进行单尾检验(即右尾检验)可用于判断离散型资料的观测值与理右尾检验)可用于判断离散型资料的观测值与理论值是不是吻合
12、论值是不是吻合卡方检验的原理和方法卡方检验的原理和方法统计假设:统计假设:H0:观测值与理论值的差异是由随机误差引起:观测值与理论值的差异是由随机误差引起 HA A:观测值与理论值之间有真实差异:观测值与理论值之间有真实差异 所以卡方值是度量实际观测值与理论值偏南所以卡方值是度量实际观测值与理论值偏南程度的一个统计量程度的一个统计量 卡方值越小,表明观测值与理论值越接近卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大卡方值越大,表明观测值与理论值相差越大 卡方值为卡方值为0 0,表明,表明H0严格成立,且它不会有下侧严格成立,且它不会有下侧否定区,只能进行右尾检验否
13、定区,只能进行右尾检验卡方检验的原理和方法卡方检验的原理和方法 由于离散型资料的卡方检验只是近似地服从连由于离散型资料的卡方检验只是近似地服从连续型变量的卡方分布,所以在对离散型资料进行续型变量的卡方分布,所以在对离散型资料进行卡方检验计算的时,结果常常偏低,特别是当自卡方检验计算的时,结果常常偏低,特别是当自由度由度df=1=1时,有较大偏差,为此需要进行矫正:时,有较大偏差,为此需要进行矫正:当自由度当自由度df1时,与连续型随机变量卡方分相时,与连续型随机变量卡方分相近似,这时可以不做连续性矫正近似,这时可以不做连续性矫正 注意:要求各个组内的理论次数不小于注意:要求各个组内的理论次数不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 检验
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。