医学统计学知识点汇总.pdf
《医学统计学知识点汇总.pdf》由会员分享,可在线阅读,更多相关《医学统计学知识点汇总.pdf(18页珍藏版)》请在咨信网上搜索。
1、医学统计学总结医学统计学总结绪论绪论1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。3、变异:同质基础上各观察单位某变量值的差异。数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。变量 无序分类变量:所分类别或属性之间无顺序和程度上的差异 分类变量:定性变量 有序分类变量:有顺序和程度上的差异4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。可以分为有限总体和无限总体。5、样本:是按随机化原则从同质总体中
2、随机抽取的部分观察单位某变量值的集合。样本代表性的前提:同质总体,足够的观察单位数,随机抽样。统计统计学中,描述学中,描述样样本本特征的指特征的指标标称称为统计为统计量,描述量,描述总总体体特征的指特征的指标标称称为为参数。参数。6、概率:描述随机事件发生的可能性大小的一个度量。若 P(A)=1,则称 A 为必然事件;若 P(A)=0,则称 A 为不可能事件;随机事件 A 的概率为 0P1.小概率事件:若随机事件 A 的概率 P,则称随机事件 A 为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。统计描述统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。频数分
3、布有对称分布和偏态分布之分。后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。均数:适用于正态或近似正态的分布的数值变量资料。样本均数用表示,总体均数用x 表示。几何均数:适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零,一组观察值中不能同时有正值和负值。中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。全距:任何资料,一组中最大值与最小值的差。四分位数间距:适用于偏态分布以
4、及分布的一端或两端无确切数据资料。方差和标准差:正态分布资料。标准差表示观察值的变异度的大小。变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。4、标准正态分布:对正态分布的(X-)/进行 u 的变换,u=(X-)/,则正态分布变换为=0,=1 的标准正态分布,亦称 u 分布。u 被称为标准正态变量或标准正态离差。两个参数:是位置参数,是形状参数。用 N(0,1)表示标准正态分布。常用估计医学参考值范围的方法有:(1)正态分布方法:适用于正态或近似正态分布的资料。双侧界值:Xu/2S 单侧上界:X+uS,或单侧下界:X-uS(2)对数正态分布方法:适用于对数正态分布资料。双侧界值:L
5、g-1(X lgxu/2S lgx)单侧上界:Lg-1(X lgx+uS lgx),或单侧下界:Lg-1(X lgx-uS lgx)(3)百分位数法:用于偏态分布资料以及资料中一端或两端无确切数值的资料。双侧上界:P2.5和 P97.5;单侧上界:P95,或单侧下界:P5常用的 u 值表5、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比。率:说明某现象发生的频率或强度。(病死率不等于死亡率)构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。相对比:亦称比,是 A、B 2 个有关指标之比,说明 A 为 B 的若干倍或百分之几。两个指标可以性质相同,也可以性质不
6、同。应用相对数时的注意事项:1、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等的几个率,不能直接相加求其平均率;4、比较相对数时应注意其可比性;5、对样本率(或构成比)的比较应遵循随机抽样,并做假设检验。6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。其基本思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更具有可比性。标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率,以及已知标准组的年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知,以及
7、已知标准组年龄别发病(死亡)率与总发病(死亡)率时。通常可从下列 3 种方法选用标准组:以两组资料中任一组的年龄别人口数或构成比作为标准组;以两组资料合并的各年龄组的人口数或构成比作为标准组;以公认的或便于与他人资料比较的标准作为标准组。7、统计表:结构:由标题、标目、线条和数字构成。编制统计表的要求:标题:概括表的内容,列于表的上方居中,应注明时间和地点;标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。横标目列于表的左侧,通常为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线和底线应略粗些,表的左
8、上角不宜用斜线。参考值范围(%)单侧 双侧80 0.842 1.282 90 1.282 1.645 95 1.645 1.96 99 2.326 2.576数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐,数字暂缺或无数字者分别用“”或“-”表示,数字为 0 者要记作“0”,不应空项,为方便核实和分析,应有合计。备注:一般不列入表内,必要时可用“*”标出,列于表下。8、统计图:条图:用于相互对比关系的资料;圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成;线图:用于连续性资料,用于说明事物在时间上的发展变化,或某现象随另一现象而变动的情况;直方图:表示连续性资料
9、的频数分布;散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。抽样分布与参数估计抽样分布与参数估计抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数的估计,二是假设检验。1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异称为抽样误差。常用标准误反映均数抽样误差的大小;用率的标准误 p反映率的抽样误差的大小;用xPossion 计数的标准误反映其抽样误差的大小。2、中心极限定理和正态分布推理:从正态分布 N(,2)总体中以固定 n 随机抽取样本,样本均数的分布仍服从正态分布,即使是从偏态分布总体中随机抽
10、样,只要 n 足够大,x的分布也近似正态分布。样本均数的均数仍为,样本均数的标准差为。xx样本均数的抽样误差(简称标准误)是反映均数抽样误差大小的指标。x=用样本均数 S 作为 的估计值,则=xnxsnS3、t 分布:将看成变量值,那么可将正态变量进行 u 变换(u=-/)后,也可将xxN(,)变换成标准正态分布 N(0,1)。常用 s 作为 的估计值,统计量为 t,此分2x布为 t 分布。统计量 t=t 曲线的形态变化与自由度 v 的大小有关。v 越小,t 值越分xsx散,曲线越低平,v 逐渐增大时,则 t 分布逐渐逼近正态分布,当当 v=v=无穷大时,无穷大时,t t 分布即为分布即为u
11、u 分布。分布。4、总体均数的估计有两种方法:一种是点估计,即用统计量估计总体均数;二是区间估x计,亦称可信区间。(1)未知且 n 小:-t/2,v sx+t/2,v sxxx(2)未知,但 n 足够大,t 分布逼近 u 分布:-u/2sx+u/2sxxx(3)已知:-u/2x+u/2xxx标准差和标准误的比较 标准差 标准误S=1)(2nxxxsns表示观察值的变异程度大小 估计均数的抽样误差大小计算变异系数 CV=100%估计总体均数可信区间xs -t/2,v sx+t/2,v xxsx确定医学参考值的范围 进行假设检验计算标准误数值变量资料的假设检验数值变量资料的假设检验1、假设检验的原
12、理:假设在一次抽样研究中得出了 u1.96,则 P0.05,此为小概率事件,依据“小概率事件在一次随机试验中认为是不可能发生的”的定理,可认为此样本不是来自该总体。2、步骤:建立假设和确定检验水准;假设有两种,一种是检验假设,常称无效假设或零假设,记为 H0,假设样本所代表的总体参数与已知总体参数相等;另一种是备择假设,记为H1,是与 H0相联系且对立的假设;检验水准,亦称显著性水准,是判断拒绝或不拒绝 H0,也是允许犯型错误的概率,通常用 0.05。选定检验方法和计算统计量确定 P 值,做出推断结论。P 值是指从 H0所规定的总体中随机抽样时,获得等于及大于现有样本统计量的概率。3 3、t
13、t 检验检验:适用于:适用于:样本均数与总体均数比较(样本均数与总体均数比较(未知且未知且 n n5050 或或 n n3030);成组设计成组设计的两小样本均数的比较(的两小样本均数的比较(n n1 1,n n2 2均小于均小于 3030 或或 5050);配对设计的两样本均数比较。配对设计的两样本均数比较。应用条件:应用条件:当样本含量较小(当样本含量较小(n n5050 或或 n n3030)时,要求样本来自正态分布总体;)时,要求样本来自正态分布总体;用于成用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。4、
14、单样本 t 检验:用于样本均数与已知总体均数的比较,研究目的是推断样本所代表的总体均数 与已知总体均数 0有无差别。统计量 t=v=n-1n/s0 x5、配对 t 检验:用于配对设计资料的两均数的两均数的比较。其研究目的是推断某种处理有无作用,或两种处理的效果有无差别。配对设计类型有 3 种:先将受试对象按配比条件配对,然后用随机分组方法将各对中的 2个受试对象分别分配到不同的处理组;同一对象分别接受 2 种不同处理;同一对象处理前后。t=(是差值的样本均数)v=n-1n/sddd6、两样本 t 检验:用于完全随机设计的两样本均数的完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究目
15、的是推断两样本所分别代表的总体均数是否相等。t=v=n1+n2-22121xxSxx)11(21221nnsxxc)11(2)1()1(212122212121nnnnnsnsxx7、单样本 u 检验:用于样本均数与已知总体均数比较,其研究目的同 t 检验。研究目的是推断样本所代表的总体均数 与已知总体均数 0有无差别。其统计量 u=n/s0 x8、两样本的 u 检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等。其统计量为:u=2121xxsxx22212121/nsnsxx9、正态性检验和方差齐性检验:资料在做假设检验之前首先
16、应该检验资料是否来自正态总体,并且它们的方差是否齐。10、两类错误:型错误:拒绝了实际上成立的 H0,即样本来自=0的总体,由于抽样的偶然性,按=0.05 检验水准拒绝了 H0,接受 H1。这类在假设检验中拒绝了原本正确的 H0的错误称为型错误。,理论上犯型错误的概率为,值得大小视研究目的而定。通常设=0.05。型错误:不拒绝了实际上不成立的 H0,即样本来自 0的总体,由于抽样的偶然性,按=0.05 检验水准不拒绝 H0,这类在假设检验中不拒绝原本不正确的 H0的错误称为型错误。犯型错误的概率为,它只有与特定的 H1结合起来才有意义。同时减少 和 的方法是增加样本含量。1-称为检验效能或把握
17、度,即两总体确有差别时,按 水准能识别该差别的能力。如 1-=0.95 表示:若两总体确有差别,理论上平均100 次抽样中,有 95 次能得出两总体有差别的结论。11、假设检验时应注意的事项:要有严密的抽样研究设计-假设检验的前提正确选用检验方法:完全随机的设计的两数值变量资料比较时,若 n 小且方差齐,则选用两样本 t 检验;若方差不齐,则选用 t 检验或成组设计的两样本比较的秩和检验;若 n1,n2均大于 50,则选用两样本 u 检验。正确理解“显著性”的含义 对差别有无统计学意义的判断不能绝对化。方差分析方差分析1 1、基本思想、基本思想:按研究目的和设计类型,将总变异的离均差平方和:按
18、研究目的和设计类型,将总变异的离均差平方和 SSSS 和自由度和自由度 v v 分别分解成分别分解成若干部分,并求得各相应部分的变异。其中的组内变异或误差主要反映个体差异或抽样误差,若干部分,并求得各相应部分的变异。其中的组内变异或误差主要反映个体差异或抽样误差,其它部分的变异与之比较得出统计量其它部分的变异与之比较得出统计量 F F 值,由值,由 F F 值的大小确定值的大小确定 P P 值,并作出推断,从而了解值,并作出推断,从而了解该因素对观测指标有无影响。该因素对观测指标有无影响。组内变异主要由个体差异所致,组间变异可能由两种原因所致:一是抽样误差,二是由于接组内变异主要由个体差异所致
19、,组间变异可能由两种原因所致:一是抽样误差,二是由于接受的处理不同。受的处理不同。2、总离均差平方和 SS 和自由度 vSS总=kinjijixx121)(nxx/)(22v总=n-13、组间离均差平方和 SS组间,自由度 v组间和均方 MS组间SS组间=v组间=k-1 MS组间=nxnxkiinjiji211)()(2组间组间vSS4、组内离均差平方和 SS组内,自由度 v组内和均方 MS组内SS组内=SS总-SS组间 v组内=n-k MS组内=SS组内/v组内多样本均数比较的方差分析的应用条件:各样本是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等,即方差齐。5、完全随机设计资
20、料的方差分析:亦称单因素的方差分析,可用于完全随机设计的多个样本均数比较的资料,研究目的是推断各个样本所代表的总体均数是否相等。单因素方差分析的计算公式变异来源 SS v MS F 总变异 n-1Cx 2组间变异 k-1 Cnxkiinjiji121)(组间组间vSS组内组间MSMS组内变异 SS总-SS组间 n-k SS组内/v组内*C 为校正系数 C=nx/)(26、配伍组设计资料的方差分析:亦称两因素的方差分析,用于配伍组设计的多个样本均数比较的资料,其研究目的是推断各样本所代表的总体均数是否相等,但考虑了个体差异对试验效应的影响。两因素方差分析的计算公式变异来源 SS v MS F总变
21、异 n-1Cx 2处理组 k-1 SS处理/v处理 MS处理/MS误差Cbxkibjij121)(配伍组 b-1 SS配伍/v配伍 MS配伍/MS误差Ckxbjkiij121)(误差 SS总-SS处理-SS配伍 (k-1)(b-1)SS误差/v误差*C 为校正系数 C=b 为配伍组数nx/)(2分类资料的假设检验分类资料的假设检验1、二项分布:应用条件:应用条件:各观察单位只能具有两种相互对立的结果各观察单位只能具有两种相互对立的结果已知发生某结果的概率为已知发生某结果的概率为,其对立结果的概率为,其对立结果的概率为 1-1-nn 次试验是在相同的条件下进行的。次试验是在相同的条件下进行的。性
22、质:=n =)(1n若均数和标准差用率表示,则 p=p=n/1)(未知时,用样本率 P 作为 的估计值,则 Sp=npp/)1(总体率的估计:正态近似法:当样本含量 n 足够大,且样本率 p 或 1-p 均不太小,如 np 与n(1-p)均大于 5 时样本率 p 的抽样误差分布近似正态分布,可信区间为:(p-u/2Sp,p+u/2Sp)2、Poisson 分布:对于二项分类变量,若某结果发生的概率很小,如 0.05 时,单位时间、人群、空间内“阳性”发生次数 x(x=0,1,2,)的概率可用 Poisson 分布概率函数来描述:P(X)=!)(x/xe 递推公式:P(0)=P(x)=ex1x)
23、(P应用条件:0.05 外,其余同二项分布。分布的性质:(1)、Poisson 分布式一种单参数的离散型分布,其参数为,表示单位时间、人群、空间内某事件平均发生的次数。(2)、Poisson 分布的方差与均数相等。2(3)、Poisson 分布可以看成是二项分布的极限形式。(4)、Poisson 分布的极限形式也是二项分布,一般当 n20 时,可按正态分布处理,当0.01 时,二项分布可以当作 Poisson 分布来处理。(5)、Poisson 分布具有可加性。总体均数的估计:(正态近似法),xxu2/xxu2/3、服从二项分布资料的假设检验:(1)样本率和总体率的估计:直接计算法:最多有 k
24、 例阳性的概率:P(xk)=kxP0)(最少有 k 例阳性的概率:P(xk)=1-nkxP)(10)(kxP正态近似法:当不太靠近 0 或 1,且样本含量 n 足够大;或 n5 且 n(1-)5 时,000二项分布接近正态分布。u=n1000)(P)1(000nnx(2)两样本率的比较:目的是推断两个样本各自代表的两总体率是否相等,当两个样本率均满足正态近似条件时,可用 u 检验。其公式为:u=2121ppspp)11)(1(2121nnppppcc为合并阳性率,=(x1+x2)/(n1+n2)x1,x2为两个样本的阳性例数。pcpc4、服从 Poisson 分布的假设检验:对于 Poisso
25、n 分布的假设检验,对于总体均数可以用乘法将小单位化大,也可以用除法将大单位化小,对于样本均数,只能用除法将大单位化小,而不能用乘法将小单位化大。(1)样本均数与总体均数的比较:适用于 020,且样本阳性数 X 较小作单侧检验时。直接计算法:最多有 k 例阳性的概率:P(xk)=kxP0)(最少有 k 例阳性的概率:P(xk)=1-nkxP)(10)(kxP正态近似法:当 20 时,Poisson 分布逼近正态分布。u=00)(x(2)两样本阳性数的比较:目的是推断两样本各自代表的两总体平均数是否相等。当两样本阳性数 X1,X2均大于 20 时,可用 u 检验。其计算用两种情况:两样本观察单位
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 知识点 汇总
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【1587****927】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【1587****927】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。