课件-医学统计学基础.pdf
《课件-医学统计学基础.pdf》由会员分享,可在线阅读,更多相关《课件-医学统计学基础.pdf(70页珍藏版)》请在咨信网上搜索。
1、第一讲绪论一、医学统计学的理论基础和研究对象:a)问题的提出:在人们的实践活动中,常常会遇到类似下面的一些问题:一种新的疫苗,如何判断它是否有效?吸烟会不会使得肺癌的机会增加?如何抽检几百或几千人来估计某种病的流行程度?某批产品中合格品究竟有多少?该不该报废?如何消耗最少的资源和人力来得到我们所需要的某种信息?某种实验方法(或饲料配方)有没有明显改进?患者分组是否具有可比性?所观察对象的数量是否足够说明其结论?试验结果的误差有多大?研究结果是否适用于观察样本以外的同类对象?等等.其共同特点:只知道事情的不完全信息,或者是单个实验的结 果有某种不确定性。例如:为了知道产品合格与否或它的使用寿命,
2、我们常常需要 对它作破坏性检验,此时显然不能把所有的产品都检验一下,而只能 满足于对少数几个作品的抽检,这样获得的信息显然是不完全的;要检验疫苗的有效性,就一般来说,接种过疫苗的动物也不一定全不发病,而未接种的也不会全发病.那么发病与不发病的差别究竟到多大时我们才能认为接种是有效的呢?这些均涉及了我们如何评价一些并不确定的实验结果的问题。要 从这类问题中得出科学的、可靠的结论,就必须依靠统计学.有人干 脆给统计学下了这样的定义:“统计学就是从不完全的信息里取得准 确知识的一系列技巧”。另外,当必须根据有限的、完全的信息作出决策时(例如决定一 批产品是出厂还是报废,某种新药是否有效等等),统计学
3、可以提供 一种方法,使我们不仅能做出合理的决策,而且知道所冒风险的大小,并帮助我们把可能的损失减至最小。其次,如何花费最小代价取得所关心的信息,也是统计学的一大 课题(实险设计).不注意这一点可能使辛辛苦苦的工作全成为一种 浪费.2.理论基础:“根据数理统计的原理、方法紧密结合医学实践,研究医药卫生领域中的资料收集、整理、分析和推断的一门应用学科,来分析和解释生物界各种现象和实验调查资料的科学”。随着生物医 学研究的不断发展,运用统计学方法来认识、推断和解释生命过程中 的各种现象也越来越广泛。运用统计学方法可以帮助人们分析占有信 息,达到去伪存真,去粗取精,正确认识世界的目的。3.研究对象:人
4、体及与人体健康有关的各种具有不确定性的 医学数据(变异、数量、同质)。二、医学统计学的主要任务和作用:任务:1、结合专业知识和具体研究的要求进行统计设计2、对收集资料进行整理、做统计描述3、对资料进行统计分析和解释作用:1、保证调查或试验设计的科学性、完整性2、指标的确定应具有特异性、客观性,灵敏性和精密度高3、样本含量足够大,数据真实可靠4、选用统计分析方法正确三、医学统计学的主要内容:1、统计设计(design)在进行统计工作和研究之前必须有一个周密的设计,设计的内容 包括资料收集、整理和分析全过程总的设想和安排。统计设计可按照在研究过程中对研究对象是否进行干预分作调 查研究设计和实验研究
5、设计。调查研究设计:研究者旨在客观地描述研究总体,未加任何干预 措施,如:调查了解某地的学龄儿童缺铁性贫血的患病率,某地新生 儿畸形的发生率,北京地区溃疡病患病率等,其目的在于了解某一医 学现象的实际情况,疾病的危害程度,以便为防治和研究这些疾病提 供依据。调查设计主要有抽样方法、调查技术、质量控制技术等。实验研究设计:研究者根据目的(研究假设),主动加以干预措 施,并观察总结其结果,回答研究假设所提出的问题。如:研究脂健乳是否有降脂作用,首无假设脂健乳可以降低血 脂,再将条件相似的20只大鼠先用高脂饲料喂养做成高脂血症的模 型,然后将动物随机分为实验组和对照组,实验组服用脂健乳和豆奶,对照组
6、单纯服用豆奶,喂养一个月后观察比较两组之间各项血脂指标 的差别有无统计学意义,进而得出脂健乳是否具有降低血脂的保健作 用的结论。实验设计主要有各种实验设计模型、分组方法、样本量估计等。由于统计设计的质量直接影响着试验结果的准确性、可靠性、严 密性和代表性,一旦出现设计上的失误或缺陷,可能导致整个研究的 失败。因此,专业设计是研究者对专业知识的把握能力,直接影响着 实验的深度和水平,而统计设计是研究者对医学统计知识的正确运 用,以保证统计描述和推断正确的基础。调查设计与实验研究设计专业设计统计设计要求运用专业知识进行设计运用统计学知识进行设计由家选题、调查(实验)、方法、材料确定设计方案、收集整
7、理资料、确定 统计指标、分析和推断方法方向探讨实验、观察结果的适用性和创 造性探讨实验、观察结果的可重复性、高 效性目的回答和解决科研课题,验证假说,保证科研结果的先进性减少和控制误差。保证样本的代表性 和可靠性,保证实验结果的精确性和 可重复性2、收集资料(collection of data)方式:1、统计报表2、经常性工作记录3、专题调查或实验3、整理资料(sorting data)将原始数据进行核对、整理,使其系统化、条理化,对数据进行 逻辑检查,纠正错误,提供整理和描述数据资料的科学方法,确定数 据的数量特征。4、分析资料(analysis of data)根据不同的资料类型,选择不
8、同的统计处理方法,计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括:统计描述(d escriptive statistics):用统计指标、统计表、统计图等方法,对资料的数量特征及分布规律进行测定 和描述。统计推断(inferential statistics):包括如何抽样,以及如何在随机变量的样本值基础上推断概率分布和总体值。统 计推断中涉及的各种统计分析方法是本次授课的重点内容。四、医学统计学在科研中的作用:1、系统积累和表达经验临床经验的积累在于大量的临床实践。实际上这些经验都可以整 理和表达为统计信息,掌握了一定的统计学知识,就可以将积累的经 验,通过对资料的
9、收集、整理和分析,转变为正规和系统的统计信息,用以报告或发表,使人类医学知识宝库不断充实和发展。2、完成科研工作生物学是一门实验科学,不管你从事的是生物学的哪一个分支,都不可能完全脱离实验,只进行逻辑推理.而实验所得到的结果几乎 无例外地都带有或多或少的不确定性,即实验误差.在这种情况下,不用统计学要想得到正确的结论是不可能的,可以毫不夸张地说,作 为一个实验科学工作者,离开了统计学就寸步难行,希望通过这门课 程的学习,能够掌握常用的统计方法,尤其是它们的条件,适用范围、优缺点等,从而能够应用它们去解决实践中遇到的问题。否则,他将 无法知道其研究结果是否具有科学意义上的可重复性。要一一回答这
10、些问题,要求研究者必须在整个研究过程中贯穿和运用统计学的理论 和方法。3、撰写研究报告和阅读书刊医学研究中往往要涉及大量的数据,但在撰写研究报告和论文 时,只能使用经过整理和归纳的统计指标,并且用规范的统计表和统 计图表达。止匕外,在阅读国外期刊时,如果不具备统计学的基础知识,则不能判断别人研究结果的可信性和局限性,更谈不上吸收和借鉴。五、医学统计学中几个重要的基本概念:(1)总体(population)、样本(sample)、个体(observed unit)a.总体:根据研究目的所确定的性质相同的所有个体的某种 变量值的集合。如:调查某地1999年正常成年男子的红细胞数,则机察对象:该地1
11、999年正常成年男子。观察单值:统计研究中的最基本单位,如:一个人、一个家庭、一个地区等。观察值rtf(1;:每个人测得的红细胞数。该地1999年正常成年男子的红细胞数就构成一个总体。同质基础:同一地区、同一年份、同为正常成人、同为男性有限总体(finite population):有确定的时间、空间和有限个观 察单位,如上例。无限总体(infinite population):没有确定的时间和空间限制,观 察单位数为无限。如研究用某药治疗缺铁性贫血的疗效,此时,总体 的同质基础是贫血患者,同时用某药治疗,该总体应包括用该药治疗 的所有贫血患者的治疗结果。b.样本:从总体中随机抽取部分个体所组
12、成的集合。(随机化原则:总体中每一个观察单位均有同等机会被抽取)(2)参数(parameter)统计量(statistics)统计学中把总体的指标称为参数,把所得样本的平均数称为统计量。(3)误差(error):袖锌篌差(sampling error)由于总体中的个体间往往存在着 变异,随机抽取的样本仅是总体中的一部分个体,因而样本测得的指 标(统计量)往往与总体指标(参数)存在着差异,这种由于随机抽 样而造成的样本的统计量与总体参数之间的差异,称为抽样误差,它 既不定量,也不定性。系统篌差:由于设计不严,测量仪器不准确,测量者水平的偏 差而造成的,这种误差是定量的,可控的。(4)统计资料对每
13、个观察单位的某项特征进行测量和观察,其特征称为变量,对变量的测值称为变量值,亦称为资料。计量资料(quantitative data)统计资料类型 计数资料(qualitative data)I等级资料(ranked dat)、定量资料(quantitative data)K称为外置费料;用专业仪器测量,具有计量单位的测量数据,表现为数值的大小,如身高(cm)、体重(kg)、血压(kPa)等。特点;每个观察单假的观察值间哧量的区别、定帙资料(qualitative data):其观察值是定性的,表现为 互不相容的类别或属性(即将观察单位按某种属性或类别分组,所得 各组的观察单位数)。特袤;每个
14、观察单位的观察使间哧质的区别分两种情况:1、无序分类(unorcCeredcategories)又称为计数资料a.二项分类 检验结果可以是阳性或阴性、治疗结果可以是治愈或未愈、性别属性等,表现为两类间互相对立。b.多项分类 某种观察结果为互不相容的多个类别,如血型、职业等。2、有序分类(ordinaCcategories)又称为等级资料介于定量测量和定性观察之间的半定量观察结果,如测定某人 群血清反应,以人为观察单位,结果分为一、土、+、+四级,又如 观察以某种药治疗某病患者的治疗结果,以每个患者为观察单位,结 果分为治愈、显效、好转、无效四级,通常有两个以上等级。等级资料与计数资料的区别在于
15、,等级资料虽然是多分类资料,但各个类别存在着大小和程度上的差别。特袤:各类之间哧程点的差别资料的转化和分析:根据分析问题的需要,各类变量可以互相转化。如:观察某人群成年男子的血红蛋白量(g/L),属数值变量;若分析比较某种病人的血红蛋白水平与正常人有无差别,须按计 量资料进行处理。序号 正常人组 病人组23456789若按血红蛋白正常与偏低分为两类,可按二项分类资料处理;正常人组 病人组_偏低合计若按贫血的诊断标准将血红蛋白含量分为五个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高,可按等级资料处理。正常人组病人组重度贫血中度贫血轻度贫血 正常 血红蛋白增高 合计(5)频率(frequ
16、ency)、概率(probability)医学研究的大多数现象是随机现象,例如用同一种治疗方法治 疗某病的一群患者,可以知道治疗的结果有四种,但对于一个病人其 治疗后的结果是不确定的,此时的每一种可能发生的结果都是一个随 机事件(偶然事件、事件)。定义:在n次随机试验中,随机事件A发生了 k次,记/,)=n 则称力(左)为随机事件A在n次试验中出现的频率。实践证明,大量的试验中随机事件会呈现出频率稳定性。定义:描述随机事件A发生可能性大小的数值,称为A的概率,记作P(A),简记为P。假如临床观察中治疗200病人的样本,求得 治愈率为75%,这只是一个频率。实际应用中,当概率不易求得时,常用n
17、8时的频率作为概率的估计值。但当n较少时,频率的波动 性是很大的,用于估计概率是不可靠的。随机事件概率的大小在0与1之间。P值越接近1,表示某事件发生的可能性越大;P值越接近0,表示某事件发生的可能性越小。严格说,P=1表示事件必然发生,P=0表示事件不可能发生,他 们是确定性的,不是随机事件,但可把他们看成随机事件的特例。统计分析中的很多结论都是带有概率性的。习惯上将PW0.05 称为小概率事件,表示在一次实验或观察中该事件发生的可能性很 小,可以视为很可能不发生。医学统计学的学习重点是:1、掌握其基本知识、基本技能、基本概念、基本方法。建立逻辑思维方法和提高分析问题的能力。2、掌握调查设计
18、和试验设计的基本原则。培养收集、整理、分析统计资料的系统工作能力。3、掌握一套统计软件的使用方法(S AS、S PS S、S TATA等)。能够达到在完成医学统计学课程后,独立完成科研论 文和正确应用统计方法。第二讲集中趋势举例设有A、B两名新战士,他们的射击技术可用下面的分布来表示:战 士 A 战 士 B击中环数 8 9 10 击中环数 8 9 10对应概率 0.3 0.1 0.6 对应概率 0.2 0.5 0.3问哪一个战士射击技术较好?1频数分布表1人频数表的编制相同观察结果出现的次数称为频数。将所有观察结果的频数按一定顺序排列 在一起便是频数表(frequency table)。步骤:
19、找出最大和最小值,计算极差R=Xmax-Xmin根据斯梯阶公式确定组距1+3.322 log”扫描样本值,划记后获得频数2人频数表的用途 大样本数据(不限于计量资料)常用的表达方式。便于观察数据的分布类型。便于发现资料中远离群体的某些特大或特小的可疑值,必要时经 检验后舍去。当样本含量足够大时,各组段的分布频率作为分布概率的估计值。例7.我国某地农村1995年已婚育龄妇女现有子女数的分布子女数(1)妇女数f(2)频率()(3)累计频数(4)累计频率()(5)0137519.45137519.4512519117.303892226.7523042620.916934847.6532856019
20、.629790867.2842171914.9211962782.205136959.4113332291.61672554.9814057796.60732682.2514384598.8581510.1014499699.6493730.2614536999.892101560.11145525100.00合计145525100.002、集中位置的描述平均数(average)是统计中最广泛、最重要的一个指标体系。用来描述一组变 量的集中趋势、中心位置或平均水平,常作为一组资料的代表值,使资料产生简 明概括的印象,又便于组间的比较。常用平均数有均数、儿何均数和中位数。()、均数(mean)的
21、计算_=x,+x2+x3.+x直接法 n 例 1、10名 7岁男童体重(kg)分别为 17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5.求平均体重。元=(17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg)频数表法:._一斗+力*2+33+项_Z仅例2:某地随机检查了 140名成年男性红细胞数(10l)4.71 5.21 4.94 4.68 5.17 4.91 5.02 4.764.765.26 5.615.954.464.574.315.184.924.274.774.
22、885.004.73 4.475.344.704.814.935.044.405.274.635.505.244.97 4.714.444.945.054.784.524.635.515.244.984.334.83 4.565.444.794.914.264.384.874.995.604.464.955.07 4.805.304.654.774.505.375.495.224.585.074.814.54 3.824.014.894.625.124.854.595.084.824.935.054.40 4.145.014.375.244.604.714.824.945.054.794.52
23、4.64 4.374.874.604.724.835.334.684.804.154.654.764.88 4.613.974.084.584.314.054.165.045.154.504.624.73 4.474.584.704.814.554.284.784.514.634.364.484.59 5.095.205.325.054.414.524.644.754.494.22红细胞数(10L)(1)频数f(2)组中值X(3)Fx(4 户(2)*(3)3.80-23.907.84.00 64.1024.64.20 114.3047.34.40-254.50112.54.60-324.701
24、50.44.80 274.90132.35.00-175.1086.75.20 135.3068.95.40-45.5022.05.60-25.7011.45.80-15.905.9合计140(Ef)669.8(EfX)JX+/13+-+_ Z 及E7 苫=4.78(1070均数的两个重要特征:各离均差的总和等于零Z(x-K)=0证明:z(%,-%)=,“=,=0 各离均差的平方和小于各观察值X与任何数a之差的平方 Z(x&)2Z(x-a均数的应用:1.用来描述一组变量值的平均水平,具有代表性,因此变量值必须是同质的。2.适用于呈正态分布(对称分布)的资料。(2)几何均数(geometric
25、mean)的计算1)直接法G=lxi-x2-x3-xnG=lgT(lg%+lg%2+-7g%)=IgT(S l)n n例3:5人的血清滴度为:1:2,1:4,1:8,1:16,1:32,求平均滴度。G=:2x4x8xl6x32LgG=(lg2+lg4+lg8+lgl6+lg32)/5=0.903G=lg10.903=8故平均滴度为1:8。2)频数表法GM钟)例4:40名麻疹疫苗接种麻疹疫苗后一个月,血凝抑制抗体滴度见下表,求平均滴度。抗体滴度人数f滴度倒数XLgXf*lgX(1)(2)(3)(4)(5 尸(2)*(4)1:4140.60210.60211:8580.90314.51551:16
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课件 医学 统计学 基础
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。