医学研究的数据管理与分析——第四章-常用研究设计的数据统计分析.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 研究 数据管理 分析 第四 常用 设计 数据 统计分析
- 资源描述:
-
,*,第四章 常用研究设计的数据统计分析,描述性研究,分析性研究,临床试验,筛检与诊断试验,常用试验设计及统计分析方法,描述性研究,(descriptive epidemiologic study),是指通过详细而正确的观察记录,查明人群中疾病或健康状态及其影响因素的分布特征。,通过这类研究可以把所研究问题在特定时间的频率及其分布特点展示出来。,1.,为当地疾病控制或健康促进工作提供基础资料;,2.,提供疾病病因或危险因素的线索,为分析性研究假设的形成提供依据。,第一节 描述性研究,(一)概念,横断面调查,是描述疾病或健康状况在特定时间内在某一地区人群中的分布状况。,从时间上说,调查是在某一时点或短时间内完成的,反映这一时点的疾病分布以及人群的某些特征与疾病的关系,好似时间上的一个横断面,故称横断面调查。,第一节 描述性研究,一、横断面调查,(三)横断面调查的特性与优缺点,缺点,:,一般不适用于调查罕见病或急性病。对于前者调查所需样本量太大,对于后者查处的病例多为较长病程病例,选择偏倚大;调查人群或样本规模较大时,花费就大,而比较分析时非病例数过多,统计学效率低;长病程病例经常有相对恶化和缓解期,可能把缓解期病例错划为无病;暴露,疾病发生时间关系难以确定,致使在病因学研究上存在明显局限性。,第一节 描述性研究,一、横断面调查,(四)横断面调查的用途,1,描述疾病或健康状况的三间分布。,2,描述某些因素与疾病或健康状况之间的关系,为建立病因假设提供线索。,3,早期发现病人,以便早诊断、早治疗。,4,监测疾病,研究其发展趋势。,5,评价疾病防制措施的效果。,第一节 描述性研究,一、横断面调查,1,描述指标:患病率、感染率、阳性率。为了控制混杂偏倚和便于比较,率应进行标准化。,2,分析指标:现患危险比(,PR=am,0,/bm1,),若,PR1,,则表明暴露为现患危险因素;若,PR1,时,说明病例组的暴露概率大于对照组,即暴露有较高的发病危险性;反之,当,OR1,说明暴露因素与疾病为正联系,暴露因素可能是危险因素;,RR1,说明暴露因素与疾病为负联系,暴露因素可能具有保护意义。不论是,RR,大于或小于,1,,距,1,越远,意义越大。下表提供了一种联系强度的判断标准。,归因危险度(,attributive risk,,,AR,):也称特异危险度,简称,AR,,或称,RD,(,rate difference,),是暴露组与非暴露组发病危险相差的绝对值,即危险特异地归因于暴露因素的程度。,AR,计算式如下:,归因危险度百分比(,attributive risk percent,ARP,):又称病因分值(,etiologic fraction,EF,),指暴露人群中归于暴露的发病或死亡占全部发病或死亡的百分比。,人群归因危险度(,population attributive risk,,,PAR,):它说明某一人群的某病发病率可归因于该暴露的部分。,RR,和,AR,都说明暴露的生物学效应,但不能说明其对一个人群的危害或消除这种因素后可能致发病率或死亡率下降的程度,即暴露的社会效应。,PAR,公式为:,式中,I,t,为全人群的发病率,,I,0,为非暴露组的发病率。,人群归因危险度百分比(,population attributive risk percent,,,PARP,或,PAR%,):它表示人群中暴露于某因素所致发病(死亡)率占全人群发病率(死亡)率的百分比。,PAR%,不仅考虑了暴露的,RR,,而且与某因素在人群中的暴露率有关。,(三)优点与局限性,1,)优点,信息偏倚较小;,能计算发病率及,RR,、,AR,;,可进行剂量,-,反应关系的评价;,可调查暴露与多种疾病的关系;,暴露与疾病的时间先后顺序明确,可验证因果关系。,第二节 分析性研究,二、队列研究,(三)优点与局限性,2)局限性,需大量样本,费用高;,不适应于罕见病;,随访时间长;可能有失访。,第二节 分析性研究,二、队列研究,临床试验,是指以患者为研究对象,以临床干预措施为研究内容,对比观察一干预措施效应的前瞻性实验研究。主要用于临床干预措施,(,药物、器械或治疗方法,),效果和对预后影响的评价。,第三节 临床试验,(一)组间均衡性评价,评价试验组和对照组非处理因素是否一致,需作均衡性检验,。,计数资料(如比较受试者性别构成)比较通常采用丫检验;计量资料比较常用X,2,检验、ANOVA或秩和检验,对于等级资料通常用秩和检验。,第三节 临床试验,一、临床试验结果的判定与评价,(,二,),疗效评价,1.,主要效应指标评定,比较干预效应差异,可以将受试者治疗前后或试验组和对照组的观察结果,视资料类型按计量、计数、等级资料进行比较。,2.,综合疗效评定,除了对受试者的症状、体征和理化指标需进行逐个分析外,还需将它们综合起来分析总的疗效,称为综合疗效评定。,通常采用四级标准,即痊愈、显效、好转和无效。,第三节 临床试验,一、临床试验结果的判定与评价,(三)安全性评价,1.,主要指标异常改变分析,比较试验药和对照药对患者某些理化指标有哪些影响,,,通常记录用药前后理化指标的“正常”和“异常”例数情况,2.不良事件及不良反应分析,主要是对试验组和对照组的不良事件、不良反 应及发生率进,行描述和比较。,第三节 临床试验,一、临床试验结果的判定与评价,(,四,),等效性检验,等效性检验是指将试验药和临床已证实有效的药物进行比较检验两种药物的疗效是否具有等效性。,等效性检验根据资料类型不同,选择不同的假设检验方法。,第三节 临床试验,一、临床试验结果的判定与评价,1,.,在临床试验的整个过程中,要注意研究对象的依从性。,2.,临床上同一疾病的不同患者其疾病类型、病情轻重、对各种治疗措施的反应等可能存在明显的差异。,3.,由于临床试验是以人作为研究对象,所以应充分考虑受试者的安全及伦理学问题。由于心理的作用,可使结果产生偏倚。样本含量小,患者之间变异大,而样本的获得往往受多方面的限制,若变异太大就不能轻易作出结论。,4.,注意失访对研究结果的影响。,第三节 临床试验,二、应用时注意事项,(一)筛检的定义,筛检,指应用快速的试验、检查或其他方法,从表面上无病的人群中查出某病的可疑患者。,第四节 筛检与诊断试验,一、筛检,(二)分类,(,1,)人群筛检:指用一定的筛检方法对一个人群进行筛检,查出其中患某病可能性较大的人,对其进一步诊断与治疗。,(,2,)多级筛检:指应用多种筛检方法同时筛检多种疾病。,(,3,)目标筛检:指对某种暴露人群、高危人群、某单位、某职业人群定期进行健康检查,以早期发现病人,及时予以治疗,.,(,4,)机会筛检:指医务人员对来诊者加用其他筛检方法,以发现与主诉无关的疾病。,第四节 筛检与诊断试验,一、筛检,(三)筛检的目的与用途,1,早期发现和早期确诊;,2,研究疾病的自然史,或开展流行病学监测;,3,发现某病的高危人群,以减缓发病。,第四节 筛检与诊断试验,一、筛检,(四)疾病筛检与诊断的区别,1对象是表面上无病的人群;,2使用的方法必须是简便、快速、易行的;,3筛检工作是医务工作者主动去发现病人;,4筛检结果是初步的,需经诊断予以确认或排除。,第四节 筛检与诊断试验,一、筛检,(五)筛检的实施原则,1,被筛检疾病是该地区当前重大的公共卫生问题;,2,所筛检疾病的自然史已了解较清楚;,3,被筛检的疾病,应有可识别的早期客观指征;,4,对被筛检出的疾病应提供进一步确诊的条件;,5,被筛检的疾病有恰当的治疗方法;,6,对确诊的病例提供治疗,有统一治疗方案和疗效判定标准;,7,筛检试验安全、经济、快速、真实性和可靠性好、预测值高;,8,筛检方法易为群众接受;,9,必须考虑筛检、诊断与治疗等的成本与效益问题;,10,筛检工作是按计划定期进行的连续过程。,第四节 筛检与诊断试验,一、筛检,(六)筛检试验(方法)的评价,1简便快速、安全经济;,2真实性好;,3可靠性强;,4预测值高;,5易为群众接受。,第四节 筛检与诊断试验,一、筛检,(七)筛检工作的评价,可以收获量、检出病人的预后和卫生经济学分析,3,方面进行评价,:,1.,收获量,:,是指经筛检后能发现多少原来未发现的病人得到相应的诊断和治疗。,收获量影响因素,:,人群某病的患病率;,筛检试验的敏感度;,参加筛检的人数;,筛检的类别;,筛检的次数。,第四节 筛检与诊断试验,一、筛检,(七)筛检工作的评价,2 检出病人的预后,:,1)病死率:比较筛检发现的患者死于该病的病死率是否低于未经筛检的患者;,2)生存率:比较筛检发现的患者生存率是否高于未经筛检的患者;,3)死亡率:比较筛检人群某病死亡率是否低于未经筛检的患者。,第四节 筛检与诊断试验,一、筛检,(七)筛检工作的评价,3卫生经济学分析,:,1,)成本效果分析:指实施筛检计划投入的费用及其获得的生物学效果,如每延长,1,年生存期所消耗之成本。,2,)成本效益分析:指实施筛检计划投入的费用及其获得的经济效果比值。,3,)成本效用分析:指实施筛检计划投入的费用与取得的生命质量改善情况。,第四节 筛检与诊断试验,一、筛检,(一)定义,诊断试验,是指评价某种疾病诊断方法的临床试验。,(二)分类,按有无标准对照可分为,标准对照诊断试验,和,参照诊断试验,。,可分为单项诊断试验和多项诊断试验,多项诊断试验包括联合诊断试验和序贯诊断试验两种形式。,第四节 筛检与诊断试验,二、诊断试验,(三)诊断试验的评价,通常用待评价的诊断试验和金标准试验检测相同的受试对象,然后进行对比。,临床常用的金标准包括病理学检查、外科一手术探查以及长期随访临床观察所获得的结论等。,通过金标准的诊断结果将被检验对象分为实际患某病,(,病例组,),与未患某病,(,无病组,),两组,同待评价的诊断试验检验得出的阳性或阴性结果整理成四格表形式,然后进行评价。,第四节 筛检与诊断试验,二、诊断试验,(三)诊断试验的评价,第四节 筛检与诊断试验,二、诊断试验,诊断试验的评价指标:,诊断试验的评价指标可分为,先验概率指标,和,后验概率指标,两类。先验概率指标表示在已知受试者为患者或非患者的条件下,推测诊断结果是阳性或阴性、符合或不符合的概率;后验概率指标则是在已知诊断结果为阳性或阴性的条件下,推测受试者为患者或非患者的概率。,属于先验概率指标的主要有灵敏度、特异度、诊断符合率、,Youden,指数等。,属于后验概率指标的主要有阳性预测值、阴性预测值等。,第四节 筛检与诊断试验,诊断试验有效性评价指标:,敏感度,=a/(,a+c,),检出真有病的人能力,特异度,=d/(,b+d,),检出真阴性的人能力,假阴性率,=c/(,a+c,)=1-,敏感度 漏诊率,假阳性率,=b/(,b+d,)=1-,特异度 误诊率,第四节 筛检与诊断试验,敏感度、特异度、误诊率与漏诊率关系示意图,诊断试验实用性评价指标:,阳性预测值,=a/(,a+b,),阴性预测值,=c/(,c+d,),预测值的高低与疾病发(患)病率高低有关,诊断试验评价的综合指标,准确性,=(,a+d,)/N,受抽样比和特异性影响,阳性似然比,=,敏感性,/(1-,特异性),1,有效,阴性似然比,=(1-,敏感性),/,特异性,越小越好,尤登指数,(,Youden,s,Index)J=1-(,误诊率,+,漏诊率),=,敏感性,+,特异性,1,(,-11,,,J0,时,无任何临床价值,例,为了评价,CT,诊断胰腺癌的价值,以病理学检查为金标准,选择胆管系统肿瘤、慢性胰腺疾患用为对照组。,附表,CT,诊断胰腺癌的评价,CT,诊断 胰腺癌 合计,有 无,阳性,44 35 79,阴性,11 23 34,合 计,55 58 113,实例分析结果,敏感度,=44/55=80%,特异度,=23/58=37.9%,准确性,=,(,44+23,),/113=59.3%,阳性预测值,=44/79=55.7%,阴性预测值,=23/34=67.6%,阳性似然比,=0.8/(1-0.379)=1.33,阴性似然比,=(1-0.8)/0.379=0.504,J=0.8+0.379,1=0.179,受试者工作特性曲线(,ROC,曲线),问题提出 定量指标敏感度与特异度关系,表,4.5,诊断糖尿病时敏感度与特异度的关系,口服葡萄糖,2,小时后 敏感度 特异度,血糖水平,(mg/100ml),(,%,)(,%,),70 98.6 8.8,80 97.1 25.0,90 94.3 47.5,100 88.6 69.6,110 85.7 84.8,120 71.4 92.1,130 64.3 96.9,140 57.1 99.4,150 50.0 99.6,160 47.1 99.8,170 42.9 100.0,100 A,敏,75,感,50,度,25,%,20 40 60 80 100,1-,特异度,%,图,4.1,血糖测定诊断糖尿病的,ROC,曲线,ROC,曲线作用与统计分析,分析与评价诊断试验的临床诊断价值;,选择与确定用于临床诊断的界值;,综合比较不同诊断试验(指标)优劣。,绘制,ROC,曲线进行定性的分析、评价和比较;,计算,ROC,曲线下的面积和可信区间,并作不同曲线间的假设检验;,考虑其他影响因素时利用回归方法进行,ROC,曲线的分析、评价和比较。,因素和水平:,因素:研究者关心的实验条件;,水平:因素的具体表现形式。,例:温度(,30,、,60,、,90,);,药物种类(,A,、,B,、,C,)药;,药物剂量(,1,、,5,、,10,),mg,。,第五节 常用实验设计及统计分析方法,准备知识,资料类型:,定量(计量、计数);定性(名义、有序)。,计量资料(如成人血液中钾含量:,4.6mmol/L,);,计数资料(如脉搏:,72,次,/min,),;,名义资料(如血型:,A,、,B,、,O,、,AB,);,有序资料(如疗效:痊愈、好转、,无效、死亡)。,交互作用:,假定某药对某病患者的疗效如下,:,药物 剂量:小 中 大,A,优 中 差,B,中 优 差,C,差 中 优,三种药对某病的疗效将随着剂量的改变而改变。,1,、概念:,完全随机设计:又称单因素设计,是将研究对象随机分到各组,或从不同的总体中随机抽取样本进行比较,它适用于两个或两个以上样本的比较。,第五节 常用实验设计及统计分析方法,一、完全随机设计,2,、随机化分组,3,、优缺点:,(1),设计与分析简单,易于实施;,(2),只能安排单因素;,(3),随机误差相对较大;,(4),个体变异较大,有些混杂因素难以控制或需要探索时,可采用分层随机设计,方法:,(,1,),编号,:按,动物体重,依次编号为,1,2,3,12,号。,(,2,),产生随机数字,:对于每一个编号,依次由计算器(计算机)产生随机数(共,12,次)。,(,3,),归组,:事先规定将较小随机数的,6,只动物分入甲组,其他,6,只动物分入乙组。,【,例,】,设有同性别的动物,12,头,要求用随机方法将其分为甲、乙两组。,随机化分组,例,2,:试将,18,个病人随机分成,3,组,编 号,1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18,抄随机数,8 6 13 5 12 1 4 3 9 2 17 14 11 7 16 15 10 0,所属组别,B B C A C A A A B A C C B B C C B A,A,组,4 6 7 8 10 18,B,组,1 2 9 13 14 17,C,组,3 5 11 12 15 16,预选对象,实验组,对照组,随机化,受 试 者,按纳入标准,实验组,对照组,实验组,实验组,第一层,第二层,受试者,预选对象,按纳入标准,按特征分层,随机化,随机化,实验中仅涉及到一个具有两水平的因素;,单因素,K,水平设计,(,K=2,),在原本可以用配对设计的场合下,若配对条件无法满足,则可改用成组设计。,成组设计:,【,例,】,今测得,12,名正常人和,15,名病毒性肝炎患者血清转铁蛋白含量,结果如下:,正 常 人,265.4 271.5 284.6 291.3 254.8 275.9 281.7 268.6 264.1 273.2 270.8 260.5,病毒性肝炎患者,235.9 215.4 251.8 224.7 228.3 231.1 253.0 218.8 233.8 230.9 240.7 221.7 256.9 260.7 224.4,问:患者和健康人的转铁蛋白之间的差别是否有显著性意义,?,成组设计(,K=2,),【,例,】,有两组小儿肝炎患者,其一为甲、乙肝炎病毒混合感染,其二为重叠感染,治愈者的治愈天数如下:,混合感染,(n,1,=9),:,55 25 14 26 42 23 40 27 56,重叠感染,(n,2,=9),:,20 34 173 27 88 16 57 77 25,试比较两组疗效之间的差别有无显著性意义,?,【,例,】,某医院妇产科为考察几种卵巢功能异常患者血清中促黄体素的水平,测定结果如下:,卵巢发育不良,42.50 38.31 35.76 33.60 31.38,丘脑性闭经,6.71 3.32 4.59 1.67 10.51 2.96 11.82 3.86 8.26 2.63 2.20,垂体性闭经,4.50 2.75 11.14 5.98 1.90 5.43 11.05 22.03,问:它们之间的差别是否有显著性意义,?,单因素,K,水平设计(,K3,),【,例,】,研究单味中药对小白鼠细胞免疫机能的影响,把,40,只小白鼠随机分为四组,每组,10,只,雌雄各半,用药,15d,后,进行,E-,玫瑰结形成率测定,结果如下:,对照组,14 10 12 16 13 14 12 10 13 9,党参组,21 24 18 17 22 19 18 23 20 18,黄芪组,24 20 22 18 17 21 18 22 19 23,淫羊藿组,35 27 33 29 31 40 35 30 28 36,单因素四水平设计,1,、概念,配对设计,:是将受试对象按某些特征或条件配成对子,(,非随机,),,然后分别把每对中的两个受试对象随机分配到试验组和对照组,再给予每对中的个体以不同处理,观察两组间的差别。,二、配对设计,第五节 常用实验设计及统计分析方法,配对实验设计的两种情况:,同源配对,:,同一受试对象,用两种不同的实验方法;受试对象自身实验前后的对比,。,非同源配对,:将具有相同条件的,实验对象,配成对子,配对设计变型:,治疗前后的比较,同一批标本分别用两种方法检测,同一批病人分别用两种方法诊断,局部试验中人体左右侧的对比;,2,、随机分组,3,、优缺点,(1),组间可比性好,节省样本大小,试验效率高;,(2),对研究对象有一定的要求,临床上有一定难度,【,例,】,将已按近似条件配好的,10,对小白鼠,用随机方法分配到实验组和对照组。,方法,(,1,),编号,:对小白鼠进行,对子编号,,同时每个,对子内,的二只小白鼠也分别编号。,(,2,),产生随机数字,:对于每一组合编号,依次由计算器(计算机)产生随机数(共,20,个)。,(,3,),归组(对子内两只小白鼠的随机),:事先规定每个对子内随机数字较小者分配到对照组;随机数字较大者分配到实验组。,非同源配对,随机化分组,【,例,】,某医院用中药治疗,9,例再生障碍性贫血患者,现将血红蛋白,(g/L),变化的数据列在下面,问:治疗前后的差别是否具有显著性意义,?,患 者 编 号,1 2 3 4 5 6 7 8 9,治疗前血红蛋白,68 65 55 75 50 70 76 65 72,治疗后血红蛋白,128 82 80 112 125 110 85 80 105,【,例,】,从八窝大白鼠中分别选出同性别、体重相近的两只,喂以水解蛋白和酪蛋白的饲料,四周后测定其体重增加情况,结果如下:,窝 编 号,1 2 3 4 5 6 7 8,含酪蛋白组,82 66 74 78 82 76 73 90,含水解蛋白组,15 28 29 28 24 38 21 37,问:两种饲料对大白鼠体重增加量之间的差别的影响有无显著性意义,?,【,例,】,为研究三棱莪术液的抑瘤效果,将,20,只小白鼠按体重相近程度配成,10,对,然后把每对中的两只动物随机分到实验组和对照组中,两组动物都接种肿瘤,实验组在接种肿瘤三天后注射,30,的三棱莪术液,0.5ml,,对照组则不加任何处理,瘤体改变量资料如下:,小白鼠对子号,1 2 3 4 5 6 7 8 9 10,对 照 组,3.6 4.5 4.2 4.4 3.7 5.6 7.0 4.1 5.0 4.6,注 射 药 液 组,3.0 2.3 2.4 1.1 4.0 3.7 2.7 1.9 2.6 1.3,问:两组瘤体大小的均值之间的差别是否有显著性意义,?,1,、概念,(,1,),随机区组设计,:亦称配伍组设计。首先将条件相近的受试对象配成一个区组,如同种属、同性别、体重相近的动物,然后在各区组内按随机原则分组,每组分别子以不同的处理。,配对设计的扩展,故又称,配伍组设计,第五节 常用实验设计及统计分析方法,三、随机区组(配伍组)设计,(2),区组的定义:实验条件相同,实验对象性质相近的组称为区组(配伍组)。,(3),随机区组设计的三个条件:,a,一个试验由若干个区组组成,b,区组内研究对象的个数等于处理组数,c,区组内对象随机分到各处理组,(4),随机区组设计的变型:治疗前后不同时间的比较,同一批样品不同方法或不同实验室检测进行比较。,3,、优缺点,(1),可安排一个因素,也可安排两个因素;,(2),误差小、均衡性好、节省样本含量,统计效率高;,(3),不能分析交互作用,(4),区组内的对象在试验中易发生意外,影响整个试验。,【,例,4】,将,【,例,1】,中的,12,头动物设计分为三个区组,进行四种处理的比较。,方法,(,1,),编号,:对,12,头动物进行,区组编号,,同时每个,区组内,的四头动物也分别编号。,(,2,),产生随机数字,:对于每一组合编号,依次由计算器(计算机)产生随机数(共,12,个)。,(,3,),归组(区组内四头动物的随机),:事先规定每一个区组内随机数字由小到大对应动物分别分配到甲、乙、丙、丁处理组。,1,、概念,交叉设计:,是将受试对象,随机,分为两组,,一组先给予,A,处理,后给予,B,处理,(,即,A-B,顺序,);,另一组先,B,后,A(,即,B-A,顺序,),。或者,一组先,A,后,B,再,A(,即,A-B-A,顺序,),,另一组,B-A-B,顺序,。两种处理方式在全部试验过程中交叉进行,前者交叉一次,叫,一次交叉设计,,又称,二阶段交叉设计,,后者交叉两次,叫,二次交叉设计,,又称,三阶段交叉设计,。,为了避免前一阶段的处理效应对后一阶段的影响,在交叉设计的两个阶段之间有一个“,洗脱期,”,;,二次交叉设计,在第一、第二和第三阶段之间各有一个“洗脱期”,“洗脱期”的长短需根据试验药物的半衰期、药物效应或血中药物浓度监测来决定。,第五节 常用实验设计及统计分析方法,四、交叉设计,优缺点:,消除了试验顺序的影响;,节省样本,控制条件,实验效率高;,对两种处理的效应作出精细估计与比较;,可以分析比较处理间(组间比较和病人内的比较)、病人间和先后顺序间的差异;(方差分析),两次观察时间不能过长,处理不能有持久效应;,不能分析因素间的交互作用;,同源配对设计的扩展,随机化分组,1,组,2,组,1,组,2,组,【,例,5】,某研究者拟采用交叉设计观察,A,、,B,两种药物治疗,18,例高血压病患者的疗效。,1.,随机数字法,(,1,),编号,:将受试者分别编号为,1,、,2,、,3,、,4,、,、,17,、,18,号。,(,2,),产生随机数字,:由计算器(计算机)产生,18,个随机数。,(,3,),归组,:随机数字较小的一半患者先用,A,药后用,B,药;较大的一半患者先用,B,药后用,A,药。,1,、概念,拉丁方设计:,是用,r,个拉丁字母排成,r,行,r,列的方阵,使每行每列中每个字母都只出现一次,这样的方阵叫,r,阶拉丁方或,rXr,拉丁方。用拉丁字母安排处理因素,行和列安排控制因素,这样的试验称为拉丁方试验。拉丁方设计是从行和列两个方面来控制非处理因素对试验结果的影响。因此,拉丁方设计是配伍组设计思想的进一步扩展。,拉丁方设计要求:,必须是三因素同水平的试验。设计时根据拉丁字母安排处理因素。行和列安排控制因素,并使行数、列数与处理数都相等。任两因素间均无交互作用。各行、列、处理的方差齐。,第五节 常用实验设计及统计分析方法,五、拉丁方设计,2,、设计方法与步骤,根据处理因素的水平数选择一个基本型的拉丁方。一般情况下,处理水平数以,5,一,8,个为宜。,对基本型拉丁方的随机化。随机化时必须整行,(,或列,),进行交换,不能将行或列拆散。,随机决定各字母所代表的处理。,第五节 常用实验设计及统计分析方法,五、拉丁方设计,1,、交互作用,若一个试验中有两个因素(,A,和,B,),当,A,因素取不同水平时可使,B,因素的效应发生改变,反之,,B,因素取不同水平时也可使,A,因素的效应发生改变,则称,A,因素和,B,因素间有,交互作用,。,两因素间的交互作用称为,一阶交互作用,,三因素及以上因素间的交互作用称为,二阶或高阶交互作用,。,第五节 常用实验设计及统计分析方法,六、析因设计,2,、析因试验设计的概念,(1),析因试验设计方法是将每个因素的所有水平互相交叉组合在一起形成总的处理组,(,比较组,),。,因素,B,因素,A,A1,水平,A2,水平,B1,水平,a,1,b,1,a,2,b,1,B2,水平,a,1,b,2,a,2,b,2,(2),处理组数,=,水平数,因素数,例,1.2,个因素,每个因素,3,个水平,3,2,=9,析因试验设计(设计步骤),1,、确立试验的因素与水平,例:某医院研究,A,、,B,两种物药对子宫的收缩作用,以大白鼠为研究对象,并考滤鼠内激素水平对收缩作用的影响,试作析因试验设计。,考察因素为,A,药、,B,药和激素水平(,C,因素),3,个,每个因素假设均为两个水平,试作析因试验设计。,2,、确定试验总处理组数,2,3,=8,3,因素,2,水平交叉形成处理组,处理组别 试验条件,A,药,B,药 激素水平,1 A1 B1 C1,2 A2 B1 C1,3 A1 B2 C1,4 A2 B2 C1,5 A1 B1 C2,6 A2 B1 C2,7 A1 B2 C2,8 A2 B2 C2,上例,C,因素为内在因素,处理组设置时通过选取不同水平的对象来实现,3,、确立各处理组的样本含量与研究对象的分配方法,完全随机设计与配伍组设计的分配方法或其他方法,4,、试验,5,、统计分析方法 方差分析,析因设计的优缺点:,可分析与比较多个因素的效应及相互间的交互作用;,从各因素的全搭配中挑选出最佳试验条件(治疗方案)或最优试验条件的方向;,每个因素的效应是在其他因素变动条件下进行试验,结论较为可靠;,对因素间交互作用分析较为完全,但当因素与水平过多,组数相当大,分析困难,故一般多用简单的析因试验。,【,例,5】,某医科大学病理生理学教研室研究三种因素,“,小鼠种别,A,、体重,B,和性别,C,”,对皮下移植,SRS,瘤细胞生长特性影响的结果,,A,、,B,、,C,三因素各有两个水平。,A,分为,A,1,:昆明种、,A,2,:沪白,1,号;,B,分为,B,1,:,2425,克,,B,2,:,1315,克;,C,分为,C,1,:雄性、,C,2,:雌性。共选了,24,只小鼠,在接种后第,8,天测得肿瘤体积见表,1,,请问:这是一种什么设计类型,?,应当对此资料作怎样的分析,?,表,1,三因素影响下小鼠第,8,天肿瘤体积,因素,肿瘤体积,(cm,3,)|,C,因素,A,与,B,:,A,1,(B,1,B,2,)A,2,(B,1,B,2,),C,1,0.7069 1.0838 0.0628 0.4712,0.7854 0.9425 0.0942 0.0880,0.3581 0.3335 0.0471 0.1759,C,2,0.0785 0.5027 0.0126 0.2246,0.1885 0.9550 0.0126 0.2513,0.3403 0.9215 0.0094 0.3676,0.2503 0.8514 0.0125 0.1327,三因素析因设计,第五节 常用实验设计及统计分析方法,七、正交设计,问题提出,因素与水平较多时,4,4,=256,可否利用一部分因素水平的搭配试验,忽略高阶交互作用,又不降低试验效率,正交设计的概念,:,正交试验设计是利用已经设计好的正交表对多因素进行设计、试验和分析,其原理是根据各因素间的相互关系,从各因素各水平的全搭配中挑选若干必不可少的搭配进行试验,从而大大减少处理组数与试验次数。,正交表是一种特别的表格,是正交设计的基本工具。我们只介绍它的记号、特点和使用方法。,正交表的记号及含义,记号及含义,正交表的列数,(最多能安排的因素个数,,包括交互作用、误差等),正交表的行数,(需要做的试验次数),各因素的水平数,(,各因素的水平数相等),q,正交表,的代号,如,表示,表示各因素的,水平数,为,2,,,做,8,次试验,,最多考虑,7,个,因素,(含交互作用)的,正,交表,。,正交表的特点,1,、正交表中任意一列中,不同的数字出现的次数相等;,表示:在试验安排中,所挑选出来的水平组合是均匀,分布的(每个因素的各水平出现的次数相同),均衡分散性,2,、正交表中任意两列,把同行的两个数字看成有序数,对时,所有可能的数对出现的次数相同。,表示:任意两因素的各种水平的搭配在所选试验中出现,的次数相等,整齐可比性,这是设计正交试验表的基本准则,正交试验设计的基本步骤,确定目标、选定因素(包括交互作用)、确定水平;,2.,选用合适的正交表;,3.,按选定的正交表设计表头,确定试验方案;,4.,组织实施试验;,5.,试验结果分析。,例,1,为了解决花菜留种问题,以进一步提高花菜种,子的产量和质量,科技人员考察了浇水、施肥、病害防,治和移入温室时间对花菜留种的影响,进行了四个因素,各两个水平的正交试验,各因素及其水平如下表:,因素,水平,1,水平,2,A,:浇水次数,不干死为原则,整个生长期只浇水,12,次,根据生长需水量和自然条件浇水,但不过湿,B,:喷药次数,发现病害即喷药,每半月喷一次,C,:施肥次数,开花期施硫酸铵,进室发根期、抽薹期、开花期和结果期各施肥一次,D,:进室时间,11,月初,11,月,15,日,解 第一步:选择适当的正交表,这是一个四因素两水平的正交试验及分析问题,,因此要选择,型的表,且不考虑交互作用时,,,,仍然是满足条件的最小的正交表,,所以选用正交表,注:也可由试验次数应满足的条件来选择正交表。,若考虑,A,与,B,、,A,与,C,的交互作用,则,,而,是满足条件的最小的正交表,,所以还可选用正交表,其中:,由 确定。,是可求出的,而 是未知的,,当不考虑交互作用时:可取,故,N,不是唯一的。,试验次数,N,的确定原则,所以一般地,由,确定,N,,,如三因素四水平,4,3,的正交试验至少应安排,次以上的试验。,如三因素四水平,4,3,并包括第一、二个因素的交互,作用,的正交试验至少应安排的试验次数为,若再加上包括第一、五个因素的交互作用的正交试验则至少应安排的试验次数为,次以上的试验。,又如安排 的混合水平的正交试验至少应安排,所以一般地,有,第二步 表头设计,查交互作用表,表示位于第二、第四列的两因素的交互作用要放于第六列。,如,L,8,(,2,7,)的交互作用表,列号,1 2 3 4 5 6 7,1,(,1,),3 2 5 4 7 6,2,(,2,),1 6 7 4 5,3,(,3,),7 6 5 4,4,(,4,),1 2 3,5,(,5,),3 2,6,(,6,),1,注意:主效应因素尽量不放交互列。如,A,、,B,因素已放,C1,、,C2,列,则,C,因素就不放,C3,列。,花菜留种的表头设计,列号,1 2 3 4 5 6 7,因子,考虑交互作用,A,B,和,A,C,,则例,1,的表头可设计为,注:第,6,列为空白列,当随机误差列;也可把第,7,列,作空白列。一般要求至少有一个空白列。,按正交表 得试验方案:,只需将各列中的数字“,1”,、“,2”,分别理解为所填因素,在试验中的水平数,每一行就是一个试验方案。,第三步 按所选定的正交试验方案组织试验,记录试验,结果;,水 列,平 号,试验号,A,B,AXB,C,AXC,D,产量,1,2,3,4,5,6,7,1,1,1,1,1,1,1,1,350,2,1,1,1,2,2,2,2,325,3,1,2,2,1,1,2,2,425,4,1,2,2,2,2,1,1,425,5,2,1,2,1,2,1,2,200,6,2,1,2,2,1,2,1,250,7,2,2,1,1,2,2,1,275,8,2,2,1,2,1,1,2,375,第四步 分析正交试验结果,方法,1,直观分析(极差分析),(,1,)计算极差,确定因素的主次顺序,第,j,列的极差,或,极差越大,说明这个因素的水平改变对试验结果的,影响越大,极差最大的那个因素,就是最主要的因素。,对例,1,来说,各因素的主次顺序为,(,2,)确定最优方案,如果不考虑交互作用,则根据各因素在各水平下的,总产量或平均产量的高低确定最优方案;如果考虑交互,作用,则取各种搭配下产量的平均数,按优化标准确定,最优方案。,本例中,不考虑交互作用,在方案,A,1,B,2,C,2,D,2,最优,,但交互作用,A,C,是第三重要因素,所以需考虑,A,、,C,的搭,配对实验指标的影响,取,A,i,B,j,的各种搭配的平均数,结,果是,A,1,与,C,1,搭配最好,故本问题的最优方案为,A,1,B,2,C,1,D,2,。,方法,2,方差分析法,基本思想与双因素方差分析方法一致:将总的,离差平方和分解成各因素及各交互作用的离差平方,和,构造,F,统计量,对各因素是否对试验指标具有,显著影响,作,F,检验。,第五节 常用实验设计及统计分析方法,十、重复测量设计,重复测量设计,:是指在不同的时间点上对同一个受试对象的某项指标进行重复测量。,此种设计的特点是,:,不同时间点重复测量值之问存在自相关性,;,测定时间有时是等距的、有时是不等距的,;,有时部分受试对象在最后的若干个时问点上出现缺失数据,;,观测指标有时是定量的、有时是定性的。,【,例,3.1】,将,15,只家兔随机地均分成,3,个组(处理因素,A,),即,A,1,(适应组)、,A,2,(平原组)、,A,3,(急性缺氧组)。让全部家兔处于缺氧状态,对接受各种处理的每组家兔中的每一只,分别在缺氧的不同时间点(时间因素,T,,,h,)上观测血浆,K,+,含量(,ppm,),即,T,1,(缺氧前)、,T,2,(缺氧,0.5h,)、,T,3,(缺氧,1h,)、,T,4,(缺氧,2h,)。设计格式和资料见表,14.12.1,,试判断此资料所取自的实验设计类型,并对资料作相应的统计分析。,重复测量设计,表,14.12.1,接受不同处理的家兔血浆中,K,+,含量的测定结果,处理组 家兔,血浆中,K,+,含量 (,ppm,),(,因素,A),编号 缺氧时间,T(h,):,T,1,(,0,),T,2,(,0.5,),T,3,(,1,),T,4,(,2,),A,1,(适应组),1 154.5 129.8 122.7 171.7,2 173.0 124.0 170.4 168.6,3 186.0 131.0 137.0 138.0,4 161.0 154.0 178.0 128.0,5 187.0 158.0 162.0 152.0,A,2,(平原组),6 144.4 135.5 149.9 129.1,7 147.1 134.2 138.3 146.1,8 18展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




医学研究的数据管理与分析——第四章-常用研究设计的数据统计分析.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12627119.html