1、第九章流行病学的常见偏倚及控制重点:掌握选择偏倚.信息偏倚和混杂偏倚概念;掌握各种偏倚产生原因及控制措施;本章内容第一节误差与研究的真实性第二节研究的真实性第三节偏倚5-M-RH弟一R l天差一、随机误差二、系统误差三、随机误差与系统误差的区别一、随机误差 也定义:由于多种无法控制及不能预测Q 的因素引起的一类表现不恒定、随机变化二 的误差叫随机误差。又叫机会。来源包括/1、测量方法或测量工具本身产生随机(变异;)2、个体内的随机生物学变异;(晶 一个体间的随机变异。4 r随机误差可用统计学方法来估计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。5 r二、系统误差定义:是指研究
2、过程中,由一些已知 或可控制的因素引起的使研究结果或推 论系统地偏离真实情况的的误差。在研 究设计、资料的收集、分析、解释或发 表过程中,都有可能发生系统误差,导 致结论系统地与真实值不同。系统误差又叫偏倚。6 r系统误差来自于对象选取、和统计分析等的方法学缺陷,有固定方向和固定大小的误差O7 三.随机误差和 系统误差的区别随机误差系统误差来源测量工具、个体内及 个体间的无规律变异测量工具、个体内及 个体间的无规律变异,及不合理的抽样、测 量、分析、结果解释 等大小和方向不可预测,但可用统 计学方法检验和量化对结果的方向和大小 大多可预测,但小可 用统计学方法检验和 量化减少和控制可通过改善研
3、究设计、增大样本量减少根据误差来源及对结 果影响的规律采取针 对性的措施以避免和 控制8/第二节研究的真实性工定义,内部真实性工外部真实性9 r、定义 真实性(效度):指研究收集的数据、分析结果和所得结 论与客观实际的符合程度。10内部真实性(internaiwid田梆真实性定义研究结果与实际研究对象真实I况的符合程度,它 邕实或有效。答一个研究本身是否改善措施限制研究对象的类型和研究的环境条 外部真实性(external validity)触 定义研究结果与推论对象真 的符合程度,又称为普遍性实,(generalizability)。它答一个研究能否推广应用到研究对象以外的人群。改善措施触
4、增加研究对象的异质性,使得研究对象 的代表性范围扩大。12乡第三节研究的偏倚工选择偏倚工信息偏倚工混杂偏倚13-)定义开究对象的选取过程中,,由于选取方式不当 争致入选对象与未K选靖翔豫在融要。由此造成的偏倚漏源择偏倚。例如研究 良采用志愿者,方便样本,或者研究对象的 玄答或失访等。令描述性研究的选择偏倚主要体现在样本对总体的代表性上如不是采用随机抽样而是使用方便样本,或某 群体(志愿者.因特网利用者等)造成的外部效 推)受限问题。控制方法尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等多分析性研究的选择偏倚主要体现 研究对象进入、排除、不参与或失访 究暴露或处理因素存在关
5、联,由此增大或减少暴 病、处理与效应的关联,导致效应估计的偏倚。控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关(二)、选择偏倚的种类(1)入院率偏倚(Berksonfsbias)指利用医院门诊或住院病人作为研究 对象时,由于入院率的不同而导致的偏 倚。社会阶层与颈椎病假定某人群中有6000人患颈椎病,6000人患冠心病,并且在患这两种疾病的人中各有20%的人属于上等社 这两种疾出的病人社会阶层情况:1-患冠心病并属上等阶层 2.患颈椎病并属上等阶层3.患冠心病不属上等阶层 4颈椎病不属上等阶层1200 A1200 A4800 A4800 A18 r社会地位
6、 病例组(颈椎病)上等阶层 1200社等阶层 4800合计 6000=1OR=1200 x4800/1200 x4800妙=1,P0.0519又假定患冠心病者入院率为60%,颈椎病为 25%,上等阶层者因接受保健检查的入院 率为40%。那么实际入院人数为:1.患冠心病并属上等阶层:共1200人,正常入院:1200X60%=720人 接受保健检查入院:480X40%=192人 实际入院人数:720+192=912人2.患冠心病不属上等阶层:共4800人正常入院:4800X60%=2880 实际入院人数:2880203.患颈椎病并属上等阶层:共1200人、正常入院:1200 x25%=300人、接
7、受保健检直入院:900 x40%=360人实际入院人数:300+360=660人4.患颈椎病不属上等阶层:共480。人正常入院:4800 x25%=1200际入院人数:120021,颈椎病与社会地位的关系:OR=660 x2880/912x 1200=1.73(PR=(48x68)/(52x32)=2.0差异性错误分类研1究真实数据、高月旨肪西食4()低月旨肪 月善食 4060*(60 x60)/(40 x40)=2.3错误分类数据高脂肪膳 食低月旨肪月善食 f心肌梗死6040 对照3268OR=(60 x68)/(40 x32)=3.244图4无差异性错误分类和差异性错误分类的示例二、信息偏
8、倚的控制(-)制定明细的资料收集方法和严格的质量搭 制方法(二)尽可能采用“盲法(=)尽量收集客观指标的资料。(四)收集资料的范围可以适当有意识地扩大些,借以分散调直人员和研究对象对某项因素的 注意力,减少某些偏见带来的偏倚。(五)通过调查知情人或采用相应的调查技术,获取正确信息,避免报告偏倚。(六)选择一个与暴露史有联系的鲜明的记忆助其联想记忆或选择新病例作为对象。45 r三、混杂偏倚、概述1.混杂偏倚:当研究暴露于某一因素与疾病的关系时,由于一个或多个既与疾病有制约关系,又与暴露密切相关的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,这些影响称为混杂偏倚。462.混杂因素:指与
9、研究因素和研究疾病均有关;若在比较的人群组中分布不均,可以歪曲因素与疾病之间真正联系的因素。3.混杂因素的基本特点:(1)必须是所研究疾病有关。(2)必须与研究因素有关。(3)一定不是研究因素与研究疾病因果链上的 中间变量。具备基本条件,如果在比较的人群组中分布不均匀,即可导致偏倚。47胃二、混杂偏倚的测量:(-)测量方法设含有某可疑混杂因素(f)时,研究因素与研 究疾病的效应估计值为eRR或cOR按该可疑混杂因素调整后的效应估计值为aRR(f)或aOR(f)1.第一种测量方法(1)gcRR=aRR(f)(2)若cRRHaRR(f)l)gcRRaRR(f)gcRRaRR(f)f无混杂作用 f有
10、混杂作用 为正混杂为负混杂48 r2.第二种测量方法:混杂偏倚=c-屈aRR(f)若值=0,为无混杂。若值40,有混杂若值为正值,为正偏倚若值为负值,为负偏倚 箍鬲大小表示混杂的程度。49 r混杂偏倚假关联去继发关联手直接因果关联的歪曲继发关联(2)直接因果关联的歪曲(3)直接因果关联的彳505混杂偏倚引起假关联1.继发关联(secondary associatioi。纯粹由混杂偏倚产生的关联。怀疑的病因(暴露)E与疾病D并不存彳 果关系,而由于两者(E,D)有共同的 C,从而继发产生E与D的关联。E与C也可以由于相关(因果方向不明)产生继发关联继发关联高血清胆例:固醇c 吸烟二7冠心病E?黄
11、色瘤D.喝咖啡E?口胰腺癌D52 r2.直接因果关联的歪曲。怀疑的病因(暴露)E与疾病D既存在直 接关联,又存在间接关联(图5,(2)。或与其他危险(保护)因素F存在相关(图5,)。直接因果关联程度或方向将可能受到混 杂干扰,歪曲估计值53直接因果关联的歪曲54 r三.混杂偏倚的控制(-)在设计阶段1.限制2.匹配3随机化分组(=)在分析阶段1.分层分析2.多因素数学模型分析;准化率分析55 r1,对研究所需指标或数据进行测定或测 量时产生的偏倚为 A.诊断怀疑偏倚 B.测量偏倚 C.暴露怀疑偏倚 D.易感性偏倚 E.Berksons 偏倚56 r2.某因素在病因学上与某疾病本无关联,但可引起
12、所研究疾病的症状或体征,从而促使患者及早就诊,提高了早期病 例检出率,从而过高的估计了暴露程度,这种偏倚是A.B.C.D.诊断怀疑偏倚检出偏倚测量偏倚混杂偏倚%erksonfs 偏倚57 r3.对于选择偏倚的控制原则是、A,对研究中可能会出现的各种选择性偏 倚要充分了解B.严格掌握研究对象的纳入和排除标准C.采用盲法收集资料D.尽量取得研究对象的合作,提高应答 率,降低失访率E.采用客观指标进行测量58 F4.在职业性疾病的研究中,由健康工N 效应带来的偏倚是、A.无应答偏倚 B,混杂偏倚 C.抽样误差 D.易感性偏倚 E.Berksons 偏倚5)利用医院就诊或住院病人为研究对象 时,由于入院率的不同而造成的偏差是 A.无应答偏倚B.混杂偏倚C.抽样误差D.易感性偏倚E.Berksons 偏倚60S