分享
分销 收藏 举报 申诉 / 54
播放页_导航下方通栏广告

类型科研设计与统计常见错误解析.ppt

  • 上传人:xrp****65
  • 文档编号:13340551
  • 上传时间:2026-03-04
  • 格式:PPT
  • 页数:54
  • 大小:148.50KB
  • 下载积分:10 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    科研 设计 统计 常见 错误 解析
    资源描述:
    单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,科研设计与统计常见错误解析,中日友好医院 李光伟,一、选题,临床科研系指以病人为研究对象的医学科学研究,其目的是为了提高诊断水平和治疗效果,改善预后和对疾病病因做宏观研究。,选题是临床科研的起点,体现科研设计和实施的指导思想,影响临床科研工作的全过程,因此在科研过程中自始至终处于主导地位。,从这个角度来说,选题比科研方法更重要。,选题就是要正确地发现和提出问题,这些问题有的来自于临床实践,有的来自文献资料,所谓正确就是这些提出的问题要符合科学的认识规律,提出新问题、新假设比完成一项科研工作更难,没有好的科研假设,再好的科研方法也不会有好的科研成果。,例,:,提出新问题,医生的共识,-,冠心病来自已知危险因素。,但是无已知危险因素的人为什么发生冠心病?,冠心病人群血同型半胱氨酸水平显著升高,,那末同性半胱氨酸是否是冠心病新的危险因素?,使之下降发生冠心病危险是否会下降?,选题,-,同型半胱氨酸是否是冠心病新的危险因素?,临床科研选题的原则,首先是研究的问题要涉及我国的常见病、多发病、危害人民健康较严重的疾病。,第二个原则是所选的课题要有创造性和先进性,要选择前人没有解决或没有完全解决的问题。研究的结果应该是前人不明了或不完全明了的。,开拓性(独创性)研究最有价值。,发展性研究,争鸣性研究也有一定的价值,没有探索性,缺乏创造性,只是重复前人做过 的工作,不能算作好的科研。,选题必须具有科学性。所提出的新问题、新假设、新思路必须要符合客观规律。,临床实践是临床科研选题的源泉:,在日常临床实践中,人们无时无刻不面临着许多诊断、治疗、病因和预后估计等问题,诊断方法和治疗措施有待于科学的系统评价,这些课题其中不少可能具有较高的研究价值,临床医学已发展成为一门综合性的学科,不仅涉及生物医学,而且涉及临床经济学和医学社会等,这一方面有许多有待研究的临床问题。,最后一个原则是可行性,指研究课题主要技术指标实现的可能性。,选题时必须考虑完成课题的条件,包括人力、物力等,如果这些条件不能满足或根本没有条件,即使所选课题有创造性、科学性又具有临床价值,也无望于成功。,临床科研选题时应注意几点:,前沿,新颖,最好实用,(,近,5-10,年有无类似 工作,或存在某些问题),涉及人群健康的重大问题(发病危险因素,提出新的诊断方法),建立新实验方法(提供研究新手段),确定新药疗效及副作用,有的放矢 无病呻吟,二、研究设计,科研设计是科研的灵魂,严密的设计是取得有价值结果的先决条件,从这个意义上说没有“设计”就没有科研。,不少回顾性分析,内容包罗万象,是研究无主题的反映,:,研究者在研究之初对研究要解决的问题即主攻方向心中无数,对研究所报的态度是逮着什么算什么,并不是想通过研究解决某一特定的问题,或不知道通过研究能解决什么问题。,这些研究缺乏严格的设计或无设计,这类研究即使有重要的发现也属偶然。,“前瞻性”研究,无前瞻性的设计,几年前做了几万人的糖尿病普查,发现了,400,例糖尿病和,500,例糖耐量低减,几年后的今天忽然想起这些病例很可能出一篇文章,于是又去调查了一番,找到了,200,例糖尿病和,300,例糖耐量低减。,写出,1.,糖尿病人冠心病危险因素分析,2.,高危人群糖尿病的危险因素,.,这种研究是残缺不全的随访,并不是前瞻性研究,缺点是难以弥补的。,高达,50%,的失访率会造成严重的信息偏差(,information Bias,),:,若是有问题的人召之即来,则发病率会被高估,;,若严重者已去医院看病不来参加,来的只有轻的病人,则会低估疾病的发病率。,例如糖尿病人群中,有许多人合并了高血压、高血脂病,不少人已用药物治疗,治疗中有的长期坚持用药,有人仅偶尔用药,有人血压或血脂一直控制很好,有些人时好时差,此时不论以随访的血压、血脂指标,还是以末次随访的指标分析,都不能反映干预对疾病的影响。,这些重要混杂因素的干扰,分析的结果常会远离实际情况,.,终点事件过少,有些研究者为了某种原因,希望尽早发表自己研究的结果,仅随访极短的时间,(,半年或一年,),,仅有几个或十几个终点事件(如死亡)就进行多因素分析,寻找危险因素。,终点事件过少的这种分析看上去可能条条是道,但其结果往往是不可靠的。应延长随访时间,增加终点事件后再分析,Navigntor,研究设计出现,1000,个终点事体时才结题。,为保证科研的成功,一个完整的科研设计应包括以下几项内容,:,有理论或实用价值的选题,选择合适的研究对象,制定可靠的测量指标,选择科学的统计分析方法,若能对结果做恰当的描述,则会得出符合实际的结论。,随机化分组在大多数情况下十分重要,,但随机化并非总是有利的和有道理的。,在某些情况下有比随机化更重要的东西那就是要满足适应症的要求。,适应症不合理,随机化反使结果变糟。,女性激素补充治疗的循证研究,(妇女健康倡议研究,WHI),19,世纪,70,年代结论:,雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松。但不会增加子宫内膜癌危险。,WHI,(,大规模,多中心,,随机对照,),结论:,雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防,预防骨质疏松时应考虑,乳腺及心血管病风险。,弊多利少!,心脏事件,29%,,卒中,41%,,,乳腺癌,26%,,,结肠癌,37%,,髋骨骨折,34%,妇女健康倡议研究(,WHI),-,再好的研究也有缺陷!,忽略了,HRT,最明显的益处:,(缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松),没有遵照处方药应该严格掌握,适应症,的原则(性激素低下 而非所有老年妇女,更不是健康老年妇女。该研究中,80%,以上是没有绝经期症状的老年妇女。,不具有,HRT,适应症,结论不应随意扩大(品种,剂量,种族),与某些风险相比,WHI,所阐明的,HRT,对各种事件的绝对风险是 很低的,(,一,).,研究对象的选择,要想证实研究者的思想,确定入选和排除标准,选择合理的研究对象是关键的一环。,1.,研究对象要有代表性,做疾病患病率的调查,随机化的原则可保证研究样本是总体人群的“缩影”,从而避免结果失真。,从某一局部地区“整体人体”调查出的“率”如推广到普遍认群,应说明该局部的“整体”人群与全局的人群结构相似。,1.,研究对象要有代表性,随机化抽样的缺点是研究对象地域较为分散,每个单位仅有少量病例,这,对于干预治疗的前瞻性研究的病人管理极为不利,,耗费更多人力,常使研究无法进行。,而在人群较多的社区进行“整群”调查,会在相对较小的地域找到较大样本,从而有利干预治疗的管理。如果其人群结构接近全局的人群,其统计的“率”也有重要参考价值,。,2.,样本含量的估计,队列研究属前瞻性研究,应考虑到失访的可能性,故一般需再加,10%,的样本量。失访率,40%,以上,其研究的真实性就会受到严重怀疑。如果失访与暴露或疾病都有联系,那么即使随访率达到,80%,以上也难以防止偏倚的发生,。,3.,从生物学医学原理选择持定的合理人群(不犯人群结构错误)研究对象中所,观察变量的梯度,例,1,看生长激素水平与身高的关系:,对,2574,岁者测,GH,与身高,结果发现,GH,与身高不相关,结论肯定错了,因为,GH,的最重要作用在于促生长,原因是人群选择失当,GH,促生长表现在身高增长期,即儿童期,成人身高已不再增高。,研究肥胖与糖尿病的关系,不能,仅选择,超重和肥胖的人群(,BMI 25-30,),因为,(,BMI 25-27,),与(,BMI 27-30,),的人群糖尿病的患病率可能无明显差别,,但,与,BMI24,人群,差别会很显著,变量的梯度是成功的关键。,4,、设定恰当的入选和排除标准,恰当的入选和排除标准,可防止混杂因素的干扰,保证研究结果的科学性,这是在各项研究遵守的。,例如,看血压与胰岛关系,不可纳入有心功障碍及肾病患者,否则可结果会有偏差。,4,、设定恰当的入选和排除标准,入组的研究对象的准入指标,是保证研究质量的最重要和最基本的条件,在研究设计和发表的论著中务必详细交代。,但这种选入排除标准应是实事求是的而不是过于苛求。,在制订纳入和排除标准时,在保证研究质量的前题下,一定要考虑研究成果的代表性和研究结果推广的受益面。,例,:,有一重点课题仅考虑入组病例诊断的严格性,排除标准竟设计了,17,项,合格的纳入对象约占整个患该病人群的,10%,左右,90%,左右的患者被排除掉。,即使该研究的结果有高度的内在真实性(,internal validity,),其代表性也仅为,10%,左右。,过度严格的选择会有轻型病人被排除,使研究结果出现偏差。,例:冠心病与胰岛素的关系,仅用冠脉造影资料作为诊断标准,结果发现,冠脉造影(,-,)者:,FINS 22 mm/ml,冠脉造影(,+,)者:,FINS 23 mm/ml,结论是冠心病与胰岛素无关,问题出在什么地方?,问题出在“诊断标准”,:,冠脉造影(,-,)的人为什么能接受这种不无危险的检查?,因为这些人已有许多危险因素!,或有轻度狭窄但达不到“狭窄的定义”的切点,没达到“狭窄”切点,只是时间尚短。,这并不能说明胰岛素与冠心病无关。,(,二,),、选择试验效果测试指标:,对测量的方法和指标的要求,敏感性要好:对于治疗出现的客观反应,要能敏感地发现并能量度,其敏感性越高越好;,(,二,),、选择试验效果测试指标:,选择要求,关联性:,指标与研究目的有本质的联系,应能确切反映处理因素的作用。,生物学意义合理:冠脉造影,,HbA1c,看降糖药物疗效。,灵敏性:,指标能正确反映效应变化的最小数量或最小水平。,特异性:对治疗反应的阳性结果要能准确地测量和确定,其特异性越强越好;,尽量选用客观指标作为主要观察指标。,精确性:,包含准确度,(,效度,),和精密度,(,信度,),两个方面。,稳定性:,变异程度,经济可行:在考虑敏感性和特异性的基础上,应从各种方法比较中,选择经济及可行性良好的测试方法和指标。,指标的选择要少而精,三,.,统计分析,在我国临床科研的统计学应用中,在统计方法的选择上存在过分强调统计检验而忽略统计学估计的倾向,存在统计方法越复杂越好的片面看法。,在发表的医学论文中,大多强调是否得到差别有统计学意义,而较少对测定值进行,95%,可信区间估计,提及样本量估计及抽样方法、样本代表性问题的文章就更少了,在,80,年代初期,国外医学杂志针对类似的情况曾进行广泛的讨论,提出应重视区间估计的意义而不能将注意力集中在,P,值是否小于,0.05,上。,现在大多数的国际医学刊物发表的论文中要求作者同时给出点估计、区间估计和具体的检验统计值,如相对危险度(,Relative Risk,RR,RR,值就是暴露人群发病机与非暴露人群发病机率之比,即,a/(a+b),与,c/(c+b),之比),,RR,的,95%,可信限和,P,值。诸如,95%,可信限的区间估计可以提供更多有价值的信息,但在我国临床科研的统计学应用中尚未引起足够的重视。片面地认为越复杂的统计方法越好,而忽视统计检验方法的适用性和恰当性。,(1),、描述性统计,描述性统计分析是统计检验的基础,能提供资料的总体特征,不论在最后的论文报告中描述性统计分析的结果占多大的比重,它都是实际的资料分析过程中的起点,它为选择进一步的分析方法如选择合理的变量提供重要的信息,发现原始资料中的错误,忽略必须的描述性统计分析,是导致统计方法应用不当的原因。,从简单到复杂,最基本的分析形式为单个因素的不匹配不分层资料组间比较的分析,这是病例对照研究推断性统计的基础。,可比较病例组与对照之间危险因素的分布情况,分析其危险因素与患病之间的联系。,由于病例和对照只是总体的代表,无法直接计算真实的患病率,也就无法直接计算,RR,值,可以估计相对危险度,OR,,,用以来代替,RR,。,(2),、统计分析中变量的选择,变量的确定:,研究的目的是相看哪两个变量之间的关系(不妨假设一因,一果),例,;,高血压为因,冠心病为果,A.,明确变量的性质,重点和首要的看变量是否为正态分布,分析中对变量进行正态分布检验,血胰岛素、血脂、生长激素、皮质醇、尿微量白蛋白,骨密度等都常为非正态分布。,非正态分布的变量是不能以原始资料进行参数统计分析,此时不进行正态化处理,得出结论会面目全非。,确定重要的变量(包括混杂因素)数量的方法,1.,首先可根据自己对所研究领域专业知识的了解初步选择,例,:,对氧磷脂酶基因多态性与糖尿病人群合并,冠心病,的关系,对照组 糖尿病组 糖尿病组,+,冠心病组,病例数,38 36 39,男,/,女,29/9 24/12 36/3,年龄,70.8+10.8 64.8+11.9,72.7+8.3,高血压,(,有,/,无,),30/8 19/17 17/22,BMI 23.86+3.41 24.96+3.14 25.29+2.56,?DM,病程,0,?,?,服药,0?,PON-192 BB 13.2%11.1%,30.8%,年龄是必须调整的混杂因素,2.,然后加入,文献中,同类研究必须纳入的变量,3.,应用,逐步回归分析,也会发现哪些变量应该选入。,有些研究在分析中囊括,全部已测变量,来做多因素步回归分析,或以为,计算机挑出,的变量就是最佳变量,是一种误解。,计算机挑出的变量受许多因素的影响,有些,未被计算计挑出的变量有时非常重要,(如年龄、性别),所选变量中若,不含有这些变量,分析结果可能不会被承认,。,D,、,决定用等级变量还是连续变量,将本应作为连续变量的参数改为等级变量有时会丢掉许多有用的信息。,决定哪些变量应作为连续变量,哪些变量应作为等级变量应由其与因变量线性相关(,pearson,),及等级相关,(spearman),的结果来决定,线性相关优于等级相关的变量不应以等级变量进入分析。,pearson,相关优于,spearman,相关,用连续变量较合理。,spearman,相关优于,Pearson,相关,用分组变量较合理。,E.,确定入选变量的数目,入选变量并非入选变量的数目越多研究越严密,总的自变量数应由样本数决定(,1,:,10,),(对于多因素设计,观测变量数为样本例数的,1/5-1/10,)。,一些作者在分析中自变量的选择目的不明,一共有,100,个病例,每人有,30,个变量,就将,30,个变量都用作为自变量,以为自变量越多,分析水平越高。,注意变量间相互关系,作者应十分明确所研究的两个主要变量的关系,将可能的混杂因素作为协变量放入模型,选入过多变量画蛇添足,徒劳无益,甚至有害,选入过多的协变量统计学上称为“过度调整”,这种调 整常常掩盖有意义的关联。,作为一个原则,多因素分析中,如不是为什么特殊目的,不宜将两个密切相关的变量放入一个方程进行分析,过度调整常会丢失一些有价值的信息。,F.,多因素分析方法的选择,:,多因素分析模式的选择取决于,研究的性质:现状研究可选用线性回归和,Logistic,回归,前瞻性研究选用成比例风险模型或,Logistic,回归,因变量的性质:因变量为连续变量选用线性回归,因度量为分组变量(,0,,,1,)选,Logistic,回归或成比例风险模型。,一般说来前瞻性研究的成比例风险模型更为优越。,四,.,结果判定,应,以审视的眼光看待统计分析的结果,:,为什麽,?,因为人们常犯下述错误,先入为主的一个想法,(自己创造的,或别人特别是外国人发表的);,在最容易取材的环境中收集病例(常常数量不多,不管或不知有多少因素干扰);,统计分析,t,检验“定终身”,,P0.05,就皆大欢喜。,五,.,结果判定,这些研究在做统计学分析时常常是在,搞“逼、供、信”,:,强制一个不适当的人群做为研究对象,强加给一个不适当的分析方法,逼出一个结果并对之深信不疑,这些研究是垃圾文章的制造厂。,1.P,值的意义:,在进行研究和阅读文献时应物别注意,P,值的大小。但是,,P,值并没有告诉我们这一性状出现的频率或水平的大小和方向,要了解这些信息必须依靠基本统计量,基本统计量包括率、均数、标准差等。,比较两组(或多组)的率或均数可以了解该性状在组间分布的差异有多大及其变化的方向。,在此基础上,结合统计检验的,P,值和专业知识下结论。,在分析评价研究结果时,P,值和基本统计量都是非常重要的,缺一不可。,观察对象的数量较少时,基本统计量的差别可能很大而,P,值大于,0.05,,此时应注意其专业意义。,如果这种差别在专业上已非常重要,应考虑继续扩大样本量,直至随机发生这种差别的机率小于,5%,。,当基本统计量的差别较小而观察对象的数量很大时,往往发现组间差异有显著性,此时应特别注意组间差别在专业上有无意义,如果这种差异在专业上并无重要意义,即使,P,值小于,0.05,,我们也认为其并无重要的意义命题,2,、因果推理:,进行科学研究的重要目的之一就是探求某件事是否是发生的另一件事的结果,.,因果推理是自然科学,社会科学的支柱,.,人们之所以能对世界取得如此深入的认识和了解,应该说与因果推理是分不开的。,推理有许多陷阱,我们常习惯于非,A,即,B,式的判断,但实际情况常有,C,或,D,存在,.,如果是这样,在将证据(结果)变成了故事(结论)的过程中就会出现偏差。,医学科研中的推理不仅要看两变量相关是否显著,而且要在看生物学上是否合理。于上述例,1,从常识上不会犯错误,;,但在例,2,由于研充者对相关疾病不了解,所以可能得出错误结论。,为保证因果推理的正确,不仅要求在研究中做为随机抽样,对照试验,还需要做换位思考和对所研究领域有广博深厚的专业知识。,例如,偏回归系数决定有无统计学意义,但不能决定变量的重要性。,标准回归系数的绝对值大小说明各变量的重要性。,五、结论,(1),、要恰如其分,在本人群,cross-sectional data,结果可以说“提示”,prospective data,结果可以说“表明”,指出自己研究的局限,有待他人证实,有待进一步研究,(2),、尽量贴近临床,能给人们提供有实际意义,有临床实用价值的建议,如:肥胖与高血压、冠心病有关。,BMI27,,,高血压危险增加,5,倍!,腰围,90cm,,,冠心病危险因素集群机会增国,15,倍!,减重,10%,可使,HBA1,C,降,1%,(3),、,复习近,10,年相关研究文献充实自己的头脑;,了解他人工作优缺点及主要结论;,借鉴好的分析方法;,为自己的结论寻找旁证或理论根据;,确定自己研究结果的独特之处。,六,.,结束语,:,做统计分析的主人,人们为什麽不能做统计分析的主人,?,一方面由于统计学知识贫乏,更重要的是对研究所涉及领域没有广博的知识,不了解所研究变量在病理生理方面错综复杂的联,系从而不能恰当地选择,最适,分析方式及,最佳,(常常是 最简单),的变量组合得出最接近真实,的结论。,
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:科研设计与统计常见错误解析.ppt
    链接地址:https://www.zixin.com.cn/doc/13340551.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork