医学科研中常见统计学错误(朱继民).doc

上传人：xrp****65

文档编号：5693375

上传时间：2024-11-15

格式：DOC

页数：35

大小：810KB

下载积分：10 金币

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档保存到电脑，查找使用更方便

10 金币

下载 开通VIP

还剩页未读，继续阅读

举报
申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：
如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

特殊限制：
部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。

关键词：
医学科研常见统计学错误朱继民

资源描述：

第十五章医学科研中常见的统计学错误第一节科研设计中的常见错误一、抽样设计二、实验设计中的随机原则三、实验设计中的对照原则四、实验设计中的重复原则五、实验设计中的均衡原则第二节科研数据描述中的常见错误一、统计指标的选取二、统计图表第三节医学科研统计推断中的错误一、t检验二、方差分析三、卡方（c2）检验四、相关与回归分析五、结论表达不当第十五章医学科研中常见的统计学错误医学科研中，研究者关心的研究对象的特征往往具有变异性；如年龄、性别皆相同的人其身高不尽相同、体重、血型等也都存在类似的现象。同时，由于研究对象往往很多，或者不知到底有多少，或者研究对象不宜全部拿来做研究；所以人们往往借助抽样研究，即从总体中抽取部分个体组成样本，依据对样本的研究结果推断总体的情况。恰恰是这种变异的存在，以及如何用样本准确推断总体的需求，使得统计学有了用武之地和发展的机遇。诚然，合理恰当地选用统计学方法，有助于人们发现变异背后隐藏的真面目，即一般规律。但是，如果采用的统计学方法不当，不但找不到真正的规律，反而可能得出错误的结论，进而影响研究的科学性，甚至会使错误的结论蔓延，造成不良影响。作为医学工作者，尤其是科研工作者，必须了解当前医学科研中常见的统计学错误，以便更好地开展科研和利用科研成果。本章借助科研中统计学误用实例，介绍常见的错用情况，以帮助读者避免类似错误的发生。第一节科研设计中的常见错误统计学是一门重要的方法学，是一门研究数据的收集、整理和分析，从而发现变幻莫测的表面现象之后隐含的一般规律的科学。医学科研是研究医学现象中隐含规律的科学，包括基础医学研究、临床医学研究和预防医学研究等，不管哪类医学科研都离不开统计学的支持。要想做好医学科研，必须掌握一定的统计学知识，如总体与样本、小概率原理、资料的类型和分布、科研设计类型、统计分析的主要工作、常用统计方法以及方法的种类和应用条件等，尤其要了解当前医学科研中常见的统计学错误。实验设计原则的正确把握、统计指标和统计方法的正确选用、对假设检验结果的正确理解、弄清不同设计类型的应用场合、弄清统计结论与实际意义的真正关系等，是科学合理应用医学统计学知识做科学研究的基本前提。但实际医学科研中，却存在着这样或那样的诸多统计学错误，如实验设计时违背实验设计应遵循的基本原则、进行资料描述时不能选择适当的统计指标、采用的统计图表不规范、假设检验时不顾资料与设计的类型而随意套用某种假设检验方法、不能正确理解P值与差异大小的关系、错误地将统计学结论与医学实际意义混为一团，等等。一、抽样设计抽样研究是常用的医学科研方法之一，但科研设计中常存在着抽样假随机，随意规定样本量的问题；从而破坏了抽样研究应满足的必要前提。常用抽样方法有：单纯随机抽样、系统抽样、整群抽样、分层抽样和多级抽样。二、实验设计中的随机原则随机指的是在选取样本时，应确保总体中任何一个个体都有同等的机会被抽到而进入样本；在分配样本时，应确保样本中任何一个个体都有同等的机会被分入任何一个组中去。遵循随机的原则，目的就是使样本具有极好的代表性，使各组受试对象在重要的非实验因素方面具有很高的均衡性，从而提高实验资料的可比性；常见的错误是以随意代替随机。（一）误用实例例1 有些临床医生常常根据患者来院就诊的先后顺序对他们进行分组，如将先来的10例患者作为对照组，中间来的10例患者作为A药组，后来的10例患者作为B药组。分析：这种分组方法看起来似乎很合理，其实这样分组是违反随机原则的。这样分入各组的患者可能在病情等某些重要的非处理因素上相差很多；因为在某一段时间内人们可能容易患上某病，其中有一部分人看医生的态度比较积极，稍有不良感觉就会去看医生，但也有一部分人在这方面较为迟钝，病不重到一定的程度都不去看医生。换言之，在某一段时间内，患者来医院的先后顺序中，可能暗含着病情轻重不等的因素；按就诊的先后顺序分组的结果，就很可能造成某些组内重症者居多，而另一些组内轻症者居多的状况。这种违反随机原则的设计，没能很好地降低重要的非实验因素对观测结果的影响，结果的可靠性必然要受到影响。例2 原文题目：小剂量干扰素加三氮唑核苷治疗流行性乙型脑炎99例分析。原作者在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎99例，采用同期的、接受一般治疗的73例该病患者作为对照。治疗组和对照组的病情，即轻型、普通型、重型和极重型的分布经c2检验差异无统计学意义。两组患者均采用传统降温、镇静、降颅内压、肾上腺皮质激素及抗生素预防感染等对症治疗；在此基础上治疗组选择发病在5天以内的患者，加用干扰素和三氮唑核苷静滴，疗程5－7天。两组比较疗效差异有统计学意义，结论：在一般治疗的基础上加用小剂量干扰素和三氮唑核苷治疗流行性乙型脑炎的疗效优于一般治疗的效果。分析：这个研究结果似乎是合理的，因为原作者考虑到了病情严重程度这一重要的非处理因素两组的分布情况，经c2检验差异无统计学意义。其实，除了病情严重程度，这个研究中还设计到一个重要的非研究因素，即治疗的及时性。对于治疗组，要求发病到治疗的时间在5天之内；而对照组却没有这样的限制；根据常识，早期治疗对疾病的预后具有重要影响，通常有较高的治愈率和较低的死亡率。所以，在治疗的及时性方面，两组不具可比性；这样得到的结论当然要受到质疑。其实，在制定实验设计方案时，应将所有重要、可控的非处理因素考虑在内；本研究除了病情严重程度外，治疗及时性也是一个重要的非处理因素，应采用随机化方法使各组患者在病情和治疗及时性上尽量达到均衡一致，从而提高组间的可比性。三、实验设计中的对照原则设立对照组的目的是寻找一个参照物，或对比的基础；因为好与坏、高与矮、快与慢、长与短等都是相对而言的。一种药物的疗效如何，要看与谁比较，是与安慰剂，还是与当前市面上治疗此类疾病疗效最好的某种药物；比较的对象不同，结论是不同的。常见的错误是：缺乏对照、对照设置不当。（一）误用实例 1. 缺乏对照例1 原文题目：银屑病发病与血型的关系探讨。原作者对64例银屑病患者进行血型观察，其中O型血30例，A型血17例，B型血17例，AB型血0例。没有进行统计分析，就认为银屑病的发病与血型有明显的关系；同时也证实了遗传致病的决定意义。分析：该文没有对照，也没有统计分析，仅凭64例病人的血型分布，就下银屑病的发病与血型有关，显然是不妥的。因为，根据常识，正常人群中的血型构成本来就不是非常均衡的；再者，64名患者的血型构成是否与发病有关，必须经与对照组进行比较，并得到统计学假设检验的支持。如果正常人群的血型分布与银屑病患者的血型分布情况，经检验差异存在统计学意义，则认为血型构成可能与银屑病的发病有关，如果差异无统计学意义，则可以认为银屑病发病与血型构成无关。例2 原文题目：静脉应用维拉帕米治疗快速型心房颤动的临床观察。原作者选择快速型房颤38例（阵发性房颤8例，持续性房颤30例），其中男22例，女16例，年龄24－78岁，平均52.9，心室率128－179次/分，房颤持续时间2天至11年。基础心脏病分别为：风湿性心脏病11例、冠心病10例、高血压性心脏病5例、肺心病2例、扩张性心肌病2例、甲亢性心脏病2例、先天性心脏病（房间隔缺损）2例、特发性心脏病4例。心功能（NYHA）分级：Ⅰ级11例、Ⅱ级13例、Ⅲ级14例，无Ⅳ级和/或预激综合征者。用药方法：常规心电监护，维拉帕米注射液5ml加入5％葡萄糖10ml中，于5分钟内注射完毕；如果15分钟后心室率减慢不显著，再予以维拉帕米2.5－5.0静注。观察用药后5、10、15、20、30分钟的心室率及血压变化。疗效判定标准：显效：用药后心室率减慢>30％或心室率低于100次/分，有效：用药后心室率减慢20％－30％但心室率不低于100次/分，无效：用药后心室率减慢<20％且心室率不低于100次/分。结果：至30分钟显效27例、有效11例，总有效率达100％；说明该法控制房颤之心室率起效迅速、效果可靠。分析：不知您看了这个案例，有何感觉？我觉得很乱、结论的可靠性难以保证。为什么呢？我们知道，要考察某种药物的疗效如何，首先必须设立合理的对照组，因为有比较才有鉴别；而本试验未安排对照组。本试验如能设置一可比的对照，严格控制重要的非实验因素，使其在各组间达到均衡一致，给对照以常规的治疗，如洋地黄制剂；这样做出的结果才能较好地反映出实验效应的差别。另外，对于不同心脏病引起的房颤，放在一起研究，似乎不太妥当；因为这样的同质性不理想。如果能适当增加各组样本数量，分开进行比较研究，效果会好许多。 2. 对照不当例1 原文题目：肝炎灵联合丹参注射液治疗慢性乙型肝炎60例。原作者将慢性乙型肝炎患者随机分为两组，治疗组60例，接受肝炎灵和丹参注射液联合治疗，对照组44例，接受肌苷、维生素C的治疗；两组在性别、年龄、病程、病情等方面差异均无统计学意义。比较两组肝功能指标恢复正常率，得出结论：两药联合应用治疗慢性乙型肝炎有良好的协同作用。分析：这个研究，如果想得出两药联合应用治疗慢性乙型肝炎是否有协同作用，恐怕要考虑采用析因设计为好；而从药物作用上看，丹参注射液单独应用对慢性乙型肝炎是否没有治疗作用。所以，原作者研究的真正目的可能是将肝炎灵与丹参注射液联合应用治疗慢性乙型肝炎的效果是否比单独使用肝炎灵治疗的效果好。如果是这个目的，该研究的对照就有问题了；因为原文中设置的对照无法显示两药合用是否会比单独用肝炎灵的疗效好的结论。正确的做法是，对照组给予肝炎灵加安慰剂治疗，安慰剂在剂型、外观、剂量等方面与丹参注射液相同。采用双盲的方法进行分组和处理，会很好地消除主观偏性，得到的结果会更为准确可靠。例2 某人在研究药物治疗铅中毒时的驱铅效果时，设计了如下试验，见表15-1。对收集的实验资料进行统计分析后，原作者得出的结论为：此药有明显的驱铅作用。分析：本研究虽然设有对照，但原作者没有考虑到这种貌似合理的对照，实际上是很不适当的；因为治疗前后患者所处的环境也发生了变化，即脱离现场，而脱离现场前后本身，也会引起尿铅和血铅的变化。所以，虽然统计分析结果清楚地显示两组之间的差别具有统计学意义，但这并不能有效说明此药具有驱铅作用。如果要考察某种疗法的驱铅效果，必需设有不给予任何治疗的空白对照；当然，这显然是行不通的，因为这样违背了伦理道德的要求；我们可以尝试做动物实验。而如果患者都必须要接受某种治疗，那么就须采用2种和2种以上的药物。采用具有一个重复测量的两因素设计定量资料的方差分析，或者把治疗前的数据作为协变量的值，采用单因素多水平设计资料的协方差分析。表15-1 30名铅中毒工人脱离现场后住院治疗的结果（s）观测指标治疗前治疗后血铅（mg/L） 0.1810.029 0.0730.019* 尿铅（mg/L） 0.1160.009 0.0870.010* 注：与治疗前比，* P < 0.01 例3 原文题目：高血压病患者肾脏早期损害指标的探讨。原作者探讨高血压患者早期肾脏损害的诊断方法，研究对象为74例高血压患者，男性43例，女性31例，平均年龄61岁（40～73岁）；对照组为53名体检健康的职工。分析：这个研究设计虽然有对照组，但没有介绍对照组与试验组间的可比性情况。显然，年龄和性别等重要的非试验因素可能会对研究结果带来一定程度的影响；本试验在设计时，就应将年龄和性别等作为选取对照的重要影响因素。四、实验设计中的重复原则实验设计中重复原则指的是“重复实验”，即在相同的实验条件下，做两次或两次以上的独立实验；这里的“独立”，是指要用不同的受试对象（个体或样品）做实验，而不是在同一受试对象上做多次实验。重复原则的作用在于它有利于使随机变量的统计规律性充分地显露出来。常见的错误是把重复测量当作重复实验、样本量不足。（一）误用实例例1 某人为了说明两台仪器测定结果之间的差别没有统计学意义，选择一名健康者作为受试对象。先用A、B两台仪器分别对该名受试者进行4次重复测量，1个月后，再用A、B两台仪器分别对该名受试者进行4次重复测量；测量的指标有3个，其中一个是“二尖瓣前叶EC幅度”，每一个指标共获得16个数据。然后采用方差分析和t检验进行统计学处理，得出两台仪器测定的结果之间差异无统计学意义；认为自制的廉价仪器可取代进口的昂贵仪器。分析：用同一台仪器在同一时间对同一个体进行重复测定，这实际上是“重复取样”，数据的波动反映了测定值技术熟练程度的高低。1个月前后采用同样的方法对同一个人进行两次测定，这是“重复测量”，目的往往是考察受试者接受某种处理后，随着时间的推移，受试者体内某些指标的动态变化趋势；本例受试者未接受任何处理，前后的变化仅仅反映了指标的生理变化，没有实际意义。本例中，虽然每个指标均有16个原始测定值，但真正的样本大小，及独立受试对象的个数应该是1，而非16。本例严重违反了实验设计的“重复原则”。例2 为探讨不合格采样及送检导致生化指标波动的原因，原作者分析了化验室检测结果波动的4个因素。第一个因素：葡萄糖盐水输液，同侧采血和异侧（正常）采血的生化检测结果差异，用病房病人2次结果比较；结果显示：同测采血时，对肌酐、尿酸等7项指标具有30％～200％的波动，其中血糖和氯的波动尤为明显。第二个因素：样本溶血和正常标本生化指标的差异，用病房病人2次结果比较；结果显示：样本溶血时，其中19项生化检测项目均有波动。第三个因素：时间依赖性项目在抽血后3种不同时间送检引起结果的差异，用1个病人的血样说明血氨在不同时间送检结果不同。第四个因素：抽血管错误，应该用血清管，但用了枸橼酸纳抗凝管后，造成生化结果波动；用5例病人两种不同抽血管的化验结果的变化率来说明差异。分析：本例原作者对4个因素分别进行的分析，除最后一个因素用了5例受试对象外，其他三个似乎只用了1个受试对象（前两个因素中关于受试对象的描述很模糊，不知到底是1位受试对象的两次检测结果还是两个病人的检测结果）；由于变异性的存在，这样的结果很难有说服力，且第四个因素虽有5例，但未对数据进行统计学处理，结论的可靠性是受怀疑的。五、实验设计中的均衡原则均衡原则是实验设计四个基本原则中最核心的内容，起着统观全局的作用。所谓均衡，是指某因素各水平组中的受试对象所受到的非实验因素的影响是完全平衡的，即这些组间的差别完全是由于该因素采取了不同水平所致，而并非其他因素取值不同所造成的影响。常见错误是设计不当，难以满足均衡的要求。（一）误用实例例1 某研究者为观察联合用药治疗鼠早期矽肺的效果，采用如下方法：石英粉尘20mg/只建立模型，采用低剂量不同抗矽肺药物分别治疗60天和150天后宰杀。给药组分别为克矽平、汉防己甲素、羟基磷酸哌嗪、柠檬酸铝单一用药组，克矽平＋汉防己甲素、汉防己甲素＋羟基磷酸哌嗪、羟基磷酸哌嗪＋柠檬酸铝联合用药组。另有生理盐水对照组和石英阳性对照组。分别称量大鼠全肺湿重、干重，测定大鼠全肺胶原蛋白。按单因素k水平设计资料进行方差分析，差异有显著意义；进一步用q检验进行两两比较。无论是预防性治疗60天或是150天，均以“柠铝＋羟哌”和“汉甲素＋羟哌”的疗效最好，明显优于单一给药组的疗效，“克矽平＋汉甲素”组在150天治疗时也优于单一给药组。分析：类似的设计似乎比较常见，尤其多见于中医药的研究；其实这样的设计属于“对照不全”，因为很多组之间在某些方面是不可比的，其本质则是违反了实验设计的“均衡原则”。原作者设计本实验的目的是想考察联合用药能否增加疗效，按单因素k水平设计资料进行方差分析；这样显然是不妥的。由于各组中并不全是单因素的每个水平，联合用药组涉及到多个因素不同水平的组合；即使在所设计的组中某个联合用药组的疗效好于其他组，但由于对照不全，研究之外的联合用药组疗效是否会更好，则不得而知。仔细分析可以发现，该研究涉及到5个实验因素，即克矽平用否、汉甲素用否、羟哌用否、柠铝用否及疗程，每个因素2个水平；所以采用5个因素的析因设计较为合适，这样既能分析出每个因素的实验效应，又能分析任意几个因素之间的交互作用。如此设计与原设计相比，能较为精确地估计和控制误差，结果更可靠；而且，所需的动物数较少。例2 某人为研究耐力训练与提高战士体质的关系时，进行如下设计：从某连队选取20名战士构成试验组，按训练方案进行耐力训练；以机关同龄的20名战士组成对照组，只进行日常活动。观察经4周试验后，两组展示进行一定量的运动时血乳酸的变化。得出的结论：按此方案进行训练能降低运动时血乳酸的蓄积，提高战士的耐力。分析：首先，根据这样的设计得出如此结论是不妥当的；因为该实验设计违反了均衡原则，对照组的选择不合理。对照组除训练因素外，其他应尽可能与实验组一致，而机关战士和连队战士由于工作性质的不同，体能的基础可能存在较大的差别，所以研究开始时两组间就不具备可比性。另外，研究回答的问题缺乏实际意义，因为人们早就知道训练和不训练不一样。可以研究不同训练方案对提高战士体质之间的差异有无统计学意义，以探索最大限度地提高战士体质的最佳方案。第二节科研数据描述中的常见错误统计描述是统计分析的重要工作之一，是展示数据特征的必要步骤。通常依据资料的性质和类型，选择适宜的统计指标以反映数据的集中水平和变异程度；多数时候还借助统计表、统计图来展示数据的分布情况。正确选择统计指标、合理运用统计图表，是进行恰当统计描述的前提；但实际运用中，统计指标选取不当，统计图表使用不规范的现象却较为普遍。一、统计指标的选取（一）定量资料的统计指标 1. 选择统计指标的一般方法：对于定量资料，在确定统计指标前，须先考察资料的分布特征，看其是否满足正态分布的要求；从而为选用恰当的统计指标提供参考。如果资料满足正态性，则考虑采用算术均数和标准差，即以s表示样本数据的集中水平和离散程度；如果数据经对数变换后能满足正态性的要求（如等比资料），则采用几何均数（G）描述其集中水平；如资料分布不能满足正态性（如传染病的潜伏期），通常采取中位数（M）和四分位数间距（Q）作为描述其集中趋势和变异程度的指标。 2. 常见的错误： ①以s描述任何类型资料的特征，尤其是以s描述分布明显呈偏态的资料；②混淆标准差与标准误：标准差和标准误是统计学中非常重要的两个概念，虽然二者在本质上是相同的，均是描述资料离散程度的大小，但描述的对象不同，含义自然也不同，标准差描述一组个体观测值的波动情况，而标准误则反映从同一总体中采用同样的抽样方法，固定样本量多次随机抽取的样本均数的波动情况。均数标准差（s），反映在相同实验条件下，观测值在均数附近的波动情况；而均数标准误（s），反映在相同条件下的重复研究中，与m的接近程度。 3. 误用实例例1 某研究者在《猪活体脑片钙离子荧光强度的测定及对停循环后脑缺血损伤的评价》一文中，对资料进行了如下表达，见表15-2。表15-2 猪小脑病理定量（s）组别猪数（只）空泡变性轻度嗜酸性变性中度嗜酸性变性重度嗜酸性变性实验组 8 1120 1927 312 00 对照组 8 28 2125 3126 3218 分析：均数标准差（s）用于描述呈正态分布资料的特征，包括平均水平和变异程度；要运用s须先考察资料的分布能否满足正态性。表中的数据明显不符合正态分布的要求，因为如果符合正态分布，均数通常比标准差要大；而表中多数的标准差反而比均数大，有的甚至达4倍。从理论上说，均数不会比标准差小，考虑到抽样误差的影响，标准差可能会大于均数，但通常不会是均数的若干倍；所以，这个资料显然属偏态分布，用s进行描述自然是不适合的。正确的描述指标应是M（Q），即中位数与四分位数间距组合。例2某人在表达正常人与四组患有不同疾病的患者血清PCⅢ测定结果时，编制出如下一张统计表，见表15-3。分析：这是一个典型的混淆标准差与标准误的例子，也可能是作者为了让资料的离散度看起来小一点，而采取的一种“补救措施”，即以标准误取代标准差。其实，均数标准差（s）与均数标准误（s）的含义是不同的。另外，用s表达定量资料的结果，同样要求资料满足正态分布。其实我们很容易将数据的标准差算出来，见表15-3最后一列；不难看出，本例资料显示的血清PCⅢ值是呈明显偏态分布的。表15-3 正常人与4组不同疾病患者血清PCⅢ的测定结果组别例数 s（ug/L） P值* 标准差D 正常人 100 85.017.5 175 急性病毒性肝炎 22 131.130.2 < 0.01 142 慢性迁延性肝炎 18 94.926.5 > 0.05 112 代偿性肝硬化 20 266.2157.5 < 0.001 704 肝硬化合并肝癌 46 288.7101.4 < 0.001 687 注：*表示各组与正常人比较，D作者根据表中数据还原出来的。（二）定性资料的统计指标定性资料是指对每个研究对象的某方面的特征和性质进行表达和描述的资料；可以是名义的，也可以是有序的和等级的。描述指标有率、构成比和相对比等，实际应用中存在的常见问题是，率与构成比的混淆、计算率的分母太小等。 1. 误用实例例1 某工厂在“职工健康状况报告”中写道：“在946名工人中，患慢性病的有274人，其中女性219人，占80％，男性55人，占20％。所以，女性易患慢性病”。分析：该报告的撰写者之所以会下“女性易患慢性病”的结论，显然是根据在274例慢性病中，女性占的比重大于男性所占的比重；误认为构成比大，发病率就高。殊不知，构成比的大小只能反映总体中某一组分所占比重的大小，却不能反映该组分出现的频率或发生的强度；而率的大小则可以较好地反映发生的强度。这里，显然是混淆了率与构成比的涵义，错把构成比当作了率。例2 某研究者在《术后病人探视需求的调查分析》一文中，根据对外科术后101例病人的探视需求进行了调查，并绘制了一张统计表，见表15-4。表15-4 101例术后病人对探视时机的需求探视时机（术后天数）例数百分率（％） 1 9 8.9 2 24 23.8 3 41 40.6 ≥4 27 26.7 分析：表15-4中百分率实际上表示的是不同探视需求者所相加之和为100％，反映一事物内部各组成部分在事物总体中所占的比例，是“构成比”，而非 “率”。这里用百分率代替构成比显然是不妥当的，应将“百分率”改为“构成比”，最好在表的下部加上“合计”，见表15-5。表15-5 101例术后病人对探视时机的需求（修改）探视时机（术后天数）例数构成比（％） 1 9 8.9 2 24 23.8 3 41 40.6 ≥4 27 26.7 合计 101 100.0 例3 有研究者用甲药治疗乙病，治疗5例都有效，就认为甲药治疗乙病的有效率为100％。分析：这位研究者显然没有把握好正确应用相对数应注意的问题，例数太少，结果的稳定性较差；说不定用同样的方法再治疗5例，都无效也未必不会发生。如果深入分析，大体分为两种情况：第一，如果乙病共有5例，他们全部接受甲药的治疗（疗法相同）；在此情况下，若5例均有效，我们是可以下甲药治疗乙病的有效率为100％这样的结论的；因为这里没有发生抽样这一过程。第二，如果乙病实际上很多，或者不能明确到底有多少，那么研究者仅对其中的5例采用甲药进行治疗，即使5例均有效，也不能说甲药治疗乙病的有效率为100％。因为这里发生了抽样的过程，且不同患者之间病情、性别、年龄等方面存在确定的变异；所以，抽样误差必然存在。二、统计图表（一）统计表是用表格的形式来描述统计资料，使统计事物之间的关系条理化、系统化与明晰化，便于对指标进行计算、分析与比较。统计表由标题、标目、线条与数字等四个部分构成，各部分均有相应的要求；如：标题应简明扼要说明统计表的内容，一般不宜超过15个字；横标目各行数字的涵义，纵标目说明各列数字的涵义；通常把主语置于横标目，谓语置于纵标目；表的线条宜少勿多，常用三线表；除顶线、底线以及标目线，绝对不用竖线，特殊情况下可加辅助横线；数字一律用阿拉伯数字，同一指标的小数位数应一致，位次对齐。不规范问题：⑴标题过于简略、甚至不写标题，或过于繁琐以及标题不确切；⑵标目过多、层次不清；⑶线条过多；⑷表内同一指标的小数位数不一致；⑸表中数字代表的含义不清楚。 1. 误用实例例1 某研究者在探讨丙型肝炎特异性诊断的比较及其意义时，将研究结果整理成如下表格，见表15-6。分析：用纵标目表示采用的方法（原因），用横标目标表示检测的结果，不符合常规。表格横纵标目的安排，一般要求从左到右阅读可以读成一句话，这样便于理解表格所要表达的意思；另外，表示同一指标数据的小数位要一致。这个表格如能用下面的方式表达，则会更为明了、规范，易于阅读，见表15-7。表15-6 四种方法对104例静脉药瘾者检测结果 Abbott CP GOR PCR 阳性 72 67 52 48 阴性 32 37 52 56 合计 104 104 104 104 ％ 69.2 64.4 50 46 表15-7 四种方法对104例静脉药瘾者检测结果(修改) 检查方法人数检出率（％）阳性阴性合计 Abbott 72 32 104 69.2 CP 67 37 104 64.4 GOR 52 52 104 50.0 PCR 48 56 104 46.2 例2 在《矽肺动物模型全肺灌洗治疗的病例观察》一文中，原作者对10只幼猪给予SiO2染尘处理制作矽肺动物模型，4～5周后，将其分为药物组、盐水组和对照组；药物组和盐水组分别给予全肺大容量灌洗，对照组不作处理。3～5月后处死各组动物，观察右肺膈叶表面病变范围，结果整理成如下表（表15-8）；经卡方检验，各组间差异有统计学意义（P<0.05）。表15-8 各组猪右膈叶矽肺病变范围比较组别病变范围分级 Ⅰ Ⅱ Ⅲ Ⅳ 盐水组（n＝4） 50 25 25 0 药物组（n＝4） 25 50 25 0 对照组（n＝2） 0 50 0 50 分析：对于这个表格中的数字，不知您需要多久才能看明白？列表格的主要目的之一就是要简单明了地表达数据，而这个表格却像个谜！经仔细观察、小心推敲，原来表中的0、25和50表示的既不是病变范围，也不是动物数；而是表示每组动物不同病变范围分级所占的构成比。比如药物组中的25、50、25、0分别表示病变范围在Ⅰ、Ⅱ、Ⅲ、Ⅳ级的动物数为1、2、1和0只。真让人费解！其实，各组动物数太少，使用百分比表达也是不妥当的。如将表15-8改成如下的形式，则较为妥当，见表15-9。表15-9 各组猪右膈叶矽肺病变范围比较（修改）组别动物数（只）合计 Ⅰ Ⅱ Ⅲ Ⅳ 盐水组 2 1 1 0 4 药物组 1 2 1 0 4 对照组 0 1 0 1 2 （二）统计图是用点的位置、线段的升降、直线的长短或面积的大小等形式，形象而直观地表达被研究事物之间的数量关系。绘制统计图时常犯的错误是：用条图表达各种各样的资料，尤其是表达连续性资料；在坐标轴上随意标刻度。 1. 误用实例例1 某研究者将4种处理条件下某定量资料随时间推移的变化数据绘制成条图，见图15-1。（见附页）图15-1 4种不同条件下CFU-GM集落总数随培养时间的变化结果（胡良平，李子建.医统统计学基础与典型错误辨析. 北京：军事医学科学出版社，2003.9. P77）分析：条图适合用来表达彼此之间相互独立项目的数量大小，并不适用于表达某事物或现象随时间推移的变化情况；而培养时间是一个连续性变量，用线图表达最合适，如用条图则割断了时间点之间的联系。例2 某人用狗作为受试对象，研究不同处理条件下血钾浓度随时间推移的变化趋势，使用了普通线图，见图15-2。（见附页）图15-2 注肛组4只狗血钾含量随时间推移的变化趋势（胡良平，李子建.医统统计学基础与典型错误辨析. 北京：军事医学科学出版社，2003.9. P77）分析：选用线图是正确的，但原作者在图坐标刻度的标注上违反了数学原则，即等长的间隔代表的数量却不等。如横坐标上，一会儿代表10min，一会儿代表30min，甚至代表6h；在纵坐标上，一会儿代表3.5，一会儿又代表0.5；这样标注刻度，必然导致图中所反映出来的曲线升降趋势是假像。正确的做法是，将坐标轴上的刻度正确表示出来后再绘图。第三节医学科研统计推断中的错误统计学中也许有成千上万的方法，但没有哪种方法是万能的；每一种方法均有其应用条件，通常依据资料类型、研究设计方案、统计推断的目的等选择相宜的检验方法。对于定量资料，常用的统计推断方法有t检验、u检验、方差分析等；对于定性资料，最常用的方法则是卡方检验；另外，相关与回归以及非参数检验也是较为常用的推断方法。推断中的常见错误是：①应用条件未能满足、或不顾应用条件是否得到满足就随意使用某种检验方法，导致结论可信度低甚至错误；②对P值的理解不透彻，导致结论绝对化、把统计学结论等同于专业结论等。一、t检验 t检验最初由W. S. Gosset在1908年以笔名“Student”发表的一篇关于t分布的论文中提出，常见的t检验有单样本t检验、两独立样本t检验和配对样本t检验等三种类型；t检验有其相应的适用条件，如正态性和方差齐性等，适用于两组以下资料的统计分析等。在实际应用中常见的错误是：应用条件不足、设计类型不符、强用t检验分析一切定量资料等。（一）单样本t检验单样本均数检验是一种关于总体均数的假设检验问题；这种问题中只有一个随机抽样的样本，研究目的是推断这个样本所代表的总体均数是否等于（或大于，或小于）某个已知的总体均数。本方法的应用条件一般要求样本来自正态分布的总体，特别是样本量较小时；但该法是一个非常稳健的统计方法，只要没有明显的极端值，其分析结果都是比较稳定的。单样本t检验在实际应用中即使存在应用条件不适当的情况，对检验结果的可靠性通常也不会有较大的影响。（二）两独立样本t检验该方法常用于解决两个总体均数的比较问题，应用时应满足三个条件：正态性，即各样本均来自正态分布的总体；方差齐性，即各样本所在总体的方差相等；独立性，即各观测值之间是相互独立的，不能互相影响。如果数据不能满足正态性和方差齐性的要求，则应考虑通过适当的数据转换使之满足条件后再进行检验；若转换仍无法满足检验的前提条件，则可考虑采用近似t检验或非参数检验的方法进行分析。该检验方法在实际应用中存在较为严重的错用和误用现象，主要是应用条件不能满足、设计类型不符的情况下强行使用等等。 1. 误用实例为探讨开胃理脾口服液对脾虚小鼠肠功能的影响，某研究者取70只小白鼠，随机分成7组，每组10只；第1组为空白组，给等容生理盐水，其余各组给100％大黄水煎液1周（静脉注射，1次/天），造成脾虚模型。停食24小时后，第1、2组静脉注射含10％炭末的冷开水，第3～5组给含10％炭末的开胃理脾口服液，第6组给含10％炭末的开胃理脾丸剂，第7组给含10％炭末的儿康宁。给药30分钟后处死小鼠，打开腹腔，剪取小肠，分别测量小肠总长度和炭末在肠内推进的距离，以推进距离除以小肠总长度计算炭末推进百分率。具体数据见表15-10。原作者用两独立样本t检验处理，结果显示：模型组与空白组比较，差异有非常显著意义，开胃理脾口服液低、中、高剂量与模型组比较，差异有有非常显著意义；提示本品具有促进小鼠小肠运动功能的作用，其作用强度较丸剂好。表15-10 各组对小肠运动的影响组别剂量（g/kg）推进率（％）空白组 0 86.185.18 模型组 0 75.835.56** 口服液低剂量组 2.34 91.225.32▲ 口服液中剂量组 7.02 94.206.39▲△ 口服液高剂量组 21.06 95.003.87▲△ 丸剂组 2.34 80.2012.22 儿康宁组 2.34 92.209.03▲▲ 注：与模型组比较▲▲P < 0.05，▲P < 0.01；与空白组比较* P < 0.05，** P < 0.01；与丸剂组比较△P < 0.05 分析：不知您看完上述设计和统计处理，有何想法？我的感觉是杂乱无章！首先是设计乱：作者想通过本次研究，探析多个因素对小鼠肠功能的影响，如是否为脾虚、开胃理脾口服液的剂量、药物剂型、是否服药等；但资料的整理表却显示作者把资料视为单因素7个水平设计的方差分析；这是错误之一。另外，作者反复采用两独立样本t检验进行处理，殊不知这样做会大大增加犯假阳性错误的概率。对于这样的资料应该如何处理呢？实际上我们可对其进行有效的拆分，本例可拆分为如下5种组合： ①空白组与模型组：成组设计，单因素2个水平，用t检验进行分析，可考察造模是否对小肠功能产生影响。 ②模型组、低剂量组、中剂量组、高剂量组：单因素4个水平，采用方差分析，可考察开胃理脾口服液的剂量对小肠功能的影响是否不同。 ③模型组、低剂量组、丸剂组、儿康宁组：单因素4个水平，采用方差分析，可考察不同药物对小肠功能的影响是否不同。 ④模型组、中剂量组、丸剂组、儿康宁组：分析方法同③。 ⑤模型组、高剂量组、丸剂组、儿康宁组：分析方法同③。注意：上述组合给定的分析方法，须满足相应的条件，如正态性与方差齐性；如果不能满足，则考虑运用非参数检验，如秩和检验进行分析。对于后4种组合，若差别经检验有统计学意义，尚须进一步采用Dunnett′s t检验分析其余各组与模型组之间的差别是否有统计学意义。（三）配对样本t检验在许多科学研究中，常采用配对设计来提高组间的可比性，进而提高研究效率。在配对设计得到的样本数据中，每对数据之间都有一定的相关性，如果忽略了这种关系，就会浪费大量的统计信息，甚至得出错误的结论；因此必须采用相对应的配对设计分析方法进行统计学处理。常见错误是：以两独立样本t检验分析配对设计的资料、采用多次配对样本t检验分析重复测量的方差分析。 1. 误用实例例1 为了解某降压药的降压效果，某研究者选取10位高血压病人作为研究对象，在治疗前后对每一位研究对象的舒张压进行测量，结果见表15-11。对这个资料如果采用成组t检验进行分析，资料的正态性和方差齐性（F=0.537，P=0.473）均能得到满足，t=-1.602，P=0.127；结果无统计学意义。表15-11 某降压药治疗前后舒张压的改变情况（mmHg）编号 1 2 3 4 5 6 7 8 9 10 治疗前 120 127 141 107 110 114 115 138 127 122 治疗后 123 108 120 107 100 98 102 152 104 107 分析：这样分析是否妥当，这个结果是否正确呢？其实，不难发现这是一个典型的配对设计，用成组t检验进行分析是不妥当的，因为①设计类型不符，②独立性得不到满足；采取错误的检验方法得到的统计学结论也未必正确。配对资料是不能拆散的，配比资料不是比较治疗前后两组的均数是否有差别，而是检验每一对子治疗前后差值的均数是否为零。现采用正确的做法，即配对t检验进行分析：对子间舒张压的差值经K-S检验，满足正态性（Z=0.632，P=0.819），t=2.645，P=0.0

展开阅读全文

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

关于本文

本文标题：医学科研中常见统计学错误(朱继民).doc
链接地址：https://www.zixin.com.cn/doc/5693375.html

xrp****65

内容提供者实名认证

平台协调中心【客服】

相似文档自信AI助手

组织生活会政治信仰问题清单范文(4篇).pdf
谈话情况及谈话人意见【3篇】.pdf
国际儿童身高体重标准表及相关知识.doc
SGS燃烧标准.pdf
纪检监察教育整顿以来的收获范文(6篇).pdf
腿部按摩缓解疲劳无视禁忌会适得其反.doc
道法教学反思范文三篇.pdf

搜索标签自信AI导航

医学科研常见 统计学 错误 朱继民