基于既有医疗数据构建研究型数据库的方法学探讨及实例解读%28一%29:变量清单和数据库架构的确定.pdf
《基于既有医疗数据构建研究型数据库的方法学探讨及实例解读%28一%29:变量清单和数据库架构的确定.pdf》由会员分享,可在线阅读,更多相关《基于既有医疗数据构建研究型数据库的方法学探讨及实例解读%28一%29:变量清单和数据库架构的确定.pdf(6页珍藏版)》请在咨信网上搜索。
1、Aug.2023 Vol.30 No.8 Chinese Journal of Information on TCM基于既有医疗数据构建研究型数据库的方法学探讨及实例解读(一):变量清单和数据库架构的确定赵国桢1,2,3,闫世艳 3,郭玉红 1,宋爽 4,胡雅慧 4,郭诗琪 3,徐霄龙 1,叶浩然 1,朱泠霏 1,杜元 1,任志颖 3,卢海天 1,胡晶1,2,李博1,2,刘清泉1,21.首都医科大学附属北京中医医院,北京市中医药研究所,北京 100010;2.北京中医药循证医学中心,北京 100010;3.北京中医药大学,北京 100029;4.天津中医药大学,天津 301617摘要:基于既有
2、医疗数据所形成的真实世界证据对医疗卫生决策产生重要影响。真实世界数据向真实世界证据转化过程中的关键点之一在于研究型数据库的建立。由于真实世界数据库的来源、结构不同及真实世界数据的复杂性、多样化等问题,研究型数据库建设在具体实施过程中仍面临各种挑战。建立研究型数据库需先确定变量清单及数据库架构,包括确定变量清单、评估既有数据、明确数据集结构及制定变量字典4个步骤。首先确定变量清单,其重点在于准确提出临床问题并对临床问题进行解构,再根据解构结果确定研究所需的关键变量;其次评估既有数据,应重点关注既有数据的可靠性,以及关键变量的数据来源;接着选择恰当的数据集结构存储数据,通常使用横断面数据结构或纵向
3、数据结构;最后,将数据库中每个变量的信息记录在变量字典中,以实现对众多变量的管理。以“中西医结合治疗新型冠状病毒感染研究型数据库”为例,对研究中变量清单及数据库架构的确定方法进行介绍,以供相关研究人员参考。关键词:真实世界;研究型数据库;变量清单;新型冠状病毒感染;既有医疗数据中图分类号:R2-03 文献标识码:A 文章编号:1005-5304(2023)08-0008-06DOI:10.19879/ki.1005-5304.202210064开放科学(资源服务)标识码(OSID):Methodological Discussion and Case Interpretation of Con
4、structing Research Database Based on Existing Medical Data(I):Determination of Variable List and Database StructureZHAO Guozhen1,2,3,YAN Shiyan3,GUO Yuhong1,SONG Shuang4,HU Yahui4,GUO Shiqi3,XU Xiaolong1,YE Haoran1,ZHU Lingfei1,DU Yuan1,REN Zhiying3,LU Haitian1,HU Jing1,2,LI Bo1,2,LIU Qingquan1,21.B
5、eijing Hospital of Traditional Chinese Medicine,Capital Medical University,Beijing Institute of Chinese Medicine,Beijing 100010,China;2.Beijing Evidence-based Chinese Medicine Center,Beijing 100010,China;3.Beijing University of Chinese Medicine,Beijing 100029,China;4.Tianjin University of Traditiona
6、l Chinese Medicine,Tianjin 301617,ChinaAbstract:Real-world evidence based on existing medical data has an important impact on medical and health decision-making.One of the key points in the process of converting real-world data into real-world evidence is the establishment of research-based database
7、s.Due to the different sources and structures of real-world databases,as well as the complexity and diversity of real-world data,the construction of research-based databases still faces various challenges in the specific implementation process.To establish a research database,it is necessary to dete
8、rmine the variable list and database structure,including four steps:determining the list of variables,evaluating the existing data,基金项目:国家自然科学基金(81774146);国家中医药多学科交叉创新团队项目(ZYYCXTD-D-202201);国家重点研发计划(2020YFC0861000)通讯作者:刘清泉,E-mail:;李博,E-mail:专题论坛8中国中医药信息杂志2023 年 8 月第 30 卷第 8 期clarifying the structure
9、 of the data set,and formulating a variable dictionary.Firstly,determination of the list of variables focuses on accurately raising the clinical questions and deconstructing the clinical questions,and then the key variables required for the study were determined according to the deconstruction resul
10、ts.Secondly,evaluating the existing data should focus on the reliability of the existing data and the data sources of key variables,choosing the appropriate dataset structure to store the data,usually using a cross-sectional data structure or a longitudinal data structure.Finally,the information of
11、each variable should be recorded in the database in the variable dictionary to realize the management of many variables.This article took the“Integrated Traditional Chinese and Western Medicine Treatment of COVID-19 Research Database”as an example to introduce the determination method of variable li
12、st and database structure in this study for the reference of relevant researchers.Keywords:real-world;research database;list of variables;COVID-2019;existing medical data既有医疗数据是真实世界数据(real-world data,RWD)的重要组成部分,而基于RWD开展的真实世界研究(real-world study,RWS)所产生的真实世界证据(real-world evidence,RWE),对医疗卫生决策产生重要影响1。
13、与西药新药开发模式不同,中药新药在开发前往往已经具有大量临床人用经验,积累了较丰富的医疗数据,为RWE的产生提供了有力保障2。国家药品监督管理局发布的真实世界证据支持药物研发与审评的指导原则(试行)指出,RWE可以支持药物监管决策,包括为新药注册上市提供有效性和安全性证据、为已上市药物的说明书变更提供证据、为人用经验总结和临床研发提供证据支持等3。此外,国务院办公厅发布的关于加快中医药特色发展的若干政策措施,要求充分利用数据科学等现代技术手段,建立中医药理论、人用经验、临床试验“三结合”的中药注册审评证据体系,积极探索建立中药真实世界研究证据体系4。目前,国内已发表多篇相关技术规范,指导从既有
14、医疗数据到RWE,其关键点之一在于研究型数据库的建设5-6。然而,因RWD来源广、容量大、中医药数据复杂等特点,数据库建设的具体实施过程仍面临挑战。本文以“中西医结合治疗新型冠状病毒感染研究型数据库”为例,对基于既有医疗数据构建研究型数据库中变量清单及数据库架构的确定方法进行介绍。本研究已获得首都医科大学附属北京中医医院医学伦理委员会批准(2022-BL02-033-01),并且在中国临床研究注册中心注册(ChiCTR2200062917)7。1相关概念和总体设计相关概念和总体设计既有医疗数据属于回顾性资料,其特点是未针对特定的研究目的而收集8。因此,从既有医疗数据,到可直接用于统计分析的分析
15、数据库,仍需要一定的数据处理过程。不同的RWS对数据的处理方法存在一定差异,但其中共有的且必要的一步是建立研究型数据库。研究型数据库可基于既有医疗数据形成,但又不同于既有医疗数据,两者的主要区别见表1。本课题中研究型数据库的构建可分为2个阶段:确定变量清单及数据库架构;数据治理。本文重点对变量清单及数据库架构的确定方法进行论述及实例解读。2确定变量清单确定变量清单2.1明确临床问题及研究目的研究目的来源于临床问题。明确研究目的,是开展各类型研究的首要步骤。本研究主要待解决的临床问题有 2 个:中医药治疗新型冠状病毒感染(Coronavirus Disease 2019,COVID-19)的有效
16、性和安全性如何?哪些具体的中医治疗措施可以有效且安全地用于COVID-19的治疗?基于以上 2 个临床问题,确定研究目的如下:对中医药治疗COVID-19的总体疗效及安全性进行评价;对清肺排毒汤、化湿败毒方、连花清瘟胶囊等中医治疗COVID-19具体措施的疗效及安全性进行评价。2.2临床问题解构为更好地确定研究所需变量,需基于研究目的,按照循证医学的“PICO原则”对临床问题进行解构。临床问题解构是确定变量清单的核心步骤。本研究以对中医药总体的疗效评价为例,对临床问题解构示例见表2。表1研究型数据库与既有医疗数据的主要区别特点研究目的研究对象变量特点数据标准化异常数据清理数据安全性既有医疗数据
17、无特定研究目的未指定研究对象/疾病变量多,可存在重复变量数据大多未标准化数据未清理数据未脱敏处理研究型数据库具有一定的研究目的基本明确研究对象/疾病根据研究需要确定变量,无重复变量数据记录格式和编码标准统一完成对逻辑错误数据、极端值等异常数据的清理完成数据脱敏处理9Aug.2023 Vol.30 No.8 Chinese Journal of Information on TCM2.3变量分类及确定完成研究所需要的变量,称为关键变量5。根据临床问题解构结果,可确定本研究的关键变量。关键变量主要分为四类:与研究对象(纳排标准)相关的变量;与研究治疗措施/暴露因素相关的变量;与结局指标相关的变量;
18、与混杂因素9相关的变量。不同类别的变量需存储在不同的数据集或数据模块中,各数据集或数据模块需通过链接变量6相连。关键变量需要根据循证医学证据、专家临床经验和既有数据情况共同确定。以上述临床问题解构中的“西医常规治疗”为例。为存储患者住院期间接受西医治疗情况的相关数据,设立西医治疗数据集,该数据集中的变量在本研究中属于与混杂因素相关的变量。根据COVID-19指南及诊疗方案推荐10,西医治疗包括:阿比多尔、-干扰素、利巴韦林等抗病毒治疗;人免疫球蛋白、康复者恢复期血浆等免疫治疗;糖皮质激素治疗;呼吸支持及其他治疗。根据专家讨论,补充奥司他韦、洛匹那韦利托那韦2种抗病毒药物;根据既有数据情况,去除
19、恢复期血浆治疗。确定本研究所需的西医治疗措施后,将各项措施的天数及有无作为变量,列入西医治疗变量集的变量清单。同时,该变量集还包含链接变量及其他相关变量。2.4衍生变量计算研究所需要的部分变量,不能从既有数据中直接提取,而是需要通过数据转换计算而得,这类变量称为衍生变量11。衍生变量的计算需要基于一定规则。例如在上述西医治疗数据集中,课题组仅可从既有数据中提取各患者各药物的使用天数,但是否可以认为该患者使用了该药物,则需要基于天数来计算。若阿比多尔使用天数3 d,可认为患者使用了该药物,以“1”表示,否则以“0”表示。其中,“阿比多尔使用天数”就是原变量,而“是否使用阿比多尔”则是衍生变量。3
20、评估既有数据评估既有数据在使用既有医疗数据前,需先评估既有数据能否为待建数据库提供可靠的数据,包括数据的准确性、完整性、数据覆盖日期跨度、研究人群代表性、样本量等。若存在数据质量问题,最好是对数据进行溯源。在评估期间,还需了解既有数据的数据库结构及变量清单,并与待建数据库所需的变量清单比对,重点关注以下问题:既有数据能否为待建数据库各变量提供可靠数据支持;待建数据库的变量在既有数据中的来源是否单一;若数据多源,还需对比不同来源数据的质量,建立重复/矛盾数据优先级。以本研究中基本信息数据集的“入院日期”变量为例。在评估既有数据中与入院日期有关的变量时,发现共有4个数据来源:入院记录、出院记录、死
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 既有 医疗 数据 构建 研究 数据库 方法 探讨 实例 解读 28 29 变量 清单 架构 的确
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
链接地址:https://www.zixin.com.cn/doc/2294635.html