《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》-PPT文档.pptx
《《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》-PPT文档.pptx》由会员分享,可在线阅读,更多相关《《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》-PPT文档.pptx(56页珍藏版)》请在咨信网上搜索。
1、汇报提纲汇报提纲一、目标与任务一、目标与任务二、课题主要技术路线二、课题主要技术路线三、课题任务的支撑条件三、课题任务的支撑条件四、课题年度计划四、课题年度计划五、课题组织实施五、课题组织实施六、课题预算六、课题预算一、一、目标与任务目标与任务提高两类重大疾病的提高两类重大疾病的临床服务临床服务能力和水平能力和水平促进中医药促进中医药源于临床源于临床、回归临床回归临床的的循证医学研究循证医学研究提高中医药在人类健康保障的贡献度提高中医药在人类健康保障的贡献度心心血血管管及及肿肿瘤瘤疾疾病病是是危危害害人人类类健健康康的的主主要要疾疾病病,中中国国拥拥有有这这两两类类疾疾病病大大量量的的临临床床
2、数数据据。利利用用大大数数据据处处理理、存存储储和和分分析析技技术术,探探索索符符合合中中国国实实际际的的临临床床诊诊疗疗模模式式与与规规律律,对两类重大疾病的防治有重大意义。对两类重大疾病的防治有重大意义。在我国,在我国,中医药中医药是贯穿心血管与肿瘤疾病诊治全过程是贯穿心血管与肿瘤疾病诊治全过程的的重要组成部分重要组成部分,对这两类疾病的诊治研究如果缺少了中,对这两类疾病的诊治研究如果缺少了中医药数据将是医药数据将是不完整的不完整的。课题课题意义意义中医药是治疗两类重大疾病重要组成部分中医药是治疗两类重大疾病重要组成部分课题课题意义意义l中医药参与度高,普遍为国民接受中医药参与度高,普遍为
3、国民接受l强调个性化的辨证论治,难以获得可重复的疗效强调个性化的辨证论治,难以获得可重复的疗效评价规律评价规律l病历数据标准化与结构化程度较低病历数据标准化与结构化程度较低分析和研究分析和研究中西医中西医临床大数据的必要性临床大数据的必要性20142014年年3 3月上海市级医院心血管和肿瘤疾病的诊疗情况月上海市级医院心血管和肿瘤疾病的诊疗情况课题课题意义意义基于基于区域区域大数据分析和研究的必要性大数据分析和研究的必要性l现行就医模式下,两类疾病患者的就医随机分散在各大医院现行就医模式下,两类疾病患者的就医随机分散在各大医院l任何一家医院的信息都是局部或不完整的任何一家医院的信息都是局部或不
4、完整的l只有区域性的数据中心才能提供完整的诊疗数据只有区域性的数据中心才能提供完整的诊疗数据完成上海市心血管和肿瘤疾病的发病及治疗总体情况研究完成上海市心血管和肿瘤疾病的发病及治疗总体情况研究完成中医药在心血管和肿瘤疾病治疗方面的疗效评价研究完成中医药在心血管和肿瘤疾病治疗方面的疗效评价研究建立心血管疾病和肿瘤疾病的中西医临床知识库及应用建立心血管疾病和肿瘤疾病的中西医临床知识库及应用研发上海市心血管疾病和肿瘤疾病中西医临床在线辅助决策研发上海市心血管疾病和肿瘤疾病中西医临床在线辅助决策支持系统支持系统课题课题目标目标心血管疾病心血管疾病肿瘤疾病肿瘤疾病建立上海中医建立上海中医临床数据中心临床
5、数据中心临床大数据关临床大数据关键技术研究键技术研究搭建临床大数搭建临床大数据平台据平台研发上海市心血管及肿瘤疾病中西医临床在线研发上海市心血管及肿瘤疾病中西医临床在线辅助决策支持系统辅助决策支持系统大数据分析与大数据分析与应用研究应用研究心力衰竭心力衰竭大肠癌大肠癌课题任务课题任务中西医知识库中西医知识库及应用研究及应用研究课题的关联性分析课题的关联性分析 二、课题主要技术路线二、课题主要技术路线 l建立包含医联中心和四家中医院数据的中医临床数据中心。建立包含医联中心和四家中医院数据的中医临床数据中心。l利用大数据关键技术搭建大数据平台,为大数据分析与应用和利用大数据关键技术搭建大数据平台,
6、为大数据分析与应用和知识库构建提供数据支撑。知识库构建提供数据支撑。l通过结构化知识库的构建,向医疗专业用户提供有价值的反馈通过结构化知识库的构建,向医疗专业用户提供有价值的反馈。总体框架图总体框架图疗效评价的复杂性问题疗效评价的复杂性问题中医药疗效的贡献问题中医药疗效的贡献问题诊疗方案的可推广诊疗方案的可推广性问题性问题管理决策缺乏数据支持管理决策缺乏数据支持全国临床大数据不多全国临床大数据不多上海已经形成了区域临上海已经形成了区域临床大数据,但是缺乏床大数据,但是缺乏病病历文本数据历文本数据清洗清洗病历数据结构化病历数据结构化程度低程度低大数据平台大数据平台大数据挖掘算法并行化大数据挖掘算
7、法并行化语义化知识库语义化知识库政府政府数据数据整合整合数据数据分析分析数据数据处理处理临床临床决策决策临床临床研究研究技术方面应用方面项目难点项目难点临床大数据挖掘技术研究及算法并行化改造技术临床大数据挖掘技术研究及算法并行化改造技术 面向临床大数据,利用并行化改造后的分类、聚类、回归、关联等面向临床大数据,利用并行化改造后的分类、聚类、回归、关联等数据挖掘技术,将支持向量机模型、向量空间模型、数据挖掘技术,将支持向量机模型、向量空间模型、LogisticLogistic回归模型回归模型以及以及CoxCox比例风险等用于进行两类疾病的病例分类、疾病相似度匹配、疾比例风险等用于进行两类疾病的病
8、例分类、疾病相似度匹配、疾病诊疗方案聚类、疾病转归影响因素分析。病诊疗方案聚类、疾病转归影响因素分析。面向中医诊疗效果评价的Cox比例风险模型面向疾病转归分析的多元Logistic回归方程模型基于粗糙集的疾病特征相似度匹配临床数据挖掘算法基于遗传算法的生命周期症状监测模型基于聚类分析的慢性病种诊疗方案慢性病跟踪预测模型常用的数据挖掘算法分类分析 聚类分析关键词搜索序列分析关联分析 预测分析偏差分析 遗传算法粗糙集方法1 1、临床大数据关键技术研究、临床大数据关键技术研究临床大数据临床大数据面向诊疗效果面向诊疗效果因果关系因果关系评价的评价的生存分析生存分析常用的生存分析方法生存率分布K-M估计
9、方法生存表分析对数秩检验经验似然推断Buckley-James估计比例风险回归分析可加风险回归分析倾向性得分匹配因果推断K-M估计生存率分布对数秩检验对比研究风险回归模型影响因素研究 利用临床观测大数据,基于利用临床观测大数据,基于RCMRCM(罗宾因果模型),采用多元(罗宾因果模型),采用多元LogisticLogistic回归,构建影响因素的倾向性得分,以回归,构建影响因素的倾向性得分,以“控制控制”混杂变量,达混杂变量,达到满足非混杂假定,进行因果性推断;在此基础上,到满足非混杂假定,进行因果性推断;在此基础上,将生存分析统计方将生存分析统计方法应用于大数据临床数据,对比研究中、西医不同
10、诊疗手段的诊疗效果;法应用于大数据临床数据,对比研究中、西医不同诊疗手段的诊疗效果;进而发展新的适用于大数据分析的新的统计方法。进而发展新的适用于大数据分析的新的统计方法。临床大数据挖掘技术研究及算法并行化改造技术临床大数据挖掘技术研究及算法并行化改造技术 词汇二义性词汇二义性临床文本分析技术临床文本分析技术 病历结构化的必要性病历结构化的必要性传统非结构化病历数据,只能通过文本匹配来进行查询无法理解相同文字但不同含义的词汇 关联查询关联查询无法精确切分查询词,理解查询意图 临床文本分析技术临床文本分析技术 基于实体链接算法的实体抽取基于实体链接算法的实体抽取临床文本分析技术临床文本分析技术
11、基于病历文本的病情正负面分析基于病历文本的病情正负面分析临床文本分析技术临床文本分析技术 病历结构化表示示意图病历结构化表示示意图【主诉主诉】两周内便血两周内便血2 2次次【现病史现病史】患者患者2 2周前无明显诱因下出现大便带鲜红色液体周前无明显诱因下出现大便带鲜红色液体2 2次,无肛门口异物感,肛门口无突出物,次,无肛门口异物感,肛门口无突出物,大便色黄,无粘胨脓液,无恶心呕吐,无胃寒发热,无尿频尿急尿痛血尿,无腹痛腹泻里急后重,至我大便色黄,无粘胨脓液,无恶心呕吐,无胃寒发热,无尿频尿急尿痛血尿,无腹痛腹泻里急后重,至我院门诊查肠镜示院门诊查肠镜示“距肛距肛9-12cm9-12cm见一浸
12、润性肿块,累及近见一浸润性肿块,累及近2/32/3肠腔肠腔-直肠癌直肠癌”,今为进一步诊治,门诊拟,今为进一步诊治,门诊拟“直肠癌直肠癌”收入我科收入我科”3.3.矛以西力欣、圣诺安抗感染、巴曲亭、捷凝止血,耐信制酸,潘金南、卫美佳、培尔吉、乐凡命、血矛以西力欣、圣诺安抗感染、巴曲亭、捷凝止血,耐信制酸,潘金南、卫美佳、培尔吉、乐凡命、血必净、天晴宁、力能、氯化钾等营养支持,环磷酰苷营养细胞,开顺化痰,贝科能保肝,甲硫氨酸维必净、天晴宁、力能、氯化钾等营养支持,环磷酰苷营养细胞,开顺化痰,贝科能保肝,甲硫氨酸维B1B1保肝治疗,托烷司琼止吐治疗,丙帕他莫止痛。保肝治疗,托烷司琼止吐治疗,丙帕他
13、莫止痛。临床文本分析技术临床文本分析技术 基于时间线索的临床路径分析基于时间线索的临床路径分析研究临床大数据整合、存储、处理与挖掘技术,搭建临床大数据平台研究临床大数据整合、存储、处理与挖掘技术,搭建临床大数据平台2 2、搭建临床大数据平台、搭建临床大数据平台利用利用Apache SqoopApache Sqoop实现医联中心关系型数据库和临床大数据平台之间的实现医联中心关系型数据库和临床大数据平台之间的数据整合数据整合利用列式存储技术实现数据格式的灵活扩充与调整,探索利用列式存储技术实现数据格式的灵活扩充与调整,探索分布式数据管理平台分布式数据管理平台的性的性能优化能优化构建构建基于内存的临
14、床大数据高速计算与分析引擎基于内存的临床大数据高速计算与分析引擎,实现数据查询和算法性能等方面,实现数据查询和算法性能等方面优化优化在分布式引擎上,实现临床数据挖掘算法在分布式引擎上,实现临床数据挖掘算法 3 3、建立上海市中医临床数据中心、建立上海市中医临床数据中心在在医医联联中中心心数数据据基基础础上上,补补充充采采集集4 4家家三三级级中中医医医医院院中中医医诊诊疗疗信信息息,建建立立上上海海市市中中医医临临床床数数据据中中心心20132013年年全全市市4 4家家三三级级中中医医医医院院共共诊治诊治:门诊病人门诊病人903903万万人次人次住院病人住院病人1313万万人次人次建设整合中
15、西医诊疗过程的建设整合中西医诊疗过程的临床数据中心:临床数据中心:-实现上海市中、西医数据中心的整合实现上海市中、西医数据中心的整合中心端中心端原原始始数数据据整整合合处处理理上传库数数据据传传输输交交换换处处理理暂存库整整合合入入库库处处理理诊疗业务库整合库原始数据抽取采集内部业务库医医院院前前置置端端医医院院内内部部备份库备份库分析库数据质量库诊疗映像库外网业务库临床数据中心数据处理流程临床数据中心数据处理流程3 3、建立上海市中医临床数据中心、建立上海市中医临床数据中心数据抽取采集数据抽取采集:将接口要求的业务数据从医院数据库迁移到前置机的整合库中将接口要求的业务数据从医院数据库迁移到前
16、置机的整合库中,保证保证来自于同一个系统的业务明细子表数据能与业务主表关联。来自于同一个系统的业务明细子表数据能与业务主表关联。数据整合处理数据整合处理:初步整合初步整合“整合库整合库”中的数据,并写入上传库。中的数据,并写入上传库。传输交换处理传输交换处理:将前置端上传库中的数据完整地迁移到中心端暂存库。迁移完成后,将前置端上传库中的数据完整地迁移到中心端暂存库。迁移完成后,交换处理过程将清空前置端上传库中的数据,并将其转移到备份库。交换处理过程将清空前置端上传库中的数据,并将其转移到备份库。整合入库处理整合入库处理:校验并整合中心端暂存库中数据,主要处理内容:将所有数据导入业校验并整合中心
17、端暂存库中数据,主要处理内容:将所有数据导入业务诊疗库,清空中心端暂存库,写入备份库。务诊疗库,清空中心端暂存库,写入备份库。4 4、心血管和肿瘤疾病中西医知识库及应用研究、心血管和肿瘤疾病中西医知识库及应用研究依托国家标准和行业规依托国家标准和行业规范,整合规范教材和经范,整合规范教材和经典案例典案例构建知识库构建知识库通过编辑界面允许通过编辑界面允许专家专家审核修改审核修改或扩充知识库或扩充知识库通过应用接口通过应用接口提供查询、提供查询、检索检索相关知识,辅助决相关知识,辅助决策支持等功能策支持等功能知识库知识库查询应用示意图查询应用示意图语义知识库技术架构语义知识库技术架构基础知识库基
18、础知识库以医联网结构化数据、国家标准为基础,使用以医联网结构化数据、国家标准为基础,使用D2RD2R映射以及文本抽取等方式构建映射以及文本抽取等方式构建中西医基础知识库中西医基础知识库,利用众包编辑扩充知识库。,利用众包编辑扩充知识库。使用图数据库以更好地表达与扩充使用图数据库以更好地表达与扩充概念之间的关联概念之间的关联。利用本体推理引擎自动检测数据之间的利用本体推理引擎自动检测数据之间的不一致性不一致性。经过人工协作编辑、核对、审批,形成检验的经过人工协作编辑、核对、审批,形成检验的知识库。知识库。使用基于自然语言的语义检索,完成问答式查询。使用基于自然语言的语义检索,完成问答式查询。基于
19、临床病例,通过信息抽取和语义标注技术生成基于临床病例,通过信息抽取和语义标注技术生成中西医病例库中西医病例库病例库将包含病例库将包含家族史、病史、入院原因、用药、手术情况家族史、病史、入院原因、用药、手术情况等,并记录病情与手术、等,并记录病情与手术、用药之间的关联。用药之间的关联。支持病例语义查询:如支持病例语义查询:如早期具有某种症状的病人,早期具有某种症状的病人,或是或是与特定病例最相似的病例与特定病例最相似的病例语义知识库技术架构语义知识库技术架构病例库病例库临床语义知识库检索临床语义知识库检索预期结果预期结果临床语义知识库的临床语义知识库的优势:优势:根据自然语言检索词,定位具体的属
20、性和语义上的推理查询,返回精确的查询结果5 5、心血管和肿瘤疾病的大数据分析与应用研究、心血管和肿瘤疾病的大数据分析与应用研究上海市心血管和肿上海市心血管和肿瘤疾病的发病及治瘤疾病的发病及治疗总体情况研究疗总体情况研究体现中医药特色的体现中医药特色的心血管及肿瘤疾病心血管及肿瘤疾病的疗效评价研究的疗效评价研究心力衰竭及大肠癌心力衰竭及大肠癌病种的病例知识库病种的病例知识库建立及应用研究建立及应用研究 对大数据进行分析对大数据进行分析和应用研究,包括和应用研究,包括3 3个方面:个方面:l基于预后评估、治疗与安全性监测等,分析研究符合基于预后评估、治疗与安全性监测等,分析研究符合中国中国实际实际
21、的诊疗方案。的诊疗方案。l基于基于终点事件终点事件,分析研究,分析研究不同诊治方案不同诊治方案及及中医药参与中医药参与的的 疗效评价。疗效评价。l基于流行病学、卫生经济学评估等,为管理决策提供基于流行病学、卫生经济学评估等,为管理决策提供大数大数据证据。据证据。5 5、心血管和肿瘤疾病的大数据分析与应用研究、心血管和肿瘤疾病的大数据分析与应用研究6 6、研发上海市心血管及肿瘤疾病中西医临床在线、研发上海市心血管及肿瘤疾病中西医临床在线辅助决策支持系统辅助决策支持系统通过临床决策支持引擎,通过临床决策支持引擎,帮助医护人员及时做出帮助医护人员及时做出临床决策。临床决策。推荐符合中医辨证论治推荐符
22、合中医辨证论治规律的、遵循现代医学规律的、遵循现代医学诊治规范的诊疗方案。诊治规范的诊疗方案。覆盖覆盖3838家三级医院的家三级医院的1000010000余余台联网医生工台联网医生工作站。作站。研发中西医临床在线辅研发中西医临床在线辅助决策支持系统:助决策支持系统:-以心力衰竭和大肠癌为实例进行验证以心力衰竭和大肠癌为实例进行验证考核考核目标目标建成两类疾病的临床病例库,病例库包含医联以及四家中医院心血管与肿瘤方面的主要病例。建成两类疾病的中医临床知识库,兼容中医95与97两个标准,包含疾病、证候、诊治规则与处方等,数据表示支持OWL/RDF标准。开发5类重大疾病相关模型,包括风险调查与数据评
23、估模型、治疗与用药安全性监测模型、预后评估模型、卫生经济学评估模型、中医“证-治-效”评价模型。建立肿瘤与心血管重大疾病大数据标准与质量体系。12345建立1000万级人群,150TB数据量的中西医临床数据中心。考核考核目标目标建成区域性中西医临床在线辅助决策支持系统。l申请国家发明专利和软件著作权10项。l发表论文30篇,其中SCI收录10篇。l培养2名学术带头人,形成1个临床大数据分析团队,包含博士5名,硕士15名以上。6897建立临床大数据处理平台1)完成医疗大数据处理及隐私保护脱敏共性技术支撑框架的研发;2)实现面向肿瘤及心血管疾病的多来源异构异质数据的接入、集成 整合及分布式存储;3
24、)实现大数据统一元数据管理及基于Hadoop的SQL访问引擎。4)实现面向心血管及肿瘤中西医结合大数据挖掘专业算法构建及核心分析运行系统。10研究特色和创新研究特色和创新首次对两类重大疾病进行首次对两类重大疾病进行10001000万级万级病人临床数据的分析研究病人临床数据的分析研究首创从大数据角度研究中医药的首创从大数据角度研究中医药的“证证治治效效”评价体系评价体系首次建立首次建立区域性区域性的临床在线辅助决策支持系统的临床在线辅助决策支持系统首创首创面向临床面向临床的的中西医中西医大数据平台大数据平台采用基于临床数据的采用基于临床数据的知识库(半)自动生成技术知识库(半)自动生成技术和基于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究 心血管疾病 肿瘤 疾病 中西医 临床 数据 分析 应用 研究 PPT 文档
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。