基于机器学习的SARS-CoV-2传播和临床风险预测方法.pdf
《基于机器学习的SARS-CoV-2传播和临床风险预测方法.pdf》由会员分享,可在线阅读,更多相关《基于机器学习的SARS-CoV-2传播和临床风险预测方法.pdf(12页珍藏版)》请在咨信网上搜索。
1、2023年第49卷第4期无线电通信技术647 doi:10.3969/j.issn.1003-3114.2023.04.008引用格式:冉黎琼,徐康镭,陈金勇,等.基于机器学习的 SARS-CoV-2 传播和临床风险预测方法J.无线电通信技术,2023,49(4):647-658.RAN Liqiong,XU Kanglei,CHEN Jinyong,et al.SARS-CoV-2 Transmission and Clinical Risk Prediction Method Based on Machine LearningJ.Radio Communications Technolog
2、y,2023,49(4):647-658.基于机器学习的 SARS-CoV-2 传播和临床风险预测方法冉黎琼1,徐康镭1,陈金勇2,高 林2,谢添丞1,于 泳1,李江敏1,彭钰寒1,韩 楠3,乔少杰1(1.成都信息工程大学 软件工程学院,四川 成都 610225;2.中国电子科技集团公司第五十四研究所,河北 石家庄 050081;3.成都信息工程大学 管理学院,四川 成都 610225)摘 要:综合征监测作为公共医疗卫生政策的主要检测指标,拥有充足且及时的监测信息至关重要。传统流行病学指标监测的滞后和误导会影响病情严重地区的医疗实施方案。使用谷歌趋势搜索量、谷歌移动、电信运营商、英国国家医疗服
3、务体系(National Health Service,NHS)电话 119 和线上新冠检测请求网站的空间数据,提出一种局部范围内SARS-CoV-2 传播和临床风险的早期指标建模方法。利用浅层学习算法作为基准方法训练局部空间神经网络,提出空间集成长短期记忆(Spatio-Integrated Long Short-Term Memory,SI-LSTM)算法和空间集成卷积神经网络长短期记忆(Spatio-Integrated Convolutional Neural Network Long Short-Term Memory,SI-CNN-LSTM)算法。在规定的评估时间周期内,两种算法均
4、能准确识别出疫情感染高风险区域。此外,在基本公共卫生服务项目中,该模型还原了 2020 年底阿尔法变体、2021 年 4 月德尔塔变体和 2021 年 11 月奥密克戎变体在英国境内的局部增长指数,其空间分散性和增长指数得到了临床数据的证实。关键词:机器学习;COVID-19;LSTM;浅层学习;深度学习中图分类号:TP311 文献标志码:A 开放科学(资源服务)标识码(OSID):文章编号:1003-3114(2023)04-0647-12收稿日期:2023-03-26基金项目:国家自然科学基金(62272066,61962006);四川省科技计划(2021JDJQ0021,2022YFG0
5、186,2022NSFSC0511,2023YFG0027,2022YFG0325,2021YFG0029);教育部人文社会科学研究规划基金(22YJAZH088);宜宾市引进高层次人才项目(2022YG02);成都市“揭榜挂帅”科技项目(2022-JB00-00002-GX,2021-JB00-00025-GX);成都市重大科技创新项目(2021-YF08-00156-GX);中国电子科技集团公司第五十四研究所高校合作课题(SKX212010057);四川省教育厅人文社科重点研究基地四川网络文化研究中心资助科研项目(WLWH22-1);成都信息工程大学科技创新能力提升计划(KYTD20222
6、2);成都海关科研项目(2022CK008)Foundation Item:National Natural Science Foundation of China(62272066,61962006);Sichuan Science and Technology Program(2021JDJQ0021,2022YFG0186,2022NSFSC0511,2023YFG0027,2022YFG0325,2021YFG0029);Planning Foundation for Humanities and Social Sciences of Ministry of Education of
7、China(22YJAZH088);High-level Talent Introduction Project of Yibin(2022YG02);Chengdu“Take the lead”Science and Technology Project(2022-JB00-00002-GX,2021-JB00-00025-GX);Chengdu Major Science and Technology Innovation Project(2021-YF08-00156-GX);The 54th Research Institute of China Electronics Technol
8、ogy Group Corporation-University Cooperation Project(SKX212010057);Web Culture Project Sponsored by the Humanities and Social Science Research Base of the Sichuan Provincial Education Department(WLWH22-1);Science and Technology Innovation Capability Improvement Project of Chengdu University of Infor
9、mation Technology(KYTD202222);Chengdu Customs Scientific Research Project(2022CK008)SARS-CoV-2 Transmission and Clinical Risk Prediction Method Based on Machine LearningRAN Liqiong1,XU Kanglei1,CHEN Jinyong2,GAO Lin2,XIE Tiancheng1,YU Yong1,LI Jiangmin1,PENG Yuhan1,HAN Nan3,QIAO Shaojie1(1.School of
10、 Software Engineering,Chengdu University of Information Technology,Chengdu 610225,China;2.The 54th Research Institute of CETC,Shijiazhuang 050081,China;3.School of Management,Chengdu University of Information Technology,Chengdu 610225,China)648 Radio Communications TechnologyVol.49 No.4 2023Abstract
11、:As the main information indicator of public health policy,syndrome monitoring is crucial to have sufficient and timely monitoring information.The lagging and misleading monitoring of traditional epidemiological indicators can affect medical implementa-tion plan in areas with severe illness.Using sp
12、atial data from the search volume of Google Trends,Google Mobile,telecom operators,the National Health Service(NHS)phone 119,and related travel websites,a method for modeling early indicators of SARS-CoV-2 transmis-sion and clinical risk in a local area is proposed.A shallow learning algorithm is re
13、garded as a benchmark method to train the local spa-tial neural network,and the Spatial Integrated Long Short-Term Memory(SI-LSTM)algorithm and the Spatial Integrated Convolutional Neural Network Long Short-Term Memory(SI-CNN-LSTM)algorithm are proposed.Within the specified evaluation time period,bo
14、th algorithms can accurately identify high-risk areas of the epidemic.Furthermore,in public health operational projects,the model recovers the local growth index of the Alpha variant in late 2020,the Delta variant in April 2021,and the Omicron variant in November 2021 in the United Kingdom,and its s
15、patial dispersion and growth index are verified by clinical data.Keywords:machine learning;COVID-19;LSTM;surface learning;deep learning0 引言新冠肺炎疫情引发了前所未有的全球公共卫生安全问题,对人类生活造成了巨大的冲击和变化。由于通过请求测试策略1会不可避免地产生偏差,对于研究人员分析 SARS-CoV-2 局部爆发的原因可能不太准确。此外,由于感染报告和临床结果之间的日期延迟,导致确诊病例、住院人数和死亡人数等数据滞后2。并且,疫情初期年轻人群作为主要传播人
16、群,感染程度较低和无症状感染较高,所以临床数据的使用率十分有限3。通常感染需要几周或几个月才能渗透到老年人群中,此时医疗卫生指标可以检测到疫情大规模爆发。对于呼吸系统疾病,了解个人的移动方式对于计算传染病的传播率和感染率至关重要。利用电信供应商、网络公司和公共交通组织提供的移动数据来了解人群接触方式和非药物 干 预 措 施(Non-Pharmaceutical Interventions,NPIs),进而采取相应的措施降低传播风险。Jeffrey 等人4使用 Facebook 的移动数据作为英国实际人口流动模式,来监测 2020 年 3 月英国封控状态下人们的遵守情况,这类数据后又被进一步用于
17、动态移动网络建模,实现 SARS-CoV-2 疫情模拟5。然而,移动轨迹的增加与疫情传播速度的加快本质是无关的,仅仅以移动数据作为接触者的有效证据明显不太可信6。在新型 SARS-CoV-2 变体的指数阶段最为明显,使用这些数据的分析都只能将变化作为传播增加或减少的部分因素7。数字搜索可能无法为传染病传统流行病学指标提供综合征监测意见。谷歌趋势及其他平台提供了用于分析热点区域的相对搜索量(Relative Search Volumes,RSVs),对人群发病率进行实时监测。对埃博拉8及其他新出现的病原体进行互联网用户大数据分析,对监测集群和疫情传统监测也有一定的作用。谷歌趋势数据结果证明了监测
18、呼吸道病毒H1N1 和西尼罗病毒(West Nile Virus,WNV)的重要性9。此外,谷歌趋势数据已被用于疫情期间台湾对于 NPIs 的政策实施,例如观察口罩的需求10。Venkatesh 等人11讨论了谷歌趋势作为早期 COV-ID-19 发病率增加的数据来源,其方式与谷歌流感趋势(Google Flu Trends,GFT)大致相同。谷歌流感趋势监测数据显示,随着传染病的发展,辅助数据源、智能设计的算法的不断迭代更新。相比于单独使用谷歌趋势,将谷歌趋势与多个数据源融合后为流感监测系统12使用,其模型性能更高,且应用该模型可以预测 SARS-CoV-2 传播变化。对 SARS-CoV-
19、2 综合征监测,需要监测症状传播率、人口就医情况、人口移动模式和检测方式,从而更全面直观地了解传染病。在疫情传播期间,线上查询防疫13和线上就诊等方式对于人们了解传染病非常重要。但是在小空间单位上,该方法并未作为疫情早期指标的潜力进行探索。本文首先评估了谷歌趋势、谷歌移动、电信运营商、NHS 电话 119 和线上新冠检测请求网站作为疫情建模预测特征的适用性。然后采用多个机器学习模型,对时间滞后特征进行敏感性分析,以评估它们在疫情局部爆发时的预测性能。利用空间数据设计了空间数据神经网络,空间集成长短期记忆(Spa-tial-Integrated Long Short-Term Memory,SI
20、-LSTM)和空间集成卷积神经网络长短期记忆(Spatial Integrat-ed Convolutional Neural Network Long Short-Term Memory,SI-CNN-LSTM)算法。并在 2022 年 12 月15 日英国社区移动数据集上进行了多组实验,评估了所提方法的有效性和优越性。2023年第49卷第4期无线电通信技术649 1 相关分析本文对英国局部地区(Local Authority District,LAD)的 PCR 核酸检测、COVID-19 住院和 COVID-19 死亡的数据进行了分析。初步调查研究了基层医疗、二级医疗和社会服务数据来源的
21、可用性,如医生信息、临床人员的考勤、养老院发病率和学校的发病率等。进一步分析了谷歌趋势中 500 个与新冠相关的网页搜索词、NHS 的 COVID-19 防疫软件中确诊患者的接触场所、谷歌移动和电信运营商中疑似患者的移动轨迹、线上新冠检测请求网站中用户预定情况和预定检测中心地址、NHS 电话 119 中预定新冠检测的呼叫者信息和位置。采用具有负二项式误差分布和动态时间规整(Dynamic Time Warping,DTW)的广义相加模型分析重点指标。如果数据源覆盖范围太广无法及时获取,或者发现数据源滞后于临床目标变量或与临床目标变量同时存在,则需要排除这些数据源。实验结果最终显示,在整个疫情传
22、播期间,最明显的重点指标包含:94 个谷歌趋势网页搜索词条、电信移动、谷歌移动、线上新冠检测请求网站和 NHS 电话 119。谷歌趋势的数据每小时收集一次,得到2 084 个地点的数据,根据谷歌提供的经纬度坐标将其缩放到LAD 地理位置,然后再传送给英国国家统计局(Office of National Statistics,ONS)14。移动数据从谷歌和电信运营商获取,该数据范围重点在 LAD 和人口密集区域,即中层超级输出区域(Middle Layer Super Output Area,MSOA)14。线上新冠检测请求网站数据来自 Test and Trace 软件,通过追踪接触者让人们知
23、道自己是否曾与后面报告为 COVID-19 阳性的人有过密切接触。可以准确地指出哪些人需要隔离,哪些人不需要隔离,相比于传统方法能更快地找到接触者,通知他们立刻进行自我隔离。通过Test and Trace Adobe 平台分析有症状和无症状患者的行程,根据行程是否进行到最后阶段再将数据进一步细分。Adobe 根据请求者的互联网协议对其进行位置定位,并创建查找表来将 Adobe 位置聚合到LAD 级。119 作为 NHS 检测和追踪系统的联系电话15,提供了预订新冠检测、查询检测结果、疫苗接种预约的业务。2 研究方法2.1 数据收集2.1.1 谷歌趋势谷歌趋势的数据提供一段时间内用户相关搜索量
24、和当时用户位置数据,可通过 进行访问。这里将数据按总搜索量进行归一化,并反映了相关搜索词会随着地点变化和疫情传播周期而改变。还分析了国家和城市的数据,城市级的数据主要选用比较有代表性的城市数据。本文收集了英国 4 个城市每小时的 RSVs,得到了 2 084 个地点的数据。对谷歌提供的搜索词和各城市位置的每日相关搜索量进行了初步分析,由于每日相对值报告的零值比例很高,有效率不高。所以需要更加细化,采用每小时收集一次的数据来解决这一问题。收集的数据包括 100 个词条:新冠最常见的症状16、NHS 医疗咨询、新冠检测和新冠常见非处方药。排除了一些在上下文中缺乏整体相关性或在谷歌趋势中有政治倾向的
25、单词和短语。对国家级数据分析采用具有负二项式误差分布和 DTW 的广义相加模型,来评估所选词条的相关性,作为新冠肺炎发病率和临床结果的预测特征。对谷歌数据按日期与 LAD 记录的新冠病例、住院人数和死亡人数进行地理位置匹配。使用谷歌提供的经纬度坐标,将数据映射到ONS 指定的 LAD 地理位置。2.1.2 移动数据移动数据来自谷歌和电信运营商,该数据范围主要在 LAD 和 MSOA。谷歌移动数据衡量了 6 个不同地点类别的访问量和停留时间的变化,类别包括药店和商店、公园、公共交通场所、娱乐场所、住宅和工作场所。电信移动数据包含 MSOA 位置上的人数及其行程次数,通过提取人口统计和人员类别(居
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 SARS CoV 传播 临床 风险 预测 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。