基于联邦学习的多囊卵巢综合征预测平台的构建.pdf
《基于联邦学习的多囊卵巢综合征预测平台的构建.pdf》由会员分享,可在线阅读,更多相关《基于联邦学习的多囊卵巢综合征预测平台的构建.pdf(4页珍藏版)》请在咨信网上搜索。
1、第5 9卷 第3期2 0 2 3年0 6月青 岛 大 学 学 报(医 学 版)J OUR NA LO FQ I N G D AOUN I V E R S I T Y(ME D I C A LS C I E N C E S)V o l.5 9,N o.3J u n e 2 0 2 3 收稿日期2 0 2 2-0 8-2 9;修订日期2 0 2 3-0 5-0 5 基金项目国家自然科学基金青年科学基金项目(8 1 8 0 4 1 3 0),山东省自然科学基金面上项目(Z R 2 0 2 0 MH 3 4 6),山东省研究生教育优质课程项目(S D Y K C 2 0 0 5 2)第一作者孙烨(1
2、9 9 5-),女,硕士研究生。通信作者任健(1 9 7 7-),男,博士,教授,博士生导师。E-m a i l:r j 1 9 7 7y e a h.n e t。基于联邦学习的多囊卵巢综合征预测平台的构建孙烨,任健,田琪,袁梦琪,徐岩(山东中医药大学中医学院,山东 济南 2 5 0 3 5 5)摘要 多囊卵巢综合征是临床常见的内分泌系统疾病,其发病机制至今尚未明确,但已知与遗传、环境等因素相关。本文根据预防为主、防治结合的诊疗思路,采用联邦学习技术融合多种算法构建平台,通过信息数据采集及管理、预测模型建立、实施风险评估和健康指导3个基本环节,在保证女性医疗隐私数据安全的前提下,以期实现对女性
3、健康状态的连续追踪、反馈和疾病的精准预防、高效治疗。关键词 多囊卵巢综合征;联邦学习;预测 中图分类号 R 7 1 1.7 5 文献标志码 A 文章编号 2 0 9 6-5 5 3 2(2 0 2 3)0 3-0 4 5 8-0 4d o i:1 0.1 1 7 1 2/j m s.2 0 9 6-5 5 3 2.2 0 2 3.5 9.0 8 3 开放科学(资源服务)标识码(O S I D)网络出版 h t t p s:/k n s.c n k i.n e t/k c m s 2/d e t a i l/3 7.1 5 1 7.R.2 0 2 3 0 7 2 6.1 0 3 3.0 0 1.
4、h t m l;2 0 2 3-0 7-2 6 1 6:2 9:4 5C O N S T R U C T I O NO FAP R E D I C T I O NP L A T F O RMF O RP O L Y C Y S T I CO V A R YS Y N D R OMEB A S E DO NF E D E R A T E DL E A R N I N GS UNY e,R ENJ i a n,T I AN Q i,Y U AN M e n g q i,XUY a n(C o l l e g eo fT r a d i t i o n a lC h i n e s eM e d i
5、 c i n e,S h a n d o n gU n i v e r s i t yo fC h i n e s eM e d i c i n e,J i n a n2 5 0 3 5 5,C h i n a)A B S T R A C T P o l y c y s t i co v a r ys y n d r o m e i s ac o mm o ne n d o c r i n e s y s t e md i s e a s e i nc l i n i c.I t sp a t h o g e n e s i sh a sn o t b e e nc l a r i-f i e
6、 dy e t,b u t i t i sk n o w n t ob e r e l a t e d t og e n e t i c a n de n v i r o n m e n t a l f a c t o r s.B a s e do n t h ed i a g n o s i s a n d t r e a t m e n t i d e ao f p r e v e n t i o nf i r s t a n dp r e v e n t i o na n dt r e a t m e n t c o m b i n a t i o n,t h i sp a p e r
7、i n t e g r a t e sv a r i o u s a l g o r i t h m su s i n g t h e f e d e r a t e d l e a r n i n g t e c h n o l o g y t ob u i l dap l a t f o r m.T h r o u g ht h r e eb a s i c l i n k so f i n f o r m a t i o nd a t ac o l l e c t i o na n dm a n a g e m e n t,p r e d i c t i o nm o d e le s
8、t a b l i s h m e n t,a n di m p l e m e n t a t i o no f r i s ka s s e s s m e n t a n dh e a l t hg u i d a n c e,c o n t i n u o u s t r a c k i n ga n d f e e d b a c ko f f e m a l eh e a l t hs t a t u s a n da c c u r a t ep r e-v e n t i o na n de f f i c i e n t t r e a t m e n to f d i s
9、e a s e s a r ee x p e c t e d t ob ea c h i e v e du n d e r t h ep r e m i s eo f e n s u r i n g t h e s e c u r i t yo f f e m a l em e d i c a lp r i v a c yd a t a.K E Y WO R D S p o l y c y s t i co v a r ys y n d r o m e;f e d e r a t e d l e a r n i n g;f o r e c a s t i n g 多囊卵巢综合征(P C O S
10、)是一种育龄期女性高发的代谢紊乱性内分泌疾病,发病率高达5.6 1%1,受遗传、环境、生活方式和心理情志等多种因素影响2。临床上主要表现为多毛及痤疮、月经稀发等3,还可引起高血压、2型糖尿病等并发症以及焦虑、抑郁等精神性疾病4。有研究发现,P C O S是一种病因多样、表现极不均一的临床综合征,具有高度异质性与持续进展性5,且不可治愈,严重危害女性的身心健康和生活质量。2 0 1 5年美国雄激素学会(A E S)和P C O S学会联合发布的P C O S诊疗操作指南指出,对于月经初潮后23年内的疑似P C O S病人应该进行定期随访6-7。有研究结果显示,青春期卵巢功能紊乱是基于月经稀发和(
11、或)不排卵,初潮后23年的持续月经稀发可以用于预测青春期P C O S8。因此,针对P C O S危险人群的发病危险因素及时采取相应的预防和治疗措施,能够有效预防P C O S的发生。故亟需建立P C O S预测平台,以实现P C O S的精准防控。本文研究采用联邦学习(F L)技术,构建P C O S预测平台。1 P C O S危险因素研究疾病危险因素是流行病学层面的病因,是指与疾病的发生发展存在因果关系,但无确实证据证明其致病效应的因子9。P C O S发病受危险因素的影响,危险因素能增加女性成为P C O S危险人群或P C O S病人的概率,且在一定程度上加大了P C O S的治疗难度
12、。P C O S危险因素可以归纳为人口学特征、相关症状、疾病史、生活方式、心理状态5个方面。人口学特征方面,研究发现肥胖与P C O S的发病具有相关性,体质量指数(BM I)偏高的女性患病率明显升高1 0。此外,初潮年龄、月经情况等与P C O S发病相关,月经初潮时间提前或延迟可能是P C O S的发病危险因素1 1;月经周期紊乱也与P C O S的发生密切相关1 2。疾病史方面,P C O S与遗传基因存在关系,表现为发病具有家族聚集现象,家族中有患糖尿病、高血压者,同性亲属不孕的女性P C O S发病率明显增加1 3。生活方式方面,晚睡或睡眠不规律对P C O S的发生也存在一定影响。
13、研究发现,睡眠障碍导致的交感神经活动水平提高和胰岛素敏感性降低均可影响P C O S的发生1 4-1 5。此外,饮食习惯、运动情况、是否吸烟、饮酒等也可能与P C O S的发病存在关联,但是否为P C O S危险因素仍需进一步研究分析。心理状态方面,长期的焦虑、抑郁等不良情绪也可能是诱发或加重P C O S的因素1 6。3期孙烨,等.基于联邦学习的多囊卵巢综合征预测平台的构建4 5 92 隐私保护问题与F L的提出由于互联网、物联网等移动信息技术的迅猛发展,利用医疗健康数据进行疾病预测成为可能,但医疗健康数据敏感程度较强,隐私安全性要求较高。欧盟于2 0 1 7年出台了 通用数据保护条例(G
14、D P R)1 7用于保护数据隐私。但2 0 1 8年腾讯智慧安全情报中心发布的报告显示,我国有7成以上的三级甲等医院所接入的第三方医疗服务平台存在隐私泄露问题1 8。出于医疗数据隐私泄露的担忧和相关数据保护法规的限制,现有医疗数据通常以“孤岛”的形式存储于不同医疗机构及设备无法共享,形成了数据壁垒。如何让数据量有限的医疗机构在数据资源安全共享的同时实现疾病的预测,F L的出现和发展解决了这一难题1 9。作为一种分布式机器学习方法和人工智能技术,F L由G o o g l e在2 0 1 6年最先提出,应用于G b o a r d输入法系统,实现候选词的预测2 0。与传统的集中式学习相反,在F
15、 L过程中,各参与方不交换原始数据,通过交换模型参数实现多个参与方数据蕴含知识的融合和敏感数据的隐私保护2 1。其模型训练效果等同于各方聚合数据所建立的最优模型。L E E等2 2在F L环境中为不同医疗机构的相似病人提供隐私保护,用于预测5种疾病的发病率。B R I S I M I等2 3提出通过存储在智能手机和医疗设备的健康数据建立F L模型,分析预测心脏病病人的住院情况。3 基于F L的P C O S预测平台3.1 平台构建预期针对各医疗机构收集到的P C O S病人、P C O S危险女性、健康人群的医疗数据信息,以F L为依托,融合多种算法深度挖掘处理构建P C O S预测平台,在医
16、疗资源共享和医疗数据不出本地以保证数据安全的前提下,实现P C O S的高危因素定位和发病风险预判,为P C O S危险女性、P C O S病人提供智能预测、辅助诊断、高效防治、随访跟踪和个性化健康指导,以改善女性健康状况,促进P C O S医疗服务体系的进一步完善。3.2 平台功能架构本平台可分为医疗机构用户端与总服务端两部分,其中用户端由社区医院、二级及三级医院等医疗机构组成,总服务端由具备一定计算和存储能力的云端服务器构成,由本平台设计研发人员操作运行。平台构建的要点在于信息数据采集及管理、F L预测模型建立、实施风险评估和健康指导3个基本环节。3.2.1 信息数据采集及管理 本平台中各
17、用户端采用医疗站点式、远程控制式等调查方式,应用纸质或电子调查问卷、手机A p p、可穿戴式智能设备等,对P C O S病人、健康女性进行信息数据采集。采集信息的内容包括人口学资料、初潮年龄、月经周期、经量、体质量指数(BM I)、毛发分布情况、痤疮情况、个人病史、家族病史、居住环境、饮食习惯、生活方式、心理状态等已知的P C O S发病高危因素,以及可能与P C O S发病相关、需要进一步研究分析是否属于P C O S高危因素的信息。见表1。考虑到单个数据库集中存储数据规模较大、存在计算延迟的可能和单点攻击数据泄露风险的问题,每个医疗机构作为一个用户端,将采集到的女性信息汇总储存在本地形成数
18、据集,在进行数据集成、数据清洗等预处理后,为F L模型的训练做好准备。表1 P C O S危险因素信息研究内容类别具体内容人口学资料 年龄、体质量、BM I、职业、婚姻状况、受教育程度等相关情况初潮年龄、月经周期、经量、毛发分布情况、痤疮情况等疾病史个人病史、家族病史(P C O S、不孕、糖尿病、高血压等)生活方式饮食习惯、吸烟、饮酒、熬夜、运动、居住环境、不良生活事件等心理状态焦虑自评量表(S A S)、抑郁自评量表(S D S)等3.2.2 F L预测模型的建立 数据预处理完成后流程进入本地模型训练阶段。用于概率预测的自然梯度提升机(N G-B o o s t)2 4是通过级联多个回归树
19、模型来产生最终预测模型的一种机器学习技术,它可以在得到预测值的同时获得置信区间,即显示“预测分布”及实值预测和概率预测的区别。见图1 A、B。与其他机器学习算法相比,N G B o o s t拥有更高的预测准确率,并且在小样本集上有着同样优秀的性能。因此,利用N G B o o s t算法对数据集进行特征大小排序、特征分割、拟合自然梯度、建立回归树模型后得到本地预测模型。沙普利可加性特征解释方法(S HA P)2 5用于解释N G B o o s t预测模型,根据S HA P值来量化每个特征对于模型预测的贡献度,可以实现危险因素的可视化分析。借助同态加密(HE)2 6算法进行联邦模型加密,用云
20、端服务器公布的公钥加密预测模型的各项参数,并将加密的模型参数和计算梯度通过T C P-I P2 7网络技术传送到云端服务器进行进一步分析。云端服务器作为远端大数据处理中心,云计算模型能够高效地运算和分析上传数据并且确保数据传输的安全性和免受恶意攻击。目前,云计算已经应用在各大企业当中,拥有相当丰富的应用模型,如腾讯云、阿里云等。云端服务器利用私 钥 对 收 到 的 加 密 参 数 进 行 解 密,使 用 联 邦 平 均(F A)2 8算法聚合梯度和参数信息,在进行加权平均后得到权重更新的全局模型参数并加密返传给用户端,用户端通过HE算法获得全局模型参数更新优化本地模型。迭代上述步骤直至本地模型
21、收敛或达到手动设定的训练次数阈值,完成整个训练过程(图2)。在模型训练过程中,用户端数据始终保留在本地,训练中的数据交互不会导致隐私泄露,因此各用户端在F L的帮助下实现隐私保护的全局合作模型训练。国内的W e B a n k银行已将F L技术落地,可基于此开源框架,迅速搭建P C O S预测模型2 9。3.2.3 实施风险评估和健康指导 各用户端在本机构云平台上设立P C O S危险因素特征库和P C O S风险评估客户端,特征库收纳了经全局模型训练后与P C O S发病密切相关的危险因素。P C O S风险评估客户端用于收集P C O S危险人 4 6 0青 岛 大 学 学 报(医 学 版
22、)5 9卷A:患病概率预测(该名女性患有P C O S的可能性,实值预测为1 0%);B:发病概率预测(该名女性未来P C O S发病的可能性,实值预测为3 5%)。图1 实值预测与概率预测的区别图2 F L模型训练过程群的人口学资料、生活方式、相关病史等信息,并自动上传数据与P C O S危险因素特征库对比、筛查,生成P C O S发病风险评估报告,为P C O S危险人群及P C O S病人分配网络健康档案,并利用手机A P P、可穿戴式智能设备等对人群实施持续追踪、实时反馈的连续医疗服务模式和人群与医生间双向的信息交流反馈互动模式,及时反馈预测信息和提供相应危险因素干预措施及个性化健康指
23、导。对于P C O S危险人群的早期症状应及时采取有效的治疗干预措施,如使用孕激素、雌激素等药物治疗或者运用中药膏方、针灸推拿等中医特色养生调理方法调节月经周期、纠正内分泌代谢异常等症状,并指导P C O S危险人群远离危险因素,如采取减轻体质量、调畅情志等措施。利用移动应用程序和传感器健康监测数据等生成人群健康数据,并对其相关危险因素情况进行跟踪随访和预警提醒,以预防P C O S的发生。由于P C O S无法治愈,对于P C O S病人最好的治疗方法是建立长期健康管理策略,除了选择合适的治疗方案之外,还应注意定期体检及重视预防远期并发症的出现。主要的基础治疗是生活方式干预,包括饮食控制、运
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 联邦 学习 卵巢 综合征 预测 平台 构建
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。