基于生信分析对阿尔茨海默病炎症相关关键基因的筛选及鉴定.pdf
《基于生信分析对阿尔茨海默病炎症相关关键基因的筛选及鉴定.pdf》由会员分享,可在线阅读,更多相关《基于生信分析对阿尔茨海默病炎症相关关键基因的筛选及鉴定.pdf(8页珍藏版)》请在咨信网上搜索。
1、论 著文章编号(23)5-0486-08基于生信分析对阿尔茨海默病炎症相关关键基因的筛选及鉴定司蕊豪1,刘羽茜1,朱仲康2,王旭3,侯文晓1,赵丹玉1(辽宁中医药大学中西医结合学院1.生物化学教研室;2.生理学教研室;3.组织与胚胎学教研室,沈阳110847)摘要 目的:筛选并鉴定阿尔茨海默病(AD)神经炎症相关关键基因。方法:用R语言limma包分别筛选GEO数据库中的数据集GSE144459(Healthy=16,AD=16)和GSE135999(Healthy=6,AD=7)中的差异基因(DEGs);用在线韦恩图工具对上述获得的差异表达基因(DEG1、DEG2)与NCBI数据库获得(IR
2、Gs)取交集,以获得差异表达的IRGs;用R语言clusterProfiler包对其进行功能富集分析;通过STRING数据库(https:/string-db.org)和Cytoscape软件对差异表达IRGs进行PPI网络构建,并用cytoHubba插件来筛选PPI中的关键节点作为候选基因。后续用于LASSO回归分析进一步筛选特征基因并构建分类器,用数据集GSE122063(AD=56,Control=44)验证特征基因的表达并绘制箱线图。结果:本研究共获得106个差异表达的IRGs。富集分析与金黄色葡萄球菌感染、中性粒细胞外陷阱形成、Toll样受体、FcR介导吞噬作用等功能及信号通路相关。
3、经过PPI网络的构建、LASSO回归分析、分类器构建及受试者工作特征(ROC)曲线绘制以及特征基因的表达验证,最终得出Fcgr2b、Cd14、Fcgr1、Fcgr3、Ly86在AD中具有较强的预测诊断能力。结论:Fcgr2b、Cd14、Fcgr1、Fcgr3、Ly86在AD中起着关键作用,可以作为AD潜在的诊断和治疗靶点。关键词阿尔茨海默病;炎症;生信分析中图分类号R742.8+9文献标志码Screening and identification of key genes associated with Alzheimer s disease inflammation based onbioi
4、nformatics analysisSI Rui-hao1,LIU Yu-xi1,ZHU Zhong-kang2,WANG Xu3,HOU Wen-xiao1,ZHAO Dan-yu1(1.Biochemistry Teaching and Research Section;2.Physiology Teaching and Research Office;3.Histology Embryology Teaching andResearch Section,Department of College of Integrated Traditional Chinese and Western
5、 Medicine,Liaoning University of TraditionalChinese Medicine,Shenyang 110847,China)AbstractObjective:To screen and identify key genes associated with neuroinflammation in Alzheimers disease(AD).Methods:Thelimma package in R language was used to screen the differentially expressed genes(DEGs)in the d
6、atasets GSE144459(Healthy=16,AD=16)and GSE135999(Healthy=6,AD=7)in the GEO database,respectively.The online VennDiagram tool was used to intersect theabovedifferentiallyexpressedgenes(DEG1,DEG2)withtheinflammation-relatedgenes(IRGs)inNCBIdatabasetoobtainthedifferentiallyexpressed IRGs.The clusterPro
7、filer package in R language was used to perform functional enrichment analysis.PPI networks wereconstructed for differentially expressed IRGs using the STRING database(https:/string-db.org)and Cytoscape software,and key nodes inthe PPI were screened as candidate genes using the cytoHubba plugin.Subs
8、equently,LASSO regression analysis was performed to furtherscreen feature gene and classifier construction,and the expression of the feature gene was verified using the dataset GSE122063(AD=56,Control=44)and the box plot was drawn.Results:A total of 106 differentially expressed IRGs were obtained in
9、 this study.Enrichmentanalysis was associated with Staphylococcus aureus infection,neutrophil extracellular trap formation,Toll-like receptor signaling pathway,FcR-mediated phagocytosis and other functions and signaling pathways.After the construction of PPT network,LASSO regressionanalysis,classifi
10、er construction,ROC curve plotting and expression verification of feature genes,it is concluded that the Fcgr2b,Cd14,Fcgr1,Fcgr3,and Ly86 had strong predictive and diagnostic capabilities in AD.Conclusion:Fcgr2b,Cd14,Fcgr1,Fcgr3,and Ly86 playkey roles in AD and can be used as potential diagnostic an
11、d therapeutic targets for AD.Key wordsAlzheimers disease;inflammation;bioinformatics analysis阿尔茨海默病(Alzheimers disease,AD)是一种常见的慢性神经退行性疾病。据世界卫生组 织报道,截至2020年9月,全球约有5 000万AD患者1。由于人口老龄化的加剧,预计到2050年AD病例数将增至1.52亿2。AD的主要临床表现为记忆力减退和认知功能障碍,主要病理特征为淀粉样蛋白基金项目 国家自然科学基金资助项目(8 1 8 0 3 8 5 4);辽宁省教育厅项目资助(L J K M Z
12、2 0 2 2 1 3 1 7)作者简介 司蕊豪(1 9 9 3-),女,硕士在读,研究方向:中医药防治代谢疾病;通信作者:赵丹玉,E-m a il:d a n y u 1 9 7 8 1 6 3.c o m。天津医科大学学报Journal of Tianjin Medical University第29卷5期23年9月 29熏 5Sep.23486(amyloid-protein,A)沉积、tau蛋白过度磷酸化、神经纤维缠结等3。大量研究表明,在AD发病过程中,各种炎症及炎症相关细胞因子在不同的大脑区域中异常表达,并且与疾病进展显著相关4-5。因此,研究炎症相关基因(inflammation
13、-related genes,IRGs)的表达对 于诊断与防治AD尤为重要。本文旨在通过生信分析鉴定AD过程中与IRGs相关的特征基因,分析特征基因所富集的生物学途径,筛选并鉴定关键基因,为AD的临床诊断和治疗提供潜在的靶点。1对象与方法1.1数据的获取及差异表达IRGs的筛选通过GEO数据库(https:/www.ncbi.nlm.nih.gov/geo/)搜索“Alzheimer”并且下载GSE1444596-7(GPL21163 Agilent-074809SurePrint G3 Mouse GE v2 8x60K Microarray数据更新至Aug 25,2020)和GSE1359
14、998(GPL21810 Agilent-074809 SurePrint G3 MouseGE v2 8x60K Microarray Feature Number version数据更新至Aug 28,2021)中的AD模型小鼠海马和正常小鼠海马转录组数据。使用limma9包分别分析两个数据集中的差异表达基因(differentially expressed genes,DEGs)。筛选标准为:P0.05。并 使 用ggplot210对DEGs进行可视化。然后在NCBI数据库中的Gene子数据库中搜索关键词“Inflammatory”及“Musmusculus”获得IRGs。运用在线韦恩图
15、工 具(http:/bioinformatics.psb.ugent.be/webtools/Venn/)对 上 述 获 得 的 差 异 表 达 基 因(DEG1、DEG2)与NCBI数据库获得IRGs取交集并获得差异表达IRGs。1.2差异表达IRGs的功能富集分析基于GO及KEGG数据库,使用clusterProfiler11包对 差异表达IRGs进行功能富集分析,并对 富集结果进行可视化。GO富集分析包含生物过程、分子功能、细胞组成。本研究中筛选条件为P0.05,count1。选取排名前15的信号通路探索差异表达IRGs的生物学功能。1.3PPI网络构建及候选基因筛选1.3.1差异表达I
16、RGs的PPI网络为探究差异表达IRGs之间是否存在互作关系,利用STRING数据库(https:/string-db.org)对106个差异表达IRGs进行PPI网络构建。置信度为0.4(Confidence=0.4),去除离散的蛋白。用Cytoscape软件对 蛋白网络图进行美化,得到PPI网络图。1.3.2PPI网络中候选基因筛选-cytoHubba利用cytoHubba插件来筛选PPI中的关键节点。根据nodes在网络中的属性进行排名。以MCC、DMNC、MNC、DEGREE、EPC 5种算法分别进行排序,然后对5种算法的TOP30基因取交集,获得候选基因。1.4特征基因的筛选及鉴定1
17、.4.1LASSO回归分析筛选特征基因本研究以GSE144459(Healthy=16,AD=16)作为训练集,以GSE135999(Healthy=6,AD=7)作为验证集,来进行LASSO回归分析。设置参数为:family=binomial,type.measure=class;LASSO分析工具为R语言glmnet12包,以lambda最小值取0.000时的模型为最佳诊断模型。1.4.2鉴定特征基因并绘制受试者工作特征(ROC)曲线将筛选得到的特征基因输入文件进行主成份分析(principle component analysis,PCA),以确定对 疾病及正常小鼠的区分能力。使 用pR
18、OC13包绘制每个特征基因的ROC曲线,判断特征基因在AD中的预测诊断能力。ROC曲线下面积(AUC)的值一般在0.51.0之间。在0.50.7时预测诊断准确性较低,在0.70.9时具有一定的预测诊断意义,在0.9以上越接近于1.0,说明其预测诊断效果越好。1.5LASSO、SVM、GSVA分类器构建分别以GSE144459及GSE135999作为训练集和验证集,采用LASSO、SVM、GSVA 3种不同的算法分别计算8个特征基因,使用R语言pROC包绘制训练集及验证集的ROC曲线,并计算AUC,一般AUC值越大,说明预测的结果较为准确,对 应的分类器具有较高的分类意义。1.6特征基因功能网络
19、为进一步探索特征基因(adj.P0.05)所靶向的通路及其发挥的功能,本研究使用clusterProfiler包对 其进行基于GO和KEGG的富集分析。并绘制特征基因与通路的网络图并且对 富集结果进行可视化。1.7特征基因的表达验证用AD相关的数据集GSE122063(AD=56,Control=44)验证8个特征基因(Fcgr2b、Cd14、Fcgr4、Fcgr1、Lyz2、Fcgr3、Ly86及Themis2)。采用秩和检验和R语言ggplot2包对 特征基因的表达进行分析和可视化。2结果2.1差异表达IRGs的筛选用limma包筛选GSE135999数据集AD/WT小鼠海马组 织中共存在
20、2 101个差异表达基因(DEG1),其中920个上调基因,1 181个下调基因;GSE144459数据集AD/WT小鼠海马组 织中共存在9 239个差异表达的基因(DEG2),其中3 883个上调基因,5 256个下调基司蕊豪,等.基于生信分析对 阿尔茨海默病炎症相关关键基因的筛选及鉴定第5期487因。如图1A、1B所示。对 上述获得的差异表达基因(DEG1、DEG2)与NCBI数据库获得IRGs取交集,以获得差异表达的IRGs。结果共获得90个上调表达IRGs,16个下调表达IRGs,如图1C、D所示。2.2功能富集分析结果为探索差异表达IRGs的生物学功能,本研究对106个差异表达IRG
21、s进行KEGG功能富集分析后,使用气泡图对TOP15通路进行展示(图2A)。得到差异表达IRGs参与了金黄色葡萄球菌感染、中性粒细胞外陷阱形成、破骨细胞分化、吞噬体、Toll样受体、FcR介导吞噬作用、趋化因子等信号通路。此外对106个差异表达IRGs进行GO分析,发现在BP中这些基因参与细胞对 生物刺激的反应、单核细胞增殖、淋巴细胞增殖、白细胞迁移、炎症反应的调节等方面。在CC中与溶酶体、吞噬囊泡、膜微区、膜筏、炎症体复合体等显著相关。在MF中与G蛋白耦联受体结合、免疫球蛋白结合、Toll样受体结合、CCR趋化因子受体结合、细胞因子受体结合等生物学功能相关(图2B)。2.3PPI网络构建及候
22、选基因筛选2.3.1差异表达IRGs的PPI网络利用STRING数据库(https:/string-db.org)对106个差异表达IRGs进行PPI网络构建,得到98个蛋白的互作网关系,包括98个节点,815条边。然后用Cytoscape插件对 蛋白网络图进行美化,如图3。图中绿色表示下调表达,红色表示上调表达,颜色越深,上调/下调的越明显。2.3.2PPI网络中候选基因筛选-cytoHubba基于cytoHubba插件中的算法,对5种算法的TOP30基因取交集,获得17个候选基因。分别是Tyrobp、Fcgr3、Fcgr2b、Fcgr1、C1qa、Cd14、Cd86、Ctss、Irf8、C
23、d68、Fcgr4、Ccl4、Lyz2、Ly86、Clec7a、Ccl3、Themis2。然后使用UpSetR14包进行可视化,得到UpSet图,如图4。2.4特征基因的筛选及鉴定2.4.1特征基因的筛选用LASSO回归对 训练集GSE144459(Healthy=16,AD=16)和验证集GSE135999(Healthy=6,AD=7)进行分析,得到基因系数的图形和交叉验证的误差图。如图5,以lambda最小值取0.000时的模型为最佳诊断模型,可见LASSO回归分析筛选得到由8个基因构成的诊断模型,分别为Fcgr2b、Cd14、Fcgr4、Fcgr1、Lyz2、Fcgr3、Ly86及Th
24、emis2。2.4.2鉴定特征基因并绘制ROC曲线对8个特征基因进行PCA分析得出无论是在GSE135999还是GSE144459中,特征基因均可较好的区分AD组 和正常组(图6)。此外,通过绘制特征基因的ROC曲线(图7)可知每个基因的AUC值均在0.7以上,由此说明特征基因对AD具有较强的预测能力。2.5LASSO、SVM、GSVA分类器构建由LASSO模型(图8A)中可以看出,训练集及验证集的AUC均大于等于0.8;SVM模型中(图8B)训练集及验证集的AUC值均为1;GSVA模型中(图8C)中训练集及验证集的AUC值均在0.9以上。由此说明3种模型均为较好的分类器,对AD具有较高的预测
25、能力,因此这8个基因可作为AD的特征基因。10.07.55.02.50.0-Log10(P-value)-1.0-0.50.00.51.0Log2(fold change)Log2(fold change)-20.0220100-Log10(P-value)GSE 135999-DEGsGSE 144459-DEGsGSE135999-上调GSE144459-上调炎症基因交集炎症基因GSE135999-下调GSE144459-下调交集ABCD注:A:GSE135999-DEGs;B:GSE144459-DEGs;C:下调表达IRGs韦恩图;D:上调IRGs韦恩图;其中红色代表上调基因,蓝色代表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 分析 阿尔茨海默病 炎症 相关 关键 基因 筛选 鉴定
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。