基于GEO对多发性骨髓瘤关键基因生物信息学分析及免疫浸润模式与验证.pdf
《基于GEO对多发性骨髓瘤关键基因生物信息学分析及免疫浸润模式与验证.pdf》由会员分享,可在线阅读,更多相关《基于GEO对多发性骨髓瘤关键基因生物信息学分析及免疫浸润模式与验证.pdf(6页珍藏版)》请在咨信网上搜索。
1、23现代检验医学杂志第 38 卷第 5 期2023 年 9 月J Mod Lab Med,Vol.38,No.5,Sept.2023基于 GEO 对多发性骨髓瘤关键基因生物信息学分析及 免疫浸润模式与验证侯丽1,张丽1,唐婧1,牛瑶1,张媛2,朱有森1(1.新疆医科大学第一附属医院医学检验中心,乌鲁木齐 830054;2.喀什地区第二人民医院检验科,新疆喀什 844000)摘要:目的通过生物信息学方法筛选多发性骨髓瘤(multiple myeloma,MM)潜在的关键基因,并分析其免疫浸润模式。方法从基因表达综合数据库(gene expression omnibus,GEO)获取与多发性骨髓瘤
2、相关的基因表达谱 GSE118985,(GSE133346和GSE146649),采用生物信息学方法筛选与多发性骨髓瘤相关的差异表达基因(DEGs)并进行基因本体(GO)功能注释和京都基因与基因组百科全书(KEGG)富集分析、免疫细胞浸润分析。通过蛋白质-蛋白质相互作用网络筛选出多发性骨髓瘤潜在的关键基因,利用数据 GSE7116 验证关键基因在多发性骨髓瘤中的诊断价值并绘制受试者工作特征(receiver operator characteristic,ROC)曲线。结果共筛选出 101 个 DEGs。GO 功能注释和 KEGG 富集分析显示,DEGs主要富集在免疫反应过程中,细胞因子受体相
3、互作用、细胞外基质受体相互作用、粘着斑和Hedgehog信号通路等,单核细胞是多发性骨髓瘤最主要的免疫浸润细胞。最终筛选出 5 个关键基因,分别为 SDC1,IRF4,CD38,TNFRSF17和 CCND1,核心基因对验证模型联合诊断的 AUC 为 0.933。结论SDC1,IRF4,CD38,TNFRSF17 和 CCND1 在多发性骨髓瘤中均上调,联合诊断的效能较高,可能是多发性骨髓瘤潜在的生物标志物,可为以后治疗提供新的思路。关键词:生物信息学;多发性骨髓瘤;免疫浸润中图分类号:R733.3;Q786文献标识码:A文章编号:1671-7414(2023)05-023-06doi:10.
4、3969/j.issn.1671-7414.2023.05.005Bioinformatics Analysis and Verify Core Genes and Immune Infiltration Patterns in Multiple Myeloma Based on GEOHOU Li1,ZHANG Li1,TANG Jing1,NIU Yao1,ZHANG Yuan2,ZHU Yousen1 (1.Medical Laboratory Center,the First Affiliated Hospital of Xinjiang Medical University,Urum
5、qi 830054,China;2.Department of Clinical Laboratory,the Second Peoples Hospital of Kashi Prefecture,Xinjiang Kashi 844000,China)Abstract:ObjectiveTo screen the potential key genes of multiple myeloma(MM)and analyze its immune infiltration pattern by bioinformatics methods.MethodsThe gene expression
6、profiles(GSE118985,GSE133346 and GSE146649)related to multiple myeloma were obtained from Gene Expression Omnibus(GEO)database,and the differentially expressed genes(DEGs)related to multiple myeloma were screened by bioinformatics methods.Gene ontology(GO)functional annotation,Kyoto Encyclopedia of
7、Genes and Genomes(KEGG)enrichment analysis and immune cell infiltration analysis were performed.The potential key genes of multiple myeloma were screened by protein-protein interaction network,and the data GSE7116 was used to verify the diagnostic value of key genes in multiple myeloma,and the ROC c
8、urve was drawn.ResultsA total of 101 DEGs were screened.GO functional annotation and KEGG enrichment analysis showed that DEGs were mainly enriched in the process of immune response,cytokine receptor interaction,extracellular matrix receptor interaction,focal adhesion,Hedgehog signaling pathway,etc.
9、Monocytes are the most important immune infiltrating cells in multiple myeloma.Five key genes were selected,namely SDC1,IRF4,CD38,TNFRSF17 and CCND1.The AUC of the core genes for the combined diagnosis of the validation model was 0.933.ConclusionSDC1,IRF4,CD38,TNFRSF17 and CCND1 were up-regulated in
10、 multiple myeloma,and the combined diagnosis efficiency was high,which may be potential biomarkers of multiple myeloma,and provide new thoughts for future treatment.Keywords:bioinformatics;multiple myeloma;immune infiltration多发性骨髓瘤(multiple myeloma,MM)是一种浆细胞恶性肿瘤,其特征表现为骨髓中克隆性浆细基金项目:新疆维吾尔自治区科技支疆计划(202
11、2E2056)。作者简介:侯丽(1988-),女,硕士研究生,主管技师,主要从事临床检验诊断学及生物信息学,E-mail:。通讯作者:朱有森(1969-),男,主任技师,主要从事临床检验诊断学及分子生物学。胞的恶性增殖,临床上主要表现为高血钙症、肾损害、贫血及骨破坏1。据报道,多发性骨髓瘤约占24现代检验医学杂志第 38 卷第 5 期2023 年 9 月J Mod Lab Med,Vol.38,No.5,Spet.2023血液系统恶性肿瘤的 10%,男性发病率高于女性2。2020 年全球多发性骨髓瘤的年龄标准化发病率为1.78/10 万人,死亡率为 1.14/10 万人3。由于多发性骨髓瘤存在
12、较高的异质性,容易出现耐药和复发频繁,多发性骨髓瘤仍然无法完全治愈,五年生存率约为 50%4。目前临床上的治疗方案,主要是通过早期化疗等方法控制病情,但治疗效果并不理想。一些研究发现免疫细胞参与了骨破坏和骨形成,并且指出骨细胞和免疫细胞之间存在双向调节的作 用5,但各类免疫细胞,如巨噬细胞、粒细胞和非特异性免疫途径对其的影响尚不清楚。本研究运用生物信息学、机器学习算法等方法对公共数据库所基因表达综合数据库(gene expression omnibus,GEO)中多发性骨髓瘤相关的数据集进行挖掘,分析多发性骨髓瘤患者和健康对照组的基因表达微阵列数据,通过差异表达基因分析、功能富集和生存分析筛选
13、关键基因,探索多发性骨髓瘤相关基因通路和功能的变化,揭示与其发生发展的分子机制提供理论依据。1材料与方法1.1 资 料 来 源 以“multiple myeloma”为 关 键词,从 GEO 数据库中检索诊断为多发性骨髓瘤的患者和健康对照样本的芯片,见表 1。选取基因芯片 GSE118985,GSE133346,GSE146649 作为训练集,芯片数据生成于同一分析 GPL570HG-U133_Plus_2Affymetrix Hunan Genome U133 Plus 2.0 Array,GSE7116 以作为验证集。表 1 MM 患者和健康对照基因芯片基本信息GEO seriesPlat
14、formsMMControlTypeGSE7116GPL570521外周血GSE146649GPL5701030骨髓GSE13346GPL5701212骨髓GSE118985GPL57068460骨髓1.2方法与统计学分析1.2.1差异表达基因筛选:根据各数据集相应的平台探针信息注释基因,采用 R 软件(4.2.2)的“limma”,“sva”软件包对三个训练集的测序原始数据进行批次校正均一化处理,并分析多发性骨髓瘤与健康对照组差异表达基因进行初筛,标准为 P0.05,且|Log2FC|1,在将各数据集筛选出的差异表达基因用稳健排序整合(robust rank aggregation,RAA)
15、法排序,筛选出差异基因,使用 R 软件中的“pheatmap”软件包构建差异表达基因(differentially expressed genes,DEGs)的热图。1.2.2DEGs 功能富集分析:基于筛选出的共同差异表达基因,通过 R 软件“stringi”“ggplot2”“clusterProfiler”“enrichplot”等软件包对获取的差异基因进行分析,基因本体论(gene ontology,GO)数据库对共同差异表达基因进行生物学功能注释;京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)通路数据库进行共同差异
16、表达基因信号通路的富集。1.2.3蛋白质互作网络构建:利用 STRING 11.5(https:/cn.string-db.org/)构建共同差异表达基因编码蛋白的互作网络,筛选置信度得分 0.4 的互作蛋白,去除网络中的游离蛋白,并用 Cytoscape软件中 CytoHubba 插件依据项目进行打分筛选出其中的关键基因(hub gene)。1.2.4 应 用 受 试 者 工 作 特 性 曲 线 评 价:利 用GSE7116 中的数据构建疾病-对照的模型验证集,评价 hub 基因与多发性骨髓瘤的关联程度。利用R 软件绘制应用受试者工作特性(receiver operator characte
17、ristic,ROC)曲线并通过计算 ROC 曲线下面积对筛选出的核心基因进行评价。2结果2.1差异表达基因筛选结果见图 1。通过筛选共获得 101 个差异表达基因,其中 25 个下调基因,76 个上调基因,并将排名前 20 的上调及下调差异基因绘制差异表达基因的热图。2.2差异表达基因功能富集及通路分析见表 2。对筛选出的 101 个共同差异表达基因进行 GO 和KEGG 通路富集分析,结果显示,差异基因 BP 主要富集在细胞因子的正向调节、B 细胞活化、T细胞、免疫效应的调节及蛋白质磷酸化;CC 主要富集在内质网腔,细胞外基质;MF 主要富集在信号受体激活,细胞因子激活及生长因子激活等;共
18、富集到KEGG 通路 12 个,主要涉及细胞因子受体相互作用、细胞外基质受体相互作用、粘着斑、Hedgehog信号通路、致心律失常性右心室心肌病(ARVC)等通路。2.3蛋白质互作网络的构建及 hub 基因的筛选将 101 个差异表达基因输入 STRING 进行互作网络分析,去除游离的蛋白后,共得到由 89 个节点(靶 点蛋白)和 61 条边(蛋白质互作)构成的蛋白质互 作网络,见图2。再进一步应用Cytohubba计算打分,筛选出蛋白质互作网络中的关键基因,皆为上调基因,分别为多配体蛋白聚糖1(Syndecan,SDC1)、干扰 素调节因子 4(interferon regulatory f
19、actor,IRF4)、分化抗原簇38(Cluster of Differentiation 38,CD38)、肿瘤坏死因子受体超家族(tumor necrosis factor receptor superfamily,TNFRSF17)和 细 胞 周 期 素(cyclin D1,CCND1),并将 hub 基因绘制差异表达基因的热图,见图 3。25现代检验医学杂志第 38 卷第 5 期2023 年 9 月J Mod Lab Med,Vol.38,No.5,Sept.2023图 1多发性骨髓瘤患者与健康对照差异表达基因热图表 2 共同差异表达基因 GO 和 KEGG 通路富集分析结果功能通路
20、类型功能通路 ID功能通路的描述基因数目LogPGene OntologyGO:0072678T 细胞迁移5-4.69GO:0042113B 细胞活化9-4.52GO:0002697免疫效应过程的调节9-4.25GO:0001819细胞因子的正向调节10-4.15GO:0036498IRE1 介导的未折叠蛋白反应3-4.01GO:0042692肌细胞分化9-4.00GO:0060393通路限制性 SMAD 蛋白磷酸化的调节4-3.74GO:0060389通路限制性 SMAD 蛋白磷酸化4-3.63GO:0072676淋巴细胞迁移5-3.59GO:0050863T 细胞活化的调节8-3.51KE
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 GEO 多发性 骨髓瘤 关键 基因 生物 信息学 分析 免疫 浸润 模式 验证
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。