基于生物信息学挖掘间变性甲状腺癌预后生物标志物及潜在的分子机制和免疫机制.pdf
《基于生物信息学挖掘间变性甲状腺癌预后生物标志物及潜在的分子机制和免疫机制.pdf》由会员分享,可在线阅读,更多相关《基于生物信息学挖掘间变性甲状腺癌预后生物标志物及潜在的分子机制和免疫机制.pdf(11页珍藏版)》请在咨信网上搜索。
1、382Journal of Practical Oncology Vol.38No.4 临床研究DOI:10.13267/ki.syzlzz.2023.061基于生物信息学挖掘间变性甲状腺癌预后生物标志物及潜在的分子机制和免疫机制柴武斌1,陈超2,黄海波11.浙江大学医学院附属第二医院岱山分院甲乳外科,浙江 舟山 316200;2.浙江省肿瘤医院核医学科,浙江 杭州 310022通信作者:柴武斌,E-mall:wubin_摘要:目的 运用生物信息学方法对间变性甲状腺癌(anaplastic thyroid carcinoma,ATC)的转录组数据进行分析,寻找相关生物标志物及潜在机制。方法 通
2、过 IMAGEO 分析平台对 Gene Expression Omnibus(GEO)的转录组基因芯片数据集GSE85457、GSE65144 和 GSE29265 综合筛选区别 ATC 与正常甲状腺组织的关键靶点,并对关键靶点进行基因本体论(Gene Ontology,GO)富集分析及 Kyoto Encyclopedia of Genes and Genomes(KEGG)分析。运用 Cytoscape 的 CytoHubba 插件筛选出前 10 位的核心靶基因。运用 Kaplan-Meier 法探究 ATC 核心靶基因对患者总生存期的影响,探究 ATC 预后相关靶基因与常见分子亚型相关性
3、。基于 CIBERSORT 算法分析其与免疫细胞浸润丰度和免疫检查点基因的关系。结果 共筛选出 ATC 差异表达基因 1 891 个,其中包含 832 个上调基因,1 059 个下调基因(均 P0.05)。富集分析显示,差异表达基因主要作用于细胞周期过程、DNA 复制、肿瘤信号转导、活性氧相关化学致癌、细胞凋亡、黏蛋白型 O 聚糖生物合成和甲状腺激素合成等通路。基于 Cytoscape 的 CytoHubba 插件 Maximal Clique Centrality(MCC)算法筛选出 10 个核心靶基因。经 Cox 比例风险模型及 Kaplan-Meier 法在癌症基因组图谱(The Can
4、cer Genome Atlas,TCGA)外部 ATC 队列验证后发现,核心靶基因中周期蛋白依赖性激酶 1(cyclin-dependent kinase 1,CDK1)和细胞周期蛋白 B1(cyclin B1,CCNB1)的高表达与患者总生存期的不良预后相关(均 P0.05)。CDK1 表达量在 B-Raf 原癌基因丝/苏氨酸蛋白激酶(B-Raf proto-oncogene,serine/threonine kinase,BRAF)野生型及突变型患者中存在差异,具有正相关性(r=0.67,P0.7,均 P0.3,均 P0.2,均 P0.4,均 P0.5,均 P0.6,P0.05)。结论
5、CDK1 和 CCNB1的高表达水平与 ATC 患者预后呈负相关,其表达水平影响患者预后可能通过调节肿瘤免疫微环境实现。CDK1 具有更强的免疫原性,为 ATC 诊断与预后的潜在生物标志物。关键词:间变性甲状腺癌;生物信息学;预后;免疫机制;肿瘤微环境基金项目:舟山市级公益类科技项目(2021C31087)甲状腺癌是内分泌恶性肿瘤常见癌种之一。据统计 2020 年全球新增确诊的男性甲状腺癌患者44.9 万例,女性 13.7 万例,发病率分别为 10.1/10万和 3.1/10 万,死亡率分别为 0.5/10 万和 0.3/10万1。同一原发部位肿瘤的病理类型不同,其基因组不稳定性与异质性较其他
6、病理类型也不同。多数甲状腺癌属于分化型甲状腺癌(differentiated thyroid carcinoma,DTC),预后较好。间变性甲状383实用肿瘤杂志 2023 年 第 38 卷 第 4 期 腺癌(anaplastic thyroid carcinoma,ATC)恶性程度高,约占全部甲状腺癌的 1%2%,预后较差,常发生远端及局灶转移2,确诊后中位生存期仅为 34 个月3。传统单一的放疗和化疗等手段对于患者生存期的获益欠佳,手术结合放化疗及靶向治疗的综合治疗策略仍在探索阶段4-5,故而亟需进一步明确 ATC 发生和发展的分子生物学机制,以促进其诊疗方案的完善。生物信息学基于生物学与
7、计算科学将转录组等多组学数据综合分析,对作用于疾病的关键靶点进行筛选,为后续药物研发及临床诊疗提供科学依据。现有甲状腺癌的生物信息学研究多基于甲状腺癌疾病整体6-7,对亚分类的 ATC 少有关注,且多运用单数据集8或传统阈值筛选后取并集的多数据集分析方法9,容易遗失数据信息而影响后续分析准确性。本研究基于 ATC 转录组数据,运用批次化校正的多数据集差异基因筛选方法筛选致病关键靶点并进行富集分析,对其核心靶基因在外部数据集上验证临床预后性能,并进一步分析核心靶基因表达水平与免疫细胞浸润丰度的相关性(图 1),以期对 ATC 临床诊疗提供新思路。1资料与方法1.1转录组芯片数据集的选定Gene
8、Expression Omnibus(GEO)数 据 库 收录大量高通量测序数据集,在 GEO 数据库检索ATC,选择与 ATC 相关转录组数据集 GSE85457、GSE65144 和 GSE29265。数据采集、差异表达基因筛选、功能富集分析、Protein-Protein Interaction(PPI)网络构建与核心靶基因筛选截止日期为2022 年 6 月 22 日。其 中 GSE85457 数 据 集 包 含ATC 患者 4 例(男性和女性各 2 例;年龄 2451岁,平均年龄 37.3 岁)与健康对照组 3 例(男性1 例,女性 2 例;年龄 2145 岁,平均年龄 34.0岁),
9、GSE65144 数据集包括 ATC 患者 12 例(男性4 例,女性 8 例;年龄 3251 岁,平均年龄 44.5 岁)与健康对照组 13 例(男性 4 例,女性 9 例;年龄2858 岁,平均年龄 41.8 岁),GSE29265 数据集包括 ATC 患者 9 例(男性 2 例,女性 7 例;年龄3559 岁,平均年龄 46.3 岁)与健康对照组 20 例(男性 8 例,女性 12 例;年龄 3758 岁,平均年龄 42.9 岁)。1.2ATC 差异表达基因筛选运 用 批 次 化 校 正 方 法 优 化 的 多 GEO 数 据集 Integrative Meta-Analysis of
10、GEO(IMAGEO)在 线 分 析 平 台10对 GSE85457、GSE65144 和GSE29265 转录组数据集进行质控、合并和功能分析等标准化步骤处理,按照随机效应模型以适用于不同批次及平台文件的异构转录组数据集,筛选参数设置为缺失值10、|logFC|2 和 adj P0.01。1.3ATC 差异表达基因功能富集分析将上一步所得 ATC 差异表达基因采用基因本 体 论(Gene Ontology,GO)富 集 分 析 其 细 胞组份(cellular component)、分子功能(molecular function)和生物途径(biological process),同时运用K
11、yoto Encyclopedia of Genes and Genomes(KEGG)分析 ATC 的代谢通路。1.4PPI 网络构建与核心靶基因筛选采用蛋白互作用网络分析平台 STRING 将ATC 差异表达基因构建 PPI 网络,运用 Cytoscape(3.5.0)中的 CytoHubba 插件对 PPI 网络模型进行筛选,运用 Maximal Clique Centrality(MCC)算法将排名前 20 位的核心靶基因进行可视化呈现。1.5预后相关 ATC 核心靶基因筛选为进一步验证核心靶基因对 ATC 患者的预后注ATC:间变性甲状腺癌(anaplastic thyroid ca
12、rcinoma);GEO:Gene Expression Omnibus;IMAGEO:Integrative Meta-Analysis of GEO;GO:基 因 本 体 论(Gene Ontology);KEGG:Kyoto Encyclopedia of Genes and Genomes;PPI:Protein-Protein Interaction;TCGA:癌症基因组图谱(The Cancer Genome Atlas)图 1生物信息学分析间变性甲状腺癌流程图ATC 预后生物标志物及其对免疫细胞浸润的影响正常组织GO分析KEGG分析CytoscapeCytoHubbaKaplan
13、-MeierPlotter差异基因筛选PPI 网络核心靶基因筛选分子亚型分析免疫浸润分析免疫检查点预后相关核心靶基因筛选ATC 组织IMAGEO去除批次化效应GEO差异基因筛选及富集分析TCGA外部队列验证GSE85457GSE65144GSE29265384Journal of Practical Oncology Vol.38No.4 性能,基于生存分析平台 Kaplan-Meier Plotter,将上一步筛选出的 ATC 核心靶基因分别按照高表达量(high expression)与低表达量(low expression)分 为 两 组,对 癌 症 基 因 组 图 谱(The Canc
14、er Genome Atlas,TCGA)数据库的外部 ATC 队列,运用 Kaplan-Meier 法分析,探究 ATC 核心靶基因对患者总生存期(overall survival,OS)预后的影响。1.6预后相关 ATC 核心靶基因与分子亚型分析为进一步分析核心靶基因表达水平与 ATC 常见分子亚型的相关性,基于 TCGA 数据库的外部ATC 队列,采用 Pearson 相关系数分别分析 ATC预后相关的核心靶基因表达水平与 B-Raf 原癌基因 丝/苏 氨 酸 蛋 白 激 酶(B-Raf proto-oncogene,serine/threonine kinase,BRAF)、神 经 母
15、 细 胞 瘤RAS 病毒癌基因同源物(neuroblastoma RAS viral oncogene homolog,NRAS)和 端 粒 酶 反 转 录 酶(telomerase reverse transcriptase,TERT)等分子亚型的关系。1.7预后相关 ATC 核心靶基因免疫浸润分析为进一步分析核心靶基因表达水平与 ATC 肿瘤免疫细胞浸润水平的相关性,基于 CIBERSORT算法11,分别分析 ATC 预后相关的核心靶基因表达水平与不同免疫细胞浸润丰度的关系。1.8ATC 核心靶基因与免疫检查点相关性分析为进一步探究 ATC 核心靶基因与免疫检查点基因表达量之间的相关性,基
16、于 TCGA 数据库的外部 ATC 队列,采用 Pearson 相关系数对 ATC 预后相关的核心靶基因表达水平与不同免疫检查点基因表达的相关性进行检验。1.9统计学分析差异表达基因的筛选采用随机效应模型,根据|logFC|2 和 adj P0.01 作为筛选标准。GO 和KEGG 富集分析采用超几何分布检验。PPI 网络构建采用 STRING 数据库,根据最小所需互作得分(minimum required interaction score)0.4 作为筛选标准。核心靶基因筛选采用 MCC 算法,根据排名前 20 位作为筛选标准。预后相关核心靶基因筛选采用 Kaplan-Meier 法分析,
17、采用 Log rank 检验。预后相关核心靶基因与分子亚型分析采用独立样本 t 检验。预后相关核心靶基因免疫浸润分析采用CIBERSORT 算法。预后相关核心靶基因与免疫检查点相关性分析采用皮尔逊相关分析。以 P0.05为差异具有统计学意义。2结果2.1ATC 差异表达基因筛选结果最终获得 1 891 个 ATC 差异表达基因,其中包含 832 个上调基因,1 059 个下调基因,将上调与下调最显著的各 50 个差异表达基因以热图形式呈现(图 2)。2.2ATC 差异表达基因富集分析结果GO 富集分析结果显示,在细胞组份方面,上调靶基因主要富集于细胞周期过程、细胞有丝分裂、DNA 复制、染色体
18、分裂和基因复制等层面,下调靶基因主要富集于神经元分化与产生、神经系统发育、纤毛组织、质膜细胞和负调控 RNA 聚合酶转录等层面;在分子功能方面,上调靶基因主要富集于核糖核酸合成、DNA 活性催化、嘌呤核糖核苷三磷酸合成、嘌呤核苷酸合成和嘌呤核糖核苷酸合成等层面,下调靶基因主要富集于 DNA结合转录因子活性、RNA 聚合酶特异性、金属离子结合和阳离子结合等层面;在生物途径方面,上调靶基因主要富集于核质核腔、细胞膜封闭腔、细胞器腔和染色体区域等层面,下调靶基因主要富集于纤毛、质膜结合细胞投射、纤毛活动、细胞突起和核周体等层面(表 13)。2.3ATC 差异表达基因代谢通路富集分析结果KEGG 代谢
19、通路分析显示,ATC 相关差异表达基因主要富集在以下 20 条代谢通路:Fanconi 贫血通路、DNA 复制通路、亨廷顿舞蹈症通路、细胞周期和肿瘤转录失调通路、单纯疱疹病毒 1 型感染通路、辅助因子生物合成通路、Fc-gamma 受体(Fc gamma receptor,FcR)介导的吞噬作用通路、缬氨酸/亮氨酸/异亮氨酸降解通路、流体剪切应力和动脉粥样硬化通路、吞噬体信号通路、药物代谢酶通路、沙门氏菌感染通路、糖类消化吸收通路、肿瘤信号通路、活性氧相关化学致癌通路、细胞凋亡通路、黏蛋白型 O 聚糖生物合成通路、甲状腺激素合成通路和型糖尿病通路(图 3)。2.4ATC 差异表达基因共表达网络
20、构建及核心靶基因筛选结果将通过 GEO 数据库筛选后的 1 891 个 ATC 差异表达基因输入 STRING 平台构建 PPI 网络,再导入 Cytoscape 软件进行调整排列,发现共有 4 854条蛋白互作用网络节点,运用 CytoHubba 插件中的 MCC 算法筛选出作用于 ATC 的排名前 10 位的核心靶基因依次如下:周期蛋白依赖性激酶 1385实用肿瘤杂志 2023 年 第 38 卷 第 4 期 (cyclin-dependent kinase 1,CDK1)、细胞周期蛋白 A2(cyclin A2,CCNA2)、CCNB1、细 胞 分 裂周 期 样 蛋 白 20(cell d
21、ivision cycle 20,CDC20)、泛素-B(ubiquitin B,UBB)、有丝分裂检验点丝/苏氨酸激酶 B 蛋白 BUB1(BUB1 mitotic checkpoint serine/threonine kinase B,BUB1B)、有 丝 分 裂 阻滞 缺 陷 2 样 蛋 白 1(mitotic arrest deficient 2 like 1,MAD2L1)、人细胞分裂周期相关基因 8(cell division cycle associated 8,CDCA8)、CDC6 和baculoviral IAP repeat containing 5(BIRC5),将结
22、果可视化呈现(图 4)。2.5ATC 核心靶基因与预后的关系将作用于 ATC 的 10 个核心靶基因运用单因素 Cox 回归及 Kaplan-Meier 法在 TCGA 数据库的外部 ATC 队列人群验证发现,CDK1(HR=11.26,P0.05)和 CCNB1(HR=9.44,P0.05)的表达水注ATC:间变性甲状腺癌(anaplastic thyroid carcinoma)图 2ATC 差异表达基因热图 LDLRAD3RALAHN1MRPS17KPNA2ZNF281FAM83DCDCA4SLC16A1SFXN3CDKN3UBE2ACTPS1GOLT1BBOLA2MRPS10CDC20
23、LHFPL2FOXM1CKLFTPD52L2DUXAP10PRR11GLRX2TPX2DEPDC1ORC6KNOP1NOL9HAUS2MAD2L1CDC45MIR3658OIP5PSMD2GGHEIF2S1RRP36ST3GAL4-AS1ZWINTBIDCKS2RPP40TROAPNCAPGCENPAPDGFAKIF2CUBE2CLZICPHYHD1EIF4BZFP3GTF2IPPP1R14CPCP4OTOSC16orf89SAP18FBXO34GPALPP1LOC101927824RP11-355B11.2PPFIBP2YPEL5TSHRPPIELGPRASP1SALL2GPX3GREB1L
24、SLC26A11FCGBPKANSL1LCOL23A1MUM1L1CGNL1SPXIPCEF1SKP1CARKDTCTAHLFCLIC3MLLT3KIAA1456IGFBPL1ESRRGFMODGLTSCR1LCCL28MIR4680PROM1IP6K3SCUBE3CDR2GALNT18ZNF148SGK223ATP8A1数据集组别10.50-0.5-1数据集组别GSE85457GSE65144GSE29265对照组ATC 组表 1ATC 差异表达基因富集分析细胞组份表IDP 值风险比 期望值 实际值细胞组份GO:00224020.013.996151细胞周期过程GO:00070490.013
25、.4120176细胞周期GO:00002780.013.985134有丝分裂细胞周期GO:19030470.014.278125有丝分裂细胞周期过程GO:00062610.0145.01838DNA 复制GO:00301820.012.75475神经元分化GO:00486990.012.45879神经元生成GO:00220080.012.36283神经发生GO:00073990.011.997122神经系统发育GO:00447820.013.72640纤毛组织表 2ATC 差异表达基因富集分析分子功能表IDP 值风险比 期望值 实际值分子功能GO:0003723 0.012.671103RNA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 生物 信息学 挖掘 变性 甲状腺癌 预后 标志 潜在 分子 机制 免疫
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。