基于GEO数据库筛选阿尔茨海默病的关键基因.pdf
《基于GEO数据库筛选阿尔茨海默病的关键基因.pdf》由会员分享,可在线阅读,更多相关《基于GEO数据库筛选阿尔茨海默病的关键基因.pdf(7页珍藏版)》请在咨信网上搜索。
1、论 著基于G E O数据库筛选阿尔茨海默病的关键基因*李方舟1,郗雪艳1,杜伯雨1,2,戴文敬1(湖北医药学院:1.生物医药研究院;2.基础医学院,湖北 十堰 4 4 2 0 0 0)摘 要 目的 应用生物信息学方法筛选阿尔茨海默病的关键基因。方法 从G E O数据库下载G S E 5 2 8 1和G S E 1 3 8 2 6 0数据集,用R语言对数据集进行去批次效应;WG C NA分析构建共表达网络,筛选与疾病相关基因模块并绘制基因聚类图和相关性图;以WG C NA筛选出的模块基因为对象进行差异表达基因分析,绘制火山图及热图;对差异表达基因进行L a s s o回归分析,筛选关键基因;对差
2、异表达基因进行京都基因和基因组数据库(K E G G)和基因本体(GO)富集分析,绘制气泡图。结果 通过WG C NA分析获得包含7 0 4个基因的b r o w n模块与疾病高度相关;b r o w n模块差异表达分析得到3 9个差异表达基因,其中1 0个下调基因,2 9个上调基因;进一步L a s s o回归后筛选出9个关键基因。GO和K E G G富集分析表明,差异表达基因在矿物质元素的吸收、氧化还原驱动的活性跨膜转运蛋白等方面富集。结论 G E O数据库初步筛选出潜在的阿尔茨海默病关键基因,但还需进一步实验验证。关键词 阿尔茨海默病;生物信息学;G E O数据库;差异表达基因;富集分析
3、D O I:1 0.3 9 6 9/j.i s s n.1 0 0 9-5 5 1 9.2 0 2 3.1 7.0 0 3中图法分类号:Q-3 1文章编号:1 0 0 9-5 5 1 9(2 0 2 3)1 7-2 8 9 3-0 6文献标识码:AS c r e e n i n g f o r t h e k e y g e n e s o f A l z h e i m e r s d i s e a s e b a s e d o n G E O d a t a b a s e*L I F a n g z h o u1,X I X u e y a n2,DU B o y u1,2,DA I
4、 W e n j i n g1(1.I n s t i t u t e o f B i o l o g i c a l M e d i c i n e;2.S c h o o l o f B a s i c M e d i c a l S c i e n c e s,H u b e i M e d i c a l U n i v e r s i t y,S h i y a n,H u b e i 4 4 2 0 0 0,C h i n a)A b s t r a c t O b j e c t i v e T o s c r e e n k e y g e n e s i n A l z h
5、e i m e r s d i s e a s e b y b i o i n f o r m a t i c s m e t h o d.M e t h o d s T h e d a t a o f G S E 5 2 8 1 a n d G S E 1 3 8 2 6 0 w e r e d o w n l o a d e d f r o m t h e G e n e E x p r e s s i o n Om n i b u s(G E O)d a t a b a s e,a n d t h e R s o f t w a r e w a s u s e d t o c a r r
6、 y o u t b a t c h e f f e c t o n t h e d a t a s e t.T h e c o-e x p r e s s i o n n e t w o r k w a s c o n s t r u c t e d b y WG C NA a n a l y s i s,a n d t h e d i s e a s e-r e l a t e d g e n e m o d u l e s w e r e s c r e e n e d a n d t h e g e n e c l u s t e r a n d c o r r e l a t i o
7、 n m a p s w e r e m a d e.T h e d i f f e r e n t i a l l y e x p r e s s e d g e n e s(D E G s)w e r e a n a l y z e d b y u s i n g t h e m o d u l e g e n e s s c r e e n e d b y WG C NA,a n d v o l c a n o m a p a n d h e a t m a p w e r e d r a w n.T h e D E G s w e r e a n a l y z e d b y L a
8、 s s o r e-g r e s s i o n a n d t h e k e y g e n e s w e r e s c r e e n e d.T h e n K y o t o E n c y c l o p e d i a o f G e n e s a n d G e n o m e s(K E G G)a n d g e n e o n t o l o g y(GO)e n r i c h m e n t a n a l y s i s o f D E G s w e r e p e r f o r m e d a n d b u b b l e c h a r t s
9、w e r e d r a w n.R e s u l t s T h e b r o w n g e n e m o d u l e w h i c h i n c l u d e 7 0 4 g e n e s c o r r e l a t e d w i t h A l z h e i m e r s d i s e a s e t h r o u g h WG C NA a n a l y s i s.A t o t a l o f 3 9 D E G s w e r e i d e n t i f i e d b y b r o w n m o d u l e d i f f e
10、r e n t i a l e x p r e s s i o n a n a l y s i s,i n c l u d i n g 1 0 d o w n-r e g u l a-t e d g e n e s a n d 2 9 u p-r e g u l a t e d g e n e s.A t o t a l o f 9 k e y g e n e s w e r e s c r e e n e d b y L a s s o a n a l y s i s.GO a n d K E G G e n r i c h m e n t a n a l y s i s s h o w e
11、 d t h a t t h e s e D E G s w e r e s i g n i f i c a n t l y e n r i c h e d i n m i n e r a l a b s o r p t i o n,o x i d o r e d u c-t i o n-d r i v e n a c t i v e t r a n s m e m b r a n e t r a n s p o r t e r,e t c.C o n c l u s i o n P o t e n t i a l k e y g e n e s o f A l z h e i m e r s
12、 d i s e a s e h a v e b e e n p r e l i m i n a r i l y s c r e e n e d o u t b a s e d o n G E O d a t a b a s e,b u t n e e d f u r t h e r e x p e r i m e n t a l v e r i f i c a t i o n.K e y w o r d s A l z h e i m e r s d i s e a s e;B i o i n f o r m a t i c s;G e n e E x p r e s s i o n Om
13、n i b u s d a t a b a s e;D i f f e r e n t i-a l l y e x p r e s s e d g e n e s;E n r i c h m e n t a n a l y s i s 阿尔茨海默病(A D)是一种由阿诺斯阿尔茨海默(A l o i s A l z h e i m e r)发现、埃米尔克雷佩林(Em i l K r a e p e l i n)命名的常见并伴随缓慢进展的神经性退行痴呆1-2。A D主要以淀粉样肽沉聚在大脑最容易3982现代医药卫生2 0 2 3年9月第3 9卷第1 7期 J M o d M e d H e a l
14、 t h,S e p t e m b e r 2 0 2 3,V o l.3 9,N o.1 7*基金项目:湖北医药学院2 0 2 1启动金项目(2 0 2 1 Q D J Z R 0 2 6)。作者简介:李方舟(1 9 9 5),硕士研究生,助理实验师,主要从事生物化学与分子生物学方面的研究。通信作者,E-m a i l:6 4 5 6 1 9 7 2 7q q.c o m。受影响的部位,例如大脑内侧颞叶、皮层而形成的神经斑块和神经纤维缠结为特征3。A D是一个全球性的健康难题,影响着全世界范围内近5 0 0 0万人口的健康,是造成人类痴呆的主要原因。根据预测,A D的患病人数将会在1 0年
15、之后翻倍,并在2 0 5 0年达到近1.5亿4-5。因此,A D的诊断与治疗方法的开发应用变得尤为重要。A D的病理特征主要分为两大类:(1)通过积聚而造成的正向损伤,如神经纤维缠结、淀粉样斑块和其他在A D患者脑内发现的沉积物;(2)由于萎缩而造成的负向损伤,如神经细胞、轴突、树突、海马体等大面积萎缩6-8。到目前为止,关于A D的发病进展及发病机制提出了一些假设,但具体病因和疾病进展机制还有待证明。关于A D的病因提出了2条主要的假说,胆碱成因假说和淀粉样蛋白成因假说。胆碱成因假说认为胆碱功能受损是造成A D的关键因素;淀粉样蛋白成因则认为淀粉样蛋白生成及修饰过程中有异,产生淀粉样蛋白异构
16、体是A D的主要发病原因5,9-1 0。作为一种多因素疾病,其病程的进展与多种风险因素相关,如年龄的增长、遗传、头部损伤、血管疾病、细菌或病毒的感染、重金属等环境因素等5。其中最为主要的风险因素是年龄,绝大多数A D患者的年龄均在6 5岁以上,年轻人(3 0岁左右)除非是家族遗传性A D,否则基本不会患有这种疾病1 1。衰老是迟发性A D的最大危险因素,占A D病例的9 5%以上。但近期确诊1例排除已有基因突变和家族性A D的1 9岁A D患者,表明A D将不再局限于老年人1 2。截至目前,A D没有治愈的方法,只有一些改善症状的治疗手段1 3-1 4。而最大限度地减轻A D对患者损害的方法是
17、在A D进展为轻度症状前给予患者神经性保护的药物1 5。所以对潜在A D患者的早期诊断是缓解疾病症状极为关键的影响因素。2 0 1 1年美国国家衰老研究所阿尔茨海默病协会提出了新的诊断标 准,这 包 括 临 床 症 状 及 生 物 标 志 物 的 共 同 诊断5。A D有2类生物标志物:(1)可以通过正电子成像术和脑脊液中检测到的脑淀粉样蛋白标志物;(2)神经元损伤标志物,如脑脊液t a u蛋白、与代谢相关的氟脱氧葡萄糖(F D G)及通过核磁成像技术直接观测到的大脑萎缩等1 6-1 8。过去的生物信息学分析仅仅分析筛选了A D的差异性表达基因作为A D的诊断标志物,如E G F R、C D
18、4 4、B C L 2 L 1、HG G 4、L P P、C T AG E等1 9-2 0。为了进一步了解A D的发病原因及发病机制,发掘A D的特征标志物,提高诊断效率,本研究综合WG C NA、差异性分析及L a s s o回归分析,基于G E O数据库中A D患者组及对照组基因表达图谱,用R语言更准确地筛选A D的关键基因及信号通路,以达到初步筛选A D关键基因、开阔疾病的诊断思路、开发有效治疗方法的目的。1 资料与方法1.1 数据来源及去批次 研究所用数据来源于美国国立生物技术中心的G E O数据库。以“A l z h e i m e r s d i s e a s e”“H o m
19、o s a p i e n s”检索高通量测序数据集。筛选出注释平台分别为G P L 5 7 0、G P L 2 7 5 5 6的2个数据集G S E 5 2 8 1和G S E 1 3 8 2 6 0。运用R语言对2个数据集中的数据进行I D转换、数据合并,并对G E O 2组数据集进行去批次运算,以去除2组数据的批次效应,增加接下来生物信息学分析的准确性。1.2 WG C NA筛选与疾病相关基因 用R语言进行WG C NA分析,排除异常信息及异常样本,构建共表达网络,将基因分为不同的模块。不同基因模块与表型数据关联分析,计算筛选出与患病相关性最高的基因模块。输出这个模块基因的表达数据集以进
20、行后续生物信息学分析。1.3 基因表达差异性分析 用R语言对数据按照表型进 行 分 组 后,进 行 表 达 差 异 性 分 析,筛 选 出|l o g F C|1.2且P1.2且P0.0 5为阈值筛选表达差异的基因并作图。结果显示共有3 9个表达差异的基因,其中1 0个下调基因,2 9个上调基因(图3 A、B)。2.4 L a s s o回归筛选关键基因与验证 通过L a s s o回归构 建 表 型 模 型,L a s s o算 法 推 荐 有2个 阈 值;l a m b d a.m i n对应出9个关键基因,l a m b d a.1 s e对应出7个关键基因(图4 A、B)。R语言对模型
21、进行自我预测,选择曲线下面积(AU C)值更接近1的l a m b d a.m i n。筛选出9个关键基因 为MA L AT 1、N S UN 6、S R RM 2、AT P 5 B、S L C 3 5 E 1、MKNK 2、Z C 3 H 7 B、CM-B L、J P X(表1)。通过受试者操作特征曲线(R O C曲线)验证L a s s o回归筛选的基因,其AU C值均在0.7 4以上(图4 E、F),证明这9个基因均可作为潜在A D的生物标志物。其中,MA L AT 1、N S UN 6、S R RM 2、S L C 3 5 E 1、MKNK 2、Z C 3 H 7 B、CMB L、J
22、P X这8个基因在A D中表达上调;AT P 5 B这个基因在A D中表达下调(图5)。2.5 K E G G和GO的信号通路富集分析 对差异表达的基因进行K E G G富集分析和GO富集分析显示,K E G G富集分析显示这3 9个基因主要参与矿物质元素的吸收、近端小管碳酸氢盐回收等通路调控(图6 A);GO富集分析表明,差异表达基因的主要分子功能与氧化还原驱动的活性跨膜转运蛋白、磷脂酰胆碱翻转酶活性等相关(图6 B)。注:A.火山图;B.热图。图3 差异表达基因火山图和热图表1 L a s s o筛选的1 2个关键基因基因样本A D v s.健康(l o g F C)AU Cm e t a
23、 s t a s i s a s s o c i a t e d l u n g a d e n o c a r c i n o m a t r a n s c r i p t 1MA L A T 11.2 1 10.8 7 5NO P 2/S u n R NA m e t h y l t r a n s f e r a s e 6I T P K B1.2 8 80.8 5 0s e r i n e/a r g i n i n e r e p e t i t i v e m a t r i x 2 f a c t o r FS R RM 21.3 6 40.8 3 1A T P s y n t
24、 h a s e,H+t r a n s p o r t i n g m i t o c h o n d r i a l A T P 5 B-1.0 3 10.8 6 2s o l u t e c a r r i e r f a m i l y 3 5 m e m b e r E 1S L C 3 5 E 11.0 2 60.8 2 9MA P K i n t e r a c t i n g s e r i n e/t h r e o n i n e k i n a s e 2MKNK 21.2 1 90.8 3 9z i n c f i n g e r C C C H-t y p e c o
25、 n t a i n i n g 7 BZ C 3 H 7 B1.0 5 20.8 3 4c a r b o x y m e t h y l e n e b u t e n o l i d a s e h o m o l o gCMB L1.0 7 80.8 1 6J P X t r a n s c r i p tJ P X1.1 1 80.7 4 56982现代医药卫生2 0 2 3年9月第3 9卷第1 7期 J M o d M e d H e a l t h,S e p t e m b e r 2 0 2 3,V o l.3 9,N o.1 7 注:A.系数分布图;B.L a s s o
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 GEO 数据库 筛选 阿尔茨海默病 关键 基因
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。