第二章-生物信息学数据库资源.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 生物 信息学 数据库 资源
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 生物信息学数据库资源,1,提纲:,模式生物测序,3,大核酸数据库,蛋白质数据库,2,提纲:,模式生物测序,3,大核酸数据库,蛋白质数据库,3,human,Arabidopsis,Thermotoga maritima,Escherichia coli,Buchnera,sp.APS,Rickettsia prowazekii,Ureaplasma urealyticum,Bacillus subtilis,Drosophila melanogaster,Thermoplasma acidophilum,Plasmodium falciparum,Helicobacter pylori,mouse,Caenorhabitis elegans,rat,Borrelia burgorferi,Borrelia burgorferi,Aquifex aeolicus,Neisseria meningitidis,Z2491,Mycobacterium tuberculosis,一、模式生物,4,模式生物基因组计划,模式生物基因组计划,酵母、线虫、果蝇、细菌、拟南芥等共约,50多种,已完成,,70余种,正在进行。目前总量已达,60亿,碱基对!,5,viruses,plasmids,bacteria,fungi,plants,algae,insects,mollusks,reptiles,birds,mammals,Genome sizes in nucleotide pairs(base-pairs),10,4,10,8,10,5,10,6,10,7,10,11,10,10,10,9,bony fish,amphibians,6,模式生物(Model Organism),病毒(Virus,),不,具有细胞形态结构,仅由核酸和蛋白质构成;,如:人艾滋病毒,HIV,、,SARS,冠状病毒,体积小,,10,300,nm,;,严格的专性细胞内寄生;,对抗生素不敏感。,电子显微镜下的SARS冠状病毒,100,nm,7,Escherichia coli,大肠杆菌,大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。,Escherichia coli,O157:H7,Escherichia coli,K12,模式生物(Model Organism),8,Saccharomyces cerevisiae,酿酒酵母,真菌界的单细胞真核生物,它的全基因组已在1996年测定。,模式生物(Model Organism),9,秀丽线虫,Caenorhabditis elegans,一种透明的、生活在海滩泥沙中的小虫。,细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元;有6条染色体,全基因组于1998年测定,长9.7Mb,模式生物(Model Organism),10,Drosophila melanogaster,果蝇,繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。,模式生物(Model Organism),11,Arabidopsis thaliana,拟南芥,个体生活周期只有6周的十字花科小草,是一种理想的模式植物。,模式生物(Model Organism),12,Oryza sativa,水稻,单子叶植物模式植物,390-430MB,模式生物(Model Organism),13,模式生物(Model Organism),非洲瓜蟾(,Xenopus lavias,),1,个受精卵在,24,小时内分裂到各种器官初具雏形的程度;,14,模式生物(Model Organism),斑马鱼(,Danio rerio,),身体透明的小鱼,生活周期约,3,个月,是研究脊椎动物发育过程的良好对象。,15,模式生物(Model Organism),小鼠(,Mus musculus,),基因组大小与人类相近,约,30,亿个核苷酸对;,16,17,18,提纲:,模式生物测序,3,大核酸数据库,蛋白质数据库,19,主要的数据库资源,核酸序列数据库,主要有GenBank,EMBL,DDBJ等.,蛋白质序列数据库,主要有SWISS-PROT,PIR,TrEMBL等,,蛋白结构数据库,有PDB,MMDB等,,与基因组有关的数据库还有dbEST,OMIM等,,20,3大核酸数据库,基因组数据库的相关背景,主要的基因组数据库资源,重点介绍GenBank,21,ATTGACTA,Primary,vs.,Derivative,Databases,ACGTGC,TTGACA,CGTGA,ATTGACTA,TATAGCCG,ACGTGC,ACGTGC,ACGTGC,TTGACA,TTGACA,TTGACA,CGTGA,CGTGA,CGTGA,ATTGACTA,ATTGACTA,ATTGACTA,ATTGACTA,TATAGCCG,TATAGCCG,TATAGCCG,TATAGCCG,GenBank,TATAGCCG,TATAGCCG,TATAGCCG,TATAGCCG,AT,GA,C,ATT,GA,GA,ATT,ATT,C,C,GA,GA,ATT,C,C,GA,GA,ATT,ATT,C,C,GA,GA,ATT,C,C,Sequencing,Centers,GA,GA,ATT,C,C,GA,GA,ATT,C,C,UniGene,RefSeq,Genome,Assembly,Labs,Curators,Algorithms,TATAGCCG,AGCTCCGATA,CCGATGACAA,22,DNA序列数据库最早于,1982,年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代。,此后不久因一项美国国家健康研究中心与洛斯阿拉莫斯国家实验室的合同而诞生了GenBank。,日本的DNA数据库(DDBJ),在几年后加入了数据收集的合作。,基因组数据库的发展历史,23,基因组数据库的发展历史,1988,年一次三方会议之后(现在称之为“国际DNA序列数据库合作计划”)达成协议,对数据库的记录采用共同的格式,现在三个中心都收集直接提交的数据,并在三者之间发布。,24,三大基因数据库,GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(,The National Center for Biotechnology Information,NCBI)建立和维护的。NCBI的网址是:。,EMBL(,The European Molecular Biology Laboratory,)核酸序列数据库由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。数据库网址是:,,。,DDBJ(DNA Data Bank of Japan)数据库日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。DDBJ的网址是:,,。,25,GenBank,Public,free,Available,via,Internet,EMBL Data Library,DDBJ (DNA Data Bank of Japan),三大基因数据库之间的关系,26,,,27,美国的核酸数据库,GenBankBanson,D.A,.et al.(1998)Nucleic Acids Res.26,1-7,从,1979,年开始建设,,1982,年正式运行。,28,29,欧洲分子生物学实验室的,EMBL,数据库也于,1982,年开始服务。,30,31,日本于,1984,年开始建立国家级的核酸数据库,DDBJ,,,并于,1987,年正式服务。,32,33,GenBank,34,35,36,37,38,提纲:,模式生物测序,3,大核酸数据库,蛋白质数据库,39,蛋白质数据库,40,主要的数据库资源,核酸序列数据库,主要有GenBank,EMBL,DDBJ等.,蛋白质序列数据库,主要有SWISS-PROT,PIR,TrEMBL等,,蛋白结构数据库,有PDB,MMDB等,,与基因组有关的数据库还有dbEST,OMIM等,,41,60,年代,“蛋白质信息资源”,(Protein Information Resource,,简称,PIR,),雏形产生,1984,年,“蛋白质信息资源”,计划正式启动,蛋白质序列数据库,PIR,也因此而诞生。,1988,年,美国的,NBRF,、日本的国际蛋白质信息数据库,JIPID,和德国的慕尼黑蛋白质序列信息中心,MIPS,合作成立了国际蛋白质信息中心,(PIR-International),,共同收集和维护蛋白质序列数据库,PIR,。,42,PIR,(protein information resource),1.,由美国,NCBI,翻译自,GenBank,的,DNA,序列,(1984,年,),;,2.,在,EMBL,和,GenBank,数据库上均建立了镜像站点;,3.,数据依据注释的质量分为,4,类。,网址:,nbrf.georgetown.edu,/,分类名称,(Name),说明,(Comment),记录数,(Number of entries),PIR1,已分类、已注释,(Classified and annotated),13572,PIR2,已注释(Annotated),69368,PIR3,未核实(Unverified),7508,PIR4,未翻译(Unencoded or untranslated),196,PIR数据库的分类情况(Release 51.03),43,44,除了,PIR,外,另一个重要的蛋白质序列数据库则是,SwissProt,。,该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所 EBI共同维护和管理。,45,SWISS,PROT,1.,瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所,(EBI),合作维护(,1986,年);,2.,在,EMBL,和,GenBank,数据库上均建立了镜像站点,;,3.,数据库包括了从,EMBL,翻译而来的蛋白质序列,这些序列经过检验和注释;,SWISS-PROT,的,网址:,46,47,PIR,和,SwissProt,是创建最早、使用最为广泛的两个蛋白质数据库,。,蛋白质序列数据库,TrEMBL,是从EMBL中的cDNA序列翻译得到的。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。,TrEMBL:,48,蛋白质结构数据库,49,主要的数据库资源,核酸序列数据库,主要有GenBank,EMBL,DDBJ等.,蛋白质序列数据库,主要有SWISS-PROT,PIR,TrEMBL等,,蛋白结构数据库,有PDB,MMDB等,,与基因组有关的数据库还有dbEST,OMIM等,,50,PDB,(,protein data bank,),1.,目前最主要的蛋白质分子结构数据库;,2.1970,年代建立,美国,Brookhaven,国家实验室维护管理,;,3.1988,年,由美国,RCSB(research,collaboratory,for structural biology),管理;,4.,以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等;,PDB,的网址:,,(,美国,),51,52,53,如何 Access PDB记录?,54,如何 Access PDB记录?,55,如何 Access PDB记录?,56,如何 Access PDB记录?,Download,PDB file,View,PDB file,Structure view,options,57,如何 Access PDB记录?,58,如何 Access PDB记录?,59,Questions:,下列数据库分别是什么类型的数据库?,GenBank,PIR,DDBJ,SWISS-PROT,PDB,EMBL,TrEMBL,60,第三章 生物信息学数据库资源,-数据库查询,61,GenBank,62,63,64,PubMed的特点,收录的文献多!大部分与生命科学相关,自动词语匹配,链接点多,部分在网上免费获得全文,也可以直接定购原文,65,二、,检索规则,66,二、,检索规则,67,68,69,70,复杂检索,限制字段类别,常用的有,:Author:,Bao,YMau,Title:,stressti,Tilte,/Abstract,:,stresstitle,/abstract,Date:1999:2009dp,71,复杂检索,布尔逻辑运算:,AND,、,OR,、,NOT,必须大写。,逻辑符的运算次序是从,左至右,,括号内的检索式可作为一个单元,优先运行。,布尔逻辑检索允许在检索词后面附加,字段标识,例如:,riceti,AND,Bao,YMau,AND 2008:2009dp,72,73,Question1:,如何查找由Zhu J实验室于2005以后发表的,题目中显示关于水稻的文献?,74,Question 2:,如:我要查找BaoYM在Nature或Science上发表的论文,1 Bao YMau AND(NatureJournal OR ScienceJournal),2 Bao YMau AND Nature OR ScienceJournal,3 Bao YMau AND NatureJournal OR ScienceJournal,4 Bao YMau AND(Nature OR Science)Journal,哪一个检索语言是正确的?,75,在PubMed页面上选择Advanced Search:,76,在PubMed页面上选择Advanced Search:,77,在PubMed页面上选择Limits:,78,在PubMed页面上选择Limits:,79,如何获取GenBank中的序列?,80,同样存在限制字段:,常用的有:Author:Xing JYau,title:BMAL1ti,organism:pigorganism,或者直接输入:,Accession:,HQ657211Accession,Gene Name:BMAL1Gene Name,Protein Name:,BMAL1,Protein Name,如:Xing JYau AND BMAL1ti AND pigorganism,如果没有限定,就是任意字段。,如何获取GenBank中的序列?,81,82,Question:,查找Xing JY发布的DNA序列.,83,84,直接录入注册号查询:,85,86,87,查找蛋白质序列:,88,查找EST序列:,89,查找Structure:,90,查找Structure,:,91,92,93,94,查找Unigene,95,UniGene is an experimental system for automatically partitioning GenBank sequences into a non-redundant set of gene-oriented clusters.Each UniGene cluster contains sequences that represent a unique gene,as well as related information such as the tissue types in which the gene has been expressed and map location.,UniGene 是非冗余的某个基因的集合,包含了该基因所有的经过实验证明的转录本及其表达信息.,96,97,98,99,100,101,Questions:,什么是,UniGene,?,2.,根据目前的内容,GenBank,的作用,?,102,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




第二章-生物信息学数据库资源.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12750670.html