GB∕T 40419-2021 健康信息学 基因组序列变异置标语言(GSVML).pdf
《GB∕T 40419-2021 健康信息学 基因组序列变异置标语言(GSVML).pdf》由会员分享,可在线阅读,更多相关《GB∕T 40419-2021 健康信息学 基因组序列变异置标语言(GSVML).pdf(104页珍藏版)》请在咨信网上搜索。
1、ICS 35.240.80 CCS C 07 中华人民共和国国家标准GB/T 404 19-2021 健康信息学基因组序列变异置标语言CGSVML)Health informatics-Genomic Sequence Variation Markup Language (GSVML) 2021-10-11发布(ISO 25720: 2009 ,MOD) 国家市场监督管理总局Lg.-/;-国家标准化管理委员会保叩2022-05-01实施G/T 40419-2021 目次前言皿引言凹1 范围.12 规范性引用文件13 术语和定义14 GSVML定位35 GSVML结构36 GSVML的DTD和X
2、ML模式四附录A(资料性)GSVML开发情况说明mA.l GSVML开发需求分析mA.2 GSVML开发过程nA.3 基本参考资料n 附录B(规范性)GSVML的DTD35 附录c(规范性)GSVML的XML模式53参考文献. 95 I G/T 40419-2021 目。吕本文件按照GB/T1. 1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。本文件使用重新起草法修改采用ISO25720: 2009 personaUlescription1: , ,二P句句i丽牛毛三户 !写巳丁子o.一lt_i?:吧iOnaldb旷-EH*1:. . Y,.WJ 3-3 E才1eno
3、tyr妃:_description G 1 九pheno仰,-dbref由*1呻1:L.7:_ v 00 :忡eno仰obab血可l |ind时annotation叶三D3ijji-:把1但1吧!如a一:!r 0I O -, :=-on1囚。申,ressionobal曲:i.对omiesdbref甲*1县一一一一一-,一-工工工飞异O l Jm叩ess风condition_ descr午1: _ _:,;-irmett c叫itio也-c工3-:吧-esSlon-,M叫K三=:a-十: =: = = = = = = = = = = = = = = = = = .;.二一一-一-,十一一-一-一
4、-,0 O !-i些TtlF一旦叫_J!:哇哇哇哇哇已引oo 图14GSVML的详细结构15 G/T 40419-2021 :. _ _ disease d出cnotionI+l mbm3 日vllJUU吁J:-一一一-i3-1-1 : 飞刀, -_ dise仰自-c-:-:-:dise平吧idem白?FYPLFj23-1: ._、-ov二oL-iJ5me-dM申*1O -:习吨tivefi血gs$-(三symptoms$ :i-山i= = = =:.7=: . ,- .laborary_fir咖p日1_1-1 : 句二百S.,.:I-: . f自tholog阳Undings曰:叫3-1-4三
5、乓;-,;-江以tkhhd;Ei-中三三兴,-二;二二;二二二;二-JJ|灿cli巾lin川川阳n川nica比ica川a.-.,-. L-j豆豆再乎乎?些传-(=曰: - f坦mily_ histOlY曰一-!3-1-6 ! 0. 理工工工二三工可今-.:,-飞:习阳E四ssm缸me咀en吃tres咀t:;斗-圣sess令号i虽ne也i白4Lii?一三三工卫Ej0. 0. :-i;二二二SSILt_db古国*1O 咽A* 机囚-u-v nd二O-r-u -nu- AU、UEn三0二UOahu-E au-EtE -O二-nHE -n二M三uva-UIM-E时川二二-4-pl-阳一一巳三主叶仨th
6、erapy$户一-!3-1-7! ijihh;品10比二ati斗n_dbrefI由*1图15GSVML的详细结构16 G/T 40419-2021 disease _ description lvHJO VLE -nI JAU 叫nv二S二-=-4-4-Eny-r-ELV-C-EI-呵。puw-nJ -o -u EI-nuu 工h叫PLU-AU -nu etiology _ description 3-1-1 -飞妇划U川川巳d由ti叫i1-扣币忖l十豆h忙-让哩la仇?:=J=l厅-二挝号l些iol旦9予罕Z三二巳哩4生!号哩?卫立1-工_.-工0 etioloIY _ expre臼ion-
7、probabili. iLEi-h-itu-1ii二占卜i五1-4! .-_ - - - - - - - -_.:-:. - - - -_.: - -_1 li0.;二i3-1-2斗(悦。/L一一一一-.-=三_1/ L-i,d吨nosb飞CI阳Iap / J-10. 3-1刁_ -1! H t!p p 1 -0-卢lr一一一一一一一一一一一iUi-)-ii豆豆liiiHL卫/ 1 : 1 / Jnprophylaxes由/。diagnostic _ standard -一r=J-!-!些卫os旦旦mOI虫草-Jo :;哩di誓旦旦巳兰ifferential月号:。,prophylaxes _
8、 description _:. prophylaxes_condition -工=:;1:O ._,二prophylaxes_expression-p呐;图16GSVML的详细结构symptoms _ description 3-1-2 一;有5ympmJondmjj飞二ro -,二symptoms_ expressiOl1-p 图17GSVML的详细结构17 G/T 40419-2021 3-1-3 3-1-4 3-1-5 18 laboratory _fndngs_type laboratory _fndings_ description lAlaborat川时ondltm1 。习lab
9、oratory_fi叫pathological_findings _ descrip J1pathologmLEndHIP -condmnli -:Jpathologlcal flndlngs expm complication _ description hcompllcatlon cOMItion, 。O -与COI11川川pressionrob. l 图17GSVML的详细结构(续)G/T 40419-2021 n, qd B -_:,. phenotype申!3-3! =1二= 0 t二cli伽Iin叫anno口I一O _a_ll1iILrn_e.ll1_h.er_ _c O 二141
10、11!LF!11气寸二怜criptlOn仕三三:BiO relation structure . 允许循环描述: 3-1 x三三日-Xa!ILIi旦?L9_r!._*1 吼一GSVML的详细结构图18responder_sidejfects _ d邸np.l豆豆豆豆豆豆叶巳主运豆豆nd豆豆苦ii。Ol斗二哥哥n。- :s 也sur些fElo -:三radi注i-:仨-飞-. . O GSVML的详细结构图1919 GSVML的XML模式见附录C。GSVML的DTD和XML模式GSVML的DTD见附录B。6 G/T 40419-2021 附录A(资料性)GSVML开发情况说明A.1 GSVML开
11、发需求分析当前医疗保健领域中存在多种不同类型的数据。随着后基因组时代的来伍,世界各国在产生临床数据和影像数据的同时,也产生了大量的基因组数据(见图A.U。对于基因组研究和基因组医学而言,基因组数据的管理变得越来越重要。而采用信息化方法对临床数据、影像数据和基因组数据进行管理已变得与基础性的湿实验(台式)研究一样重要。/ /Ill- 图A.1医疗保健领域中的主要数据类型目前世界各国存在多种组学数据有待用于人类健康领域。基因组数据包括基因组序列、DNA序列变异以及其他基于基因组的数据(如表达数据、蛋白组学数据、分子网络等)。本文件以DNA序列变异为切人点、并在DNA序列变异中选择SNP为核心对象的
12、原因有以下三个方面:a) SNP是研究最多的、与人类健康相关的序列变异;b) 全世界存在大量以各种数据格式表示的SNP数据,有待用于药物发现、白床诊断和临床研究;c) SNP数据已对基因医学和药物基因组学等在人类健康中的应用产生了巨大影响。当前的观点认为SNP是了解人体对外部剌激(如外来入侵、治疗措施以及人体与环境之间的相互作用等)产生反应的关键。外来入侵的典型案例是细菌感染,不同的个体对细菌感染的反应各不相同。从治疗的角度,不同的患者对药物的副作用是不同的,不同环境下对外来入侵的反应也是不同的。基因组序列变异数据在持续增加,相应的基因组序列变异注释信息也在不断增加,并填补了信息空白。SNP数
13、据就是典型案例。基因组序列变异数据的处理缺乏标准化的数据格式。为了对世界各国积累的SNP数据进行利用,应制定SNP数据交换标准,内容包括数据格式定义和信息交换等。置标语言是满足这一要求的合理选择。置标语言是对文本进行标记时使用的一套符号及其使用规则。标准通用置标语言CStandard Gen-eralized Markup La吨uage,SGML)是第一个标准化的置标语言,与Unix系统提供的troff及nroff文本布局语言极其相似。超文本置标语言CHypertext Markup La吨uage,HTML)是建立 在SGML基础之上的。可扩展置标语言CExtensibleMarkup L
14、a吨uage,XML)是SGML的精简本, 专为Web文档而设计。XML是可扩展的HTMLCXHTML)、无线置标语言CWireless Markup La吨uage,WML)的基础,也是诸如简单对象访问协议CSimple Object Access Protocol, SOAP)之类的系统交互协议进行标准化定义的基础。与此相反,文本布局或文本语义与大多数文字处理文件格式一样,通常是以纯机器可20 G/T 40419-2021 读形式进行定义的。以XML为基础的生物医学领域置标语言已发展了几十年,用于加强研究人员之间的数据交换。生物信息序列置标语言CBioinformaticSequence
15、Markup Language, BSML)、系统生物学置标语言CSystems Biology Markup Language, SBML)、细胞置标语言CCell Markup Language, Cell ML)、神经置标语言CNeuroMarkup Language, Neuro-ML)都是置标语言的范例。多态性挖掘与注释程序CPolymorphism Mining and Annotation Programs, PolyMAPr)是以SNP为中心,并尝试通过编程对诸如单核昔酸多态性数据库CdbSNP)、癌症基因剖析工程CCancerGene Anatomy Project, CGA
16、P)和日本单核昔酸多态性(Japanese Si吨leNucleotide Polymorphisms, SNP)之类的公共数据库实现挖掘、注释和功能分析。上述各项置标语言都曾被用于处理基因组信息,并开发了相应的程序。但一直没有开发以基因组序列变异为中心的置标语言。GSVML是第一个以为人类健康服务为准则、以基因组序列变异为中心的置标语言。其所有的需求和规定都源于这些方向。首先,GSVML应能够对基因组序列变异数据(如等位基因、类型、部位、长度和区域)进行可共享的表示。这些表示还应扩展应用到其他可能的序列变异数据。其次,因为诸如变异相关基因、个体序列、实验分析之类的变异注释对于理解基因组序列变
17、异的基本原理和情况至关重要,多以为了理解变异的临床意义或在临床中使用,就有必要根据诸如临床观察、表型之类次要的变异注释确定变异的含义。考虑到SNP是经过深入研究的一种多态性,并对人类健康和应对措施影响很大,因此可认为GSVML最有可能成为指定的人类健康置标语言。实际应用于人类健康的应用程序应能处理直接或间接的SNP注释。直接的SNP注释是指通用注释信息(如与SNP相关的基因和试验准备),间接的SNP注释是指源于SNP变异的所有组学数据和临床数据。这些附加信息有助于理解每位患者基于基因的临床情况。考虑到增加多种附加信息的要求,所以GSVML的开发与标准化不可能独立进行,需要与其他国际标准制定组织
18、(如HL7)进行协调。GSVML旨在用于与人类健康相关的数据交换消息,因此GSVML的开发与标准化过程中应时刻关注患者安全、临床效果和医疗费用。从信息视角看,保护患者信息对于患者安全很重要。简单易懂对于提高临床效果很重要。适应能力和方便安装对于降低医疗费用很重要。GSVML试图通过提供可共享的基于XML的数据交换格式来满足这些基本需求。GSVML可用于在各种数据类型之间进行临床基因组序列变异数据交换。在更高层次的临床数据标准化框架中,GSVML起到描述基因组序列变异数据及其必要信息的作用。A.2 GSVML开发过程GSVML的开发过程有如下8个步骤。步骤1.根据对用例的调研设置元素和需求。一一
19、步骤2:构建基本结构和DTD。步骤3.调研现有的生物学置标语言及其对需求的适用性,并与MAGE-ML、BSML、SBML、RNAML、ProML、CellML,PolyMAPr等进行比较。一一步骤4.细化基本结构和DTD,构建XML模式CXMLSchema、XSD)。步骤5.调研现有的SNP数据库,并对其数据格式进行比较。一一步骤6.检查HL7基因型模型的接口能力。步骤7:细化GSVML的需求及其所需的元素。步骤8.细化基本结构、DTD和XML模式。图A.2给出了GSVML的开发过程框架。其中,GSVML是与HL7白床基因组学特别兴趣小组C Health Level Seven Clinica
20、l Genomics Special Interest Group, HL7 CG SIG)联合开发的。设计工作与标准化过程之间曾有多次反复的过程。21 G/T 40419-2021 需求分析与定义共享格式的提取其他可考虑的数据格式消息传输设计GSVML设计TSO标准化过程(验证与理由)用例分析需求分析数据格式多样性调查消息传输案例分析数据库模式分析未来愿景(可扩展性)应用假设与HL7CGSlG合作设计工作反馈图A.2GSVML的开发过程框架A.3 基本参考资料A.3.1 概述本条列出了开发GSVML的参考资料和一份并不详尽的、普适性最强的基本参考资料清单。对于具体的主题,也会提供其他普适性较
21、差的相关文档。A.3.2 用例分析A.3.2.1 通则本文件总结了人类健康中基因组序列变异数据交换的典型用例,具体位置用于SNP数据交换的兰类准则的六个用例。a) 类型1:白床实践应用第一类用例是临床实践。在该用例中,SNP数据是在设施与临床专家之间进行交换。用例1.遗传诊断或遗传咨询在遗传诊断或遗传咨询中,SNP数据是在医学专家、实验室技术人员和咨询人员之间进行交换。这种情况中,个体的SNP数据应与其临床数据一起发送/接收。更先进的诊断还会要求增加个体的基因组数据(包括组学数据)。用例2:药物基因组学处方在药物基因组学处方中,SNP数据在大多数情况下不会进行交换。交换的数据应是处方、理由及其
22、注释。这种情况中,个体的SNP数据不与其处方结果一起发送/接收。用例3.基因疗法在基因疗法中,SNP数据是在医院、其他设施、医学专家和患者之间进行交换。这种情况下,个体的SNP数据应与其临床数据和基因组数据一起发送/接收。用例4.基于个体多态性的疾病预防在基于个体多态性的疾病预防中,SNP数据是在医学专家和实验室技术人员之间进行交换。这种22 G/T 40419-2021 情况中,个体的SNP数据应与其临床数据一起发送/接收。b) 类型II:白床试验应用在临床试验中,SNP数据是在医院、研究机构、医学专家和制药公司之间进行交换。这种情况中,个体的SNP数据应与其临床数据和用于详细说明实验所需的
23、其他数据一起发送/接收。所需的临床数据取决于临床试验所处的阶段。早期临床试验阶段不需要很多个体,但需要很多参数,而在后期的临床试验阶段则相反。c) 类型皿:转化研究应用在转化研究中,SNP数据是在医院、研究机构、医学专家、研究人员和制药公司之间进行交换。这种情况中,个体的SNP数据应与其临床数据和用于详细说明实验说明所需的其他数据一起发送/接收。所需的临床数据元素数量将是几十个,而每个个体有很多参数。A.3.2.2 临床应用场景说明图A.3是GSVML在临床应用场景中的通用用例。通过GSVML,每个执行者都可以顺利地交换数据,而不需改变其现有的数据库模式。同样,研究人员也可以轻松地交换基因组序
24、列变异数据。例如,在遗传诊断中,个体的SNP数据是在诸如医院和医学实验室之类的设施之间进行交换。这些数据也在医学专家、实验室分析人员、咨询人员以及在某些情况中的患者本人之间进行交换。其中,个体的SNP数据应与其临床数据和某些情况中的组学数据封装在一起用于进一步的检查。为了分析个体的SNP数据,就需要将个体的SNP数据与派生于SNP数据但具有不同类型数据格式的数据库进行比较。口工门。3实验室分析入员(医学专家 GSVML 仲I 咨询人员l !n 图A.3通用用例框架示例A.3.2.3 用例和必备元素在对用例和必备元素进行总结前,应列出对GSVML的需求应考虑的因素(见图A.4)。23 GB/T
25、40419-2021 用例 转化研究(包括分析研究阶段 临床试验(人体试验) 临床实践(遗传诊断、基因疗法等 参与方 数据准则 变异数据(等位基因、类型、部位、长度、区域) 直接注释(相关基因、实验分析 间接注释(组学、l临床、环撞)图A.4对GSVML的需求应考虑的因素本文件考虑了用例、参与方和数据准则的因素。对于用例,本文件主要考虑以下三个因素:a) 转化研究(包括分析研究阶段); b) 白床试验(人体试验); c) 白床实践(遗传诊断、基因疗法等)。对于参与方,本文件考虑了用户和执行者。对于数据,本文件根据下列准则对其进行分类:a) 变异数据(等位基因、类型、部位、长度、区域); b)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GBT 40419-2021 健康信息学 基因组序列变异置标语言GSVML GB 40419 2021 健康 信息学 基因组 序列 变异 标语 GSVML
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。