SN∕T 4714-2016 DNA条形码数据库技术规范(出入境检验检疫).pdf
《SN∕T 4714-2016 DNA条形码数据库技术规范(出入境检验检疫).pdf》由会员分享,可在线阅读,更多相关《SN∕T 4714-2016 DNA条形码数据库技术规范(出入境检验检疫).pdf(38页珍藏版)》请在咨信网上搜索。
1、书 书 书中华人民共和国出入境检验检疫行业标准犛犖犜 犇犖犃条形码数据库技术规范犜 犲 犮 犺 狀 犻 犮 犪 犾狊 狆 犲 犮 犻 犳 犻 犮 犪 狋 犻 狅 狀犳 狅 狉犇犖犃犫 犪 狉 犮 狅 犱 犲 狊犱 犪 狋 犪 犫 犪 狊 犲 发布 实施中华人民共和国国家质量监督检验检疫总局发 布书 书 书前言本标准按照 给出的规则起草。本标准由国家认证认可监督管理委员会提出并归口。本标准起草单位:中国检验检疫科学研究院、国家质量监督检验检疫总局信息中心、中华人民共和国广东出入境检验检疫局、中国科学院微生物研究所。本标准主要起草人:蒋弘山、张燕平、雷荣、岳巧云、马骏、陈克、刘力。犛犖犜 犇犖犃条
2、形码数据库技术规范范围本标准规定了条形码的分类代码、实体编码、属性数据的结构、数据库构建、运行与维护等技术规范。本标准适用于指导检疫性有害生物条形码数据库建设及数据交换。规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 中华人民共和国行政区划代码 医学媒介生物标本编码规范术语和定义下列术语和定义适用于本文件。 犇犖犃条形码犇犖犃犫 犪 狉 犮 狅 犱 犲生物体内能够代表该物种的、标准的、有足够变异的、易扩增的特征片段。 候选基因犮 犪 狀 犱 犻 犱 犪 狋 犲犵 犲 狀
3、犲 狊使用条形码进行物种鉴别时供选择的基因。理想的候选基因具有如下特点:种间遗传距离显著大于种内遗传距离,且重叠区小或无。常用的候选基因有线粒体细胞色素氧化酶亚基()基因、序列、质体 序列、叶绿体 序列等。 聚合酶链式反应狆 狅 犾 狔犿犲 狉 犪 狊 犲犮 犺 犪 犻 狀狉 犲 犪 犮 狋 犻 狅 狀犘犆犚一种分子生物学技术,用于扩增特定的片段。在该反应中,使用与目的序列互补的寡核苷酸作为引物,进行多轮的合成。其中包括变性,引物退火和在聚合酶催化下的合成。 测序实验信息狊 犲 狇 狌 犲 狀 犮 犻 狀 犵狉 狌 狀犻 狀 犳 狅 狉犿犪 狋 犻 狅 狀测定条码相关的包含扩增引物、测序引物、
4、实验流程、测序时间、测序机构、测序原始峰图等的信息。 凭证标本狏 狅 狌 犮 犺 犲 狉狊 狆 犲 犮 犻 犿犲 狀具完备的采集、鉴定信息(采集人、日期、地点、生境、鉴定人、种名等) ,用于物种复核、引证、溯源并永久保存的标本(或腊叶标本) 。犛犖犜 参考物质狉 犲 犳 犲 狉 犲 狀 犮 犲犿犪 狋 犲 狉 犻 犪 犾某些具有确定含量或组分,在实际样品定量定性测定中用作计算被测物质的组分含量的直接或间接的参照标准的一类物质。 标本图片狊 狆 犲 犮 犻 犿犲 狀狆 犺 狅 狋 狅 犵 狉 犪 狆 犺反映标本形态学信息的图片,包含宽度、高度、文件类型等信息。 分类学信息狋 犪 狓 狅 狀 狅犿
5、狔犻 狀 犳 狅 狉犿犪 狋 犻 狅 狀由林奈分类法界定的包括界、门、纲、目、科、属、种的分类学信息。 分布地点犱 犻 狊 狋 狉 犻 犫 狌 狋 犻 狅 狀狊 犻 狋 犲包括经度、纬度、海拔的位置集合。 机构代码犻 狀 狊 狋 犻 狋 狌 狋 犻 狅 狀犮 狅 犱 犲用于唯一标识检疫系统内部机构或与检疫相关的组织机构的位数字代码。 数据库犱 犪 狋 犪 犫 犪 狊 犲按照数据结构来组织、存储和管理数据的仓库。 服务器狊 犲 狉 狏 犲 狉也称伺服器。通常指一个管理资源并为用户提供服务的计算机软件,分为文件服务器、数据库服务器和应用程序服务器等。运行以上软件的计算机或计算机系统也被称为服务器。
6、 犇犖犃(犱 犲 狅 狓 狔 狉 犻 犫 狅犖狌 犮 犾 犲 犻 犮犪 犮 犻 犱)脱氧核糖核酸。 犆犗(犮 狔 狋 狅 犮 犺 狉 狅犿犲犆狅 狓 犻 犱 犪 狊 犲)线粒体细胞色素氧化酶亚基,为最常见的条形码基因。 犐 犜犛(犻 狀 狋 犲 狉 狀 犪 犾狋 狉 犪 狀 狊 犮 狉 犻 犫 犲 犱狊 狆 犪 犮 犲 狉)核糖体转录间隔区,常作为植物的条形码基因。 犅犗犔犇(犫 犪 狉 犮 狅 犱 犲狅 犳犾 犻 犳 犲犱 犪 狋 犪)生命条形码系统,总部设在加拿大的全球最大的条形码数据库系统。 犖犆犅 犐(狀 犪 狋 犻 狅 狀 犪 犾犮 犲 狀 狋 犲 狉犳 狅 狉犫 犻 狅 狋 犲 犮
7、 犺 狀 狅 犾 狅 犵 狔犻 狀 犳 狅 狉犿犪 狋 犻 狅 狀)美国国家生物技术信息中心。 犈犚(犲 狀 狋 犻 狋 狔狉 犲 犾 犪 狋 犻 狅 狀 狊 犺 犻 狆犱 犻 犪 犵 狉 犪犿)实体关系图,用于设计数据库系统的一种图形表示。犛犖犜 数据编码规则 基本内容条形码数据主要包含如下数据实体:)样本标本;)参考物质;)条形码;)数字影像。 编码规则 总则数据编码由数据分类和数据属性两部分组成,具体规定为:起始为表示数据分类的字母编码,之后为对应的数据属性编码。两部分之间通过“”号连接。 分类的表示表分类的表示第位检疫类群编码 对应英文第位实体类型编码 对应英文第位获取方式编码 对应英
8、文昆虫 样本标本 采集 线虫 参考物质 截获 蜗牛 条形码 提取 杂草 数字影像 双端测序 细菌 单端测序 真菌 克隆测序 病毒 数字照相 啮齿动物 显微照相 节肢动物 未知 动物 植物 原生生物 非检疫真菌 古菌 犛犖犜 表(续)第位检疫类群编码 对应英文第位实体类型编码 对应英文第位获取方式编码 对应英文 非检疫细菌 色藻 未知 第位检疫类群的说明(参考 : 中的物种分类) : 、昆虫()表示检疫性有害的昆虫纲物种; 、线虫()表示检疫性有害的线虫动物门物种; 、蜗牛()表示蜗牛等检疫性有害的软体动物门物种; 、杂草()表示检疫性有害的植物物种; 、细菌()表示检疫性有害的细菌界物种; 、
9、真菌()表示检疫性有害的真菌界物种; 、病毒()表示检疫性有害的病毒界物种; 、啮齿动物()表示能够传播疫病的媒介生物中的啮齿目物种; 、节肢动物()表示能够传播疫病的媒介生物中的节肢动物门物种; 、动物()表示除传统检疫类群之外的属于动物界的物种; 、植物()表示除传统检疫类群之外的属于植物界的物种; 、原生生物()表示除传统检疫类群之外的属于原生生物界的物种; 、非检疫真菌()表示除传统检疫类群之外的属于真菌界的物种; 、古菌()表示除传统检疫类群之外的属于古菌界的物种; 、非检疫细菌()表示除传统检疫类群之外的属于细菌界的物种; 、色藻()表示除传统检疫类群之外的属于色藻界的物种;第位实
10、体类型的说明: 、样本标本指通过野外采集或者口岸截获得到的生物样本或生物标本; 、参考物质主要指核酸、菌液或者克隆载体等用作定性的标准参考物质; 、条形码指像条形码一样能够唯一标识生物所属物种的特征片段; 、数字影像指用做形态学特征存档用的数字图片或视频,常用于构建数字图书馆;第位获取方式的说明: 、采集指科学考察类的野外采集; 、截获指口岸检疫过程中截获; 、提取指通过物理化学方法提取; 、双端测序指通过正链和反链两个方向对片段进行测序; 、单端测序指仅通过正链一个方向对片段进行测序; 、克隆测序指通过构建 载体将待测片段插入载体再测序,它通常比用扩增得到的序列更可靠; 、数字照相指通过数码
11、相机进行照相; 、显微照相指通过带有照相功能的高倍显微镜照相;第、位合法的编码组合有:、 、。犛犖犜 属性的表示编码格式: (格式名称) 属性编码。其中,由圆括号包含的“格式名称”为可选项(不指明时采用默认格式) ,表示属性编码所采用的国家标准或行业标准的名称,如: ( )和( ) 。 默认的属性编码格式 采集标本的属性编码格式:采用与 相兼容的规范,其格式为:类群标本序号采集地点采集日期保存地点物种名。以下为具体的格式说明:)类群用该类群的英文名称的首三位的缩略语大写字母表示;)标本序号直接用数字表示,为该类生物的流水号,位数为位;)采集地点由表示地区的两位国家代码(参见附录)加不含前导零的
12、地区区号以及表示具体地名的英文组成(具体地名的拼写采用每个单词的首字母为大写,其他字母均为小写的命名方式,即大骆驼(, )命名方式,如无具体地点,用表示) ;如果采集地点在国内,亦可以采用位行政区划代码(参见 )具体的采集地全小写英文名表示,如:采集地在辽宁朝阳凤凰山,则表示为 ;)采集日期的格式为;)保存地点为我国检疫机构的,用其对应的位检验检疫机构代码表示,参见 ;保存地点非我国检疫机构的,用“”位国家代码“ ”或“ ”位国家代码“ ”表示,参见附录。如:广东中山出入境检验检疫局为 ,葡萄牙某机构用 ;)物种拉丁名称的拼写采用大骆驼命名方式。示例: 年月日在广东中山(国家代码,区号 )小榄
13、采集的鉴定为红头丽蝇的第号蝇类保存在中山局的标本编号为: ,或者 示例: 年月 日在北京(国家代码,区号 )房山采集的鉴定为褐家鼠的第号鼠类保存在中山局的标本编号为: ,或者 。示例:纪录号为 的在 年月 日在葡萄牙( ,国家代码)里斯本( ,区号 )采集的第号红头丽蝇保存在 (非检疫机构代码 )的样本编号为: 。 截获标本的属性编码格式:采用 ,其格式为:类群标本序号国家(起运港口) 截获口岸截获日期保存地点物种名。为了便于整体说明,将其中对截获标本的编码格式摘要如下:)类群用该类群的英文名称的首三位的缩略语大写字母表示,与 )同;)标本序号直接用数字表示,为该类生物的流水号,位数为位,与
14、)同;)用国家或地区的电话直拨代码位国名缩写代替,具体参见附录;)起运港口用该港的英文名起运港类别携带工具类别表示。 起运港类别:海港为( ) ,空港为( ) ,陆港为( ) 。 携带工具:船舶为( ) ,飞机为( ) ,火车为( ) ,集装箱为( ) ,行李为( ) ,邮包为( ) ,货车为( ) 。如:剑桥港的英文为 ,表犛犖犜 示为( ) ,无法确定起运港着用()表示。海港船舶为() ,空港飞机为() ,海运集装箱为() ,陆运火车为() ,陆运货车为() 。)截获口岸用该口岸或者办事处检验检疫局的统一机构代码(参见附录)表示,如:中华人民共和国樟木出入境检验检疫局的业务代码为 ;)截获
15、日期的格式为,与 )同;)保存地点用保存所在地检验检疫机构业务代码(参见附录)表示,与 )同;)物种拉丁名称的拼写采用大骆驼命名方式。示例:如于 年月日在西藏樟木口岸截获的装载港为英国剑桥陆港的蝇类鉴定为红头丽蝇的第号标本,保存地点为广东中山局(代码 ) : () 。示例:如于 年月日在湖南检验检疫局湘西局(代码: )截获的来自英国海港无法确定准确来源地区的蝇类鉴定为红头丽蝇的第号标本,保存地点为广东中山局(代码: ) : () 。 未知标本的属性编码格式:其格式为:类群标本序号保存日期保存地点物种名。)类群用该类群的英文名称的首三位的缩略语大写字母表示,与 )同;)标本序号直接用数字表示,为
16、该类生物的流水号,位数为位,与 )同;)保存日期的格式为,与 )同;)保存地点用保存所在地检验检疫机构业务代码(参见附录)表示,与 )同;)物种拉丁名称的拼写采用大骆驼命名方式。 参考物质的属性编码格式:类别物质序号送样机构收藏日期保存地点物种名)类别:蛋白质为,核酸为,菌株为,病毒粒子;)物质序号直接用数字表示,为该类物质的流水号,位数为位:)送样机构用送样单位的检验检疫机构业务代码表示;)收藏日期的格式为,与 )同;)保存地点用保存所在地的检验检疫机构业务代码表示;)物种拉丁名称的拼写采用大骆驼命名方式。示例:如于 年月日由中科院植物所送样的病毒粒子,被鉴定为黄瓜花叶病毒的第号参考物质,保
17、存地点在中国检验检疫科学研究院: 。 犇犖犃条形码的属性编码格式:基因编码序号区域(正向引物,反向引物) 测序日期测序地点)基因编码见表。表基因编码表条形码基因双字母英文名线粒体基因 叶绿体 基因 叶绿体 基因 犛犖犜 表(续)条形码基因双字母英文名叶绿体 基因 核糖体基因间区 细菌 核糖体基因 其他基因 )序号直接用数字表示,为条形码的流水号,位数为位;)区域为:、等;)引物序列为编码的字符串;)测序日期的格式为,与 )同;)测序地点用测序所在地的检验检疫机构业务代码表示。示例:如于 年月日由中国检科院(双向)测序的细菌 基因的、区,正向引物为 、反向引物为的第号条形码数据: (,) 。 数
18、字影像的属性编码格式:文件格式序号拍摄日期拍摄地点物种名)文件格式包括: 、 等;)序号直接用数字表示,为该格式文件的流水号,位数为位;)拍摄日期的格式为,与 )同;)拍摄地点用拍摄所在地的检验检疫机构业务代码表示;)物种拉丁名称的拼写采用大骆驼命名方式。示例:如于 年月日在中国检科院拍摄的红头丽蝇的第号标本,文件格式为 : 。数据库建设 流程数据库建设的基本流程为:)确定数据库建设总体目标;)进行户调查和需求分析;)进行数据库的总体设计和详细设计(包括概念设计、功能设计、逻辑设计、物理设计和安全设计等) ;)根据设计要求建立集成化软硬件环境;)创建库体结构,开发功能模块;)将各种数据在经过入
19、库检查和数据处理后加载到数据库中,并进行数据集成和功能集成;)系统测试、数据库验收。在建设完成后开始数据库的运行、服务和维护、更新。具体建库流程如图所示,其中数据准备是数据库建设的重要组成部分,所生产的数据应符合有关的技术规定,并满足数据库建库的要求。犛犖犜 图犇犖犃条形码数据库建库流程 系统设计 需求分析需求分析包括以下:)采集标本方面:为了有效测定遗传多样性,以便精确地进行物种分类和物种鉴定,每个物种需要采集多个标本(通常为 个个体) ,对于凭证标本还需要记录馆藏信息,以便发生争议时能够追根溯源;)参考物质方面:需要记录馆藏信息、保藏条件等,以便发生争议时能够追根溯源;)条码基因方面:根据
20、测序数据和进化分析的结果确定理想的候选基因或者基因组合,需要记录用扩增条码基因区序列所需要的正反向引物序列、扩增反应条件等;)数字标本库方面:按照标本数字化制作规范建立数字图片,同时记录对应的物种信息;)物种鉴定的需求:作鉴定时将未知样本的条码信息与已知物种的条码信息进行序列比对,确定可能的物种鉴定结果,并给出统计显著性计量。做数据库设计时,需要记录实验信息、原始数据、相关负责人、时间、地点等信息,并且实现信息的分级管理。从数据安全的角度考虑,除了需要设计用户登录认证机制,还需要对关键数据进行版本管理,以便在误操作之后能够恢复正确数据。 质量要求数据库中的数据应满足如下要求:)完整性:数据库中
21、的数据不应有遗漏和重复,数据集之间关系应完整,尽量减少冗余,不同类型的数据和数据集之间的集成关系应当完全正确。)逻辑一致性:实体类别、数据结构、属性及各要素间的关系应保持一致;数据项的取值应在值域的界定范围内;数据存储应与数据集物理结构及规定格式保持一致。)属性准确性:实体的属性项及其名称、类型、长度、顺序和值应完整正确。)现实性:应按需求定期或及时对数据进行更新,保持数据的现实性,相关属性中应包含时间标识。犛犖犜 DNA条形码数据库建设DNA条形码数据库 概念模型设计采用自底向上的概念设计方法进行条形码概念设计,即先抽象形成局部概念设计,再集成局部设计形成总体概念设计视图。首先对条形码相关的
22、各类数据进行归类、抽取;其次确定局部应用中的实体、属性、实体编码;最后确定实体之间的联系及其类型。条形码数据实体及属性主要包括:)样本(标本)实体:基本属性包括样本编码(编码方式见“ 采集标本的属性”和“ 截获标本的属性”中的编码规定) 、林奈分类信息、采集(截获)日期、采集地(截获口岸) 、保存地点等,扩展属性包括鉴定者、采集者(截获人) 、组织类别(肌肉组织等) 、组织类型(冰冻、福尔马林浸泡等) 、性别、所属生命期、寄主信息等;)参考物质实体:基本属性包括物质类型(核酸、菌种) 、送样机构、收藏日期、保存地点,扩展属性包括保藏条件(温度、湿度、营养液等)等;)条形码实体:基本属型包括条码
23、基因名称、正反向扩增引物、条码核酸序列等,扩展属性包括测序实验信息,如测序时间、测序机构、测序原始峰图等;)数字影像实体:基本属型包括所属物种、文件格式( 、等) 、宽、高,扩展属性包括对应样本标识、拍摄者、拍摄时间、拍摄地;)用户实体:基本属型包括用户名称、口令密文、姓名、单位代码、电子邮件地址。依据条形码数据实体及属性确定实体关系图(图) ,如图所示:图犇犖犃条形码数据库基本实体关系图其中属性数据类型表示为:( )文本类型,( )日期类型,( )字符类型,( )数字类型。用户对样本、条形码、参考物质以及数字影像的管理权限可以通过相应的关联表来控制。通过增加“项目”表,还可以以项目为权限控制
24、单位来组织对各类实体的管理。通过增加版本属性或时间戳属性的方式还可以实现版本控制。 功能设计 数据展示可通过条形码信息系统进行可视化的条形码数据管理,具有图形、图像的缩小、放大和犛犖犜 TTT 用户名称口令密文姓名单位代码电邮地址CTD 参考物质物质类型送样机构收藏日期保存地点TTDT 样本样本编码物种分类采集日期采集地保存地点T T T T TT#T 数字影像物种分类文件格式宽高链接地址DNA条形码基因名称T正向引物T反向引物T核酸序列T漫游等浏览功能。 输入输出输入功能包括对入库数据的批量导入、检查和确认;输出功能包括对相应数据的 报表输出,用于数据交换。 查询统计根据查询条件,可以对各类
25、样本的数目进行统计,给出直方图、饼图等类型的统计。如可以查询某个时间段截获的某类有害生物的统计信息。 数据管理可以对样本、条形码、参考物质、数字影像等信息进行管理,根据用户对相应实体的访问权限赋予增、删、改的操作功能。 数据维护具有直接编辑或批量导入等方法实现数据更新的功能。比如外源数据库( )中数据的成批导入。 历史数据管理提供可选的加注时间标识或版本顺序号的方式,来实现版本控制,实现历史数据的建立、删除、修改,以及历史数据的查询、统计和分析等功能。 安全管理具有用户管理、权限管理、日志管理、数据库备份和修复功能。数据库备份包括数据的备份和系统软件的备份。备份可采用全备份或增量备份方式,定期
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SNT 4714-2016 DNA条形码数据库技术规范出入境检验检疫 SN 4714 2016 DNA 条形码 数据库技术 规范 出入境 检验 检疫
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。