DB13∕T 2351.2-2016 标准文献结构化数据规范 第2部分:指标元数据(河北省).pdf
《DB13∕T 2351.2-2016 标准文献结构化数据规范 第2部分:指标元数据(河北省).pdf》由会员分享,可在线阅读,更多相关《DB13∕T 2351.2-2016 标准文献结构化数据规范 第2部分:指标元数据(河北省).pdf(23页珍藏版)》请在咨信网上搜索。
1、ICS 01.140.20 A 14 DB13 河北省地方标准 DB 13/T 2351.22016 标准文献结构化数据规范 第 2 部分:指标元数据 Structured data specifications of standard documents Part 2: Indicator metadata 2016 - 05 - 23 发布 2016 - 07 - 01 实施 河北省质量技术监督局 发 布 DB13/T 2351.22016 I 目 次 前言 . II 引言 . III 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 指标元数据的属性 . 2 5
2、指标元数据模型 . 2 6 技术指标元数据描述 . 3 7 指标元数据字典描述 . 10 8 指标元数据扩展原则和方法 . 10 附录 A(规范性附录) 标准文献指标元数据代码集 . 11 附录 B(资料性附录) 标准文献结构化指标元数据-字典描述 . 12 参考文献 . 17 DB13/T 2351.22016 II 前 言 本部分按照GB/T 1.1-2009给出的规则起草。 DB13/T 2351标准文献结构化数据规范包括了3部分: 第1部分:全文元数据; 第2部分:指标元数据 第3部分:元数据著录规则。 本部分是第2部分,本部分与第3部分配套使用。 本部分由河北省服务业标准化技术委员会
3、提出并归口。 本部分起草单位:河北省标准化研究院。 本部分主要起草人:马星晓、施健、卢艳芳、郭天强、闫志强、李建勋、谢燕、张园园、陈南、赵倩、安姣。 DB13/T 2351.22016 III 引 言 标准文献电子文档格式有DOCX、数字版PDF、扫描版PDF。在生产、科研和管理过程中,往往需要定位到标准内容、指标信息上,如:检索标准指标、指标比对及标准水平分析等。但是,现有的标准文献电子文档为非结构化文档,这一特性决定它的内容检索指向性笼统模糊,故而,以非结构化文档为单元存储无法实现小颗粒度的指标数据的检索、 比对分析。 只有通过数据处理将非结构化文档转换为结构化或半结构化文档方能解决上述问
4、题。 为寻求上述瓶颈的突破,河北省标准化研究院在2012年将标准文献结构化列为重点科研项目,在此基础上,2013年又承担了国家标准化委员会标准化信息中心的“双打”重点产品标准文献结构化内容数据库项目,而实现标准文献结构化必须首要解决2个问题:1)结构化标准的数据结构问题,换而言之,标准结构化加工抽取出的数据是哪些数据?2)抽取出来的数据进行加工应符合什么样的数据规范要求,方能满足与原始标准文本内容的一致性的需求。 解决第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现; 解决第二个问题,需要建立数据的著录规则,实现数据的规范性。 项目组在确定文献结构化抽取技术的基础上,对4000余
5、项强制性国家标准的内容要素逐一进行了分析研究、归纳总结后,按UML思想确定了标准结构化数据模型,并在工程上对4000余项强制性国家标准进行了结构化数据的抽取验证,确定了结构化元数据。通过验证测试,逐步完善了加工抽取结构化数据的规范要求,形成了标准文献结构化数据规范。 目前,在行业内广泛使用的GB/T 22373-2008标准文献元数据是针对标准文献题录的元数据标准,侧重的是标准文献形式特征,而此次制定的标准文献结构化数据规范是关于标准内容结构化的全文元数据和指标元数据规范,希望此两个标准的结合使用,实现标准文献信息资源的统一描述,促进标准文献信息资源的开发利用。 DB13/T 2351.220
6、16 1 标准文献结构化数据规范 第 2 部分:指标元数据 1 范围 本部分规定了标准文献结构化技术指标元数据(以下简称指标元数据)的术语和定义、属性、数据模型、数据描述以及扩展原则和方法。 本部分适用于标准文献结构化数据的处理。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。 凡是注日期的引用文件, 仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 7408 数据元和交换格式信息交换 日期和时间表示法(GB/T 7408-2005,ISO 8601:2000,IDT) GB/T 18391.3-2009 信息技术 元数据注
7、册系统(MDR) 第3部分:注册系统元模型与基本属性(ISO/IEC 11179-3:2003,IDT) GB/T 19710-2005 地理信息元数据(ISO 19115-2003,MOD) GB/T 26816-2011 信息资源核心元数据 DB13/T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据 3 术语和定义 下列术语和定义适用于本文件。 3.1 信息资源 information resource 在政治、经济和社会等各领域产生和使用、具有各种载体形式的信息内容。 GB/T 26816-2011,定义3.1 3.2 元数据 metadata 定义和描述其他数据
8、的数据。 GB/T 18391.3-2009,定义3.2.18 3.3 元数据元素 metadata element 元数据的基本单元。 注:元数据元素在元数据实体中是唯一的。 GB/T 19710-2005,定义4.61 DB13/T 2351.22016 2 3.4 元数据实体 metadata entity 一组说明信息资源相关特性的元数据元素。 注:可以包含一个或一个以上元数据实体。 GB/T 19710-2005,定义4.71 3.5 核心元数据 core metadata 描述信息资源基本属性的元数据元素和元数据实体。 GB/T 26816-2011,定义3.5 4 指标元数据的属
9、性 本部分采用摘要表示的方法定义和描述标准结构化指标元数据, 摘要内容包括以下八个属性: 中文名称、英文名称、缩写名、定义、数据类型、值域、约束/条件、最大出现次数。 4.1 中文名称 元数据元素或元数据实体的中文名称,用第6章中各条的标题来表达。 4.2 英文名称 应符合DB13/T 2351.1-2016中4.2的规定。 4.3 缩写名 应符合GB/T 26816-2011中4.6的规定。 4.4 定义 应符合GB/T 26816-2011中4.2的规定。 4.5 数据类型 应符合GB/T 26816-2011中4.4的规定。 4.6 值域 应符合GB/T 26816-2011中4.5的规
10、定。 4.7 约束/条件 应符合GB/T 26816-2011中4.7的规定,约束/条件代码见DB13/T XXXX.1-2016附录A 表A.1。 4.8 最大出现次数 应符合GB/T 26816-2011中4.8的规定。 5 指标元数据模型 DB13/T 2351.22016 3 标准文献结构化指标元数据模型见图1。 +标准对象 : string+指标对象 : string+指标对象属性 : 指标对象属性+指标影响因素 : 指标影响因素+指标名称 : string+指标内容 : string+计量单位 : string+指标注 : string+表注 : string+试验方法 : str
11、ing-指标组ID : string+指标对象属性名称 : string+指标对象属性值 : string+指标对象属性类型 : string+指标影响因素名称 : string+指标影响因素值 : string+指标影响因素类型 : string+更新时间 : string+记录状态 : string+版本 : string+加工单位 : string+指标状态 : string+是否强制 : bool+指标类型 : string+指标性质 : string+标准号 : string+标准名称 : string+篇章条编号 : string+表号 : string+表名 : string10
12、.*10.*11.*+标识符 : string+技术指标 : 技术指标+版本信息 : 版本信息+位置信息 : 位置信息+类别状态信息 : 类别状态信息111111.* 图1 指标元数据模型 6 技术指标元数据描述 6.1 技术指标元数据 中文名称: 技术指标元数据 英文名称: Technical Indicator Metadata 缩写名: TechIndMdata 定义: 描述结构化标准中技术指标数据的元数据。 数据类型: 复合型 约束/条件: M 最大出现次数: 1 6.2 标识符 应符合DB13/T 2351.1-2015中6.2的规定。 6.3 技术指标 中文名称: 技术指标 英文名
13、称: Technical Indicator 缩写名: TechInd DB13/T 2351.22016 4 定义: 描述标准质量特性指标的一组信息。 数据类型: 复合型 约束/条件: M 最大出现次数: 1 6.4 标准对象 中文名称: 标准对象 英文名称: document object 缩写名: docObj 定义: 描述一个实体的标准化活动的作用对象。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.5 指标对象 中文名称: 指标对象 英文名称: indicator object 缩写名: indObj 定义: 描述一个实体的质量特征的作用对象。 数据
14、类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.6 指标对象属性 中文名称: 指标对象属性 英文名称: Indicator Object Attribute 缩写名: IndObjAttr 定义: 描述指标对象特征、特性的一组信息。 数据类型: 复合型 约束/条件: O 最大出现次数: N 6.7 指标对象属性名称 中文名称: 指标对象属性名称 英文名称: indicator object attribute name 缩写名: indObjAttrNm 定义: 描述指标对象的特性、特征的名称。如:形状、颜色、气味、优劣、用途等都是指标对象的性质。 数据类型: 字符
15、串 值域: 自由文本 约束/条件: M DB13/T 2351.22016 5 最大出现次数: 1 6.8 指标对象属性值 中文名称: 指标对象属性值 英文名称: indicator object attribute value 缩写名: indObjAttrVal 定义: 描述指标对象属性的内容。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.9 指标对象属性类型 中文名称: 指标对象属性类型 英文名称: indicator object attribute type 缩写名: indObjAttrTyp 定义: 描述指标对象的类别。 数据类型: 字符串 值
16、域: 字典 约束/条件: O 最大出现次数: N 6.10 指标影响因素 中文名称: 指标影响因素 英文名称: Indicator Influencing Factor 缩写名: IndInfluFact 定义: 描述与指标数据有关的一组信息。 数据类型: 复合型 约束/条件: O 最大出现次数: N 6.11 指标影响因素名称 中文名称: 指标影响因素名称 英文名称: indicator influencing factor name 缩写名: indInfluFactNm 定义: 对指标数据产生有一定约束关系的因素名称。如:环境因素、测试方法、工具、工艺、作用对象等。 数据类型: 字符串
17、值域: 自由文本 约束/条件: M 最大出现次数: 1 6.12 指标影响因素值 DB13/T 2351.22016 6 中文名称: 指标影响因素值 英文名称: indicator influencing factor value 缩写名: indInfluFactVal 定义: 指标影响因素的具体内容描述。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.13 指标影响因素类型 中文名称: 指标影响因素类型 英文名称: indicator influencing factor type 缩写名: indInfluFactTyp 定义: 描述指标影响因素的类别。
18、 数据类型: 字符串 值域: 字典 约束/条件: O 最大出现次数: N 6.14 指标名称 中文名称: 指标名称 英文名称: indicator name 缩写名: indNm 定义: 描述实体质量特征属性的技术要求名称。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.15 指标内容 中文名称: 指标内容 英文名称: indicator value 缩写名: indVal 定义: 某项技术要求的具体内容描述。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.16 计量单位 中文名称: 计量单位 英文名称: indicator
19、measurement unit 缩写名: indMeasUnit DB13/T 2351.22016 7 定义: 技术要求的量值单位。 数据类型: 字符串 值域: 字典 约束/条件: O 最大出现次数: 1 6.17 指标注 中文名称: 指标注 英文名称: indicator note 缩写名: indNote 定义: 指标的注释。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: 1 6.18 表注 应符合DB13/T 2351.1-2015中6.17的规定。 6.19 试验方法 中文名称: 试验方法 英文名称: test method 缩写名: tstMethd 定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DB13T 2351.2-2016 标准文献结构化数据规范 第2部分:指标元数据河北省 DB13 2351.2 2016 标准 文献 结构 数据 规范 部分 指标 河北省
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
链接地址:https://www.zixin.com.cn/doc/161377.html