元数据标准化发展研究.pdf
《元数据标准化发展研究.pdf》由会员分享,可在线阅读,更多相关《元数据标准化发展研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、标准化研究Standardization Research2023 年第 9 期http:/25随着大数据技术的发展,万物皆可数,我们进入到物理世界和数字世界的双重世界,数据已经成为一种重要战略资源。元数据作为后数据时代治理管理数据的一种重要技术手段,面临如何建、如何管、如何用等问题,即如何通过元数据的建设研究推进数据产品化、服务化,推动全域数据上网上线,落地建设基于元数据的共享数据空间,促进数据搜索发现、有序流转,释放数据价值与活力,实现数据为战的目标。本文从元数据标准化建设的视角,分析比较国内外技术发展,提出发展思路和框架。1 元数据概述1.1 元数据概念与分类数据是客观事物的符号记录,是
2、信息的可再处理和解释的形式化表示,以适应于数据的通信、解释或处理。元数据是用来描述数据的数据,是对数据的更高层级抽象,是认识和管理数据的一种媒介和途径,其使用目的在于:识别资源、描述资源、评价资源、追踪资源等,实现数据资源的有效发现、理解、组织和管理等。数据反映了真实世界的对象、事件、活动和关系,而元数据则反映了数据的结构、特征、关系、管理等。在国际上,元数据的标准研究一直非常活跃,并随着数据建模、Web 互联网、大数据等技术的发展同步发展。2019 年 ISO 发布的 ISO/IEC 19583-1:2019 Information technology-Concepts and usage
3、 of metadata Part 1:Metadata concepts 中规定,根据元数据的功能不同,主要可以将元数据分为 3 类1-2。(1)结构元数据。在信息系统中负责数据管理的编辑:贾静宇E-mail:中国电子科技集团公司第二十八研究所1 全军大数据中心建设专项办公室2 军事科学院战争研究院3严 红1 穆志勇2 李明哲3 武志功1 王 静1 周 宇1Research on the Development of Metadata Standardardization摘 要 元数据作为后数据时代治理管理数据的一种重要技术手段,面临如何建、如何管、如何用等问题。为了促进元数据规范化建设发展
4、,有效提升元数据质量,介绍了元数据概念、分类和发展趋势,分析了国内外元数据技术标准化进展,提出了元数据标准体系的总体框架,并梳理元数据标准化发展重点和关键技术,以推进对数据的治理管理能力提升,从而提升数据的可发现、可访问、可理解、可互操作等能力。关键词 元数据 发展趋势 标准体系 总体框架Abstract:Metadataas an important technical means of governancing and managing data in the post-data eras,faces problems such as how to build,how to manage
5、and how to use it.In order to promote the standardized construction and development of metadata,effectively improve the quality of metadata,this paper introduces the concept,classification and development trends of metadata;analyses the standardization development of metadata technology at home and
6、abroad;and puts forward the overall framework,development priorities and key technologies of the metadata standardization development.So to promote the improvement of data governance and management capabilities,and improve the discoverability,accessibility,comprehensibility and interoperability of d
7、ata.Keywords:metadata;development features;standard system;overall framework元数据标准化发展研究标准化研究Standardization Research信息技术与标准化http:/26人所使用的元数据,用来描述数据的“容器”,例如,使用 SQL 数据库语言管理的数据库中的表和字段。(2)描述性元数据。其用于发现和识别内容的元数据,如图书管理员的元数据;有助于进一步描述其他数据的元数据,如科学家观察到的关于连续或系统产生的数据的元数据。(3)管理元数据。与数据值相关联的元数据,例如描述何时以及谁创建了数据的元数据,谁可
8、以编辑和管理数据,以及关于数据的任何其他有用信息,包括描述多媒体数据的元数据。本文从结构元数据、描述性元数据和管理元数据 3 个方面分析国内外元数据的技术和标准的发展。1.2 元数据技术发展趋势纵观国内外元数据技术发展,主要呈现以下发展趋势:(1)元数据是数据目标实现的关键。从美国 2009年启动开放政府数据,2014 年发布国家数据门户的元数据方案Project Open Data Metadata Schema v1.1,POD v1.1 3;欧盟 2014 年为推进其各国间不能交换元数据而形成“信息孤岛”发布了 DCAT-AP 等4,可以看出元数据是全球范围“开放政府数据”(Open G
9、overnment Data,OGD)的关键,同时也体现了元数据在实现其数据目标中的地位和作用。(2)元数据模型基于本体融合化发展。一是元模型逐步回归到本体,在 W3C 的溯源标准 PROV、元数据编目 DCAT 等标准中都基于本体扩展,如将数据对象作为实体,将对其的处理作为活动等;二是相互融合,在 DCAT 包含了 PROV 和质量元数据等,在 ISO/IEC 11179 系列标准中,增加第 7 部分面向数据集等,均体现了不同标准体系的互相借鉴和融合发展。(3)元数据互操作是瓶颈也是发展方向。目前看没有哪个元数据能解决所有问题,大多是在基础核心模型上扩展应用。元数据互操作问题,从早期的ISO
10、/IEC 19502:2005信息技术 元对象设施(GB/T 329132016信息技术 元对象设施(MOF)与其等同)5,到 W3C 的 DCAT,都在试图为元数据互操作提供解决方案。2 国内外元数据技术标准进展分析2.1 国外元数据技术标准进展2.1.1 结构元数据技术标准进展早期元数据主要集中在结构化数据的描述方面,元数据标准通常可以分为两类:一是专用的结构元数据标准。通常这类元数据标准与其描述的数据模型标准同步发布,如北约多边互操作性计划(Multilateral Interoperability Program,MIP)发布了联合指挥控制信息交换数据模型(Joint C3 Infor
11、mation Exchange Data Model,JC3IEDM)的同时,配套了元模型规范(JC3IEDM Metamodel);美国国土安全部和司法部共同实施的国家信息交换模型(National Information Exchange Model,NIEM)6-7,其结构域是一个规范其他域的描述方法,只是未明确说明是元数据。二是通用的结构元模型。此类标准是更抽象地描述这类元数据的模型规范,如国 ISO 发布的 ISO/IEC 11179-3:2013 Information technology-Metadata registries(MDR)Part 3:Registry metam
12、odel and basic attributes(规范了元数据注册表的概念模型是个 典型8。2.1.2 描述性元数据技术标准发展描述性元数据最早由都柏林元数据发展而来,并在各领域的派生发展,由此带来了元数据互操作问题,推进了 W3C 对元数据编目的标准发展。(1)都柏林元数据标准都柏林核心元数据集(Dublin Core Element Set,DC)由美国联机图书馆中心和美国国家超级计算应用中心于 1995 年 3 月联合发起9,目的是要建立一个广泛适用的元数据元素集,可以描述任何网络数据,方便在网络上存储、检索、传递和获取数据。都柏林核心元数据集是一个致力于规范 Web 资源体系机构的国
13、际性元数据解决方案,由于它定义了一个所有 Web 资源都应遵循的通用核心标准,其标准化研究Standardization Research2023 年第 9 期http:/27内容简单,比较通用,因此得到了其他相关标准的广泛支持。它已经成为 Internet 的正式标准(RFC 2413都柏林资源发现元数据)。(2)W3C 开放数据的元数据编目 DCATDCAT(Data Catalog Vocabulary)是 一 个 RDF 词汇表,最早(2010 年)是由爱尔兰国立高威大学的数字化企业研究所(Digital Enterprise Research Institute)开发。DERI 在对
14、美国、英国、澳大利亚、新西兰、爱尔兰、伦敦和旧金山 7 个数据开放平台的元数据进行分析后得出 DCAT 的初始框架。2012 年由 W3C的 政 府 关 联 数 据 工 作 组(Government Linked Data Working Group)的进一步完善,2022 年 7 月发布第 3版 DCAT 3。根据目前的 OGD 元数据标准,DCAT是最为广泛采用的元数据词表,美国和欧洲的标准均是基于 DCAT 来设计的,而英国和澳大利亚则将其作为标准的重要组成部分,支持 DCAT 的描 述10-11。2.1.3 管理元数据技术标准发展(1)溯源元数据标准溯源元数据模型目前也有多个标准:20
15、08 年,为了解决来源互操作性问题,首次提出开放溯源模型(Open Provenance Model,OPM)12;后 Provenir 模型采用基于本体的方法来表达溯源信息,使用 OWL-DL 来定义通用的溯源术语和关系13,Provenir 已经在生物科学、海洋、传感器和卫生保健中得到了广泛应用;2013 年 4 月溯源工作小组(Provenance Working Group,PWG)发 布 了 第 一 个 溯 源 标 准PROV14,成为全球互联网信息溯源规范的一个关键性里程碑。2017 年 我 国 家 发 布 GB/T 349452017 数 据溯源描述模型,定义了名为 ProVOC
16、(Provenance Vocabulary Model)数据溯源描述模型15。(2)质量元数据标准在 DCAT 标准中,以本体(即 RDF 词汇表)的形式建立元数据模型,修订版 DCAT 1.1 在原有本体的基础上,借鉴其他元数据)的一些做法,引入了新类和新属性,不仅融合了 W3C 溯源本体 PROV-O,还引入质量元数据。数据质量词汇表(DataQualityVocabulary,DQV)由 W3C“Web 数据最佳实践工作组”开发,为dcat:dataset 类补充 dqv:hasqualitymeasurement(质量测度)等属性,同时引入 dqv:qualitymeasuremen
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 标准化 发展 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。