1、 ICS 35.240 CCS L 72 15 内蒙古自治区地方标准 DB15/T 21042021 政务数据开放共享 元数据 Government data opening and sharing specificationMetadata 2021-02-26 发布 2021-03-26 实施 内蒙古自治区市场监督管理局 发 布 DB15/T 21042021 I 前言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。 本文件由内蒙古自治区大数据发展管理局提出并归口。 本文件起草单位:内蒙古自治区大数据发展管理局、中国电子技术标准化研究院、
2、呼和浩特市大数据管理局、中国人民银行呼和浩特中心支行、内蒙古银保监局、中国建设银行内蒙古分行、内蒙古自治区公安厅、 内蒙古农业大学、 内蒙古自治区质量和标准化研究院、 内蒙古自治区电子信息职业技术学院、内蒙古自治区教育招生考试中心。 本文件主要起草人:崔连伟、张建军、卫凤林、孙卫、赵坤、郭敏、崔娜、付学良、武茂春、徐小强、钟国栋、曹幼林、 胡大伟、焦暄、许洁、蔡斐、谢友、金晶、支泽锋、马祎霞。 DB15/T 21042021 1 政务数据开放共享规范 元数据 1 范围 本文件规定了内蒙古自治区政务数据资源的元数据描述规范。 本文件适用于内蒙古自治区政务数据资源的目录编制和开放共享。 2 规范性
3、引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 4754 国民经济行业分类 GB 18030信息技术 中文编码字符集 3 术语和定义 下列术语和定义适用于本文件。 3.1 政务数据 government data 各级政务部门及其技术支撑单位在履行职责过程中依法采集、生成、存储、管理的各类数据资源。 注: 根据可传播范围,政务数据一般包括可共享政务数据、可开放公共数据及不宜开放共享政务数据。 3.2 政务数据目录 government
4、 data directory 对国家政务数据资源和部门政务数据资源的资源分类, 按照一定的次序编排而成, 便于数据资源共享交换的检索、定位与发现。 3.3 政务数据元数据 government data metadata 描述政务数据资源的数据。 4 概述 政务数据资源元数据通过一系列属性来实现。包括以下六个方面的基本属性: 标识类属性:适用于政务数据资源目录标识的属性; 定义类属性:描述政务数据资源目录语义方面的属性; 关系类属性:描述各政务数据资源目录之间的相互关联关系的属性; 表示类属性:描述政务数据资源目录表示方面的属性; 管理类属性:描述政务数据资源目录管理与控制方面的属性; DB
5、15/T 21042021 2 附加类属性:在上面未能详细描述的其他属性。 5 元数据属性的描述方法 元数据属性应按照以下方式进行描述。 a) 名称:元数据属性的标记;名称是唯一的且应以字符串形式表示。 b) 定义:元数据属性的描述,可使一种属性与其他属性清晰地区别开来。属性定义应以字符串形式表示。 c) 约束:显示一个属性是始终还是有时出现的描述符。该描述符可以有两个取值:必选或可选,前者表示该属性应出现,后者表示该属性可以出现,也可不出现。 d) 出现次数:显示一个属性出现次数的描述符。该描述符有以下四种情况: 1) 0:1(表示不出现或出现 1 次) ; 2) 0:n(表示不出现或出现
6、n 次) ; 3) 1:1(表示出现且仅出现 1 次) ; 4) 1:n(表示出现 1 次或多次) 。 e) 类型:描述属性的所有取值的类型。属性值的数据类型示例有: “字符” 、 “字符串” 、 “数字” 、“日期” 。 f) 备注:与属性应用有关的注释。 6 标识符命名规则 标识符由9位数字组成,命名规则见图1。数据类编号由一级代码、二级代码和三级代码共6位数字组成。 图1 标识符命名规则图 标识类编码解释如下: a) 一级代码:表示一级分类,由 2 位数字组成,取值从 01-99,01 至 05 分别代表人口、空间地理、法人、文化和宏观经济; b) 二级代码:表示二级分类,由 2 位数字
7、组成,取值从 01-99; c) 三级代码:表示三级分类,由 2 位数字组成,取值从 01-99,无三级分类时取值为 00; d) 顺序码:表示数据资源序号,由 3 位数字组成,取值从 001-999。 7 标识类属性 DB15/T 21042021 3 7.1 名称:中文名称 定义:赋予元数据的单个或多个中文字词的指称。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:元数据的中文名称。 7.2 名称:字段名称 定义:在提供的共享数据中对应的字段名称。 约束:可选。 出现次数:0:1。 类型:字符串。 备注:无。 7.3 名称:标识符 定义:由注册机构分配的、与语言无关的元数据的唯一
8、标识符。 约束:必选。 出现次数:1:1。 类型:数字。 备注:命名规则见6。 7.4 名称:蒙文名称 定义:中文名称对应的蒙文。 约束:可选。 出现次数:0:1。 类型:字符串。 备注:无。 8 定义类属性 定义:表达一个元数据的本质特性并使其区别于所有其他元数据的陈述。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:对应于政务数据资源目录的名字解释。 9 关系类属性 9.1 名称:数据类编号 定义:政务数据资源目录提供部门给出的数据分类编号。 约束:必选。 出现次数:1:1。 DB15/T 21042021 4 类型:字符串。 备注:无。 9.2 名称:数据类名称 定义:政务数据
9、资源目录提供部门根据业务情况给出的数据分类名称。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:无。 10 表示类属性 10.1 名称:数据类型 定义:表示元数据值的不同值的集合。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:可能的实例为:“字符”、“数值”、“日期”、“时间”、“日期时间”和“二进制”。 10.2 名称:表示格式 定义:从应用的角度规定的元数据值的格式需求,包括所允许的最大或最小字符长度,元数据值的类型和表示格式等。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:数据格式的表示如下表1所示。 表1 表示格式说明表 基本格式 示例 说明 c c
10、字符,应至少支持 GB 18030 强制部分规定的字汇 c12 固定长度为 12 的字符串 c.12 最大长度为 12 的字符串 a a 特指字母字符(a-z,A-Z) a3 固定长度为 3 的字母字符 a.3 最多为 3 位字母字符 n n 数值型字符 n3 固定长度为 3 的数字字符 n.3 最多为 3 位数字字符 DB15/T 21042021 5 基本格式 示例 说明 n.9,n2 数值型,总长度最多为 9 位数字字符,小数点后保留 2 位数字 an an 字母和数字字符 an3 固定长度为 3 的字母数字字符 an.3 最多为 3 位字母数字字符 d d8 日期型,按年、月、日顺序,
11、格式为 8 位定长、全数字表示(YYYYMMDD) 。年用 4 位数字表示,月、日各用 2 位数字表示,彼此之间没有分隔符 t 时间型,按时、分、秒顺序全数字表示,格式为 6 位定长、全数字表示(hhmmss) dt 日期时间型,按年、月、日、时、分、秒顺序全数字表示,格式为 14 位定长、全数字表示(YYYYMMDDhhmmss),如 2007 年 10 月 11 日 11 时 34 分 21 秒,应表示为 20071011113421 b b 二进制类型,用来表示图形、图像、音频、视频等非结构化数据 10.3 名称:值域 定义:根据相应属性中所规定的表示形式、格式、数据类型和最大与最小长度
12、而决定的元数据的允许实例表示的集合。 该集合可以根据名称、 引用来源、 实例表达的枚举, 或者根据实例生成规则来规定。 约束:可选。 出现次数:0:1。 类型:字符串。 备注:当值域是编码表示的枚举形式时,每一个元数据值及其实例都应当成对表示。 11 管理类属性 11.1 名称:提供部门编码 定义:政务数据资源目录提供部门对应的编码。 约束:必选。 出现次数:1:1。 类型:字符。 11.2 名称:提供部门名称 定义:政务数据资源目录提供部门中文名称的全称。 约束:必选。 出现次数,1:1。 类型:字符串。 11.3 名称:共享类型 定义:数据共享交换的类型。 约束:必选。 出现次数:1:1。
13、 DB15/T 21042021 6 类型:字符串。 备注:实例为:“无条件共享”、“有条件共享”和“不予共享”。 11.4 名称:共享条件 定义:不同共享类型的政务数据资源的共享条件。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:无条件共享和有条件共享类型的共享条件一般可描述为“作为行政依据”、“工作参考”、“用于数据校核”和“业务协同”等;不予共享类型的数据,应注明相关法律、行政法规或中央、国务院政策依据。 11.5 名称:共享方式 定义:获取数据的方式。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:一般通过共享平台方式获取,确因条件所限可采用其他方式,如邮件、拷盘
14、、介质交换(纸质报表、电子文档)等方式。 11.6 名称:开放类型 定义:数据开放的类型。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:实例为:“完全开放”、“依申请有条件开放”和“不予开放”。 11.7 名称:更新周期 定义:数据更新的频度。 约束:必选。 出现次数:1:1。 类型:字符串。 备注:实例为:“实时”、“每周”、“每季度”和“每年”; 11.8 名称:发布日期 定义:数据提供方发布共享、开放数据的日期。 约束:必选。 出现次数:1:1。 类型:日期。 备注:按年、月、日顺序,格式为8位定长、全数字表示(YYYYMMDD)。年用4位数字表示,月、日各用2位数字表示,彼
15、此之间没有分隔符; 11.9 名称:提供方式 DB15/T 21042021 7 定义:数据提供的方式。 约束:可选。 出现次数:0:1。 类型:字符串。 备注:实例为:“API获取”、“数据库封装”、 “文件”、“网页链接”、“推送”、和“交换库”等。 12 附加类属性 12.1 名称:使用频率 定义:数据的使用频率。 约束:可选。 出现次数:0:1。 类型:字符串。 备注:无。 12.2 名称:使用部门 定义:使用数据的部门。 约束:可选。 出现次数:0:1。 类型:字符串。 12.3 名称:应用领域 定义:数据被应用的领域。 约束:可选。 出现次数:0:1。 类型:字符串。 备注:应用领域分类见GB/T 4754。 12.4 名称:备注 定义:政务数据资源元数据的附加注释。 约束:可选。 出现次数:0:1。 类型:字符串。 备注:在上述属性未能描述的其他注释。 DB15/T 21042021 8 参考文献 1 国发201550号 促进大数据发展行动纲要的通知(国发201550 号) 2 国办发201739号 政务信息系统整合共享实施方案(国办发201739号) 3 内政发201712号 研究自治区大数据发展工作有关事宜(201712号) 4 内政发201720号 内蒙古自治区“十三五”信息化发展规划 (内政发201720号)