1、 ICS 07.040 CCS A 75 15 内蒙古自治区地方标准 DB15/T 27762022 地理信息大数据平台运行维护规范 Specifications of operation and maintenance for big data platform of gaographic information 2022-08-30 发布 2022-09-30 实施 内蒙古自治区市场监督管理局 发 布 前言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。本文件由内蒙古自治区测绘地理信息中心、内蒙古自治区测绘学会提出。本文件由内蒙古自治区测
2、绘地理信息标准化技术委员会(SAM/TC 27)归口。本文件起草单位:内蒙古自治区测绘地理信息中心、内蒙古自治区测绘学会。本文件主要起草人:魏富恒、张瑞新、张贵俊、李锁乐、邓丁柱、左振华、彭莲香、张宏强、李慧、宝力杰、杨旭、李改凡、昂格鲁玛、张国栋、何红艳。地理信息大数据平台运行维护规范 1 范围 本文件规定了地理信息大数据平台运行过程中的运维内容和应急响应。本文件适用于地理信息大数据平台建成后的运维工作。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)
3、适用于本文件。GB/T 2887 计算机场地通用规范 GB/T 9361 计算机场地安全要求 GB 17859 计算机信息系统 安全保护等级划分准则 GB/T 22239 信息安全技术 网络安全等级保护基本要求 GB/T 28827.3 信息技术服务 运行维护 第3部分:应急响应规范 GB/T 51314 数据中心基础设施运行维护标准 3 术语和定义 GB/T 28827.3界定的以及下列术语和定义适用于本文件。地理信息大数据平台 big data platform of geographic information 以地理信息大数据为基础、云计算环境为支撑,依托网络、分布式聚合信息资源,并按
4、需提供数据服务、接口服务、功能服务的基础性软硬件设施。应急事件 emergency event 导致或即将导致运维服务对象运行中断、运行质量降低,以及需要实施重点时段保障的事件。来源:GB/T 28827.32012,3.2 应急响应 emergency response 组织为预防、监控、处置和管理应急事件所采取的措施和活动。来源:GB/T 28827.32012,3.3 4 运维内容 基础设施 4.1.1 运维范围 基础设施运维指对电气系统、通风空调系统、消防系统和智能化系统等机房基础设施的运维管理:a)电气系统的运维范围包括供配电系统、不间断电源和后备电源系统、照明系统、配电线路布线系统
5、、防雷与接地系统;b)通风空调系统的运维范围包括冷源和水系统、机房空调和风系统;c)消防系统的运维范围包括火灾自动报警系统、消防联动系统、自动灭火系统;d)智能化系统的运维范围包括环境和设备监控系统、安全防范系统。4.1.2 一般要求 确保基础设施稳定、安全、可靠运行,具体要求如下:a)计算机场地安全等级要求符合 GB/T 9361 的规定,计算机场地通用要求符合 GB/T 2887 的规定;b)非涉密系统的基础设施符合 GB/T 22239 的规定,宜满足信息安全等级保护管理办法第二章等级划分与保护第三级要求;c)涉密系统的基础设施符合 信息安全等级保护管理办法 第四章涉密信息系统的分级保护
6、管理要求;d)基础设施的运行维护包括监控、预防性检查和常规性作业,具体要求符合 GB/T 51314 的规定。安全保护 4.2.1 运维范围 安全保护应符合客观存在和发展规律,分级、分区域、分类和分阶段做好工作。安全保护运维体系具体内容包括:a)网络安全包括网络的拓扑结构、布线、防护、攻击监测和处理、安全审计和检查、边界完整性检查、设备的管理和报警等;b)主机安全包括主机的身份鉴别、访问控制、安全审计、入侵防范、恶意代码防范、监控和终端接入控制等;c)系统安全包括应用系统的身份鉴别、访问控制、安全审计、剩余信息保护、通信完整性和保密性、抗抵赖、软件容错和资源控制等;d)数据安全包括数据本身、传
7、输、存储的完整性和安全性、数据的备份和恢复、信息过滤等。4.2.2 一般要求 在运行维护过程中对网络、主机、系统、数据的安全具体要求如下:a)优先采用我国自主开发研制的信息安全技术和设备;b)使用经国家密码管理部门批准和认可的国产密码技术及相关产品;c)部署身份鉴别、访问授权、防火墙、网络行为审计、入侵检测、入侵防御、漏洞扫描、计算机病毒防治、安全管理等必要安全产品,达到 GB 17859 中规定的安全保护等级,防止非法窃取或破坏数据;d)对信息系统核心设备采取冗余措施(包括线路及设备冗余);e)根据系统安全等级进行安全等级测评,测评机构选择具有相应资质的安全等级保护测评机构;f)对涉密数据做
8、全生命周期的安全控制,如:加密存储、授权访问、脱密共享、数据粉碎等;g)制定数据备份、恢复的容灾机制和策略,确认数据存储安全等级,保障数据的安全性、完整性、可用性和可追溯性,对数据存储的安全进行保护;h)对入网设备的接入进行非法外联的定位和阻断,对审计系统进行两种以上鉴别技术,保证特权用户分离;i)使用网页防篡改技术或专用安全设备进行保护,确保网站在受到破坏时能自动恢复;j)根据业务需求和系统安全,分析制定系统的访问控制策略,控制分配信息系统、文件及服务的访问权限;k)保证数据库系统的宿主操作系统除提供数据库服务外,不应提供其它网络服务,如:WWW、FTP等;l)对数据库系统安装目录及相应文件
9、访问权限进行控制,查看数据库系统的运行日志和审计日志;m)监控服务器相关服务,保证最小授权原则,对相关记录进行分析并形成报表;n)进行系统补丁检查,及时安装补丁程序。在安装系统补丁前,需在测试环境中测试通过;o)确保运维人员、操作、数据以及工具等符合运维安全防护的要求;p)分级管理用户,明确各个角色的权限、责任和风险,权限设定遵循最小授权原则;q)对于用户注册的信息,以及通过数据交换获取的信息,建立相应的安全保密机制,如:信息认证、信息加密、链接密钥等,确保信息安全;r)对于用户标绘或注册的不当信息,如:标注的空间信息或属性信息错误、涉密信息标绘等。进行互联网地图安全检查,并建立信息自动搜索过
10、滤机制,保证平台信息的安全、准确;s)建立安全巡检制度,设立安全管理岗位,依计划对照安全检查细目逐项检查,检查记录真实、准确、完整;t)开展信息安全应急演练,防病毒、防入侵、防数据丢失,确保相应机制和策略的有效性。平台运行 4.3.1 运维范围 平台运维管理指对平台运行过程进行监测和管理,确保平台各类业务和应用系统运行的可用性和稳定性。具体运维范围包括:a)信息资产运维包括掌握平台运行所需软硬件资源信息和配置信息等;b)网络系统运维包括设备基础性能监测、网络带宽流量实时监测和网络拓扑链路状态监测等;c)硬件设备运维包括主机(集群)与存储设备的日常监控、设备运行状态监控与故障处理、设备管理系统维
11、护等;d)软件系统运维包括对平台基础环境、功能模块、数据库和应用系统的安装部署、调试等。4.3.2 一般要求 平台运行过程中对信息资产、网络系统、硬件设备和软件系统的具体要求如下:a)建立平台信息资产台账,对信息资产新增情况、维护更新情况、转移情况和报废情况等进行统计记录,并持续性更新管理;b)对平台进行程序变更、版本升级、参数调整和硬件设备调整等工作时,经过用户审批报备通过后方可实施,并按规定进行详细记录。对软件系统、现场资料、运行日志等整理存档;c)进行服务器系统扫描,及时关闭可疑端口与服务,查看服务器运行日志;d)检查服务器与存储设备磁盘空间使用情况,及时发现异常运行情况,并形成记录;e
12、)对数据库进行备份,并检查备份完成情况,确保数据库备份操作正确执行及备份完整性;f)检查数据库空间使用情况,检查并分析运行日志及跟踪文件,协助进行地理信息数据库空间规划管理;g)评估平台及应用系统的性能;h)指定专人作为平台管理员和数据库管理员,对平台的安装部署、运行、管理、维护和安全负责,并按照有关规定负责平台与数据的备份与恢复;i)软件系统备份、升级实施人员严格按照平台运维操作手册执行,详细记录系统备份、升级过程,包括原始状态信息、目的状态信息等,并形成操作日志;j)对网络、集群、主机、服务、实例等运维对象进行监控;k)对网络、服务器、操作系统及各服务的运行健康度检查;l)支持图形化操作界
13、面对软件系统的配置项进行管理,包括查看、修改、删除和自定义等;m)支持以角色、用户和用户组的方式管理权限,并提供图形化界面管理角色、用户和用户组;n)使用有效工具实施和管理运维服务,如:监控工具、过程管理工具和专用工具等,承担部分日常监控及运维实施工作;o)配备具有地理信息行业相关专业背景的运维管理人员和技术人员;p)对提交上来的地理信息服务及时进行测试和发布,服务元数据填写正确和完整。5 应急响应 基本要求 在日常运维工作中注重安全防范,针对自然灾害、人为破坏或不可预见等突发故障即时响应,在规定时间内排除故障或提出故障处理解决方案。应急响应具体要求如下:a)根据实际情况建立应急响应领导小组,
14、结合地理信息大数据业务领域常见突发事件制定应急响应处理(故障解决)预案,配备保障措施(如人员、资金和设备),开展日常应急响应培训和演练;b)应急响应处理预案要包括地理信息大数据业务领域常见的危险状况以及必需的处置方式,并明确有关人员在紧急状况下的职责;c)应急响应人员包括单位主要领导、分管领导、机房维护人员、网络安全维护人员、系统维护人员以及地理信息专业技术人员;d)每年至少开展一次应急培训和应急演练。演练的整个过程有详细的记录,并形成书面报告;e)建立监测、预警的记录和报告制度。报告内容包括应急事件发生及发现的时间和位置、事件级别、状态描述、影响范围和程度、初步原因分析、采用的专项对应预案(
15、处理措施)、处理结果等。对记录、报告及时进行整理与归档;f)应急响应领导小组负责人对报告内容进行逐项核实。处理流程 应急响应的处理流程如下:a)事件发现。通过日常的巡检巡查、机房传感器短信报警及声光报警、停电通知、灾害预报、系统监控、用户上报等手段,及时发现异常运行事件,进行有效预警;b)应急决策。根据所发现应急事件类型和对应的应急预案,进行应急指挥决策。在必要时做出断网断电,人力动员,上报上级或报警处理等决策,并形成相应的书面记录;c)应急处置。根据应急决策内容和紧急程度、重要程度、服务时段、影响程度等方面确定响应处理优先级。按照事先制定的应急预案,采取必要的应急处置手段,开展故障排查与诊断,进行有效、快速的处理与系统恢复,及时通报应急事件,提供持续性服务保障;d)事件总结。对应急事件发生原因、处理过程和结果进行总结分析,并形成报告,持续改进应急工作,进一步健全和完善地理信息大数据平台。运维单位按要求提交:事件报告、故障总结报告等。