JR∕T 0236-2021 金融大数据 术语.pdf
《JR∕T 0236-2021 金融大数据 术语.pdf》由会员分享,可在线阅读,更多相关《JR∕T 0236-2021 金融大数据 术语.pdf(24页珍藏版)》请在咨信网上搜索。
1、ICS 35.240.40CCS A 11JR中 华 人 民 共 和 国 金 融 行 业 标 准JR/T 02362021金融大数据 术语Financial big dataTerminologies2021-12-29 发布中国人民银行发 布2021-12-29 实施JR/T 02362021I目次前言.II引言.III1 范围.12 规范性引用文件.13 基础概念.14 参考体系和生命周期.65 治理与管理.116 支撑运行环境.15附录(资料性)本文件中术语描述的策略.19参考文献.20JR/T 02362021II前言本文件按照 GB/T 1.12020标准化工作导则 第1部分:标准化
2、文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国人民银行提出。本文件由全国金融标准化技术委员会(SAC/TC 180)归口。本文件起草单位:中国人民银行科技司、成方金融信息技术服务有限公司、中国农业银行股份有限公司、中国人民银行金融信息中心、中国建设银行股份有限公司、中国人民银行重庆营业管理部、中证信息技术服务有限责任公司、华为技术有限公司、成方金融科技有限公司、中国工商银行股份有限公司、海通证券股份有限公司、工业和信息化部电子第五研究所、北京国家金融标准化研究院有限责任公司。本文件主要起草人:李伟、陈立吾、杨富玉、周祥昆、
3、虞瑾、齐小东、何军、梁静、丁俨、时向一、郝洁、李宽、王鹏、艾霁坤、聂晓峰、徐光贤、朱建强、孟桂清、刘静芳、曹建勇、刘超、刘启滨、秦逞、李向东、冯晋雯、赵华、符海芳、文州、汪星辰、沈云明、吴保杰、刘舒婷、柴思跃、谢彦丽、李琪。JR/T 02362021III引言随着大数据技术在金融领域的广泛深入应用,大数据技术已经成为促进金融科技创新,驱动监管科技智能化的重要技术支撑,在规范社会治理、提供金融服务等方面发挥着重要作用。在金融应用场景下,一方面,大数据术语可能会被赋予特定的金融含义,部分术语从信息技术视角看不属于狭义的大数据概念,需要进一步定义,供金融行业参考;另一方面,在不同的场合,对大数据的概
4、念存在不同的表述,导致在大数据管理与使用等过程中对大数据的实质性内容认知不同,可能影响信息传导和业务需求的表达。基于以上原因,有必要尽快统一金融领域大数据相关概念,促进快速形成共识。本文件在收集现有国家标准、行业标准以及国际标准中大数据相关术语的基础上,通过分析归纳,结合我国金融应用特点,形成了金融大数据的术语标准。本文件通过描述金融大数据的基础概念、参考体系和生命周期、治理与管理、支撑运行环境等方面的常用术语,以期望减少相关人员在沟通中的分歧,促进大数据在金融行业中的应用。JR/T 023620211金融大数据 术语1范围本文件界定了金融大数据领域中的常用术语。本文件适用于在金融领域中涉及到
5、的与大数据相关的信息沟通。注:本文件中术语描述的策略见附录。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 52712021 信息技术词汇GB/T 250002021 系统与软件工程系统与软件质量要求和评价(SQuaRE)GB/T 352742017信息安全技术大数据服务安全能力要求GB/T 352952017信息技术大数据术语GB/T 349602018信息技术服务治理GB/T 360732018数据管理能力成熟度评估模型ISO/I
6、EC 2382:2015 Information technology VocabularyISO/IEC 20546:2019 Information technology Big data Overview and vocabularyISO/IEC 20547:2020 Information technology Big data reference architectureISO/IEC 20944:2013 Information technology Metadata Registries Interoperability andBindings(MDR-IB)ISO/IEC 3
7、8505:2018 Information technology Governance of IT Governance of dataISO 55000:2014 Asset management Overview,principles and terminology3基础概念3.1大数据big data海量的数据集,其数据在本质上具有体量大、种类多、变化快、变数多的特征,需要一种易扩展的技术来有效存储、处理、管理和分析。注:1.大数据通常以多种不同方式使用,例如,作为某种用于处理大数据海量数据集的易扩展技术的名称。2.GB/T 352952017信息技术大数据术语中 2.1.1 对大数据的
8、定义为“具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据”。3.在某些非工程性研讨的场合,“大数据”一词的外延可能被扩大到所有的数据。来源:ISO/IEC 20546:2019,3.1.2,有修改3.2JR/T 023620212金融大数据financial big data金融领域中的大数据。注:在某些非工程性研讨的场合,“金融大数据”一词的外延可能被扩大到所有的金融数据,也可能被限定在某一特殊的领域,例如银行大数据、证券大数据、保险大数据等。3.3信息information在信息处理中,关于客体(如事实、事件、事物、过程或想法,包括概念
9、)的知识,这些客体在一定的场合中具有特定的含义。注:在某些非工程性研讨的场合,“信息”和“数据”可能没有被严格地区分。来源:GB/T 5271.12000,01.01.01,有修改3.4数据data任何以电子或者其他方式对信息的记录。注:1.可以通过人工或自动手段处理数据。2.在某些非工程性研讨的场合,“数据”有可能被认为是“大数据”的一个子集。3.ISO/IEC 20546:2019 Information technology Big data Overview and vocabulary 中 3.1.5 对数据的定义与此等同。4.GB/T 5271.12000信息技术词汇基本术语中 0
10、1.01.02 对数据的定义为“信息的可再解释的形式化表示,以适用于通信、解释或处理”。3.5证券交易数据securities trading data在证券交易过程中产生的数据。3.6证券期货行情数据securities and futures market data有关证券期货市场价格的数据。3.7数据隐私data privacy记录与描述自然人的私人生活安宁和不愿为他人知晓的私密空间、私密活动、私密信息的数据。注:在不同工作场合、不同业务场景和不同数据组合下,“数据隐私”可能对应不同的外延。3.8目标实体target entity与用户相关的基础事物,关于这些事物的信息应保留并被测量。注
11、:1.目标实体同义词可能包括信息产品输入和工作成果。2.目标实体的示例有:体系结构、上下文模式、概念模型、逻辑模型、物理数据模型、数据字典、文档、数据文件、数据库管理、关系数据库管理系统、表单、显现设备等。3.目标实体由性质精确定义。性质的示例有:属性、元素、信息、元数据、词汇表、数据格式、数据项、数据值、信息项、信息项内容、数据记录等。来源:GB/T 25000.242017,4.36,有修改3.9属性attribute目标实体的固有性质或特性,能用人工或自动手段定量或定性地区分。来源:GB/T 25000.242017,4.23.10JR/T 023620213数据变异性data vari
12、ability数据集传输速率、格式或结构、语义或质量的变化。来源:ISO/IEC 20546:2019,3.1.133.11数据多样性data variety数据集的各种格式、逻辑模型、时间尺度和语义。注:数据多样性指不规则数据结构或异构数据结构,及导航、查询和数据类型划分。来源:ISO/IEC 20546:2019,3.1.143.12数据速度data velocity创建、传输、存储、分析或可视化数据的流速。来源:ISO/IEC 20546:2019,3.1.153.13数据真实性data veracity数据的完整性或准确性。注:数据真实性指用以支持实时决策的描述性数据和对于对象的自查询
13、。来源:ISO/IEC 20546:2019,3.1.163.14数据波动性data volatility与数据的一段时间变化率有关的特征。来源:ISO/IEC 20546:2019,3.1.173.15数据体量data volume数据量的范围,与数据处理过程中的计算和存储资源及对这些资源的管理有关。注:数据体量在处理大型数据集中变得非常重要。来源:ISO/IEC 20546:2019,3.1.183.16数据模型data model根据数据在信息系统的正式描述和所使用的数据库管理系统的要求确定的在数据库中构建数据的模式。注:大数据不需要数据模型的观点是不正确的,至少是不完整的。大数据的数据
14、模型往往在对大数据进行处理时,根据大数据的特征和对大数据加工的目的构建。来源:ISO/IEC 20546:2019,3.1.8,有修改3.17上下文模式contextual schema应用了数据模型的使用周境边界的正规描述。注:这是对业务信息需求的高层描述,上下文模式比概念模型更一般化,包括体系结构的(系统)周境的整体视图。来源:GB/T 25000.242017,4.4,有修改3.18数据集data set(dataset)可用一种或多种格式访问或下载的可标识的数据集合。注:数据集中的数据可能是可唯一定位但非为某一特定目的组织的,也可能是非结构化的。来源:ISO/IEC 20546:201
15、9,3.1.11,有修改JR/T 0236202143.19数据项data item在特定上下文内数据的最小可识别单位,其定义、标识、允许值和其他信息由一组属性指定。注:1.字段被认为是数据项的同义词。2.数据项是数据值的物理对象“容器”。来源:GB/T 25000.242017,4.93.20数据记录data record一个单元化的相关数据项的集合。来源:GB/T 25000.242017,4.153.21数据文件data file一个单元化的相关数据记录的集合。来源:GB/T 25000.242017,4.73.22主数据 master data组织中需要跨系统、跨部门共享的核心业务实体
16、数据。注:大数据意义下的主数据可能是原始数据中的,也可能是加工后的数据中的,两者并不等同。来源:GB/T 360732018,3.12,有修改3.23数据字典data dictionary收集有关数据的信息,如名称、描述、创建者、所有者、出处、不同语言的翻译以及用法。来源:GB/T 25000.242017,4.63.24数据格式data format对于数据的储存或者显现的管理安排。注:数据格式可以参照数据类型以及数据项的长度。来源:GB/T 25000.242017,4.8,有修改3.25数据类型data type(datatype)指定数据结构和一组允许操作的一组数据对象,以便这些数据对
17、象在执行其中任何一个操作时作为操作数。注:ISO/IEC 2382:2015 Information technology Vocabulary中17.6.6对数据类型的定义为“以这些值的属性和对这些值的操作为特征的不同值集”。来源:ISO/IEC 20546:2019,3.1.12,有修改3.26数据值data value数据项的内容。注:1.GB/T 25000.122017系统与软件工程系统与软件质量要求和评价(SQuaRE)的 5.1.1 中说明,从“固有”的角度看,数据质量是指数据本身,如数据域值和可能的限制。2.数据值是对目标实体的属性赋予的数值或类别。来源:GB/T 25000.
18、242017,4.17,有修改3.27JR/T 023620215数据指纹digital fingerprint部署算法的技术,该技术通过分析设备上的大量技术特征和设置,生成独特的标识符,该标识符可对产生机器识别码的特定计算设备进行识别,并可对个人身份进行识别。来源:ISO 19731:2017,3.173.28结构化数据structured data一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型进行有效描述。注:一般来说,原始未经处理的大数据不是结构化数据,但处理的结果往往采用结构化的方式组织。来源:GB/T 352952017,2.2.13,
19、有修改3.29半结构化数据semi-structured data包含用来分隔语义元素以及对记录和字段进行分层的标记,但不符合关系模型的数据。示例:可扩展标记语言(Extensible Markup Language,XML)和 Java 脚本对象表示法(JavaScript Object Notation,JSON)都是半结构化数据的例子。注:1.半结构化数据往往不完全符合除关系模型外其他形式的关联。2.半结构化数据的一般特点是属于同一类的实体可以有不同的属性。3.半结构化数据往往也被称为自描述的数据,其顺序往往并不重要。4.ISO/IEC 20944-1:2013 Information
20、technology Metadata Registries Interoperability and Bindings(MDR-IB)中 3.21.12.21 对半结构化数据的定义为“组件的数据类型及其标签未预先确定的聚合数据类型”。3.30非结构化数据unstructured data特征为除了记录或文件级别外没有任何结构的数据。示例:自由文本是非结构化数据的一个例子。注:总体而言,非结构化数据不是由数据元素组成。来源:ISO/IEC 20546:2019,3.1.37,有修改3.31静态数据data at rest处于静止状态,具有大数据的体量大和多样性特征的数据。示例:静态数据可能不是
21、大数据,例如应用系统的配置数据。注:静态数据通常是存储于物理媒体中的数据。来源:GB/T 352952017,2.1.37,有修改3.32动态数据data in motion处于活动状态,其典型特征表现为大数据的速度和多变性特征的数据。示例:动态数据可能不是大数据,例如应用系统在某个时点的交易量。注:动态数据在网络上传输或暂时驻留于计算机内存中供读取或更新。对动态数据以实时或近实时方式进行处理和分析。来源:GB/T 352952017,2.1.36,有修改3.33开放数据open data可被其他数据使用的数据。注:开放数据有可能有一个开放的范围,例如客户信息在核心银行系统内是对交易系统开放的
22、,但并不对核心银行JR/T 023620216系统外的其他系统开放。来源:GB/T 352952017,2.1.44,有修改3.34链接数据linked data连接其他数据的数据。来源:GB/T 352952017,2.1.453.35流数据streaming data经由接口传递,从连续运行的数据源产生的数据。来源:GB/T 352952017,2.1.243.36关系模型relational model结构基于一组关系的数据模型。来源:GB/T 5271.172010,17.04.04,有修改3.37非关系模型non-relational model在存储和处理数据时不遵从关系模型的逻辑
23、数据模型。来源:ISO/IEC 20546:2019,3.1.283.38内源性数据endogenous data产生规则由系统协调者确定,并可在需要时由系统协调者协调数据提供者、大数据应用提供者、大数据框架提供者产生、变更、废止使用的数据。来源:GB/T 31186.12014,3.7,有修改3.39外源性数据exogenous data在系统协调者、大数据应用提供者、大数据框架提供者外部产生,产生规则可能公开也可能不公开,数据提供者在提供数据时不能确定其可用状态,可在系统协调者不知道的情况下产生、变更、废止使用的数据。来源:GB/T 31186.12014,3.8,有修改4参考体系和生命周
24、期4.1大数据参考体系结构big data reference architecture一种用作工具以便于对数据内在要求、设计结构和运行进行开放性探讨的高层概念模型。注:比较普遍认同的大数据参考体系结构一般包含:系统协调者、数据提供者、大数据应用提供者、大数据框架提供者和数据消费者等5个逻辑功能构件。来源:GB/T 352952017,2.1.34.2系统协调者system orchestrator大数据参考体系结构中的一种逻辑功能构件,可定义所需的数据应用活动并将其整合到可运行的垂直系统中。示例:在金融行业中,系统协调者可能是金融监督管理部门或相关行业协会。在一个金融机构内部,系统协调者可J
25、R/T 023620217能是高级管理层或特别授权的大数据管理部门。注:1.系统协调者可以是人、软件或这二者。2.系统协调者一般包括:业务领导者、咨询师、数据科学家、信息体系结构设计师、软件体系结构设计师、安全体系结构设计师、个人信息保护体系结构设计师和网络体系结构设计师。来源:GB/T 352952017,2.1.4,有修改4.3数据提供者data provider大数据参考体系结构中的一种逻辑功能构件,可将新的数据或信息引入大数据系统。示例:在金融行业中,数据提供者可能是各金融机构。在一个金融机构内部,数据提供者可能是某个应用系统、某个业务部门或某个金融业务的客户。注:数据提供者一般包括:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- JRT 0236-2021 金融大数据 术语 JR 0236 2021 金融 数据
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【ylh50****.com】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【ylh50****.com】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。