二信息系统的技术基础.数字存储与分析技术PPT课件.ppt
《二信息系统的技术基础.数字存储与分析技术PPT课件.ppt》由会员分享,可在线阅读,更多相关《二信息系统的技术基础.数字存储与分析技术PPT课件.ppt(113页珍藏版)》请在咨信网上搜索。
1、第二章第二章:2.6 数据存数据存储与分析技与分析技术本本节主要内容主要内容2.6.12.6.1引言引言2.6.2 2.6.2 数据管理技数据管理技术的的发展展2.6.3 数据数据库环境下的数据管理境下的数据管理2.6.42.6.4数据数据库设计2.6.4.1 2.6.4.1 数据数据库设计的步的步骤2.6.4.2 2.6.4.2 实体体联系模型(系模型(E ER R模型)模型)2.6.4.32.6.4.3数据模型数据模型2.6.4.42.6.4.4关系数据关系数据库的的规范化范化2.6.4.52.6.4.5数据数据库操作操作2.6.4.62.6.4.6常常见关系型数据关系型数据库系系统介介绍
2、2.6.5 2.6.5 数据数据库技技术的的发展展2.6.5.12.6.5.1数据数据仓库2.6.5.22.6.5.2数据集市数据集市2.6.5.32.6.5.3数据挖掘数据挖掘了解了解传统的文件的文件组织和管理技和管理技术了解了解传统文件管理文件管理环境下存在的境下存在的问题了解数据了解数据库管理系管理系统中数据的中数据的组织方方法法理解三种不同的数据理解三种不同的数据库组织模型模型掌握掌握E-R模型和模型和E-R图的画法的画法掌握三范式理掌握三范式理论掌握基本的数据掌握基本的数据库操作方法操作方法了解数据了解数据库技技术的的发展展 本章学本章学习目的目的 国国际著名著名调查机构机构Gart
3、ner GroupGartner Group在高在高级技技术调查报告中,将告中,将数据分析数据分析和和人工智人工智能能列列为“未来三到五年内将未来三到五年内将对工工业产生深生深远影响的五大关影响的五大关键技技术”之首,之首,还将将并行并行处理体系和数据分析理体系和数据分析列列为未来五年内投未来五年内投资焦点的十大新焦点的十大新兴技技术前两位。前两位。GartnerGartner的的调查报告告预计:到:到20102010年,数据分析在相关年,数据分析在相关市市场的的应用将从目前少于用将从目前少于5%5%增加到超增加到超过80%80%。在国外,数据分析已在金融、。在国外,数据分析已在金融、证券、券
4、、电信、制造、信、制造、统计、零售、零售业等数据密集型行等数据密集型行业实施,并取得巨大的效益。施,并取得巨大的效益。2.6.12.6.1引言引言 数据管理技数据管理技术术数据分析技数据分析技术术数据加密技数据加密技术术数据数据压缩压缩技技术术数据恢复技数据恢复技术术 一、数据一、数据一、数据一、数据处处理技理技理技理技术术2.6.12.6.1引言引言 数据存数据存储技技术 数据数据检索技索技术 数据挖掘技数据挖掘技术 二、数据管理技二、数据管理技术术数据数据仓库技技术 2.6.12.6.1引言引言 数据数据组织层次次描描 述述字段:字段:属性的特定属性的特定值。记录:记录由字段由字段组成,其
5、中字段成,其中字段代表了代表了实体体对象的各种属性。一条象的各种属性。一条记录由一个或者多个字段由一个或者多个字段组成。成。文件:文件:多个相关多个相关记录的集合形成的集合形成数据数据库:由多个在系由多个在系统执行行过程中程中相互关相互关联的文件的文件组成。成。1.1.位位2.2.字符字符3.3.数据元数据元(字段)(字段)4.4.记录5.5.文件文件6.6.数据数据库2.6.12.6.1引言引言 三、数据的三、数据的组织层组织层次次数据数据数据数据库库文件记录文件文件文件文件1 1文件文件文件文件2 2文件文件文件文件3 3文件文件文件文件3 3文件文件文件文件n n记录记录n n记录记录1
6、 1记录记录n n记录记录1 1记录记录n n记录记录1 1字段字段字段字段n n字段字段字段字段1 1字段字段字段字段n n字段字段字段字段1 1字段字段字段字段n n字段字段字段字段1 1字段字符字符字符字符n n字符字符字符字符1 1字符字符字符字符n n字符字符字符字符1 1字符2.6.12.6.1引言引言 数据管理技数据管理技术术的的发发展展经过经过了三个了三个阶阶段:段:vv人工管理:人工管理:人工管理:人工管理:50505050年代中期以前年代中期以前年代中期以前年代中期以前vv文件管理:文件管理:文件管理:文件管理:50505050年代后期到年代后期到年代后期到年代后期到606
7、06060年代中期年代中期年代中期年代中期vv数据数据数据数据库库管理:管理:管理:管理:60606060年代后期开始、年代后期开始、年代后期开始、年代后期开始、DBMSDBMSDBMSDBMS广泛广泛广泛广泛应应用用用用2.6.22.6.2数据管理技数据管理技术的的发展展发展展阶段段描描 述述人工管理人工管理数据和程序相互依赖:数据保存在处理程序中或随程序进行人机交互地输入,数据处理后将结果输出。文件管理文件管理数据存放在永久性的系统文件中,供与之相对应的应用程序调用,应用程序和数据文件相互独立,数据文件可以长期保存。2.6.22.6.2数据管理技数据管理技术的的发展展.奖金文件金文件 工工
8、资文件文件 .产品文件品文件 销售文件售文件 .物料文件物料文件 计划文件划文件 数据数据文件文件 工资程序销售程序计划程序应用用程序程序 财务财务财务部部部门门门销销销售部售部售部门门门计计计划部划部划部门门门用用户 数数据据报表表发展展阶段段缺缺 点点人工管理人工管理程序不具有独立性,灵活性差。应用程序之间无法共享数据。数据不能永久保存文件管理文件管理数据冗余和不一致并发访问异常缺乏灵活性安全性差2.6.22.6.2数据管理技数据管理技术的的发展展数据数据库 数据库(DB-Database)是以一定的组织方式存储在一起的互相关联的数据的集合(逻辑相关的记录和文件的集合)。数据数据库管理系管
9、理系统 数据库管理系统(DBMS-Database Management System)是对数据库进行管理的特定软件。通常所说的数据库管理系统是指DBMS,而不是指具体的数据库Database。一、数据一、数据库、数据、数据库管理系管理系统和数据和数据库系系统2.6.3 2.6.3 数据数据库环境下的数据管理境下的数据管理数据数据数据数据库库系系系系统统 口语中常说的“数据库系统”在大多数时候都是指DBMS。但是严格来说,数据库系统(DBS-Database System是指在计算机系统中引入数据库之后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(DBA-Dat
10、abase Administrator)和用户构成。即:DBS=DB+DBMS+APPLICATION+DBA+USER2.6.3 2.6.3 数据数据库环境下的数据管理境下的数据管理 数据数据库管理系管理系统的目的的目的:就是为了解决前面提到的在文件处理系统中存在的一些问题:数据冗余和不一致数据访问困难数据孤立灵活性差并发访问异常安全性问题 由于这些问题,数据库管理系统提出了很多新的概念和算法,加速了DBMS的发展。二、数据二、数据库管理系管理系统(DBMS)2.6.3 2.6.3 数据数据库环境下的数据管境下的数据管理理 数据数据库管理系管理系统的功能就是的功能就是:2.6.3 2.6.3
11、 数据数据库环境下的数据管理境下的数据管理创建和修改数据建和修改数据库。存存储和和检索数据。索数据。操操纵数据和生成数据和生成报表。表。保保证所存所存储数据的安全性。数据的安全性。数据被多用数据被多用户共享共享时,要,要 避免可能避免可能产生的异常生的异常结果果(并并发控制控制)。Windows 2000UnixDBMS(OraccleDB2SQL ServerSybase)财务管理程序管理程序Windows 2000Unix销售部售部财务部部计划部划部计划数据划数据工工资数据数据销售数据售数据销售管理程序售管理程序计划管理程序划管理程序数据的数据数据的数据数据的数据数据的数据库库管理管理管理
12、管理环环境境境境数据共享减少数据冗余提高了数据的一致性数据与应用程序之间的独立性提高了数据的安全性三、数据三、数据库管理的管理的优点点2.6.3 2.6.3 数据数据库环境下的数据管理境下的数据管理 数据库设计是建立数据库及其应用系统的技术,是信息系统开发和建设中的核心技术。具体说,数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)。数据库合理的结构和组织是信息系统分析、设计时需要考虑的一个重要方面。2.6.42.6.4数据数据库设计一、什么是数据一、什么是数据库设计2.6.42.6.4数据数
13、据库设计转换12信息世界信息世界(观念世界念世界)概念模型概念模型3数据世界数据世界(机器世界机器世界)数据模型数据模型 字段字段记录记录文件文件实实体集体集实实体体属性属性现实世世界界事物事物类类事物事物性性质质认识抽抽象象二、人二、人们对客客观事物的事物的认识和描述和描述过程程现实世界的自行世界的自行车 2.6.42.6.4数据数据库设计观念世界的自行念世界的自行车 信息模型(概念模型)信息模型(概念模型)2.6.42.6.4数据数据库设计数据世界的自行数据世界的自行车 中国中国铁路网路网络图信息模型(概念模型)信息模型(概念模型)2.6.42.6.4数据数据库设计阶阶段段段段描述描述描述
14、描述需求分析分析用户的需求:数据、功能和性能概念结构设计根据用户需求设计概念数据模型,主要使用E-R模型,画E-R图逻辑结构设计将概念模型转换成DBMS支持的数据模型,主要是将E-R模型转换成关系模型数据库物理结构设计选择合适的存储结构和存取路径数据库的实施包括编程、测试和试运行数据库运行与维护系统运行与数据库的日常维护按规范的设计方法,一个完整的数据库设计一般分为以下六个阶段:2.6.42.6.4数据数据库设计三、数据三、数据库设计的步的步骤需求收集和分析需求收集和分析设计概念概念结构构设计逻辑结构构数据模型数据模型优化化设计设计物理物理物理物理结结构构构构评价价设计,性能,性能预测物理物理
15、实现试验性运行性运行使用、使用、维护数据数据库四、数据四、数据库设计的流程的流程2.6.42.6.4数据数据库设计v需求信息收集需求信息收集初步初步调查详细调查(目的、内容、方法)(目的、内容、方法)v需求信息的分析整理需求信息的分析整理业务流程流程数据流程、数据字典数据流程、数据字典 1.1.1.1.需求分析需求分析需求分析需求分析2.6.42.6.4数据数据库设计五、数据五、数据库设计各各阶段的任段的任务:需求分析:需求分析v目目标 是把是把现实世界中的客世界中的客观对象抽象象抽象为某种信息某种信息结构,构,设计出反映某个出反映某个组织部部门信息需求的数据信息需求的数据库系系统概念概念模式
16、,它独立于数据模式,它独立于数据库系系统的的逻辑结构、独立于数据构、独立于数据库管理系管理系统(DBMSDBMS)、)、独立于独立于计算机系算机系统。v设计方法方法 是在需求分析的基是在需求分析的基础上,用概念数据模型(例如上,用概念数据模型(例如E-RE-R模型)表示数据及数据之模型)表示数据及数据之间的相互的相互联系,系,设计出反出反映用映用户信息需求和信息需求和处理需求的数据理需求的数据库系系统概念模式。概念模式。2.2.2.2.概念概念概念概念结结构构构构设计设计2.6.42.6.4数据数据库设计五、数据五、数据库设计各各阶段的任段的任务:概念:概念结构构设计(1 1 1 1)实实体体
17、体体联联系模型(系模型(系模型(系模型(E-RE-RE-RE-R模型:模型:模型:模型:EntityRelationship )E-RE-R模型模型是是这样认识现实世界的:世界的:现实世界是由一世界是由一组称作称作实体的基本体的基本对象以及象以及这些些对象象间的的联系构成的。系构成的。实体(体(EntityEntity):):“实体体”是是观念世界中描述客念世界中描述客观事物事物的概念。的概念。实体可以是人,也可以是物或事件;可以指体可以是人,也可以是物或事件;可以指事物本身,也可指事物之事物本身,也可指事物之间的的联系,例如一个人、一系,例如一个人、一件物品、一个部件物品、一个部门、一个、一
18、个银行行帐户等都是一个等都是一个实体。体。实体可以通体可以通过属性集合来描述。属性集合来描述。属性:属性:属性:属性:“属性属性”是指是指实体具有的某种特性。如人有身体具有的某种特性。如人有身高、体重、年高、体重、年龄、性、性别等属性。等属性。联系:系:“联系系”是事物是事物间的相互关的相互关联。在信息世界中,。在信息世界中,事物之事物之间的的联系可分系可分为两两类:一是:一是实体内部的体内部的联系,系,一是一是实体之体之间的的联系系.2.6.42.6.4数据数据库设计(2)实体之体之间的的联系系 一一对一一联系(系(1:1)对于于实体集体集A A中的每一中的每一实体,体,实体集体集B B中至
19、多有一中至多有一个个实体与之体与之联系。反之亦然。系。反之亦然。一一对多多联系(系(1:N)对于于实体集体集A A中的每一中的每一实体,体,实体集体集B B中有中有N N个个实体体与之与之联系。反之,系。反之,对于于实体集体集B B中每一中每一实体,体,实体体集集A A中至多只有一个中至多只有一个实体与之体与之联系。系。多多对多多联系(系(M:N)对于于实体集体集A A中的每一中的每一实体,体,实体集体集B B中有中有N N个个实体体与之与之联系,系,对于于实体集体集B B中每一个中每一个实体,体,实体集体集A A中有中有M M个个实体与之体与之联系。系。2.6.42.6.4数据数据库设计(3
20、)(3)实体体联系方法系方法(EntityRelation Approach)概念模型最常用的表示方法是概念模型最常用的表示方法是实体体联系方法系方法(EntityEntityRelationRelation Approach Approach,简称称E ER R方法方法)。E ER R方法通方法通过E ER R图来描述某一来描述某一组织的信息模型。的信息模型。E-RE-R图由以下元素构成:由以下元素构成:矩形:矩形:代表代表实体集体集(具有相同属性或特征的(具有相同属性或特征的实体集合);体集合);椭圆:代表代表实体属性;体属性;菱形:菱形:代表代表实体体间的的联系集系集(同一(同一类型的所
21、有型的所有联系的集合);系的集合);线段:段:将属性与将属性与实体集相体集相连或将或将实体集与体集与联系集相系集相连。2.6.42.6.4数据数据库设计E-RE-R图示例示例客客户帐户存款存款/取取款款身份身份证号号客客户名名客客户街道街道客客户城市城市帐户号号余余额电话2.6.42.6.4数据数据库设计联系名联系名联系名实体A实体B实体A实体B实体A实体B11m1nn(4)实体之体之间联系系类型的型的E-R表示表示2.6.42.6.4数据数据库设计管理管理厂厂长工厂工厂112.6.42.6.4数据数据库设计存放存放仓库商品商品1n2.6.42.6.4数据数据库设计如如对于学生、于学生、课程和
22、教程和教师这三个三个实体,若体,若规定每定每个学生可以个学生可以选择多多门课程,每程,每门课程可以被多个学生程可以被多个学生选修,每修,每门课程惟一程惟一对应一个任一个任课教教师,一个教,一个教师可可以以讲授多授多门课程。程。则学生、学生、课程和教程和教师这三个三个实体之体之间的的E-RE-R图可表示可表示为:学生教师课程学习讲授学号成绩课程号教材教师号mnp1(5)三个或更多)三个或更多实体相互体相互联系的情况系的情况2.6.42.6.4数据数据库设计(6 6)设计E-RE-R图的的过程程E-RE-R图设计过程程实际是是对数据数据进行行归纳、分析、分析、抽象的抽象的过程,首先把企程,首先把企
23、业的有关数据的有关数据综合合组织,然然后根据不同用后根据不同用户对数据的使用需求数据的使用需求进行分行分组,再从,再从局部入手,建立局部局部入手,建立局部E-RE-R模型,再模型,再综合成合成总体体E-RE-R模模型。型。确定确定实体集体集确定确定联系和系和联系系类型(型(1 1:1 1或或1 1:n n)设计局部及整体的局部及整体的E-RE-R图确定属性确定属性将将E-RE-R图优化化2.6.42.6.4数据数据库设计2.6.42.6.4数据数据库设计在数据分析的基在数据分析的基础上,就可以着手上,就可以着手设计概念概念结构。构。设计初步初步E-RE-R图的步的步骤先先设计局部局部E-RE-
24、R图,也称用,也称用户视图 综合各局部合各局部E-RE-R图,形成,形成总的的E-RE-R图,即用,即用户视图的集成。也称的集成。也称基本基本E-RE-R图(全局全局E-RE-R图)在在设计初步初步E-RE-R图时,要尽量能充分地把,要尽量能充分地把组织中各部中各部门对信息的要求集中起来,而不需要考信息的要求集中起来,而不需要考虑数数据的冗余据的冗余问题。局部概念模型局部概念模型设计是从用是从用户的的观点出点出发,设计符符合用合用户需求的概念需求的概念结构。局部概念模型构。局部概念模型设计的就是的就是组织、分、分类收集到的数据收集到的数据项,确定哪些数据,确定哪些数据项作作为实体体,哪些数据哪
25、些数据项作作为属性属性,哪些数据哪些数据项是同一是同一实体的属性体的属性等。等。确定确定实体与属性的原体与属性的原则:能作能作为属性的尽量作属性的尽量作为属性而不要划属性而不要划为实体;体;作作为属性的数据属性的数据项不能再用其他属性加以描述,不能再用其他属性加以描述,也不能与其他也不能与其他实体或属性体或属性发生生联系。系。设计局部局部E-RE-R图2.6.42.6.4数据数据库设计仓库存放存放物物资1n物物资a.a.仓库作作为属性属性b.b.仓库作作为实体体2.6.42.6.4数据数据库设计学 生选 课课程学 生选 课课程出生日期学号姓名性别系别出生日期何时入学奖学金成绩课程号选/必教师课
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息系统 技术 基础 数字 存储 分析 PPT 课件
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。