数据仓库基本概念PPT学习课件.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 基本概念 PPT 学习 课件
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2005 iSoftStone Information Service Corporation.All rights reserved.,*,数据仓库基础知识,1,iSoftStone,Information Service Corporation,数据仓库基本概念,1.1,从传统数据库到数据仓库,1.2,数据仓库定义及基本特性,1.3,数据仓库与决策支持系统,1.4,数据仓库体系结构,1.5,数据仓库相关概念,2,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.1,从传统数据库到数据仓库,随着市场竞争的加剧,信息系统的用户已经不满足于仅仅用计算机去处理每天所发生的事务数据,而是需要信息,能够支持决策的信息,去帮助管理决策。这就需要一种能够将日常业务处理中所收集到的各种数据转变为具有商业价值信息的技术,传统数据库系统无法承担这一责任。因为传统数据库的处理方式和决策分析中的数据需求不相称。这些不相称性主要表现在决策处理中的系统响应问题、决策数据需求的问题和决策数据操作的问题。,3,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.1,从传统数据库到数据仓库,(,续,),传统的事务处理环境不适宜于,决策支持应用,事务处理和分析处理的性能特性不同,数据集成问题,数据动态集成问题,历史数据问题,数据的综合问题,操作型环境和分析型环境的分离,:,数据抽取,4,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,现实生活中面临的问题,人们在日常生活中经常会遇到这样的情况:,超市的经营者希望将经常被同时购买的商品放在一起,以增加销售;,保险公司想知道购买保险的客户一般具有哪些特征;,医学研究人员希望从已有的成千上万份病历中找出患某种疾病的病人的共同特征,从而为治愈这种疾病提供一些帮助;,5,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,企业面临的问题,经过多年的计算机应用和市场积累,许多企业保存了大量原始数据和各种业务数据,它是企业生产经营活动的真实记录,由于缺乏集中存储和管理,这些数据不能为本企业加以利用,不能进行有效的统计、分析及评估,无法将这些数据转换成企业有用的信息,6,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,数据爆炸问题,自动的数据收集工具和成熟的数据库技术导致巨大的数据存储在文件系统、数据库和其它的信息库中。,我们会淹死在数据中,但却为信息、知识所饿,!,7,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,面临的挑战,如何在堆积如山的企业交易数据中发现具有商业价值的闪光点?,如何使您的企业或组织在激烈的市场竞争中保持对客户的吸引力?,如何预先发现和避免企业运作过程中不易察觉的商业风险?,8,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,数据仓库应运而生,数据仓库的出现和发展,是数据库和,OLTP,技术发展、数据库应用深化的产物;,目的是把数据库中的大量数据转化为有用信息,为企业更好地进行决策服务。,9,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,讨论话题一,数据仓库产生的源动力是什么?数据仓库系统是数据驱动还是需求驱动的,?,10,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,“,我们花了20多年的时间将数据放入数据库,如今是该将它们拿出来的时候了。,”,-著名的数据仓库专家,Ralph Kimball,市场需求是技术发展的源动力,1.2,数据仓库定义及基本特性,1.2.1,数据仓库定义,1.2.2,数据仓库基本特性,12,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.2.1,数据仓库定义,数据仓库(,Data Warehouse,)是一个,面向主题的(,Subject Oriented,),集成的(,Integrate,),相对稳定的(,Non-Volatile,),反映历史变化(,Time Variant,),的数据集合,用于支持管理决策。,13,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.2,数据仓库定义,数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。,数据仓库之父-,Bill Inmon,14,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.2,数据仓库基本特性,面向主题性,数据集成性,数据的时变性,数据的非易失性,15,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,面向主题性,面向主题性表示了数据仓库中数据组织的基本原则,数据仓库中的所有数据都是围绕着某一主题组织的。,确定主题以后,需要确定主题应该包含的数据。,不同的主题之间可能会出现相互重叠的信息。,主题在数据仓库中可以用多维数据库方式进行存储。,主题的划分中,必须保证每一个主题的独立性。,16,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,数据集成性,根据决策分析的要求,将分散于各处的源数据进行抽取、筛选、清理、综合等工作,最终集成到数据仓库中。,业务数据库,1,业务数据库,2,业务数据库,n,数据仓库,抽取转换清洗加载,17,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,数据的时变性,数据应该随着时间的推移而发生变化,不断地生成主题的新快照。,存量数据,T1,时点增量数据,Tn,时点增量数据,数据仓库,抽取转换清洗加载,初始主题数据,T1,时点主题数据,Tn,时点主题数据,18,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,数据的非易失性,数据的相对稳定性。,数据仓库中的数据只进行刷新,从不进行更新处理。,反映历史变化。,存量数据,T1,时点增量数据,Tn,时点增量数据,数据仓库,抽取转换清洗加载,初始主题数据,T1,时点主题数据,Tn,时点主题数据,时间戳锁定数据,19,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,讨论话题二,数据库和数据仓库有什么不同?,20,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,数据库与数据仓库的对比,对比内容,数据库,数据仓库,数据内容,当前值,历史的、存档的、归纳的、计算的数据,数据目标,面向业务操作程序、重复处理,面向主题域、管理决策分析应用,数据特性,动态变化、按字段更新,静态、不能直接更新、只定时添加,数据结构,高度结构化、复杂、适合操作计算,简单、适合分析,使用频率,高,中到低,数据访问量,每个事务只访问少量记录,有的事务可能要访问大量记录,对响应时间的要求,以秒为单位计量,以秒、分钟、甚至小时为计量单位,21,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.3,数据仓库与决策支持系统,决策支持系统的发展阶段,初始阶段(,DSS,阶段),与专家系统结合阶段(,IDSS,阶段),基于数据仓库技术阶段(,BI,阶段),基于数据仓库的决策支持系统,22,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,DSS,的先天不足,DSS,的先天不足,决策所需信息不足,难以满足决策支持系统的需要。,模型库提供的分析能力有限,人机接口部件占整个,DSS,开发工作量的一半,成为,DSS,实施中的一个瓶颈。,23,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,基于数据仓库的,DSS,基于数据仓库的,DSS,数据仓库为,DSS,的发展开辟了新途径,目前,DSS,的开发模式(,BI,解决方案),以数据仓库技术为基础,以联机分析、数据挖掘工具为手段,24,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.4,数据仓库体系结构,接,口,数据仓库,管理,环境,细节级数据,数据集市,1,数据集市,2,数据集市,n,ETL,逻辑 数据仓库组织与管理 数据利用,元数据,(MetaData),数据集市,x,主题数据,主题数据,主题数据,业务数据,系统,市场调查信息,数据源,外部数据,OLAP,DataMining,Forecasting,应用环境,专家经验数据,25,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.4.1,数据仓库的概念结构,从数据仓库的概念结构看,应该包含:数据源、数据准备区、数据仓库数据库、数据集市,/,知识挖掘库以及各种管理工具和应用工具。,数据集市,/,知识挖掘库,业务系统,外部数据源,数据准备区,数据仓库数据库,应用工具,管理工具,应用工具,数据集市,/,知识挖掘库,26,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.4.2,虚拟数据仓库结构,虚拟数据仓库利用描述了业务系统中数据位置和抽取数据算法的元数据直接从业务系统中抽取查询的数据进行概括、聚合操作后,将最终结果提供给用户。,用户,图,1.2,虚拟数据仓库结构,数据仓库查询管理服务器,业务系统数据库,27,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.4.3,数据集市结构,数据集市结构或称为主题结构的数据仓库是按照主题进行构思所形成的数据仓库,没有一个独立的数据仓库。系统的数据不存储在同一数据仓库中,每个主题有自己的物理存储区。,数据仓库查询管理服务器,业务系统数据库,主题,1,主题,2,28,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.4.4,单一数据仓库结构,将所有的主题都集中到一个大型数据库中的体系结构。数据源中数据被按照同一标准抽取到独立的数据仓库中,用户在使用时再根据主题将数据仓库中的数据发布到数据集市中。,数据仓库查询管理服务器,业务系统数据库,数据仓库,数据集市,1,数据集市,2,29,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.4.5,分布式数据仓库结构,在企业各个分公司具有相当大的独立性时,企业总部设置一个全局数据仓库,各个分公司设置各自的局部数据仓库。局部数据仓库主要存储各自的未经转换的细节数据,全局数据仓库中主要存储经过转换的综合数据。,站点,A,站点,B,总部,站点,C,站点,D,站点,C,站点,D,全局数据仓库,局部数据仓库,局部数据仓库,局部数据仓库,局部数据仓库,30,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,讨论话题三,数据仓库、数据集市、分析主题的关系是什么?,在数据集市间如何保证数据的一致性?,31,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,1.5,数据仓库相关概念,BI(,商务智能,),ETL,(抽取、转换、加载),META DATA,(,元数据),DATA MART(,数据集市,),SUBJECT(,主题,),DIMENSION(,维度,),32,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,商务智能,简单定义,综合企业所有沉淀下来的信息,用科学的分析方法,为企业领导提供科学决策信息的过程。,完整定义,基于数据仓库技术的决策支持系统,(DSS),。它,以数据仓库(,DW,)技术为基础,通过抽取、转换和清洗将分散在企业各处的数据整合在一起,转化为信息;进而以联机分析处理(,OLAP,)工具、数据挖掘(,DM,)工具、报表工具为手段将信息提升为知识;最后运用可视化技术以快捷直观的方式将探察分析结果呈现给最终用户,为管理决策层提供量化依据的过程。,33,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,ETL,抽取、转换、加载(,ETL,),数据抽取(,Extract,)、转换,Transform,)、清洗(,Cleansing,)、装载(,Load,)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。,34,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,元数据,元数据(,Meta Data,),关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理。为数据仓库的发展和使用提供方便。,35,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,数据集市,数据集市(,Data mart,),即,”,小数据仓库,”,。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只是面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。,36,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,主题,主题(,SUBJECT,),是一个在较高层次将数据归类的标准,每一个主题对应一个宏观的分析领域,针对具体决策需求可细化为多个主题表,具体来说就是确定决策涉及的范围和所要解决的问题。,37,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,维度,维度,(DIMENSION,),是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维,(,时间维、地理维等,),。,38,2005 iSoftStone Information Service Corporation.All rights reserved.,2024/12/3 周二,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




数据仓库基本概念PPT学习课件.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/6978029.html