分享
分销 收藏 举报 申诉 / 39
播放页_导航下方通栏广告

类型厦门大学应用多元统计分析第11章多变量可视化分析.ppt

  • 上传人:精****
  • 文档编号:12548401
  • 上传时间:2025-10-28
  • 格式:PPT
  • 页数:39
  • 大小:1.55MB
  • 下载积分:12 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    厦门大学 应用 多元 统计分析 11 多变 可视化 分析
    资源描述:
    单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,厦门大学应用多元统计分析第11章多变量可视化分析,第一节 引言,众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪70年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。,从研究的成果来看,主要可以分为两类:,一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;,另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数据的维数降为2维或1维,然后再在平面上表示。例如前面介绍的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。这里仅介绍5种实用而有效的多变量可视化方法。,表是我国华北地区5个省市2003年城镇居民家庭平均每人全年消费性支出的六项指标数据,下面分别用5种可视化方法对数据进行分析。,考虑微机的普及应用,本章主要介绍5种图形的制作方法,图形的制作则通过电脑实现。折线图、条形图、矩阵散点图在SPSS中制作,雷达图和星座图则在EXCEL中实现。,表11.1 华北5省市城镇居民家庭消费性支出,第二节 折线图分析法,折线图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。折线图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。,折线图的作图原理如下:,(1)作平面坐标系,横坐标取,p,个点,表示,p,个变量,纵坐,标表示变量取值。,(2)对给定的样品观测值,在,p,个点的纵坐标上标出相应的,变量取值。,(3)将表示,p,个变量取值的点连接成一条折线,即得到了表,示一个样品观测数据的折线,,n,次观测可绘出,n,条折 线,构成多变量折线图。,在SPSS中作折线图的方法如下:,(1)将原始数据输入SPSS中。注意数据的组织形式要像图那样。即把不同地区当成变量,而把支出指标当成观测。,图11.1 作折线图时的数据组织形式,(2)选择菜单项GraphsLine,打开Line Charts对话框,如图。在对话框上方的三个选项用于选择折线图的形式,由于是这里是多变量作图,所以选择Multiple。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Multiple Line对话框。,图11.2 Line Charts对话框,(3)在Define Multiple Line对话框中,将代表不同地区的5个变量移入Lines Represent列表框中,将代表支出指标的变量(variable)移入Variable框中。单击OK按钮,即可作出如图所示的折线图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。,图11.3 Define Multiple Line对话框,图11.4 折线图,第三节 条形图分析法,条形图是由若干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。,按图所示的方式在SPSS中组织好数据后,条形图的制作步骤如下:,(1)选择菜单项GraphsLine,打开Bar Charts对话框,该对话框与图所示的Line Charts对话框有相同的选项。在对话框上方的三个选项用于选择条形图的形式,由于是这里是多变量作图,所以选择Clustered。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Clustered Bar对话框。,(2)在Define Clustered Bar对话框中,将代表不同地区的5个变量移入Bars Represent列表框中,将代表支出指标的变量移入Variable框中。单击OK按钮,即可作出如图所示的条形图。,图11.5 条形图,可以发现,折线图和条行图的作图过程几乎相同,作图原理也大同小异,折线图是以折线的高低来表示变量的大小,条形图是以矩形的高低来表示变量的大小。,从图也可以得出与折线图同样的结论:北京市各项支出都比较高,而山西省各项支出都比较低。,第四节 散点图分析法,散点图又称散布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图则是一种反映多个变量之间相关关系的二维散点图。,利用SPSS制作矩阵散点图的步骤如下:,(1)在SPSS中按图的形式组织数据,即把支出指标当成变量,而把不同地区当成观测。,图11.6 作散点图时的数据组织形式,(2)选择菜单项GraphsScatter,打开Scatter plot对话框,如图。该对话框用于选择散点图的形式。选定Matrix,即矩阵散点图,单击Define按钮,打开Scatter plot Matrix对话框,如图。,图11.7 Scatter plot对话框,图11.8 Scatter plot Matrix对话框,(3)在打开的Scatter plot Matrix对话框中,将食品、衣着、居住三个变量移入Matrix Variables列表框中,将标志变量region移入Label Cases by列表框中。,(4)点击OK按钮,得到如图所示的矩阵散点图。,从图可以看出,河北、山西、内蒙古在居住和食品消费支出方面与北京、天津相比较低,食品与居住支出变量之间存在一定的线性关系。天津在衣着支出方面较低,与最低的河北接近,与最高居住支出形成鲜明对比。北京则除在居住支出方面低于天津外,其他方面支出均高于华北其他省市。内蒙古则在衣着支出方面仅次于北京,显示出某种特殊消费特征。,图11.9 矩阵散点图,另外,还可以作三维立体散点图。只需在Scatter plot对话框(图)中选择3-D选项。在跳出的3-D Scatter plot对话框中将食品、衣着、居住三个变量分别移入X Axis、Y Axis和Z Axis列表框中,将标志变量region移入Label Cases by列表框中。单击OK按钮,则作出图所示的三维立体散点图。,矩阵散点图不仅可以在二维平面上同时反映多个变量数值,而且可以用于直观反映多个变量间是否存在某种关系。与三维立体图相比,有着更好的可视性。比较图与图不难看出这一点。,图11.10 三维立体散点图,第五节 雷达图分析法,雷达图是一种较为常用的多变量可视化图形。在雷达图中,每个变量都有它自己的数值轴,每个数值轴都是从中心向外辐射。由于图形就好像雷达荧光屏上的图像,故称其为雷达图。又像蜘蛛网,所以也称蛛网图。,雷达图的作图方法:,(1)作一圆,并按变量的个数,p,将圆周分成,p,等分。,(2)连接圆心和各分点,将这,p,条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。,(3)对给定的一次观测值,将每个变量值分别标在相应的坐标轴上,把,p,个点相连就形成了一个,p,边形,,n,次观测值就可画出,n,个,p,边形。,例如,根据表中的数据,调用EXCEL图表向导,选择雷达图,然后按图表向导提示,即可制作出如图17所示的雷达图。图画出了北京、天津和河北的雷达图,从图可以看出,三省市消费支出结构有较大差异。北京人均消费支出的各项指标都高,对应面积最大的六边形,其次是天津,在三个省市中面积最小的是河北,天津在居住支出方面与北京较为接近,而在衣着和交通、通讯支出方面则与河北接近。其他支出方面三地存在较大差异。利用雷达图的形状、面积大小,可以对样品进行初始分类分析。,为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,具体的分配办法要结合分析的问题而定。例如可将要对比的指标分布在左、右或上、下方,以便于对比分析。,当观测次数,n,较大和指标较多时,画出的雷达图线段太多,图形的效果会很差。为了获得较好的可视化效果,在一张雷达图上可以画几个样品观测数据,甚至一张雷达图只画一个样品观测数据。如图所示,对这些图进行比较分析,也可了解其特点。,图,图,图,图,图,图,图,第六节 星座图分析法,星座图是将高维空间的样本点投影到平面上的一个半圆内,用投影点表示样本点的多元图示方法。由于样本点在半圆内的投影犹如浩瀚苍穹中的星座,因此而称其为星座图。,星座图的作图方法:,(1)通过对观测数据,X,ij,作极差标准化变换,将其变换为角度,ij,:,最后,利用EXCEL中的散点图制作功能可得如图所示的星座图。,图11.18 星座图,本章结束,谢谢大家!,
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:厦门大学应用多元统计分析第11章多变量可视化分析.ppt
    链接地址:https://www.zixin.com.cn/doc/12548401.html
    页脚通栏广告

    Copyright ©2010-2025   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork