第二章-数据整理.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 数据 整理
- 资源描述:
-
第二章第二章 统计数据的整理与显示统计数据的整理与显示统计学第二章第二章 统计数据的整理与显示统计数据的整理与显示第一节第一节 数据的预处理数据的预处理 第二节第二节 品质数据的整理与显示品质数据的整理与显示第三节第三节 数值型数据的整理与显示数值型数据的整理与显示第四节第四节 统计表统计表学习目标学习目标1.了解数据预处理的内容和目的了解数据预处理的内容和目的2.掌握品质数据整理与显示的方法掌握品质数据整理与显示的方法3.掌握数值型数据整理与显示的方法掌握数值型数据整理与显示的方法4.用用Excel作作频数分布表和形频数分布表和形图图5.合理使用统计表合理使用统计表第一节第一节 数据的预处理数据的预处理一一.数据的审核与筛选数据的审核与筛选二二.数据的排序数据的排序数据的审核、筛选与排序数据的审核、筛选与排序1.数据的审核发现数据中的错误发现数据中的错误2.数据的筛选找出符合条件的数据找出符合条件的数据3.数据排序发现数据的基本特征发现数据的基本特征升序和降序升序和降序数据的审核数据的审核(原始数据)(原始数据)审核的内容审核的内容1.完整性审核n n检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏n n所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全2.准确性审核n n检检查查数数据据是是否否真真实实反反映映客客观观实实际际情情况况,内内容是否符合实际容是否符合实际n n检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等数据的审核数据的审核(原始数据)(原始数据)审核数据准确性的方法审核数据准确性的方法1.逻辑检查n n从从定定性性角角度度,审审核核数数据据是是否否符符合合逻逻辑辑,内内容容是是否否合理,各项目或数字之间有无相互矛盾的现象合理,各项目或数字之间有无相互矛盾的现象n n主要用于对定类数据和定序数据的审核主要用于对定类数据和定序数据的审核2.计算检查n n检检查查调调查查表表中中的的各各项项数数据据在在计计算算结结果果和和计计算算方方法法上有无错误上有无错误n n主要用于对定距和定比数据的审核主要用于对定距和定比数据的审核数据的审核数据的审核(第二手数据)(第二手数据)1.适用性审核n n弄弄清清楚楚数数据据的的来来源源、数数据据的的口口径径以以及及有有关关的的背景材料背景材料n n确定这些数据是否符合自己分析研究的需要确定这些数据是否符合自己分析研究的需要2.时效性审核n n应尽可能使用最新的统计数据应尽可能使用最新的统计数据3.确认是否必要做进一步的加工整理数据的筛选数据的筛选1.对审核过程中发现的错误应尽可能予以纠正2.当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选3.数据筛选的内容包括:将将某某些些不不符符合合要要求求的的数数据据或或有有明明显显错错误误的的数数据予以剔除据予以剔除将将符符合合某某种种特特定定条条件件的的数数据据筛筛选选出出来来,而而不不符合特定条件的数据予以剔出符合特定条件的数据予以剔出数据的排序数据的排序(要点)(要点)1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成数据的排序数据的排序 (方法)(方法)1.定类数据的排序字字母母型型数数据据,排排序序有有升升序序降降序序之之分分,但但习习惯惯上上用升序用升序汉汉字字型型数数据据,可可按按汉汉字字的的首首位位拼拼音音字字母母排排列列,也也可可按按笔笔画画排排序序,其其中中也也有有笔笔画画多多少少的的升升序序降降序之分序之分2.定距和定比数据的排序n n递递增增排排序序:设设一一组组数数据据为为X X1 1,X X2 2,X XN N,递递增排序后可表示为:增排序后可表示为:X X(1)(1)X X(2)(2)X X(2)(2)X X(N)(N)第二节第二节 品质数据的整理与显示品质数据的整理与显示一一.定类数据的整理与显示定类数据的整理与显示二二.定序数据的整理与显示定序数据的整理与显示定类数据的整理与显示定类数据的整理与显示定类数据的整理与显示定类数据的整理与显示(基本问题)(基本问题)1.要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的2.对定类数据和定序数据主要是做分类整理3.对定距数据和定比数据则主要是做分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据定类数据的整理定类数据的整理(基本过程基本过程)1.列出各类别 2.2.计算各类别的频数3.制作频数分布表4.用图形显示数据定类数据的整理定类数据的整理(可计算的指标可计算的指标)1.频频 数:数:落在各类别中的数据个数2.比比 例:例:某一类别数据占全部数据的比值3.百分比:百分比:将对比的基数作为100而计算的比值4.比比 率:率:不同类别数值的比值定类数据整理定类数据整理频数分布表频数分布表(实例)(实例)【例例例例3.13.1】为为研研究究广广告告市市场场的的状状况况,一一家家广广告告公公司司在在某某城城市市随随机机抽抽取取200200人人就就广广告告问问题题做做了了邮邮寄寄问问卷卷调调查查,其其中中的的一一个个问问题题是是“您您比比较较关关心下列哪一类广告?心下列哪一类广告?”1 1商商品品广广告告;2 2服服务务广广告告;3 3金金融融广广告告;4 4房房地地产产广广告告;5 5招招生生招招聘聘广广告告;6 6其他广告。其他广告。表表表表3-1 3-1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型广告类型广告类型人数人数人数人数(人人人人)比例比例比例比例频率频率频率频率(%)(%)商品广告商品广告商品广告商品广告 服务广告服务广告服务广告服务广告 金融广告金融广告金融广告金融广告 房地产广告房地产广告房地产广告房地产广告 招生招聘广告招生招聘广告招生招聘广告招生招聘广告 其他广告其他广告其他广告其他广告11211251519 9161610102 20.5600.5600.2550.2550.0450.0450.0800.0800.0500.0500.0100.01056.056.025.525.54.54.58.08.05.05.01.01.0合计合计合计合计2002001 1100100定类数据的图示定类数据的图示条形图条形图(条形图的制作)(条形图的制作)1.条形图是用宽度相同的条形的高度或长短来表示数据变动的图形2.条形图有单式、复式等形式3.在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率4.绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图定类数据的图示定类数据的图示条形图条形图(由(由 Excel Excel 绘制的条形图)绘制的条形图)人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 图图3-1 3-1 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布定类数据的图示定类数据的图示圆形图圆形图(圆形图的制作)(圆形图的制作)1.也也称称饼饼图图,是是用用圆圆形形及及园园内内扇扇形形的的面面积积来来表表示示数数值大小的图形值大小的图形2.主主要要用用于于表表示示总总体体中中各各组组成成部部分分所所占占的的比比例例,对对于研究结构性问题十分有用于研究结构性问题十分有用3.在在绘绘制制圆圆形形图图时时,总总体体中中各各部部分分所所占占的的百百分分比比用用园园内内的的各各个个扇扇形形面面积积表表示示,这这些些扇扇形形的的中中心心角角度度,是按各部分百分比占是按各部分百分比占3603600 0的相应比例确定的的相应比例确定的4.例例如如,关关注注服服务务广广告告的的人人数数占占总总人人数数的的百百分分比比为为25.5%25.5%,那那 么么 其其 扇扇 形形 的的 中中 心心 角角 度度 就就 应应 为为3603600 025.5%25.5%91.891.80 0,其余类推,其余类推定类数据的图示定类数据的图示圆形图圆形图(由(由 Excel Excel 绘制的圆形图)绘制的圆形图)其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5%服务广告25.5%招生招聘广告5.8%图图3-2 3-2 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成定序数据的整理与显示定序数据的整理与显示定序数据的整理定序数据的整理(可计算的指标)(可计算的指标)1.累计频数:累计频数:将各类别的频数逐级累加2.累计频率:累计频率:将各类别的频率(百分比)逐级累加 定序数据频数分布表定序数据频数分布表(实例(实例 )【例例例例3.23.2】在在一一项项城城市市住住房房问问题题的的研研究究中中,研研究究人人员员在在甲甲乙乙两两个个城城市市各各抽抽样样调调查查300300户户,其其中中的的一一个个问问题题是是:“您您对对您您家家庭庭目目前前的的住住房房状状况况是是否否满满意意?1 1非非常常不不满满意意;2 2不不满满意意;3 3一一般般;4 4满满意;意;5 5非常满意。非常满意。表表表表3-2 3-2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530308 8363631311515101024241321322252252702703003008.08.044.044.075.075.090.090.0100.0100.030030027627616816875753030100.0100.09292565625251010合计合计合计合计300300100.0100.0定序数据频数分布表定序数据频数分布表(实例(实例 )表表表表3-3 3-3 乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别乙城市乙城市乙城市乙城市户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意212199997878646438387.07.033.033.026.026.021.321.312.712.721211201201981982622623003007.07.040.040.066.066.087.387.3100.0100.03003002792791801801021023838100.0100.093.093.060.060.034.034.012.712.7合计合计合计合计300300100.0100.0定序数据的图示定序数据的图示累计频数分布图累计频数分布图(由(由 Excel Excel 绘制的累计频数分布图)绘制的累计频数分布图)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向下累积向下累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向上累积向上累积图图图图3-3 3-3 甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布定类数据的图示定类数据的图示环形图环形图(环形图的制作)(环形图的制作)1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别n n圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例n n环环形形图图则则可可以以同同时时绘绘制制多多个个总总体体的的数数据据系系列列,每一个总体的数据系列为一个环每一个总体的数据系列为一个环3.环形图可用于进行比较研究 4.环形图可用于展示定类和定序的数据品质数据的图示品质数据的图示环形图环形图(由(由 Excel Excel 绘制的环形图)绘制的环形图)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 图图3-4 3-4 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价第三节第三节 数值型数据的整理与显示数值型数据的整理与显示一一.数据的分组数据的分组二二.数值型数据的图示数值型数据的图示三三.频数分布的类型频数分布的类型频数分布表的编制频数分布表的编制编制频数分布表的步骤编制频数分布表的步骤确确定定组组数数编制频数分编制频数分布表的步骤布表的步骤确确定定组组距距计计算算频频数数编编制制表表格格频数分布表的编制频数分布表的编制(实例)(实例)117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108108 131 125 117 122 133 126 122 118 108108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135112 134 127 123 119 113 120 123 127 135112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 121【例例例例3.33.3】某某生生产产车车 间间 5050名名 工工 人人 日日加加工工零零件件数数如如下下(单单位位:个个)。试试采采用用单单变变量量值值对数据进行分组。对数据进行分组。分组方法分组方法等距分组等距分组异距分组异距分组单变量值分组单变量值分组(要点)(要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况单变量值分组表单变量值分组表(实例)(实例)表表表表3-4 3-4 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数零件数零件数(个个个个)频数频数频数频数(人人人人)零件数零件数零件数零件数(个个个个)频数频数频数频数(人人人人)零件数零件数零件数零件数(个个个个)频数频数频数频数(人人人人)1071071081081101101121121131131141141151151171171181181 12 21 12 21 11 11 13 33 31191191201201211211221221231231241241251251261261271271 12 21 14 44 43 32 22 23 31281281291291301301311311331331341341351351371371391392 21 11 11 12 22 21 11 12 2组距分组组距分组(要点)(要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.必须遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组 组距分组组距分组(步骤)(步骤)1.1.确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征和和规规律律为为目目的的。在在实实际际分分组组时时,可可以以按按 SturgesSturges 提提出的经验公式来确定组数出的经验公式来确定组数K K2.2.确确定定各各组组的的组组距距:组组距距(Class(Class Width)Width)是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所分的组数来确定,即所分的组数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值)最小值)最小值)最小值)组数组数组数组数 3.3.根据分组整理成频数分布表根据分组整理成频数分布表 组距分组组距分组(几个概念)(几个概念)1.下下 限:限:一个组的最小值2.上上 限:限:一个组的最大值3.组组 距:距:上限与下限之差4.组中值:组中值:下限与上限之间的中点值下限值下限值+上限值上限值2组中值组中值等距分组表等距分组表(上下组限重叠)(上下组限重叠)表表表表3-5 3-5 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组按零件数分组按零件数分组频数(人)频数(人)频数(人)频数(人)频率(频率(频率(频率(%)105105 110110110110 115115115115 120120120120 125125125125 130130130130 135135135135 1401403 35 58 8141410106 64 46 6101016162828202012128 8合计合计合计合计5050100100等距分组表等距分组表(上下组限间断)(上下组限间断)表表表表3-6 3-6 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组按零件数分组按零件数分组频数(人)频数(人)频数(人)频数(人)频率(频率(频率(频率(%)105105 109109110110 114114115115 119119120120 124124125125 129129130130 134134135135 1391393 35 58 8141410106 64 46 6101016162828202012128 8合计合计合计合计5050100100等距分组表等距分组表(使用开口组)(使用开口组)表表表表3-7 3-7 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组按零件数分组按零件数分组频数(人)频数(人)频数(人)频数(人)频率(频率(频率(频率(%)110110以下以下以下以下110110 114114115115 119119120120 124124125125 129129130130 134134135135以上以上以上以上3 35 58 8141410106 64 46 6101016162828202012128 8合计合计合计合计5050100100组距分组与不等距分组组距分组与不等距分组(在表现频数分布上的差异)(在表现频数分布上的差异)1.等距分组n n各组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响n n可可直直接接根根据据绝绝对对频频数数来来观观察察频频数数分分布布的的特特征征和和规律规律2.不等距分组n n各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响n n各各组组绝绝对对频频数数的的多多少少不不能能反反映映频频数数分分布布的的实实际际状况状况n n需需要要用用频频数数密密度度(频频数数密密度度频频数数/组组距距)反反映映频数分布的实际状况频数分布的实际状况数值型数据的图示数值型数据的图示用用ExcelExcel作图作图以下图形均由以下图形均由以下图形均由以下图形均由计算机绘制计算机绘制计算机绘制计算机绘制!ExcelSTATISTICASTATISTICA分组数据分组数据直方图直方图(直方图的制作)(直方图的制作)1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面面积积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)3.直方图下的总面积等于1 1分组数据分组数据直方图直方图(直方图的绘制)直方图的绘制)频频频频频频数数数数数数(人人人人人人)151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)直方图下的面直方图下的面积之和等于积之和等于1 1图图图图3-5 3-5 某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图我一眼就看出我一眼就看出来了,大多数来了,大多数人的日加工零人的日加工零件数在件数在120120125125之间之间!分组数据分组数据直方图直方图(直方图与条形图的区别)(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列分组数据分组数据折线图折线图(折线图的制作)(折线图的制作)1.折线图也称频数多边形图折线图也称频数多边形图(Frequency polygon)(Frequency polygon)2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点(组组中值中值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是n n第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与其竖边中点连接到横轴与其竖边中点连接到横轴n n折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者者所表示的频数分布是一致的所表示的频数分布是一致的151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)频频频频频频数数数数数数(人人人人人人)折线图下的面积折线图下的面积与直方图的面积与直方图的面积相等!相等!分组数据分组数据折线图折线图(折线图的绘制)(折线图的绘制)图图图图3-6 3-6 某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由由数数字字组组成的成的3.3.以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.4.对于对于n n(20(20n n300)300)个数据,茎叶图最大行数不超过个数据,茎叶图最大行数不超过 L L=10 log=10 log 10 10 n n 5.5.茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别 直直方方图图可可大大体体上上看看出出一一组组数数据据的的分分布布状状况况,但但没没有有给给出出具体的数值具体的数值 茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数值,保留了原始数据的信息数值,保留了原始数据的信息树茎树茎树茎树茎 树叶树叶树叶树叶788788022347778889022347778889013344579901334457991010111112121313数据个数数据个数数据个数数据个数3 3131324241010茎叶图类似横置茎叶图类似横置的直方图的直方图未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)图图图图3-7 3-7 某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图未分组数据未分组数据茎叶图茎叶图(扩展的茎叶图)(扩展的茎叶图)树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶10s10s10s10.10.10.11*11*11*11t11t11t11f11f11f11s11s11s11.11.11.12*12*12*12t12t12t12f12f12f12s12s12s12.12.12.13*13*13*12t12t12t13f13f13f13s13s13s13.13.13.7 778 88 88 80 002 2 32 2 32 2 34 54 54 57 7 77 7 77 7 78 8 8 98 8 8 98 8 8 90 0 10 0 10 0 12 2 2 2 3 3 3 32 2 2 2 3 3 3 32 2 2 2 3 3 3 34 4 4 5 54 4 4 5 54 4 4 5 56 6 7 7 76 6 7 7 76 6 7 7 78 8 98 8 98 8 90 10 10 13 33 33 34 4 54 4 54 4 57 779 99 99 9树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶10*10*10*10.10.10.11*11*11*11.11.11.12*12*12*12.12.12.13*13*13*13.13.13.7 8 87 8 87 8 80 2 2 3 40 2 2 3 40 2 2 3 45 7 7 7 8 8 8 95 7 7 7 8 8 8 95 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 90 1 3 3 4 4 0 1 3 3 4 4 0 1 3 3 4 4 5 7 9 95 7 9 95 7 9 9图图图图3-8 3-8 图图图图3.73.7扩展后的茎叶图扩展后的茎叶图扩展后的茎叶图扩展后的茎叶图未分组数据未分组数据箱线图箱线图(箱线图的制作)(箱线图的制作)1.用于显示未分组的原始数据或分组数据的分布2.箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.其绘制方法是:n n首首先先找找出出一一组组数数据据的的5 5个个特特征征值值,即即最最最最大大大大值值值值、最最最最小小小小值值值值、中中中中位位位位数数数数MMe e 和和两两个个四四四四分分分分位位位位数数数数(下下四四分分位位数数Q QL L和上四分位数和上四分位数Q QU U)n n连连接接两两个个四四分分(位位)数数画画出出箱箱子子,再再将将两两个个极极值值点与箱子相连接点与箱子相连接 未分组数据未分组数据单批数据箱线图单批数据箱线图(箱线图的构成)(箱线图的构成)中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值图图图图3-9 3-9 简单箱线图简单箱线图简单箱线图简单箱线图未分组数据未分组数据单批数据箱线图单批数据箱线图(实例)(实例)最小值最小值最小值107107107最大值最大值最大值139139139中位数中位数中位数123123123下四分位数下四分位数下四分位数117.75117.75117.75上四分位数上四分位数上四分位数128128128105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140图图图图3-10 503-10 50名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图分布的形状与箱线图分布的形状与箱线图 对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU图图图图3-11 3-11 不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图未分组数据未分组数据多批数据箱线图多批数据箱线图(实例)(实例)【例例例例 3.43.4】从从某某大大学学经经济济管管理理专专业业二二年年级级学学生生中中随随机机抽抽取取1111人人,对对8 8门门主主要要课课程程的的考考试试成成绩绩进进行行调调查查,所所得得结结果果如如表表3-83-8。试试绘绘制制各各科科考考试试成成绩绩的的批批比比较较箱箱线线图图,并并分分析析各各科科考考试试成成绩绩的分布特征的分布特征表表表表3-8 113-8 11名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称课程名称课程名称学生编号学生编号学生编号学生编号1 12 23 34 45 56 67 78 89 910101111英语英语英语英语经济数学经济数学经济数学经济数学西方经济学西方经济学西方经济学西方经济学市场营销学市场营销学市场营销学市场营销学财务管理财务管理财务管理财务管理基础会计学基础会计学基础会计学基础会计学统计学统计学统计学统计学计算机应用基础计算机应用基础计算机应用基础计算机应用基础7676656593937474686870705555858590909595818187877575737391917878979751517676858570709292686881817171747488886969848465657373959570707878666690907373787884847070939363637979808060608787818167678686919183837777767690907070828283838282929284848181707069697272787875757878919188886666949480808585717186867474686879796262818181815555787870707575686871717777未分组数据未分组数据多批数据箱线图多批数据箱线图(由由由由STATIATICASTATIATICASTATIATICASTATIATICA绘制的多批数据箱线图绘制的多批数据箱线图绘制的多批数据箱线图绘制的多批数据箱线图)图图图图3-12 83-12 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图图图图图3-13 113-13 11名学生名学生名学生名学生8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图Min-Max25%-75%Median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据未分组数据箱线图箱线图(由由由由STATIATICASTATIATICASTATIATICASTATIATICA绘制的多批数据箱线图绘制的多批数据箱线图绘制的多批数据箱线图绘制的多批数据箱线图)时间序列数据时间序列数据线图线图(线图的制作)(线图的制作)绘制线图时应注意以下几点绘制线图时应注意以下几点1.时间一般绘在横轴,指标数据绘在纵轴2.图形的长宽比例要适当,其长宽比例大致为10:73.一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断时间序列数据时间序列数据线图线图(实例)(实例)【例【例【例【例3.53.5】已知已知1991199119981998年年我国城乡居民我国城乡居民家庭的人均收家庭的人均收入数据如表入数据如表3-3-1111。试绘制线。试绘制线图图¥表表表表3-11 19913-11 199119981998年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份年份年份城镇居民城镇居民城镇居民城镇居民农村居民农村居民农村居民农村居民19911991199219921993199319941994199519951996199619971997199819981700.61700.62026.62026.62577.42577.43496.23496.24283.04283.04838.94838.95160.35160.35425.15425.1708.6708.6 784.0 784.0 921.6 921.61221.01221.01577.71577.71926.11926.12091.12091.12162.02162.0时间序列数据时间序列数据(由(由 Excel Excel 绘制的线图)绘制的线图)020004000600019911992199319941995199619971998城镇居民农村居民收收入入(元)(元)图图3-14 3-14 城乡居民家庭人均收入城乡居民家庭人均收入1.雷达图(Radar Chart)是显示多个变量的常用图示方法3.在显示或对比各变量的数值总和时十分有用4.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比5.可用于研究多个样本之间的相似程度多变量数据多变量数据雷达图雷达图(要点)(要点)设有n组样本S1,S2,Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是多变量数据多变量数据雷达图雷达图(雷达图的制作)(雷达图的制作)n n 先先做做一一个个圆圆,然然后后将将圆圆展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




第二章-数据整理.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/5474265.html