统计学--数据的整理及图表展示.ppt
《统计学--数据的整理及图表展示.ppt》由会员分享,可在线阅读,更多相关《统计学--数据的整理及图表展示.ppt(65页珍藏版)》请在咨信网上搜索。
1、第第3章章 数据的整理与数据的整理与 图表展示图表展示3.1 数据的预处理数据的预处理3.2 品质数据的整理与展示品质数据的整理与展示3.3 数值型数据的整理与展示数值型数据的整理与展示.3.1 数据的预处理数据的预处理1.数据审核数据审核 发现数据中的错误发现数据中的错误2.数据筛选数据筛选 找出符合条件的数据找出符合条件的数据3.数据排序数据排序发现数据的基本特征发现数据的基本特征升序和降序升序和降序.数据筛选数据筛选例例3.1 3.1 表表3-13-1是是8 8名学生名学生4 4门课程的考试成绩门课程的考试成绩数据(单位:分)。试找出数据(单位:分)。试找出(1 1)统计学成绩等于)统计
2、学成绩等于8080分的学生分的学生(2 2)数学成绩最高的前三名学生,英语成绩)数学成绩最高的前三名学生,英语成绩最低的三名学生最低的三名学生(3 3)统计学成绩在)统计学成绩在80-9080-90之间的学生之间的学生(4 4)四门课程成绩都大于)四门课程成绩都大于7070分的学生分的学生.数据排序数据排序1.分类数据的排序分类数据的排序字字母母型型数数据据,排排序序有有升升序序降降序序之之分分,但但习习惯上用升序惯上用升序汉汉字字型型数数据据,可可按按汉汉字字的的首首位位拼拼音音字字母母排排列列,也也可可按按笔笔画画排排序序,其其中中也也有有笔笔画画多多少少的升序降序之分的升序降序之分2.数
3、值型数据的排序数值型数据的排序.分类汇总分类汇总 根据不同的研究目的,按照某个类别进根据不同的研究目的,按照某个类别进行汇总分析。行汇总分析。分类汇总之前要先按分类项排序。分类汇总之前要先按分类项排序。简单分类汇总简单分类汇总 多级分类汇总多级分类汇总.数据透视表数据透视表 利用数据透视表可以按照研究目的不同,利用数据透视表可以按照研究目的不同,进行交叉汇总分析,使研究者可以从各种进行交叉汇总分析,使研究者可以从各种角度、维度去查看分析数据,从繁杂的数角度、维度去查看分析数据,从繁杂的数据中挖掘和整合数据。据中挖掘和整合数据。.例例3.2 在某大学随机抽取在某大学随机抽取30名学生,调查名学生
4、,调查他们的性别、家庭所在地、平均月生活费他们的性别、家庭所在地、平均月生活费支出、平均每月购买衣物支出和购买衣物支出、平均每月购买衣物支出和购买衣物时所考虑的首选因素等,得到的数据如表时所考虑的首选因素等,得到的数据如表3-2,试建立一个数据透视表,在表的行变量试建立一个数据透视表,在表的行变量中给出性别和买衣物的首选因素,在列变中给出性别和买衣物的首选因素,在列变量中给出学生的家庭所在地区,对平均月量中给出学生的家庭所在地区,对平均月生活费和月平均衣物支出进行交叉汇总。生活费和月平均衣物支出进行交叉汇总。.3.2 品质数据的整理与展示品质数据的整理与展示 3.2.1 分类数据的整理与图示分
5、类数据的整理与图示 1.列出各类别列出各类别 2.计算各类别的频数计算各类别的频数 3.制作频数分布表制作频数分布表 4.用图形展示用图形展示.分类数据中需要计算的指标分类数据中需要计算的指标1.1.频频 数:落在各类别中的数据个数数:落在各类别中的数据个数 频数分布:把各个类别及落在其中的相应频频数分布:把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来。数全部列出,并用表格形式表现出来。2.2.比比 例:某一类别数据占全部数据的比值例:某一类别数据占全部数据的比值3.3.百分比:将对比的基数作为百分比:将对比的基数作为100100而计算的比值而计算的比值4.4.比比 率:不同类别
6、数值之间的比值率:不同类别数值之间的比值.【例例3.3】一家市场调查公司为研究不同品牌一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市饮料的市场占有率,对随机抽取的一家超市进行调查。调查员随机观察了进行调查。调查员随机观察了50名顾客购买名顾客购买饮料类型及购买者性别,并进行了记录,如饮料类型及购买者性别,并进行了记录,如果一个顾客购买某一品牌的饮料,就将这一果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。数据见饮料的品牌名字记录一次。数据见Excel表。表。要求:对饮料类型和顾客性别的分布状况进要求:对饮料类型和顾客性别的分布状况进行描述分析,求不同品牌饮料
7、的频数分布、行描述分析,求不同品牌饮料的频数分布、比例和百分比。比例和百分比。.方法一:数据透视表方法方法一:数据透视表方法利用数据透视表功能,进行频数分析。在数据透视表【布局】对话框中,依次将“饮料类型”拖到“行”区域以及“数据”区域,将“顾客性别”拖到“列”区域。.方法二:方法二:EXCEL中的函数功能中的函数功能插入插入 函数函数 数一数数一数 COUNT IF要计算某一类别的频数要计算某一类别的频数.分类数据的图示分类数据的图示条形图条形图 条条形形图图是是用用宽宽度度相相同同的的条条形形的的高高度度或长短来表示数据多少的图形或长短来表示数据多少的图形 各各类类别别可可以以放放在在纵纵
8、轴轴,称称为为条条形形图图,也也可以放在横轴,称为柱形图可以放在横轴,称为柱形图 对对比比条条形形图图(复复式式条条形形图图):显显示示分分类类变变量量在在不不同同时时间间或或不不同同空空间间上上的的差差异异或或变化变化.复式条形图复式条形图.对比条形图.分类数据的图示帕累托图1.按各类别数据出现的频数多少排序后绘制的柱形图 2.主要用于展示分类数据的分布.饼饼 图图1.饼饼图图:用用圆圆形形及及圆圆内内扇扇形形的的面面积积来来表表示示数值大小的图形。数值大小的图形。2.主主要要用用于于表表示示总总体体中中各各组组成成部部分分所所占占的的比例,对于研究结构性问题十分有用比例,对于研究结构性问题
9、十分有用3.在在绘绘制制圆圆形形图图时时,总总体体中中各各部部分分所所占占的的百百分分比比用用圆圆内内的的各各个个扇扇形形面面积积表表示示,这这些些扇扇形形的的中中心心角角度度,是是按按各各部部分分百百分分比比占占3600的相应比例确定的的相应比例确定的.环形图环形图1.环环形形图图中中间间有有一一个个“空空洞洞”,总总体体中中的的每一部分数据用环中的一段表示每一部分数据用环中的一段表示2.环形图与饼图类似,但又有区别环形图与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例环环形形图图则则可可以以同同时时绘绘制制多多个个总总体体的的数数据据系系列,每
10、一个总体的数据系列为一个环列,每一个总体的数据系列为一个环3.环形图可用于进行比较研究环形图可用于进行比较研究 4.环形图可用于展示分类数据和顺序数据环形图可用于展示分类数据和顺序数据.8%8%36%36%31%31%15%15%7%7%33%33%26%26%21%21%13%13%10%10%非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 图图图图3-4 3-4 3-4 3-4 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价.3.2.2 顺序数据的整理与图示顺序数据的整理与图示1.累积频数:
11、将各有序类别的频数逐级累加累积频数:将各有序类别的频数逐级累加起来得到的频数。起来得到的频数。向上累积:从类别顺序的开始一方,向类别向上累积:从类别顺序的开始一方,向类别 顺序的最后一方累加频数;顺序的最后一方累加频数;向下累积:从类别顺序的最后一方,向类别向下累积:从类别顺序的最后一方,向类别 顺序的开始一方累加频数。顺序的开始一方累加频数。2.累积频率:将各类别的百分比逐级累加累积频率:将各类别的百分比逐级累加.【例例例例3.53.5】在一项城市住房问题的研在一项城市住房问题的研在一项城市住房问题的研在一项城市住房问题的研究中,研究人员在甲乙两个城市究中,研究人员在甲乙两个城市究中,研究人
12、员在甲乙两个城市究中,研究人员在甲乙两个城市各抽样调查各抽样调查各抽样调查各抽样调查300300户,其中的一个问户,其中的一个问户,其中的一个问户,其中的一个问题是:题是:题是:题是:“您对您家庭目前的住房您对您家庭目前的住房您对您家庭目前的住房您对您家庭目前的住房状况是否满意?状况是否满意?状况是否满意?状况是否满意?1 1非常不满意;非常不满意;非常不满意;非常不满意;2 2不满意;不满意;不满意;不满意;3 3一般;一般;一般;一般;4 4满意;满意;满意;满意;5 5非常满意。非常满意。非常满意。非常满意。.甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回
13、答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0.乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分
14、比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意209812040226.732.74013.37.3合计合计300100.0.乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意209812040226.732.74013.37.3201182382783006.739.
15、479.492.7100300280182622210093.360.620.67.3合计合计300100.0.24243003001321322252252702700 0100100200200300300400400 非常非常不满意不满意 不满意不满意 一般一般 满意满意 非常非常满意满意累累积积户户数数(户)(户)(a)(a)向上累积向上累积向上累积向上累积276276168168303030030075750 0100100200200300300400400 非常非常不满意不满意 不满意不满意 一般一般 满意满意 非常非常满意满意累累积积户户数数(户)(户)(b)(b)向下累积向下
16、累积向下累积向下累积甲城市家庭对住房状况评价的累积频数分布图甲城市家庭对住房状况评价的累积频数分布图甲城市家庭对住房状况评价的累积频数分布图甲城市家庭对住房状况评价的累积频数分布图.3.3 数值型数据的整理与显示数值型数据的整理与显示 3.3.1 数据的分组数据的分组 .单变量值分组单变量值分组(要点)(要点)适合于离散变量适合于离散变量 适合于变量值较少的情况适合于变量值较少的情况 步骤:步骤:排序排序排序排序将一个变量将一个变量将一个变量将一个变量值作为一组值作为一组值作为一组值作为一组.117 122 124 129 139 107 117 117 122 124 129 139 107
17、 117 117 122 124 129 139 107 117 130 122 125 108 131 125 117130 122 125 108 131 125 117130 122 125 108 131 125 117122 133 126 122 118 108 110122 133 126 122 118 108 110122 133 126 122 118 108 110118 123 126 133 134 127 123118 123 126 133 134 127 123118 123 126 133 134 127 123118 112 112 134 127 123
18、119 118 112 112 134 127 123 119 118 112 112 134 127 123 119 113 120 123 127 135 137 114 113 120 123 127 135 137 114 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121120 128 124 115 139 128 124 121120 128 124 115 139 128 124 121【例例例例3.63.6】某某某某生生生生 产产产产 车车车车 间间间间 5050名名名名工工工工人人人人日日日日加加加加工工工
19、工零零零零件件件件数数数数如如如如下下下下(单单单单位位位位:个个个个)。试试试试采采采采用用用用单单单单变变变变量量量量值值值值对对对对数数数数据据据据进进进进行行行行分组。分组。分组。分组。.107 108 108 110 112 112 113 114 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 120 120 121 122 122 122 122 123 123 123 12
20、3 124 124 124 125 125 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 130 131 133 133 134 134 135 137 139 139139 139.某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数
21、零件数(个个)频数频数(人人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112.组距分组组距分组(要点)(要点)适合于连续变量n n适合于变量值较多的情况n n将变量值的一个区间作为一组n n可采用等距分组,也可采用不等距分组 .组距分组组距分组(几个概念)(几个概念)1.下下 限:一个组的最小值限:一个组的最小值2.上上 限:一个组的最大值限:一个组的最大值3.组组 距:上限与下限之差距:上限与下限之差4.组中值:下限与上限之
22、间的中点值组中值:下限与上限之间的中点值下限值下限值+上限值上限值2组中值组中值.组距分组组距分组第第1步:排序,确定组数(步:排序,确定组数(K)5K15 能够显示数据的分布特征和规律能够显示数据的分布特征和规律第第2步:确定组距步:确定组距 组距(最大值最小值)组距(最大值最小值)组数组数 组距宜取组距宜取5 5或或1010的倍数的倍数 .第一组的下限应低于最小值,第一组的下限应低于最小值,最后一组的上限应高于最大值。最后一组的上限应高于最大值。遵循遵循“不重不漏不重不漏”的原则的原则 第第3步:根据分组整理成频数分布表步:根据分组整理成频数分布表上组限不在内上组限不在内.等距分组表等距分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 整理 图表 展示
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。