ch04统计分布的数值特征.pptx
《ch04统计分布的数值特征.pptx》由会员分享,可在线阅读,更多相关《ch04统计分布的数值特征.pptx(96页珍藏版)》请在咨信网上搜索。
1、数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)介绍如何将一个现象分布的特征,提炼出来。以及这些特征值有什么作用?怎样计算?Ch4 主要内容主要内容Ch4 统计分布的数值特征统计分布的数值特征4.1 数值平均数数值平均数4.2 位置平均数位置平均数4.3 分布的离散程度分布的离散程度4.4 分布的偏度和峰度分布的偏度和峰度Ch4 学习要求学习要求1,掌握统计平均数的计算及作用2,掌握分布的离散程度指标的作用及计算3,掌握分布的偏度和峰
2、度的计算Ch4 统计分布的数值特征统计分布的数值特征4.1 数值平均数数值平均数4.2 位置平均数位置平均数4.3 分布的离散程度分布的离散程度4.4 分布的偏度和峰度分布的偏度和峰度Ch4 统计分布的数值特征统计分布的数值特征4.1 统计平均数数值平均数4.2 统计平均数位置平均数4.3 分布的离散程度4.4 分布的偏度和峰度统计学原理统计学原理4.1 数值平均数数值平均数统计平均数概述图图41 统计平均数概述统计平均数概述统计平均数统计平均数静态、分布平均数静态、分布平均数数列平均数数列平均数动态、序时平均数动态、序时平均数数值平均数数值平均数位置平均数位置平均数算术平均数算术平均数调和平
3、均数调和平均数几何平均数几何平均数中位数中位数众数众数其他分位数其他分位数Ch4 统计分布的数值特征统计分布的数值特征4.1 数值平均数数值平均数4.2 位置平均数位置平均数4.3 分布的离散程度分布的离散程度4.4 分布的偏度和峰度分布的偏度和峰度4.1 数值平均数数值平均数4.1.1 算术平均数4.1.2 调和平均数4.1.3 几何平均数Ch4 统计分布的数值特征统计分布的数值特征4.1 数值平均数数值平均数4.2 位置平均数位置平均数4.3 分布的离散程度分布的离散程度4.4 分布的偏度和峰度分布的偏度和峰度返回算术平均数,是算术级数数列 x1,x2,x3,xn-1,xn;的平均数。所谓
4、算术级数,就是指同质总体各单位之间,数量标志值的差异变动,往往是独立的或者不相关的。算术平均数是最常用的一种统计平均数。它的理论公式是标志变量的算术平均数=标志总量/总体单位数(4.1.1)算术平均数的具体计算方法,根据标志数列的分布特点确定:简单算术平均数方法和加权算术平均数方法。不论采用什么方法计算算术平均数,其计算内容在概念上必须满足理论公式(4.1.1)。4.1.1 算术平均数算术平均数 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数一、简单算术平均数对未分组整理的算术级数数列 x1,x2,x3,xn-1,xn;其标志序列总量为x1+x2+x3+xn-1+x
5、n,总体单位数为n,则数据序列分布的算术平均数(4.1.2)该方法主要适用于,在总体单位数很少,而且已知各单位数量标志值的情况下,可直接将各单位的数量标志值相加,求出标志总量,再除以总体单位数,得出平均数。这种计算平均数的方法,称为简单算术平均数方法。4.1.1 算术平均数算术平均数 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数【例4-1】观察某路口在若干个10分钟内的车流量,资料记录如下:26,26,38,24,32,22,15,33,19,26,21,29,16,20,34,24,27,30,31,33。试计算该路口在10分钟内的车流量强度。解:车流量强度就是
6、平均车流量。观察了20个10分钟,每10分钟当成一个时间段,每个时间段记录了一个车流量数据。因此,这20个时间段的平均车流量为通过这个结果,我们对该路口的车流量规律,有了一个大致的了解,即每10分钟平均通过26.3辆。4.1.1 算术平均数算术平均数 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数二、加权算术平均数 加权算术平均数,主要适用于分组数据的平均数计算。分组数据一般也有两种:一种是单变量分组数据;另一种是组距式变量分组数据。这两种数据资料条件,其计算方法,当然也有两种。4.1.1 算术平均数算术平均数 Ch4 统计分布的数值特征统计分布的数值特征 4.1
7、数值平均数数值平均数如果分组整理后的分布为单变量分布。设整理后的标志数据序列xi及相应的频数序列fi为于是,标志数据序列xi的算术平均数为(4.1.3)此称为加权算术平均公式。可以证明,当f1=f2=fn时,加权算术平均公式,将化为简单算术平均公式。4.1.1 算术平均数算术平均数 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数组数i标志变量xi频数fi1x1f12x2f23x3f3n-1xn-1f n-1nxnf n-合计f表表41单变量分组表单变量分组表【例4-2】对某公司员工工资数据进行整理,结果如下:计算该公司人平均月工资。(p54)解:4.1.1 算术平均
8、数算术平均数 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数组数i工资变量xi频数fi总工资xi fi1x1=800f1=58005=40002x2=1000f2=10100010=100003x3=1200f3=20120020=240004x4=1500f4=715007=105005x5=2000f5=520005=100006x6=2500f6=325003=7500-合计f=5066000表表42单公司员工工资分组计算表单公司员工工资分组计算表于是,可得解:4.1.1 算术平均数算术平均数 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数
9、值平均数图图42 某公司员工工资分布竖线图某公司员工工资分布竖线图20000频数(人)频数(人)工资51015010003000204.4.1 算术平均数算术平均数如果整理后的分布为组距变量分布,则必须用组中值变量代替组距变量xi。设数据组中值变量序列及相应的频数序列fi为则组距变量的算术平均数,可用下式估计(4.1.4)其中:(4.1.5)组数i分组标志变量xi组中值频数fi频率1 L1U1 f1.2 L2U2 f2.3L3U3 f3.n LnUn fn.-合计 f表表43某某标志组距变量分组表标志组距变量分组表Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1
10、.1 算术平均数算术平均数【例4-3】以上下班的前后30分钟为一个观察时段,连续观察了50个工作日,得到某路口的车流量数据分布如下表。试计算其日平均车流量强度。组数i车流量变量xi日数fi组中值日车流量总数fi1105110f1=3107.5107.53=322.52110115 f2=5112.5112.55=562.53115120 f3=8117.5117.58=9404120125 f4=14122.5122.514=17155125130 f5=10127.5127.510=12756130135 f5=6132.5132.56=7957135140 f5=4137.5137.54=
11、550-合计f=50-6160表表44 某路口日平均车流量计算表某路口日平均车流量计算表Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.1 算术平均数算术平均数解:上表是50个工作日车流量的分布情况,只能作大概估计其日平均车流量数。方法是计算其各组的组中值,用其组中值变量代替各组的一般水平,然后进行加权求平均。即同时,我们也整理得到了该路口比较准确的车流量分布规律。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数图图43 某路口车流量分布某路口车流量分布f(x).x14013012011051015123.210004.1.1 算术平
12、均数算术平均数三、算术平均数的数学性质各变量值与算术平均数的离差之和为零。(4.1.6)各变量值与算术平均数的离差的平方和最小。(4.1.7)两个独立的同质变量代数和的平均数,等于各变量平均数的代数和。(4.1.8)两个独立的同质变量乘积的平均数,等于各变量平均数的乘积。(4.1.9)Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数返回4.1.2 调和平均数调和平均数调和平均数H调和平均数,也叫标志变量的倒数的算术平均数的倒数,它是算术平均数的另一种表现形式。在实际工作中,由于所获得的数据不同,有时不能直接采取算术平均公式计算平均数,这就需要使用调和平均的形式,来计算
13、平均数。调和平均数的计算方法,也是根据数列的分布特点确定。通常采用两种形式:简单调和平均数和加权调和平均数。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.2 调和平均数调和平均数一、加权调和平均数 为了更好地理解调和平均数与调和平均数的应用场合,我们看下面的例子。【例4-4】某蔬菜批发市场三种蔬菜日成交数量数据如下。计算三种蔬菜的日平均批发价格。表表45 某市场蔬菜日成交数据分组表某市场蔬菜日成交数据分组表 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数组数i蔬菜名称批发价格xi成交金mi=xifi1a1.280002b0.512
14、5003c0.86400-合计369004.1.2 调和平均数调和平均数解:从平均批发价格的概念上看,其计算方法应该是:平均批发价格=成交金额/成交量;它的公式也应该是一个批发价格xi的加权平均公式。但是,成交量fi未知。所以必须将各组的成交量fi换算出来。利用mi=xifi关系,有fi=mi/xi,即表表46 三种蔬菜的日批发数据及调和平均数计算表三种蔬菜的日批发数据及调和平均数计算表则三种蔬菜的日平均批发价格为 Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数组数i蔬菜名称批发价格xi成交金额mi=xifi成交量fi=mi/xi1a1.21800018000/1.
15、2=150002b0.51250012500/0.5=250003c0.864006400/0.8=8000-合计36900480004.1.2 调和平均数调和平均数一、加权调和平均数因此,我们令 (4.1.10)为在某些特殊条件下的平均数计算方法,这种方法就是调和方法,其中(4.1.10)式就为加权调和平均公式。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.2 调和平均数调和平均数三、调和平均数与算术平均数的关系三、调和平均数与算术平均数的关系:在mi=xifi条件下,可以证明,调和平均公式与算术公式是等价的。调和平均数,是算术平均数的一种变化形式。Ch4
16、 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数是由于使用了不同的数据4.1.2 调和平均数调和平均数二、简单调和平均数加权调和平均公式,适用于各组的标志变量代表值xi已知,且已知各组的标志总量mi。但是如果各组的标志总量m1=m2=mn。则调和平均公式可化为(4.1.11)令yi=1/xi,又由于yi=1/xi,就是标志变量xi的倒数。则(4.1.11)可化为(4.1.12)于是也可以说,调和平均数,是标志变量的倒数的算术平均数的倒数。公式(4.1.11)式也叫简单调和平均公式。它的适用条件是,已知各组的标志变量代表值xi,且各组的标志总量mi恰好相等。Ch4 统计分布的
17、数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.2 调和平均数调和平均数调和平均数,有着比算术平均数更好的使用空间。比如,欲了解某商品的市场变化规律,就必须收集市场逐日的商品价格,但逐日的商品价格资料搜集,是非常困难的,因为你必须了解每日各个市场,不同时间的价格资料和成交量资料,这种要求不仅困难而且也不可行。因此,在大多数情况下,逐日的商品价格资料收集,是采用市场抽样的方法。【例4-5】市场抽样。指派一个调查员到市场上去购买某商品,抽样理论可以证明,在完全随机的情况下,调查员的购买成本,就是市场的销售价格;调查员依次在三个不同的市场,购买了某商品,每次消费1元钱;其获得的资料如
18、下:Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数组数i蔬菜名称批发价格xi成交金额mi=xifi1a1.212b0.513c0.81-合计34.1.2 调和平均数调和平均数求该商品的日平均销售价格。解:抽样理论可以证明,在完全随机的情况下,调查员的购买成本就是市场的销售价格;而该日的购买价格=消费金额/购买数量。已知,消费金额=1+1+1=3;而购买数量=1/1.2+1/1.5+1/1.3。因此有即,该商品该日的平均销售价格为1.322034元。显然,这里该日的平均销售价格计算,使用了简单调和平均公式。如果考虑到各个市场的价格差异对消费者消费欲望的影响,则调整各市
19、场的消费金额,便可以将计算推广到加权调和平均公式。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数返回4.1.3 几何平均数几何平均数算术平均数或调和平均数的计算,各个标志变量值xi是独立不相干的。如果xi是非独立和相关的,则标志变量xi数列的平均数计算,就不能再采用算术方法或调和方法,而必须使用其他方法。几何平均数,是几何级数的平均数。它的xi数列特点是,xi=x0Gi,i=1,2,.,n,标志变量xi的每一项值的变化,基本与该值的前后项有关,存在时间上相互衔接的比率关系,xi数列是一个几何级数数列。例如,流水线上的产品合格率数列,在复利条件下的本利率数列变动,等等
20、,都是几何级数数列。几何平均数的计算方法,也是根据数列的分布特点确定:简单几何平均公式和加权几何平均公式。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.3 几何平均数几何平均数一、简单几何平均公式简单几何平均数是n个变量值乘积的n次方根。具体地说,如果有xi数列 x1,x2,x3,xn-1,xn;满足几何级数变化的要求,则xi数列的平均数 (4.1.13)Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.3 几何平均数几何平均数【例4-6】某产品的完整生产过程,要经过3道流水作业工序,这3道工序的产品合格率,分别为80%,90
21、%,95%。求整个生产流程的产品总平均合格率。解:因为,任意一道工序的产品合格与否,都与上一道工序有关。设流水作业的初级投入为y,每个工序的产品平均合格率都为G,则整个生产流程的产品总合格率R=yG G G/y=G3;80%,90%,95%是流水作业的状态合格率,同样有整个生产流程的产品总合格率R=80%90%95%=G3。于是即,整个生产流程的产品总平均合格率为88.1%。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.3 几何平均数几何平均数【例4-7】一位投资者持有一种股票。1996年,1997年,1998年,1999年的收益率分别为4.5%,2.0%,
22、3.5%,5.4%。求投资者这4年的年平均收益率。解:本题的正确答案是年平均收益而非原因是在按复利计算收益的条件下,只有益本率1+r才具有几何平均数性质;于是Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4.1.3 几何平均数几何平均数二、加权几何平均公式如果几个变量值出现的次数不同时,计算其平均数应该采用加权几何平均方法(4.1.14)该公式的导出,类似于对几何级数数列(x1,x1);(x2,x2);(x3,x3);,;(xn,xn);f1个,f2个,f3个,.,fn个;求简单几何平均数。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数4
23、.1.3 几何平均数几何平均数【例4-8】某项为期20年的投资,其收益按复利计算,前10年的年利率为10%,中间5年的年利率为8%,最后5年的年利率为6%。求这20年的年平均收益率。解:本题的正确答案是年平均收益而非原因是,在按复利计算收益的条件下,只有益本率1+r才具有几何平均数性质;于是即这20年的年平均收益率为8.47%。Ch4 统计分布的数值特征统计分布的数值特征 4.1 数值平均数数值平均数返回4.2 位置平均数位置平均数4.2.1 众数Mo4.2.2 中位数Me 4.2.3 其它分位数4.2.4 各种平均数的比较Ch4 统计分布的数值特征统计分布的数值特征4.1 数值平均数数值平均
24、数4.2 位置平均数位置平均数4.3 分布的离散程度分布的离散程度4.4 分布的偏度和峰度分布的偏度和峰度返回4.2.1 众数众数Mo众数是统计数列中,出现次数最多的变量值或者标志值;由于众数与分布的频数fi有关,不受极端值的影响,因此,可作为现象一般水平的代表值。理论上,确定众数,必须编制相应变量分布序列。众数确定:一、品质数列和单项式变量数列的众数确定。二、组距式变量数列的众数确定。Ch4 统计分布的数值特征统计分布的数值特征 4.2 位置平均数位置平均数4.2.1 众数众数Mo一、品质数列、单项式变量数列的众数确定。方法非常简单。由Maxfi,(4.2.1)求Mo组i,i对应的xi就是该
25、数列的众数,Mo=xi。Ch4 统计分布的数值特征统计分布的数值特征 4.2 位置平均数位置平均数I see!【例4-9】在某城市随机调查了200个市民,整理后得到其关注的广告变量频数分布。求分布的众数。解:这里的变量为“广告变量”,这是个定类变量,不同类型的广告就是变量值。由于在所调查的200人中,关注商品广告的人最多,为112人,占总调查人数的56%,因此,众数属于“商品广告”这一类别,i=1,即Mo=x1=“商品广告”。组数i广告类型分组xi人数fi1商品广告1122服务广告513金融广告94房地产广告165招生招聘广告106其他广告2-合计200市民关注的广告类型频数分布4.2.1 众
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ch04 统计 分布 数值 特征
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。