分享
分销 收藏 举报 申诉 / 89
播放页_导航下方通栏广告

类型数理统计学-基本概念-.pptx

  • 上传人:a199****6536
  • 文档编号:2288006
  • 上传时间:2024-05-25
  • 格式:PPTX
  • 页数:89
  • 大小:1.46MB
  • 下载积分:16 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数理 统计学 基本概念
    资源描述:
    数理数理统计学学2024/5/22周三Ch6-1研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。数数理理统统计计的的分分类类描述统计学推断统计学第六章第六章数理数理统计的基本概念的基本概念第六章第六章 2024/5/22周三Ch6-2参数估计(第七章)假设检验(第八章)回归分析(第九章)方差分析(第九章)推断统计学2024/5/22周三Ch6-3Ch6-42024/5/22周三第六章统计量及其分布6.1 总体与样本6.2 样本数据的整理与显示6.3 统计量及其分布6.4 三大抽样分布2024/5/22周三Ch6-5例6.0.1 某公司要采购一批产品,每件产品不是合格品就是不合格品,但该批产品总有一个不合格品率p。由此,若从该批产品中随机抽取一件,用x 表示这一批产品的不合格数,不难看出X 服从一个二点分布B(1,p).但分布中的参数p 是不知道的。一些问题:2024/5/22周三6 p 的大小如何;p 大概在什么范围内;能否认为p 满足设定要求(如p 0.05)。2024/5/22周三7总体体 研究对象全体元素组成的集合总体的三层含义:1.研究对象的全体2.数据3.分布总体和样本6.16.1总体与个体与个体体6.16.12024/5/22周三Ch6-8例6.1.1 考察某厂的产品质量,以0记合格品,以1记不合格品,则总体=该厂生产的全部合格品与不合格品 =由0或1组成的一堆数若以p 表示这堆数中1的比例(不合格品率),则该总体可由一个二点分布表示:X 0 1P 1 p p2024/5/22周三9比如:比如:两个生产同类产品的工厂的产品的总体分布:X01p0.9830.017X01p0.9150.0852024/5/22周三10样本本 从总体中抽取的部分个体.称 为总体 X 的一个容量为n的样本观测值,或称样本的一个实现.用 表示,n 为样本容量.个体个体 组成总体的每一个元素2024/5/22周三Ch6-11样品、样本、样本量:样本具有两重性 一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此,样本是随机变量,用大写字母X1,X2,Xn 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此,样本又是一组数值。此时用小写字母x1,x2,xn 表示是恰当的。2024/5/22周三12例6.1.2 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒净含量均为640克。现从某厂生产的啤酒中随机抽取10瓶测定其净含量,得到如下结果:641,635,640,637,642,638,645,643,639,640这是一个容量为10的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量。这样的样本称为完全样本。2024/5/22周三Ch6-13例例6.1.36.1.3 考察某厂生考察某厂生产产的某种的某种电电子元件的子元件的 寿命,寿命,选选了了100100只只进进行寿命行寿命试验试验,得到,得到 如下数据:如下数据:2024/5/22周三Ch6-14表表6.1.26.1.2 100100只元件的寿命数据只元件的寿命数据表5.1.2中的样本观测值没有具体的数值,只有一个范围,这样的样本称为分组样本。寿命范围元件数寿命范围元件数寿命范围元件数(0 24 4 (192 216 6 (384 408 4 (24 48 8 (216 240 3 (408 432 4 (48 72 6 (240 264 3 (432 456 1 (72 96 5 (264 288 5 (456 480 2 (96 120 3 (288 312 5 (480 504 2 (120 144 4 (312 336 3 (504 528 3 (144 168 5 (336 360 5 (528 552 1 (168 192 4 (360 184 1 552 132024/5/22周三Ch6-15 独立性:样本中每一样品的取值不影响其它样品的取值-X1,X2,Xn 相互独立。要使得推断可靠,对样本就有要求,使样本能很好地代表总体。通常有如下两个要求:随机性:总体中每一个个体都有同等机会被选入样本-Xi 与总体X有相同的分布。-也称代表性,同分布性。样本的要求:简单随机样本2024/5/22周三16若总体 X 的样本 满足:一般,对有限总体,放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替.而代替的条件是(1)与X 有相同的分布(2)相互独立则称 为简单随机样本.简单随机随机样本本N/n 10.总体中个体总数总体中个体总数样本容量样本容量2024/5/22周三Ch6-17设总体X 的分布函数为F(x),则样本若总体X 的密d.f.为f(x),则样本的联合d.f.为的联合分布函数为2024/5/22周三Ch6-186.2.1 经验分布函数6.2 样本数据的整理与显示设X1,X2,Xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为x(1),x(2),x(n),则称X(1),X(2),X(n)为有序样本,用有序样本定义如下函数2024/5/22周三19大数定律的应用2024/5/22周三20则Fn(x)是一非减右连续函数,且满足F Fn n()=0)=0 和和 F Fn n()=)=1 1由此可见,Fn(x)是一个分布函数,并称Fn(x)为经验分布函数。2024/5/22周三21例6.2.1 某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重(单位:克)351 347 355 344 351x(1)=344,x(2)=347,x(3)=351,x(4)=354,x(5)=355这是一个容量为5的样本,经排序可得有序样本:2024/5/22周三22其经验分布函数为由由伯努里大数定律:只要n 相当大,Fn(x)依概率收敛于F(x)。0,x 344 0.2,344 x 347Fn(x)=0.4,347 x 351 0.8,344 x 347 1,x 3552024/5/22周三23更深刻的结果也是存在的,这就是格里纹科定理。定理6.2.1(格里纹科定理)设X1,X2,Xn是取自总体分布函数为F(x)的样本,Fn(x)是其经验分布函数,当n时,有PsupFn(x)F(x)0=1格里纹科定理表明:当n 相当大时,经验分布函数是总体分布函数F(x)的一个良好的近似。经典的统计学中一切统计推断都以样本为依据,其理由就在于此。2024/5/22周三24 160 196 164 148 170 175 178 166 181 162 161 168 166 162 172 156 170 157 162 1546.2.2 频数-频率分布表样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其频数分布表或频率分布表。例6.2.2 为研究某厂工人生产某种产品的能力,我们随机调查了20位工人某天生产的该种产品的数量,数据如下2024/5/22周三Ch6-25(1)1)对样对样本本进进行分行分组组:作作为为一般性的原一般性的原则则,组组数通数通常在常在520520个个:K=1+3.3log(n):K=1+3.3log(n)(2)确定每确定每组组组组距:距:近似公式近似公式为为组组距距d d=(=(最大最大观测值观测值 最小最小观测值观测值)/)/组组数数;(3)确定每组组限:各组区间端点为a0,a1=a0+d,a2=a0+2d,ak=a0+kd,形成如下的分组区间-含下不含上a0,a1),a1,a2),ak-1,ak)对这20个数据(样本)进行整理,具体步骤如下:其中其中a a0 0 略小于最小略小于最小观测值观测值,a ak k 略大于最大略大于最大观测值观测值.2024/5/22周三26(4)统计样本数据落入每个区间的个数频数,并列出其频数频率分布表。表6.2.1 例6.2.2 的频数频率分布表组序分组区间组中值频数频率累计频率(%)1 147,157)152 3 0.15 15 2 157,167)162 9 0.45 60 3 167,177)172 5 0.25 85 4 177,187)182 2 0.10 95 5 187,197)192 1 0.05 100合计20 12024/5/22周三Ch6-276.2.3 样本数据的图形显示一、直方图直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。2024/5/22周三Ch6-28表6.2.1 例6.2.2 的频数频率分布表组序分组区间组中值频数频率累计频率(%)1 147,157)152 3 0.15 15 2 157,167)162 9 0.45 60 3 167,177)172 5 0.25 85 4 177,187)182 2 0.10 95 5 187,197)192 1 0.05 100合计20 1output-c(160,196,164,148,170,175,178,166,181,162,161,168,166,162,172,156,170,157,162,154)hist(output,breaks=c(147+10*0:5),right=FALSE)2024/5/22周三Ch6-29Ch6-302024/5/22周三把每一个数值分为两部分,前面一部分(百位和十位)称为茎,后面部分(个位)称为叶,然后画一条竖线,在竖线的左侧写上茎,右侧写上叶,就形成了茎叶图。如:二、茎叶图数值分开茎和叶112 11|2 11 和22024/5/22周三31例例5.2.35.2.3 某公司某公司对应对应聘人聘人员进员进行能力行能力测试测试,测试测试成成绩总绩总分分为为 150150分。下面是分。下面是5050位位应应聘人聘人员员的的测测试试成成绩绩(已(已经过经过排序):排序):64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133我们用这批数据给出一个茎叶图,见下页。2024/5/22周三32图5.2.3测试成绩的茎叶图6 4 77 0 2 4 6 6 98 0 1 2 2 3 5 6 8 9 1 1 2 3 3 3 5 6 6 7 7 910 0 0 2 4 6 6 7 8 811 2 2 4 6 8 9 912 2 3 5 6 813 3 2024/5/22周三33在要比较两组样本时,可画出它们的背靠背的茎叶图。甲车间 6 2 0 5 6 乙车间8 7 7 7 5 5 5 4 2 1 1 6 6 7 7 8 8 8 7 7 6 6 4 4 2 1 7 2 2 4 5 5 5 5 6 6 6 8 8 9 8 7 6 6 5 3 2 8 0 1 1 3 3 3 4 4 4 6 6 7 7 8 7 3 2 1 0 9 0 2 3 5 8 5 3 0 0 10 7 注意:茎叶图保留数据中全部信息。当样本量较大,数据很分散,横跨二、三个数量级时,茎叶图并不适用。2024/5/22周三Ch6-346.3.1 统计量与抽样分布6.3 统计量及其分布当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。定义6.3.1 设X1,X2,Xn 为取自某总体的样本,若样本函数T=T(X1,X2,Xn)中不含有任何未知参数。则称T为统计量。统计量的分布称为抽样分布。2024/5/22周三35例例 是未知参数,若,已知,则为统计量是一样本,是统计量,其中则但不是统计量.2024/5/22周三Ch6-36常用的常用的统计量量为样本均值样本均值为样本方差样本方差为样本标准差样本标准差设是来自总体 X 的容量为 n 的样本,称统计量2024/5/22周三Ch6-37为样本的k 阶原点矩原点矩为样本的k 阶中心矩中心矩例如2024/5/22周三Ch6-38(5)顺序序统计量与极差量与极差设为样本,为样本值,且当取值为时,定义 r.v.则称统计量为顺序统计量顺序统计量.其中,称为极差极差2024/5/22周三Ch6-39(6)样本分位数与样本中位数样本中位数也是一个很常见的统计量,它也是次序统计量的函数,通常如下定义:更一般地,样本p分位数mp可如下定义:2024/5/22周三40通常,样本均值在概括数据方面具有一定的优势。但当数据中含有极端值时,使用中位数比使用均值更好,中位数的这种抗干扰性在统计中称为具有稳健性。2024/5/22周三41(7)五数概括与箱线图次序统计量的应用之一是五数概括与箱线图。在得到有序样本后,容易计算如下五个值:最小观测值xmin=x(1),最大观测值xmax=x(n),中位数m0.5,第一4分位数Q1=m0.25,第三4分位数Q3=m0.75.所谓五数概括就是指用这五个数:xmin,Q1,m0.5,Q3,xmax来大致描述一批数据的轮廓。R code:Summary(),boxplot()2024/5/22周三42注注 样本方差样本方差 与样本二阶中心矩与样本二阶中心矩 的不同的不同故推导推导关系式关系式1)2024/5/22周三Ch6-43推导推导 设则2)2024/5/22周三Ch6-44例例1 1从一批机器零件毛坯中随机地抽取10件,测得其重量为(单位:公斤):210,243,185,240,215,228,196,235,200,199求这组样本值的均值、方差、二阶原点矩与二阶中心矩.解解令例例1 12024/5/22周三Ch6-46则2024/5/22周三Ch6-47例例2 2 在总体 中,随机抽取一个容量为36的样本,求样本均值 落在50.8到53.8之间的概率.解解故例例2 22024/5/22周三Ch6-48按照统计量定义:若X1,X2,Xn 为样本,则以及经验分布函数Fn(x)都是统计量。而当,2 未知时,X1,X1/等均不是统计量。尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。下面介绍一些常见的统计量及其抽样分布。2024/5/22周三496.3.2 样本均值及其抽样分布思考:在分组样本场合,样本均值如何计算?二者结果相同吗?X=(X1+Xn)/n2024/5/22周三50定理6.3.2 数据观测值与均值的偏差平方和最小,即在形如(Xic)2 的函数中,样本均值的基本性质:定理6.3.1 若把样本中的数据与样本均值之差称为偏差,则样本所有偏差之和为0,即 最小,其中c为任意给定常数。2024/5/22周三Ch6-51样本均值的抽样分布:定理6.3.3 设X1,X2,Xn 是来自某个总体的样本,X为样本均值。(1)若总体分布为N(,2),则XX的精确分布为N(,2/n);XAN(,2/n)这里渐近分布是指n 较大时的近似分布.(2)若总体分布未知或不是正态分布,但E(X)=,Var(X)=2,则n 较大时的渐近分布为N(,2/n),常记为。2024/5/22周三526.3.3 样本方差与样本标准差称为样本标准差。定义6.3.3称为样本方差,其算术平方根在n 不大时,常用作为样本方差,其算术平方根也称为样本标准差。2024/5/22周三Ch6-53在这个定义中,(Xi X)2n1称为偏差平方和的自由度。其含义是:X能自由取值,因为只有n1个数据可以自由变动,而第n个则不 (Xi X)=0.称为偏差平方和,中样本偏差平方和有三个不同的表达式:(XiX)2=Xi2 (Xi)2/n=Xi2 nX2它们都可用来计算样本方差。思考:分组样本如何计算样本方差?2024/5/22周三54样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。定理6.3.4 设总体X 具有二阶矩,即E(X)=,Var(X)=2 ,X1,X2,Xn 为从该总体得到的样本,X和S2 分别是样本均值和样本方差,则E(X)=,Var(X)=2/n,E(S2)=2 2024/5/22周三55当当总总体关于分布中心体关于分布中心对对称称时时,我,我们们用用X和和 S刻画样本特征很有代表性,而当其不对称时,只用 就显得很不够。为此,需要一些刻画分布形状的统计量,如样本偏度和样本峰度,它们都是样本中心矩的函数。样本偏度1反映了总体分布密度曲线的对称性信息。样本峰度2反映了总体分布密度曲线在其峰值附近的陡峭程度。定义:1=B3/B23/2 称为样本偏度,2=B4/B22 -3称为样本峰度。X和 S2024/5/22周三56R:Library(moments)skewness(),kurtosis()Examplelibrary(moments)x-rchisq(500,3)y-dchisq(x,3)plot(x,y)skewness(x)out=1.88x1 0时收敛,称为函数,具有性质的密度函数为自由度为 n 的2024/5/22周三ch6-67n=2n=3n=5n=10n=15 2024/5/22周三ch6-68例如例如分布的性质分布的性质20.05(10)n=10性质性质性质性质2024/5/22周三ch6-69相互独立,证证 1设则2024/5/22周三ch6-70(3)t 分布分布(Student 分布)定定义则称T 服从自由度为n 的T 分布.其密度函数为X,Y相互独立,设t 分布分布2024/5/22周三ch6-71t 分布的图形(红色的是标准正态分布)n=1n=202024/5/22周三ch6-72t 分布的性分布的性质1f n(t)是偶函数,2T 分布的上分位数t 与双测分位数t/2 均有表可查.性质2024/5/22周三ch6-73n=10t-t2024/5/22周三ch6-74t/2-t/2/2/22024/5/22周三ch6-75(4)F 分布分布则称F 服从为第第一一自自由由度度为n,第第二二自自由由度度为m 的F 分布分布.其密度函数为定定义X,Y 相互独立,设令F 分布分布2024/5/22周三ch6-76m=10,n=4m=10,n=10m=10,n=15m=4,n=10m=10,n=10m=15,n=102024/5/22周三ch6-77F 分布的性分布的性质例如事实上,故求F(n,m)性质2024/5/22周三ch6-78例例1 1 证明证例12024/5/22周三ch6-79 抽抽样分布的某些分布的某些结论()一个正一个正态总体体与相互独立设总体,样本为(),(1)(2)结论2024/5/22周三ch6-80(II)两个正两个正态总体体相互独立的简单随机样本.令设与分别是来自正态总体与的2024/5/22周三ch6-81则若则(3)2024/5/22周三ch6-82则相互独立的简单随机样本.设与分别是来自正态总体与的2024/5/22周三ch6-83与相互独立2024/5/22周三ch6-84(4)2024/5/22周三ch6-85例例4 4 从正态总体中,抽取了 n=20的样本(1)求(2)求解解(1)即例42024/5/22周三ch6-86故(P.386)2024/5/22周三ch6-87(2)故2024/5/22周三ch6-88例例5 设r.v.X 与Y 相互独立,X N(0,16),Y N(0,9),X1,X2,X9 与Y1,Y2,Y16 分别是取自X 与Y 的简单随机样本,求统计量所服从的分布.解解例52024/5/22周三ch6-89从而2024/5/22周三
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:数理统计学-基本概念-.pptx
    链接地址:https://www.zixin.com.cn/doc/2288006.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork