第2章简单随机抽样.ppt
《第2章简单随机抽样.ppt》由会员分享,可在线阅读,更多相关《第2章简单随机抽样.ppt(80页珍藏版)》请在咨信网上搜索。
1、第第2章章 简单随机抽样简单随机抽样1精选精选2.1 简单随机抽样的概念简单随机抽样的概念n简单随机抽样(简单随机抽样(Simple Random Sampling,SRS):从容量为):从容量为N的总体中的总体中抽取一个容量为抽取一个容量为n的样本,若所有可能的的样本,若所有可能的 个样本中的每一个被抽到的概率都相等,即个样本中的每一个被抽到的概率都相等,即每个可能样本被抽中的概率均为每个可能样本被抽中的概率均为 ,这,这种抽样方法称为不放回的简单随机抽样,简种抽样方法称为不放回的简单随机抽样,简称称简单随机抽样简单随机抽样,所得的样本称为不放回的,所得的样本称为不放回的简单随机样本,简称简
2、单随机样本,简称简单随机样本简单随机样本2精选精选n简单随机抽样的实施方法:将总体中的单元简单随机抽样的实施方法:将总体中的单元依次从依次从1到到N进行编号,然后利用抽签法或随进行编号,然后利用抽签法或随机数法来进行简单随机抽样机数法来进行简单随机抽样n抽签法抽签法:一般用于总体所含单元不多的情况,:一般用于总体所含单元不多的情况,首先做首先做N个签并依次写上个签并依次写上1至至N的号码,然后的号码,然后将签充分混合均匀,再一次抽取其中的将签充分混合均匀,再一次抽取其中的n个个签或逐个不放回地抽取签或逐个不放回地抽取n个签,则编号为这个签,则编号为这n个签上的号码的单元就构成一个简单随机样个签
3、上的号码的单元就构成一个简单随机样本本3精选精选n随机数法随机数法:产生:产生n个在个在1,2,N中离散均匀分中离散均匀分布的随机整数(舍去重复的或大于布的随机整数(舍去重复的或大于N的数),的数),编号为这编号为这n个随机整数的单元就构成一个简个随机整数的单元就构成一个简单随机样本单随机样本(1)随机数骰子)随机数骰子(2)随机数表)随机数表n简单随机抽样是其他抽样方法的基础,其理简单随机抽样是其他抽样方法的基础,其理论最容易处理也最为成熟,在抽样理论中占论最容易处理也最为成熟,在抽样理论中占有重要的地位;效率一般比较高,但当总体有重要的地位;效率一般比较高,但当总体单元比较多时不容易实施,
4、且有时精度不高单元比较多时不容易实施,且有时精度不高4精选精选n引理引理2.1.1 从容量为从容量为N的总体中抽取一个容量的总体中抽取一个容量为为n的简单随机样本,则总体中每个特定单的简单随机样本,则总体中每个特定单元的入样概率为元的入样概率为n/N,总体中每两个特定单,总体中每两个特定单元的入样概率为元的入样概率为注:简单随机抽样是一种不放回的等概率抽样方法注:简单随机抽样是一种不放回的等概率抽样方法5精选精选n引理引理2.1.2 从容量为从容量为N的总体中抽取一个容量的总体中抽取一个容量为为n的简单随机样本,对总体中每个单元引的简单随机样本,对总体中每个单元引入一个随机变量:入一个随机变量
5、:则:则:其中:其中:称为抽样比称为抽样比6精选精选2.2 总体均值与总体总值的简单估计总体均值与总体总值的简单估计n从容量为从容量为N的总体中抽取一个容量为的总体中抽取一个容量为n的简单的简单随机样本,对某个指标随机样本,对某个指标Y,总体中,总体中N个单元个单元的指标值用的指标值用 来表示,样本中来表示,样本中n个单个单元的指标值用元的指标值用 来表示,则:来表示,则:(注:这里的(注:这里的 为定量,为定量,为随机变量)为随机变量)指标指标Y的的总体均值总体均值为为指标指标Y的的样本均值样本均值为为7精选精选指标指标Y的的总体总值总体总值为为指标指标Y的的样本总值样本总值为为指标指标Y的
6、的总体方差总体方差为为指标指标Y的的样本方差样本方差为为8精选精选显然有:显然有:9精选精选n如果还有一个指标如果还有一个指标X,N个总体单元的指标值个总体单元的指标值为为 ,n个样本单元的指标值为个样本单元的指标值为指标指标X的总体均值和样本均值分别为的总体均值和样本均值分别为指标指标X的总体总值和样本总值分别为的总体总值和样本总值分别为10精选精选指标指标X的总体方差和样本方差分别为:的总体方差和样本方差分别为:指标指标Y与与X的的总体协方差总体协方差为为指标指标Y与与X的的样本协方差样本协方差为为11精选精选同样有:同样有:12精选精选n在简单随机抽样中,称在简单随机抽样中,称 为为总体
7、均值总体均值 的简单估计量的简单估计量,称,称 为为总体总值总体总值 的简的简单估计量单估计量n定理定理2.2.1 在简单随机抽样中,在简单随机抽样中,分别是分别是 的无偏估计量,即的无偏估计量,即n定理定理2.2.2 在简单随机抽样中,估计量在简单随机抽样中,估计量 的的方差分别为方差分别为13精选精选注注1:的精度随着样本量的增加而提高,随着总体的精度随着样本量的增加而提高,随着总体方差即总体变异程度的增加而降低方差即总体变异程度的增加而降低注注2:1-f称为称为有限总体校正系数有限总体校正系数(finite population correction,简记为,简记为fpc),当抽样比),
8、当抽样比f很小时,很小时,1-f就接近于就接近于1,这样抽样比对,这样抽样比对 的精度就没有直接影的精度就没有直接影响;一般地,当抽样比小于响;一般地,当抽样比小于5%,甚至小于,甚至小于10%时,时,fpc可以忽略不计,即认为可以忽略不计,即认为1-f为为1;事实上略去;事实上略去fpc的影响是使的影响是使 高了一些高了一些注注3:中的中的 一般是未知的,因此需要通一般是未知的,因此需要通过样本进行估计过样本进行估计14精选精选n定理定理2.2.3 在简单随机抽样中,样本方差在简单随机抽样中,样本方差 是总体方差是总体方差 的无偏估计量,样本协方差的无偏估计量,样本协方差 是总体协方差是总体
9、协方差 的无偏估计量的无偏估计量n推论推论2.2.1 在简单随机抽样中,在简单随机抽样中,是是 的无偏估计量的无偏估计量 是是 的无偏估计量的无偏估计量注:把注:把 分别作为分别作为 的估计的估计量,都称为量,都称为标准差估计量标准差估计量15精选精选n 当当n充分大时,可以认为:充分大时,可以认为:的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:它们分别可以用它们分别可以用 来估计来估计16精选精选n书上书上P36例例2-3n例例1 为估计某中学为估计某中学200名新生的平均身高,用简
10、单名新生的平均身高,用简单随机抽样的方法抽取随机抽样的方法抽取10名进行测量,得数据如下:名进行测量,得数据如下:158,149,156,153,160,151,157,145,152,159(单位为(单位为cm),求平均身高的置信度为),求平均身高的置信度为90%的置信区间。的置信区间。n例例2 从一个有从一个有14848户居民的某区中抽取一个户居民的某区中抽取一个30户户的简单随机样本,样本中每户的人数为:的简单随机样本,样本中每户的人数为:5,6,3,3,2,3,3,3,4,4,3,2,7,4,3,5,4,4,3,3,4,3,3,1,2,4,3,4,2,4,试,试估计该区居民总数及其标准
11、差。估计该区居民总数及其标准差。17精选精选n习题习题2.5,2.6作作 业业18精选精选2.3 总体比例的估计总体比例的估计n从容量为从容量为N的总体中抽取一个容量为的总体中抽取一个容量为n的简单的简单随机样本,用随机样本,用P来表示具有某种特征的总体来表示具有某种特征的总体单元在全体总体单元中所占的比例(简称单元在全体总体单元中所占的比例(简称总总体比例体比例),用),用A来表示具有某种特征的总体来表示具有某种特征的总体单元的数目;相应地,用单元的数目;相应地,用p来表示具有这种来表示具有这种特征的样本单元在全体样本单元中所占的比特征的样本单元在全体样本单元中所占的比例(简称例(简称样本比
12、例样本比例),用),用a来表示具有这种来表示具有这种特征的样本单元的数目特征的样本单元的数目;显然有:;显然有:19精选精选n在简单随机抽样中,用在简单随机抽样中,用 作为作为 的估计量,的估计量,用用 作为作为 的估计量的估计量n定理定理2.3.1 在简单随机抽样中,在简单随机抽样中,是是 的无偏的无偏估计量,估计量,是是 的无偏估计量,即的无偏估计量,即n定理定理2.3.2 在简单随机抽样中,估计量在简单随机抽样中,估计量 的的方差分别为方差分别为其中其中20精选精选n定理定理2.3.3 在简单随机抽样中,在简单随机抽样中,是是 的无偏估计量的无偏估计量 是是 的无偏估的无偏估 计量,其中
13、计量,其中21精选精选n 当当n充分大时,充分大时,的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:22精选精选n可以用可以用 分别作为分别作为的估计的估计23精选精选n例例 从有从有15786位老人的某地区按简单随机抽样的位老人的某地区按简单随机抽样的方法抽取方法抽取525位老人,调查每位老人的性别及生活位老人,调查每位老人的性别及生活能否自理,结果如下表:能否自理,结果如下表:(1)估计该地区男性老人的比例并估计标准差;)估计该地区男性老人的比例并估计标准差;(2)估计该地区生活不能
14、自理的老人的比例并估计)估计该地区生活不能自理的老人的比例并估计标准差;标准差;(3)估计该地区生活不能自理的女性老人的人数,)估计该地区生活不能自理的女性老人的人数,并以并以95%的置信度对其作区间估计。的置信度对其作区间估计。性别性别能否自理能否自理男男女女能能211263不能不能312024精选精选n习题习题2.4n补充题:补充题:有一份共有有一份共有3042个人名和地址的名册中抽选个人名和地址的名册中抽选了一个包含了一个包含200个人名的简单随机样本,查个人名的简单随机样本,查出有出有38个错误地址,试估计这份名册中需要个错误地址,试估计这份名册中需要校正的地址的数目,并求出这个估计的
15、标准校正的地址的数目,并求出这个估计的标准差。差。作作 业业25精选精选2.4 总体比率的估计总体比率的估计n总体比率总体比率是总体中两个指标的均值或总值之是总体中两个指标的均值或总值之比,记为比,记为注:总体比例和总体比率都具有比的形式,但总体比注:总体比例和总体比率都具有比的形式,但总体比例中分母是已知的,分子是分母的一部分;而总体例中分母是已知的,分子是分母的一部分;而总体比率中的分母可以是未知的,并且分子和分母之间比率中的分母可以是未知的,并且分子和分母之间可以没有部分和总体的关系可以没有部分和总体的关系26精选精选n设每个单元都具有两个指标设每个单元都具有两个指标Y和和X,在简单随机
16、抽样中,把在简单随机抽样中,把 作为总体比作为总体比 率率 的估计量的估计量n定理定理2.4.1 在简单随机抽样中,在简单随机抽样中,是是 的近似的近似无偏估计量,即当无偏估计量,即当n足够大时,足够大时,27精选精选n定理定理2.4.2 在简单随机抽样中,当在简单随机抽样中,当n足够大时,足够大时,n 的估计量为:的估计量为:28精选精选注:注:都是有偏的,但它们的偏倚都随都是有偏的,但它们的偏倚都随着着n的增大而减少并趋向于零;此外,当的增大而减少并趋向于零;此外,当 已知时,已知时,之间哪个偏倚更小并没有之间哪个偏倚更小并没有一定的结论,对不同的总体可能会有不同的一定的结论,对不同的总体
17、可能会有不同的结果结果n 的估计量为:的估计量为:29精选精选n 当当 ,且,且 时,时,的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:可用可用 估计估计30精选精选2.5 总体均值与总体总值的比估计总体均值与总体总值的比估计n通常,把需要估计的指标称为通常,把需要估计的指标称为主要指标主要指标,把,把用来帮助主要指标估计的其它指标称为用来帮助主要指标估计的其它指标称为辅助辅助指标指标n在一定条件下,利用辅助指标的信息可以提在一定条件下,利用辅助指标的信息可以提高对主要指标的估计的精度高对主要指标的估计的精度n一般地,辅助指标可以是主要指标的前期资一般地,辅助指
18、标可以是主要指标的前期资料,也可以是表示单元规模的量,或者是单料,也可以是表示单元规模的量,或者是单元的某个易测指标,等等元的某个易测指标,等等31精选精选n如果主要指标如果主要指标Y与辅助指标与辅助指标X之间有正相关关之间有正相关关系,就可以构造比估计量系,就可以构造比估计量n在简单随机抽样中,称在简单随机抽样中,称 为为总体均总体均值值 的比估计量的比估计量,称,称 为为总体总总体总值值 的比估计量的比估计量,其中,其中 必须已知必须已知n定理定理2.5.1 在简单随机抽样中,在简单随机抽样中,是是 的近似的近似无偏估计量,无偏估计量,是是 的近似无偏估计量,即的近似无偏估计量,即当当n足
19、够大时,足够大时,32精选精选n定理定理2.5.2 在简单随机抽样中,当在简单随机抽样中,当n足够大时,足够大时,33精选精选n 的估计量分别为:的估计量分别为:34精选精选n 当当 ,且,且 时,时,总体均值总体均值 的置信度为的置信度为 的的近似置信区间近似置信区间的两个端点为:的两个端点为:总体总值总体总值 的置信度为的置信度为 的的近似置信区间近似置信区间的两个端点为:的两个端点为:分别可以用分别可以用 来估计来估计35精选精选n定理定理2.5.3 在简单随机抽样中,当在简单随机抽样中,当n足够大时,足够大时,若若 则有:则有:其中其中36精选精选n注:如果要使得比估计量的精度高于简单
20、估计量的注:如果要使得比估计量的精度高于简单估计量的精度,那么指标精度,那么指标Y与与X至少应该要正相关,因此比估至少应该要正相关,因此比估计量一般用于主要指标与辅助指标正相关的情形;计量一般用于主要指标与辅助指标正相关的情形;一般来说,可以先作一个试点调查,利用试点调查一般来说,可以先作一个试点调查,利用试点调查的数据,算出的数据,算出 的估计:的估计:判断判断 是否成立,再决定是采用比估计量还是否成立,再决定是采用比估计量还 是简单估计量是简单估计量37精选精选n书上书上P42例例2-4n例例1 某单位共有职工某单位共有职工1000人,人,2003年初有关部门年初有关部门按简单随机抽样的方
21、法抽取按简单随机抽样的方法抽取100人,经调查得:人,经调查得:其中其中 分别为第分别为第i个职工个职工2001年、年、2002年的医疗费年的医疗费(1)估计)估计2002年与年与2001年总医疗费的比率;年总医疗费的比率;(2)已知)已知2001年职工总医疗费为年职工总医疗费为125000元,对元,对2002年职工的平均医疗费作点估计和置信度为年职工的平均医疗费作点估计和置信度为95%的区的区间估计。间估计。38精选精选n例例2 对对21户的一个试点给出如下的数据:户的一个试点给出如下的数据:其中其中 为人数,为人数,为孩子数,为孩子数,为汽车数,为汽车数,为电为电视机数,假定总体总值视机数
22、,假定总体总值X是已知的,你是否建议用是已知的,你是否建议用比估计量代替简单估计量来估计孩子的总数、汽车比估计量代替简单估计量来估计孩子的总数、汽车的总数及电视机的总数?的总数及电视机的总数?5 2 4 4 6 3 5 2 3 2 6 3 4 5 6 4 4 3 2 4 33 0 1 2 4 1 3 0 1 0 4 1 2 3 3 2 2 1 0 2 11 1 2 1 1 1 1 0 1 2 2 0 1 1 2 1 1 0 2 1 13 1 0 1 1 2 1 1 1 0 1 0 1 1 0 1 1 1 1 1 139精选精选n习题习题2.8,2.9n补充题:补充题:一卡车桔子重一卡车桔子重1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 随机 抽样
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。