简单随机抽样教育课件.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 随机 抽样 教育 课件
- 资源描述:
-
,*,*,*,*,*,*,*,*,-简单随机抽样PPT讲座,本章教学目的与要求,简单随机抽样是抽样中最基本、最成熟、最简单的抽样设计方式,是所有概率抽样方法发展、比较的基础。具体要求:,通过学习,熟练掌握简单随机抽样的抽样方式和样本抽选方法;,熟知总体均值、总体总值和总体比例的简单估计;,掌握样本量的确定;,了解子总体的估计。,第一节 抽样方式,简单随机抽样(simple random sampling):也称纯随机抽样。对于大小为N的总体,抽取样本量为n的样本,若全部可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样。,可以分为放回和不放回抽样。,(一)放回简单随机抽样,放回抽样也称重复抽样。做法是每次从总体中随机抽取一个样本单位,经调查观测后,将该单位重新放回总体,然后再在总体中随机抽取下一个单位进行调查观测,依次重复这样的步骤,直到从总体中随机抽够n个样本单位为止。,可能的样本为 (考虑顺序)或,放回抽样的特点:同一个单位有可能在同一个样本中重复出现。,(一)放回简单随机抽样,设总体有个单位(,1,,,2,,,3,,,4,,,5,),按放回简单随机抽样的方式抽取,2,个单位,若考虑样本单位的顺序,则所有的可能样本为,25,个,若不考虑样本单位的顺序,则所有可能样本为,15,个。,不考虑顺序的放回简单随机抽样的估计量方差大于或等于考虑顺序时的估计量的方差。只讨论和使用考虑顺序的情形。,(二)不放回简单随机抽样,不放回也称不重复抽样,每次从总体中随机抽取一个样本单位,经调查观测后,不再将该单位放回总体参加下一次抽样,然后再在剩下的总体单位中随机抽取下一个样本单位进行调查观测,直到抽够,n,个样本单位为止。,考虑顺序可能的样本为,每个样本被抽中的概率为,(二)不放回简单随机抽样,不考虑样本单位顺序,可能的样本为 个。,每个样本被抽中的概率为,虽然样本个数不同,但有同样的概率分布。,(二)不放回简单随机抽样,设总体有5个单位(1,2,3,4,5),按不放回简单随机抽样的方式抽取2个单位,若考虑样本单位的顺序,则所有可能样本20个。若不考虑样本单位的顺序,所有可能样本为10个。二者概率分布相同,不考虑顺序的工作量小,所以对于不放回抽样,只讨论不考虑顺序的不放回抽样。,(三)不放回和放回简单随机抽样的比较,每次抽样面对的总体结构不同。放回抽样总体结构不变,每次抽取相互独立,不放回抽样总体结构改变,每次抽取不相互独立,前者的数学处理简单。,样本提供的信息量不同。不放回抽样信息量更大,抽样效率高。,样本单位数量限制不同。,一般采用不考虑顺序的不放回简单随机抽样。,二、简单随机样本的抽选方法,抽签法:材质相同N个签,一次抽n,或者一次抽1个直到抽够n.,随机数表法,随机数色子,摇奖机,计算机产生,三、简单随机抽样的地位与局限,抽样技术的重要理论基础。,当很大时,编制抽样框困难;有辅助信息不加利用,统计效率低下;样本分布广泛时,抽样费时费力;可能得到差的样本。,第二节 总体均值与总体总值的估计,一、总体均值的简单估计,(一)简单估计量,样本均值是总体均值的简单估计量。,(二)无偏性,总体中每个特定的单位出现在全部可能样本中的次数都相等是 每一单位入样概率,总体中任意两个单位出现在全部可能样本中的次数都相等是 每一单位入样概率,对称性论证法,(三)简单估计量的方差,(四)简单估计量方差的无偏性,简单随机样本的方差是总体方差的无偏估计。,是的无偏估计。,(五)放回简单随机抽样的简单估计,样本方差是无限总体方差的无偏估计量。,考虑顺序的放回简单随机抽样方差的无偏估计是,放回不放回,为调查某校大学生的电信消费水平,在全校15230名学生用简单随机抽样抽取n=36名学生,调查上月电信支出数据。试以95%的置信度估计该校大学生该月电信消费的平均支出额。,样本序号,消费元,/,月,样本序号,消费,样本序号,消费,1,45,13,48,25,83,2,36,14,53,26,51,3,7,15,24,27,33,4,13,16,39,28,25,5,170,17,41,29,28,6,89,18,93,30,90,7,33,19,19,31,17,8,75,20,59,32,57,9,22,21,111,33,43,10,56,22,64,34,146,11,79,23,35,35,19,12,5,24,76,36,47,对该校大学生某月电信消费人均支出额的估计为,53.64,元,在置信度,95%,下,临界值,1.96,,可以说以,95%,的把握说明该校大学生该月的人均支出在,53.64+(-)1.96*6.1355,即,41.6165.67,元。,总体总值,总体总值的简单估计量,总体总值估计量的性质由总体均值估计量的性质决定。简单随机抽样的 是 的无偏估计量。,方差 无偏估计为,二、总体总值的简单估计,第三节 总体比例的简单估计,一、总体比例,总体中具有某种属性的单位占总体单位的比例或具有某种属性单位的总个数,也称成数。,设总体有,N,个单位,具有某种属性的单位,N1,个,不具有该属性的单位有,N-N1,个。,二、总体比例的简单估计量及性质,(一)简单估计量的定义,利用简单随机抽样抽取,n,个单位组成样本,其中,n1,个单位具有某种属性,则样本比例是总体比例的简单估计量。,是总体中具有某种属性单位的总个数,的简单估计量。,(二)估计量性质,p是P的无偏估计量。,p的方差,V(p)的无偏估计量是v(p),当N,n,N-n都比较大时,以正态分布给出P及N1的近似置信区间(置信度1-a)为,正态近似产生的误差主要与nP有关,特别当nP比较小时,产生的误差甚大,在95%置信度下,P0.5时正态分布需要的最小nP值与n值如下表。,P,nP,n,0.5,15,30,0.4,20,50,0.3,24,80,0.2,40,200,0.1,60,600,0.05,70,1400,0,80,无穷,试以95%的置信度估计上例大学生月电信消费超过80元的人数及其比例。,第四节 样本量的确定,一、确定样本量主要考虑因素,样本量过大,容易产生非抽样误差,样本量过小,产生抽样误差。,因素一:对抽样估计量精度的要求。精度要求高,即要求抽样误差小,则必须样本量大。总体单位调查标志的变异程度、总体的大小、样本设计和所使用的估计量、回答率等都是影响估计精度的因素。,一、确定样本量主要考虑因素,因素二:实际调查运作的机制。调查经费能支持多大样本?允许调查持续的时间多久?需要多少调查人员?多种约束条件。,能够量化的因素只有抽样精度和调查费用。,方案:总费用一定的条件下精度最高;或者在满足一定精度要求的条件下使费用最小。,费用公式:,达到要求精度,就是控制抽样误差,估计量的标准差或变异系数都是,n,的函数,只要给定对精度的要求,就可以求出最低样本量要求。,二、估计总体均值(总值)的样本量确定,总体总值是总体均值N倍,N是常数,对样本量的确定不起决定作用,只须估计总体均值的情形。,无限总体或放回抽样情况下,,n,0,为所确定的样本量。,不放回情况下,若总体单位,N,很大,,n,0,/Nn,在同样精度要求下,放回比不放回需要的样本量大。,利用绝对允许误差,相对允许误差和变异系数公式变形估计,样本量上限,。,复杂的抽样设计方法,样本量估计公式也复杂。在同样精度要求下,先获取简单随机抽样的样本量n,计算复杂抽样设计的效果Deff,再间接推算复杂设计方法需要的样本量n,有n=n*Deff.,前面大学生通信费消费调查例子中,要求以95%的置信度估计该校大学生该月人均电信消费支出的绝对允许误差不超过5元,样本量为多少?,解:,三、估计总体比例的样本量确定,如果要求以95%的置信度估计该校大学生月电信消费支出超过80元的人数比例的相对允许误差不超过10%,样本量多少?,四、逆抽样法(适于调查稀有事件),现实中有的情况,总体中具有所考虑属性的单位数很少,即,P,很小,利用之前公式计算困难,并且调查者难以估计,P,的大致范围,由于,n,0,和,P,成反比,不同的,P,估计的样本量悬殊。,逆抽样法:根据调查精度的要求,事先确定其样本中含有稀有事件的个数,m,然后一个一个地随机抽取样本,直到样本中含有,m,个稀有事件为止。此时样本量,n,是一个随机变量。,假设稀有事件数占总体的比例为P,样本量服从Pascal分布:,第n次抽样恰好抽到第m个具有所考察属性的单位这一事件,必须是前n-1次抽样中抽到m-1个这样的单位的事件已经发生,而在第n次抽样时又恰好抽到具有这种属性的单位,前者的概率是二项分布,后者概率恰为P,第五节 子总体估计,一、问题提出,有时总体按照某个属性可以分为若干个组成部分。例如,总体单位按所属的地域不同划分,企业按所有制性质、行业以及规模不同划分,人口按性别、年龄、民族等划分。,把总体中具有某种共同属性特征的单位的集合称为子总体。,对子总体的估计方法,若每个子总体在编制抽样框时可以区分开,可以采用分层抽样方法进行估计,若事先不能将各个子总体区分开,但事先知道各个子总体的单位数Nj,可以采用事后分层的方法进行估计,若既不能事先将各个子总体区分开来,又无法事先知道各子总体的单位数Nj,则属于这一节讨论的特殊子总体估计问题。,子总体均值的估计,设总体单位数为,N,,假设属于第,j,个子总体的单位数为,Nj,单位标志值 ,从总体中抽取一个样本量为,n,的简单随机样本,记样本中属于第,j,个子总体的单位数为,nj,,其相应的标志值为 ,,nj,随样本的不同而变化。在,nj,固定的条件下,可以证明这,nj,个单位可以看成是从大小为,Nj,的子总体中抽取的一个简单随机样本。,子总体总值的估计,对总体每个单位定义新的指标值为,例:为了估计个体餐饮业经营户的纳税情况,某市地税局从全部,15800,户个体经营户中利用简单随机抽样的方法随机抽取,800,户,对其中从事餐饮业的,375,户年纳税情况作调查,户均年纳税额为,4376,元,年纳税标准差,755,元,试估计全部餐饮业个体经营户的全年纳税额,并估计其标准差和变异系数。,练习题,1,判断一下抽取方式是否为等概率抽样。,(,1,)总体(,1120,),抽法:从数,160,中随机抽取一个数,r,再从数,4,和,5,中抽取一个数,如果抽中,4,则取该数为,r,如果抽中,5,则取该数为,60+r,(,2,)总体(,1120,),抽法:从,1,和,2,中抽取一个数以决定两个群,195,和,96120,,再从抽中的群中随机地抽取一个数,r.,(,3,)总体(,019,),抽法:在,1100,中随机抽选,r,,再除以,20,,如果余数为,019,,则抽中相应的余数,否则不取。,(4),总体(,119,),抽法:在,1100,中随机抽选一个数除以,19,,以余数为抽中的数。,2,设总体,N=4,,其指标值,2,,,5,,,6,,,9,,,(,1,)计算总体总值,总体方差。,(,2,)给出,n=2,的全部不放回简单随机样本,并验证,3,为调查某中学学生的每月购书支出水平,在全校,N=1750,名学生中,用不放回简单随机抽样方法抽得一个,n=30,的样本,对每个抽中的学生调查其上个月购书支出金额如下表。,(,1,)在,95%,的置信度下估计该校学生该月平均购书支出额。,(,2,)估计该校学生购书支出超出,70,元的人数。,()如果要求相对误差不超过,以的置信度估计购书支出超过元的学生比例,则样本量至少多少?,样本序号,支出额,样本序号,支出额,样本序号,支出额,1,85,11,20,21,49,2,62,12,75,22,45,3,42,13,34,23,95,4,15,14,41,24,36,5,50,15,58,25,25,6,39,16,63,26,45,7,83,17,95,27,128,8,65,18,120,28,45,9,32,19,19,29,29,10,46,20,57,30,84,某保险公司欲对某地区家庭汽车调查,万户家庭,按简单随机抽样抽出户,调查后发现有户拥有汽车,,()估计该地区家庭拥有汽车的比例及给出估计的标准误差。,()在的置信度下,要求估计的绝对误差不超过,样本量至少为多少?,5,要调查甲乙两种疾病的发病率,历史资料得知,甲病的发病率,8%,,乙病发病率,5%,,()要得到相同的标准误差,0.05,,采用简单随机抽样各需要多少样本量?()要得到相同的变异系数,0.05,,各需多大样本量?,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




简单随机抽样教育课件.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12771085.html