分享
分销 收藏 举报 申诉 / 77
播放页_导航下方通栏广告

类型社会调查方法——-抽样.ppt

  • 上传人:精***
  • 文档编号:1711060
  • 上传时间:2024-05-08
  • 格式:PPT
  • 页数:77
  • 大小:1.61MB
  • 下载积分:18 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    社会调查 方法 抽样
    资源描述:
    浙江工业大学社会调查方法第 四章 抽 样 抽抽样样使使我我们们能能从从总总体体具具有有代代表表性性的的部部分分样样本本中中获获取取数数据据,从而可以得到关于整个总体的有效结论。从而可以得到关于整个总体的有效结论。英英 托尼托尼普罗科特普罗科特浙江工业大学社会调查方法开篇案例 我们知道,近几十年来,美国总统大选前夕,总有一些民意测验机构喜欢对总统选择投票的结果进行预测。1936年美国总统选举前夕,盖洛普民意测验所仅仅调查了3000人,就成功地预测了民主党人罗斯福将当选为美国的新一任总统。1984年这家民意测验机构又一次成功地预测了罗纳得里根将以59%比41%的优势战胜蒙代尔而当选为美国的新一任总统。这一预测结果与实际投票结果(59%:41%)相一致。而当时盖洛普民意测验所在将近1亿美国选民中,调查的对象还不到2000人。浙江工业大学社会调查方法案例2004年美国大选主要民调样本数调查机构调查机构样本量样本量福克斯新闻福克斯新闻 1200 1200 盖洛普盖洛普 1573 1573 全国广播公司全国广播公司/华尔街日报华尔街日报 1014 1014 哥伦比亚广播公司哥伦比亚广播公司/纽约时报纽约时报 939 939 美国广播公司美国广播公司/华盛顿邮报华盛顿邮报 939 939 新闻周刊新闻周刊 882882浙江工业大学社会调查方法51.3448.3148.3120042004年美国总统大选一周前民调结果年美国总统大选一周前民调结果浙江工业大学社会调查方法抽样与我们的生活生活中充满了抽样 冬泳之前,用脚尖试探一下水温;做菜时,用勺子舀起一些试试味道浓了还是淡了;在书店挑选一本营销调研的书籍,随手拿起一本,翻看其中几页以决定是否购买;体检时抽一试管的血看看身体血液情况;浙江工业大学社会调查方法为什么需要抽样?一些实验本质上是破坏性的物理上不具备考察总体所有项目的可能性对总体每一项目逐一考察费用过高对总体每一项目逐一考察相当耗时样本结论充分性浙江工业大学社会调查方法抽样方法论抽样过程就是使用少量项目或者总体的一部分得出关于整个总体的结论样本(sample)是一个更大的总体的子集或一部分抽样的目的在于帮助我们对总体的一些未知特征进行估计浙江工业大学社会调查方法抽抽样的有关的有关术语抽抽样的基本程序的基本程序抽抽样类型(方法)型(方法)样本本规模与抽模与抽样误差差1234浙江工业大学社会调查方法一、抽样的有关术语1 1、总体体(PopulationPopulation)()(此指此指调查总体)(体)(在社会在社会调查中用中用N N表示)表示)通常与构成的元素共同定通常与构成的元素共同定义,总体是构成它的所有元素的集合,而元体是构成它的所有元素的集合,而元素素则是构成是构成总体的基本体的基本单位。位。(1)(1)研究研究总体:是在理体:是在理论上明确界定的个体(分析上明确界定的个体(分析单位)集合体。(是理位)集合体。(是理论上的上的总体)体)(2)(2)调查总体:是研究者体:是研究者实际抽抽样样本的个体(分析本的个体(分析单位)的集合体。(是位)的集合体。(是实际操作中的操作中的总体)体)二者不同:研究二者不同:研究总体是我体是我们概念上的,而概念上的,而调查总体是我体是我们实际抽取抽取样本的集合。本的集合。二者关系:二者关系:调查总体体应当无限当无限趋近直至等于近直至等于研究总体研究总体。如:开展如:开展对某省大学生某省大学生择业倾向向调查时,该省所有在校大学生的集合就是省所有在校大学生的集合就是研研究究总体,每个在校大学生就是构成体,每个在校大学生就是构成总体的元素。体的元素。该省所有在省所有在册大册大学生学生则构成构成调查总体。体。2 2、样本本(SampleSample)(社会)(社会调查中用中用n n表示)表示)是从是从调查总体中按一定方式抽取出来的那一部分代表的集合体。体中按一定方式抽取出来的那一部分代表的集合体。浙江工业大学社会调查方法3.3.抽抽样(SamplingSampling)是一种是一种选择调查对选择调查对象的程序与方法,即从象的程序与方法,即从总总体中体中选选取一部分代表的取一部分代表的过过程,程,也即从也即从总总体中按一定方式体中按一定方式选择选择或抽取或抽取样样本的本的过过程。程。如:从某省如:从某省总总数数为为1010万人的大学生万人的大学生总体中按照一定方式抽取出体中按照一定方式抽取出10001000名大学生名大学生进行行调查,这10001000名大学生就是构成名大学生就是构成总体的一个体的一个样本。(本。(从一个从一个总体中可以体中可以抽取出若干个不同的抽取出若干个不同的样本本)4.4.抽抽样单位位(SamplingUnit)(SamplingUnit)一次直接的抽一次直接的抽样样所使用的基本所使用的基本单单位。抽位。抽样单样单位和构成位和构成总总体的元素有体的元素有时时相相同,有同,有时时不同。不同。5.5.抽抽样框框(SamplingFrameSamplingFrame)也称抽也称抽样样范范围围,指抽取,指抽取样样本的所有抽本的所有抽样单样单位的名位的名单单。如:从某所大学全体学生中直接抽取如:从某所大学全体学生中直接抽取200200名学生作名学生作为样本本该校全体学生的名校全体学生的名单从某一所大学所有班从某一所大学所有班级中抽取中抽取3 3个班个班级作作为样本本该校所有班校所有班级的名的名单浙江工业大学社会调查方法6.6.参数参数值(Parameter)(Parameter)也称也称总体体值,是关于,是关于总体中某一体中某一变量的量的综合描述。合描述。如:某厂如:某厂职工的平均收入、平均年工的平均收入、平均年龄7.7.统计值(StatisticStatistic)也称也称样本本值,是关于,是关于样本中某一本中某一变量的量的综合描述。合描述。如:某厂如:某厂职工中抽取出一部分,得到的平均收入、平均年工中抽取出一部分,得到的平均收入、平均年龄参数参数值与与统计值之之间的区的区别与与联系:系:(1)(1)参数参数值是确定不是确定不变的、唯一的,并且通常是未知的。的、唯一的,并且通常是未知的。(2)(2)统计值则是是变化的,即化的,即对于同一个于同一个总体来体来说,不同,不同样本所得到的本所得到的统计值常常是有差常常是有差别的;的;对于某一个特定的于某一个特定的样本来本来说,统计值是已知的,是可以通是已知的,是可以通过计算得到的。算得到的。(3)(3)联系:通系:通过样本本统计值可以推算可以推算总体参数体参数值,从而达到,从而达到调查部分以部分以认识总体的目的。体的目的。这就是抽就是抽样调查的作用所在。的作用所在。浙江工业大学社会调查方法8.8.抽抽样误差差(SamplingErrorSamplingError)是指在用是指在用样本本统计值去推估去推估总体参数体参数值时所存在的偏差。它是由所存在的偏差。它是由抽抽样本身的随机性引起的,是不可避免的。但是抽本身的随机性引起的,是不可避免的。但是抽样误差的大小差的大小是控制的。是控制的。抽抽样误差的意差的意义:是衡量:是衡量样本代表性好坏的本代表性好坏的标准,抽准,抽样误差越小,差越小,说明明样本的代表性越好,反之,本的代表性越好,反之,则越不好。越不好。浙江工业大学社会调查方法9.9.置信水平与置信区置信水平与置信区间(1 1)置信水平()置信水平(ConfidenceLevelConfidenceLevel)也称置信度,指的是也称置信度,指的是总体参数体参数值落在落在样本本统计值某一区某一区间内的概率。内的概率。(2 2)置信区)置信区间(ConfidenceIntervalConfidenceInterval)是指在一定范是指在一定范围的置信水平下,的置信水平下,样本本统计值与与总体参数体参数值之之间的的误差范差范围(3 3)置信水平与)置信水平与置信区间的关系的关系置信水平反映的是抽置信水平反映的是抽样的可靠性程度,置信区的可靠性程度,置信区间反映的是抽反映的是抽样的精确性程的精确性程度。度。在其他条件不在其他条件不变的情况下,置信水平越高,置信区的情况下,置信水平越高,置信区间越大;置信水平越低,越大;置信水平越低,置信区置信区间越小。越小。对抽抽样的可靠性程度要求越高,抽的可靠性程度要求越高,抽样的精确性程度将越低;的精确性程度将越低;对抽抽样的可靠性程度要求越低,的可靠性程度要求越低,则抽抽样的精确性程度将越高。的精确性程度将越高。浙江工业大学社会调查方法抽抽样的有关的有关术语抽抽样的基本程序的基本程序抽抽样类型(方法)型(方法)样本本规模与抽模与抽样误差差1234浙江工业大学社会调查方法二、抽样的基本程序(一)界定(一)界定总体体即在具体抽即在具体抽样前,前,对从中抽取从中抽取样本的本的总体范体范围作出明确的作出明确的界定。界定。为什么要什么要对总体体进行界定?行界定?原因之一:是由抽原因之一:是由抽样调查的目的决定的,其目的是的目的决定的,其目的是调查部部分以反映分以反映总体。体。原因之二:界定原因之二:界定总体是达到良好的抽体是达到良好的抽样效果的前提条件。效果的前提条件。例如:例如:19361936年美国年美国总统大大选前前文学文摘文学文摘杂志的抽志的抽样 浙江工业大学社会调查方法思考美国的美国的文学文摘文学文摘是一本是一本18901890年年19381938年年间在美国在美国发行行颇为流流行的新行的新闻杂志。志。19201920年、年、19241924、19281928、19321932年的美国年的美国总统大大选前都作前都作出了准确的出了准确的预测。19361936,文学文摘文学文摘进行了一次最具雄心的民意行了一次最具雄心的民意测验活活动:选票寄票寄给了从了从电话簿簿与与车牌登牌登记单中挑中挑选出来的出来的10001000万人。万人。收到了收到了200200万人以上的回万人以上的回应;结果果显示,有示,有57%57%人支持共人支持共产党候党候选人阿人阿尔夫夫兰登,而当登,而当时在任的美国在任的美国总统富富兰克林克林罗斯福的支持率斯福的支持率为43%43%。两个星期以后全民两个星期以后全民选举的的结果出来了,果出来了,罗斯福以斯福以历史上最大的史上最大的优势61%61%的得票率的得票率获得第二届任期。得第二届任期。思考:思考:为什么什么文学文摘文学文摘的的预测会失会失败?浙江工业大学社会调查方法(二)(二)选择抽抽样的具体方法,确定抽的具体方法,确定抽样的精确性程度与的精确性程度与样本本规模模如何确定抽如何确定抽样的精确性和的精确性和样本本规模(待)模(待)(三)制作抽(三)制作抽样框(回框(回顾什么是抽什么是抽样框)框)当采用一次性抽当采用一次性抽样时,应依据已依据已经明确界定的明确界定的总体范体范围,收集收集总体中全部抽体中全部抽样单位的名位的名单,并,并对名名单按随机原按随机原则进行行统一一编号,建立起供抽号,建立起供抽样使用的抽使用的抽样框。框。例如:我例如:我们要在浙江工要在浙江工业大学大学进行一行一项该校学生校学生职业观的的抽抽样调查。注意:当采取多注意:当采取多级抽抽样时,则需制作多个抽需制作多个抽样框。框。例如:例如:为了了解某市小学生的学了了解某市小学生的学习情况,需要从全市情况,需要从全市500500所小学中抽取所小学中抽取500500名小学生名小学生调查。浙江工业大学社会调查方法准确的抽准确的抽样框原框原则:1 1、完整性、完整性2 2、不重复性、不重复性例如:例如:在城市居民在城市居民户的抽的抽样中,会中,会经常出常出现一一户有多有多处住房的住房的情况,情况,这样很容易把一很容易把一户重复列入抽重复列入抽样框,使得他框,使得他们在抽在抽样中的中中的中选概率高于其他居民,相反,概率高于其他居民,相反,许多城市居民居住多城市居民居住条件比条件比较差,很多居民同住在一个差,很多居民同住在一个门牌号中,因此很容易牌号中,因此很容易遗漏。两种情况均漏。两种情况均违背了随机抽背了随机抽样的等概率原的等概率原则。浙江工业大学社会调查方法(四)(四)实际抽取抽取样本本即在前即在前进几个步几个步骤的基的基础上,上,严格按照所格按照所选定的抽定的抽样方法,从抽方法,从抽样框中抽框中抽取一个个抽取一个个抽样单位,构成位,构成调查样本。本。(五)(五)评估估样本本质量量所所谓样本本评估,就是估,就是对样本的本的质量、代表性、偏差等量、代表性、偏差等进行初步的行初步的检验和衡和衡量,其目的是防止由于前面步量,其目的是防止由于前面步骤中的失中的失误而使而使样本偏差太大,本偏差太大,进而而导致致整个整个调查的失的失误。评估估样本的基本方法本的基本方法:将可得到的反映:将可得到的反映总体中某些重要特征及其分布的体中某些重要特征及其分布的资料与料与样本中的同本中的同类指指标的的资料料进行行对比。若二者之比。若二者之间的差的差别很小,很小,则可可认为样本的本的质量量较高,代表性高,代表性较好;反之,若二者之好;反之,若二者之间的差的差别十分明十分明显,则表明表明样本的本的质量和代表性不可能高。因而需要量和代表性不可能高。因而需要对前面的抽前面的抽样步步骤进行行检查、修正,直到抽出、修正,直到抽出质量量较高、代表性高、代表性较好的好的样本本为止。止。浙江工业大学社会调查方法例如:例如:从我从我校校30003000名学生中抽取名学生中抽取300300名学生作名学生作为样本。同本。同时,我我们从学从学校校教教务处或学生或学生处得到下列得到下列统计资料:全料:全校校男生男生占学生占学生总数的数的53%53%,女生占,女生占47%47%;本市学生占本市学生占40%40%,外省学,外省学生占生占60%60%。那么,我。那么,我们可以可以对抽出的抽出的300300名学生名学生进行行这两方两方面分布情况的面分布情况的统计。假定。假定样本本统计得到的得到的结果是:果是:男生占男生占52%52%,女生占女生占48%48%;本市学生占本市学生占41%41%,外省学生占外省学生占59%59%。两相。两相对比,可以比,可以发现二者之二者之间的差距很小,的差距很小,这就在一定程度上就在一定程度上说明,明,样本的本的质量量较高,代表性高,代表性较好,从好,从这样的的样本中得到本中得到的的结果往往能果往往能较好地反映和体好地反映和体现总体的情况。体的情况。浙江工业大学社会调查方法抽抽样的有关的有关术语抽抽样的基本程序的基本程序抽抽样类型(方法)型(方法)样本本规模与抽模与抽样误差差1234浙江工业大学社会调查方法三、抽样类型根据根据调查总体中每一个个体有无同等的机会入体中每一个个体有无同等的机会入选样本,本,可以将抽可以将抽样分分为概率抽概率抽样与非概率抽与非概率抽样两大两大类。概率抽概率抽样是依据概率是依据概率论的原理,按照的原理,按照等概率原等概率原则进行行的抽的抽样,因而它能,因而它能够避免抽避免抽样过程中的人程中的人为误差,保差,保证样本的代表性。此法在社会本的代表性。此法在社会调查最常用。最常用。非概率抽非概率抽样主要是依据研究者的主主要是依据研究者的主观意愿、主意愿、主观判断判断或是否方便等因素来抽取或是否方便等因素来抽取调查对象,它象,它不考不考虑抽抽样中是否中是否等概率等概率,因而往往,因而往往产生生较大的大的误差,差,难以保以保证样本的代表本的代表性。此法在社会性。此法在社会调查中用得中用得较少。少。浙江工业大学社会调查方法根据抽取调查对象的具体方式的不同,又可分将概率抽样与非概率抽样分为若干小类,具体分类如下图所示。简单随机系统抽样概率抽样分层抽样整群抽样抽样方法多段抽样偶遇抽样非概率抽样判断抽样定额抽样雪球抽样probability sample Non-probability sample sample浙江工业大学社会调查方法(一)概率抽样1 1、简单随机抽随机抽样(Simple Random Sampling)概念:它是按等概率原概念:它是按等概率原则直接从含有直接从含有N N个个体的个个体的总体中抽取体中抽取n n个个体个个体组成成样本本(NnNn)。其典型就是抽)。其典型就是抽签。方法:一是抽方法:一是抽签;二是利用随机数表来抽;二是利用随机数表来抽样。利用随机数表利用随机数表进行抽行抽样的具体步的具体步骤是:是:(1 1)先取得一份)先取得一份调查总体所有个体的名体所有个体的名单(即抽(即抽样框);框);(2 2)将)将总体中所有个体一一按体中所有个体一一按顺序序编号;号;(3 3)根据)根据总体体规模是几位数来确定从随机数表中模是几位数来确定从随机数表中选几位数几位数码;(4 4)以)以总体体规模模为标准,准,对随机数表中的数随机数表中的数码逐一逐一进行衡量并决定取舍;行衡量并决定取舍;(5 5)根据)根据样本本规模的要求模的要求选择出足出足够的数的数码个数;个数;(6 6)依据从随机数表中)依据从随机数表中选出的数出的数码,到抽,到抽样框中去找出它所框中去找出它所对应的个体。的个体。这些个案的集合就构成些个案的集合就构成样本。本。适用范适用范围:总体体单位数目和所需位数目和所需样本数目都比本数目都比较少。少。例:某例:某总体共体共60006000人,人,现需要从中抽取需要从中抽取300300名作名作为样本本进行行调查,运用随机数,运用随机数表法。表法。浙江工业大学社会调查方法2 2、系、系统抽抽样(Systematic Sampling)概念:是把概念:是把总体中的个体体中的个体进行随机行随机编号并排序,再号并排序,再计算出某种算出某种间隔,然后隔,然后按按这一固定的一固定的间隔抽取个体的号隔抽取个体的号码来来组成成样本的方法。本的方法。具体步具体步骤:(1 1)给总体中的每一个个体随机体中的每一个个体随机编上号上号码并按号并按号码排序,即制作抽排序,即制作抽样框;框;(2 2)计算出抽算出抽样间距,公式距,公式为:K=N/nK=N/n(K K抽抽样间隔,隔,N N总体体规模,模,n n样本本规模);模);(3 3)在最前面的)在最前面的K K个个体中,随机抽取一个个体,并个个体中,随机抽取一个个体,并记号其号其编号(假定号(假定为A A),作),作为随机起点;随机起点;(4 4)在抽)在抽样框中,自框中,自A A开始,每隔开始,每隔K K个个体抽取一个个体,即所抽取个体的个个体抽取一个个体,即所抽取个体的编号分号分别为A A,A AK K,A A2K2K,A A(n n1 1)K K;(5 5)将)将这n n个个体合起来,就构成了个个体合起来,就构成了该总体的一个体的一个样本。本。浙江工业大学社会调查方法例如:例如:某某学院学院共有共有1 1000000名学生,要抽取一个容量名学生,要抽取一个容量为100100的大学生的大学生样本,使用系本,使用系统抽抽样的方法如何抽取。的方法如何抽取。课堂堂练习:现要要对某一某一产品的口味品的口味进行行测试,需要从,需要从调查总体的体的150150人中抽取人中抽取1212人人进行行测试,请使用系使用系统抽抽样的方法抽取的方法抽取样本。本。?思考:如果思考:如果总体的个体数不能被体的个体数不能被样本容量整除本容量整除时,如何,如何处理?理?浙江工业大学社会调查方法001011021031091002012022032092003013023033093004014024034094005015025035095006016026.096007017027097008018028098009019029099010020030100浙江工业大学社会调查方法注意:一般不注意:一般不选用系用系统抽抽样方法的情况。方法的情况。(1 1)在)在总体的名体的名单中,个体的排列具有次序上的先中,个体的排列具有次序上的先后和等后和等级上的高低的上的高低的时候。候。(2 2)在)在总体名体名单中,个体的排列上有与抽中,个体的排列上有与抽样间隔相隔相对应的周期性分布的情况。的周期性分布的情况。适用范适用范围:总体数量不大,个体排列无次序性和体数量不大,个体排列无次序性和周期性。周期性。浙江工业大学社会调查方法3 3、分、分层抽抽样(Stratified Sampling)概概念念:是是先先将将总体体中中的的所所有有个个体体按按某某种种特特征征或或标志志划划分分为若若干干类型型,然然后后再再在在各各类型型中中采采用用简单随随机机抽抽样或或系系统抽抽样的的方方法法抽抽取取一一个个子子样本本,最最后后将将这些些子子样本本合合起起来来构构成成总体体的的一一个个样本本。其中,其中,N为总体,体,Ni为子子总体,体,n为样本,本,ni为子子样本本浙江工业大学社会调查方法具体步具体步骤:(1 1)确定分)确定分类标准,如性准,如性别、年、年龄、地区等。、地区等。(2 2)按确定的)按确定的标准将准将总体体单位分位分为若干若干类型。型。(3 3)计算各算各类型型单位数量占位数量占总体体单位数量的比重。位数量的比重。设总体体单位数位数为N N,各,各类型型单位数位数为NiNi,各各类型型单位数占位数占总体体单位数的位数的比重比重为RiRi。公式:公式:Ri=Ni/NRi=Ni/N(4 4)根据)根据RiRi计算出各算出各类型中型中应抽取抽取样本本单位的数量。位的数量。设各各类型的型的样本本单位数位数为nini,所需抽取的,所需抽取的样本本总数数为n n。公式:公式:ni=nRini=nRi(5 5)按)按简单随机抽随机抽样或系或系统抽抽样方法从各方法从各类型中按比例抽取型中按比例抽取样本。本。浙江工业大学社会调查方法分类分类随机随机抽样抽样总体体样本本子群子群浙江工业大学社会调查方法例如:某省例如:某省10001000个个乡,其中山区,其中山区乡500500个,丘陵个,丘陵乡300300个,平原个,平原乡200200个,个,现在要抽取在要抽取100100个个乡进行行调查,如何运用分,如何运用分层抽抽样来抽取来抽取样本?本?解:解:设山区山区i=1,i=1,丘陵丘陵i=2,i=2,平原平原i=3i=3R1=N1/N100R1=N1/N100=500/1000100=500/1000100=50=50 R2=N2/N100R2=N2/N100=300/1000100=300/1000100=30=30R3=N3/N100R3=N3/N100=200/1000100=200/1000100=20=20n1=R1n=50n1=R1n=50100=50100=50n2=R2n=30n2=R2n=30100=30100=30n3=R3n=20n3=R3n=20100=20100=20即从即从500500个山区个山区乡中抽取中抽取5050个,从个,从300300个丘陵个丘陵乡中抽取中抽取3030个,从个,从200200个平原个平原乡中抽取中抽取2020个。其中各个。其中各阶段均使用段均使用简单随机抽随机抽样的方法的方法进行。行。浙江工业大学社会调查方法课堂堂练习:某地共有居民某地共有居民2000020000户,其中高收入居民,其中高收入居民40004000户,中等收入居民中等收入居民1200012000户,低收入居民,低收入居民40004000户,现要从要从中抽取中抽取500500户做做购买力力调查,如何运用分,如何运用分层抽抽样抽取抽取样本?本?浙江工业大学社会调查方法优点:点:(1 1)可以在不增加)可以在不增加样本本规模的前提下,降低抽模的前提下,降低抽样误差,提高抽差,提高抽样的精度。的精度。(2 2)便于了解)便于了解总体内不同体内不同层次的情况,便于次的情况,便于对总体中不同体中不同层次和次和类别进行行单独独研究,或研究,或进行比行比较。注意:注意:(1 1)分)分层标准:准:A.A.以以调查所要分析和研究的主要所要分析和研究的主要变量或相关的量或相关的变量作量作为分分层标准;准;B.B.以保以保证各各层内部同内部同质性性强,各,各层之之间异异质性性强、突出、突出总体内在体内在结构的构的变量作量作为分分层标准;准;C.C.以那些已有明以那些已有明显层次区分的次区分的变量作量作为分分层变量。量。浙江工业大学社会调查方法(2)(2)分分层比例:比例:A.A.按比例分按比例分层B.B.不按比例分不按比例分层在用在用样本本资料去推断料去推断总体体时,要,要调整整样本本中各中各层的比例,使数据的比例,使数据资料恢复到料恢复到总体中各体中各层实际的比例的比例结构。构。例如:例如:某厂有工人某厂有工人600600人,按性人,按性别分分层则有男工有男工500500人,女工人,女工100100人,人,现要抽取要抽取6060人作人作为样本本进行行调查,分,分别按比例分按比例分层和和不按比例分不按比例分层抽抽样。适用范适用范围:总体体单位数量位数量较多,多,单位之位之间差异性差异性较大大。浙江工业大学社会调查方法4 4、整群抽、整群抽样(Cluster Sampling)思考:思考:某高中有某高中有80008000名学生,分名学生,分为200200个班个班级,每班有,每班有4040名学名学生,生,现在要从中抽取在要从中抽取400400名学生名学生调查本校学生消本校学生消费情况,情况,问:使用:使用简单随机抽随机抽样方法和系方法和系统抽抽样方法分方法分别如何抽取如何抽取样本?除了使用以上方法,本?除了使用以上方法,还能怎能怎样抽取抽取样本?本?浙江工业大学社会调查方法N Nn nN1N1N2N2N3N3N4N4N5N5N6N6N2N2N6N6N3N3概概念念:是是从从总体体中中随随机机抽抽取取一一些些小小群群体体,然然后后由由所所抽抽出出的的若若干干个个小小群群体体内内的的所所有有元元素素构构成成调查的的一一个个样本本。其中,其中,N为总体,体,Ni为子子总体,体,n为样本本浙江工业大学社会调查方法划分划分子群子群随机随机抽样抽样浙江工业大学社会调查方法整群抽整群抽样与前几种抽与前几种抽样方法的最大区方法的最大区别在于,它的抽在于,它的抽样单位位不是不是单个的个体,而是个的个体,而是成群的个体成群的个体。具体步具体步骤:1 1、将、将总体各体各单位按一定位按一定标准划分准划分为若干群体。若干群体。2 2、以群、以群为单位,从整体中抽取部分群(数量确定)位,从整体中抽取部分群(数量确定)3 3、将、将这些群中的些群中的所有个体所有个体合起来,形成合起来,形成总体的一个体的一个样本。本。浙江工业大学社会调查方法特点:特点:(1)优点:可点:可简化抽化抽样的的过程,降低程,降低调查中收集中收集资料的料的费用,同用,同时还能相能相对地地扩大抽大抽样的的应用范用范围。(2)缺点:是)缺点:是样本的分布面不广,本的分布面不广,样本本对总体的代表性相体的代表性相对较差。差。(解(解释:在:在95的置信度下,置信区的置信度下,置信区间为3这一范一范围,简单随机抽随机抽样500个个体,整群抽个个体,整群抽样800个个体。)个个体。)整群抽整群抽样的的应用范用范围较广,在广,在简单随机抽随机抽样与系与系统抽抽样中,都要中,都要求有一份求有一份总体所有成体所有成员的名的名单,即抽,即抽样框。但在框。但在实际调查过程中,程中,这样的名的名单往往往往难获得,此得,此时可采用整群抽可采用整群抽样来解决来解决问题。适用范适用范围:总体体规模模较大,各群体之大,各群体之间差异性不大,而群体内部差异性不大,而群体内部个体之个体之间差异性差异性较大。大。浙江工业大学社会调查方法思考:分思考:分层抽抽样与整群抽与整群抽样的适用范的适用范围有何不同?有何不同?为什么?什么?当群当群间同同质性高,群内异性高,群内异质性高性高时,适合于采用整群抽,适合于采用整群抽样的方法的方法当群当群间异异质性高,群内同性高,群内同质性高性高时,则适于采用分适于采用分层抽抽样的方法的方法浙江工业大学社会调查方法课堂练习:某中学有某中学有48004800名学生,分名学生,分为4 4个年个年级,8080个班,个班,现在要抽取在要抽取480480名学生名学生进行学生身体行学生身体健康状况健康状况调查,运用,运用简单随机抽随机抽样、系、系统抽抽样、分、分层抽抽样和整群抽和整群抽样的方法分的方法分别如如何抽取何抽取样本?本?浙江工业大学社会调查方法5、多段抽、多段抽样(Multi-stage sampling)按抽按抽样单位的隶属关系或位的隶属关系或层次关系,把抽次关系,把抽样分分为几个几个阶段来段来进行。行。例如:从全市例如:从全市300所小学抽取所小学抽取300名小学生名小学生调查,可以分,可以分为几几个个阶段来段来进行?每个行?每个阶段的抽段的抽样单位分位分别是什么?是什么?优点:点:简化抽化抽样过程。程。缺点:抽缺点:抽样误差大。差大。在同等条件下,减少多段抽在同等条件下,减少多段抽样误差的方法差的方法是:是:适当增加开适当增加开头阶段的段的样本数而相本数而相对减少后面减少后面阶段的段的样本数。本数。浙江工业大学社会调查方法 例如:某地有例如:某地有2.4万名教万名教师,他,他们分布在全市分布在全市10个区的个区的200所学校里,所学校里,现在要抽取一个在要抽取一个由由1200名教名教师组成的成的样本,按照三本,按照三级抽抽样的方法,有以下几种抽的方法,有以下几种抽样方案:方案:?思考:思考:1、哪一种方案最、哪一种方案最节省人力和省人力和经费?2、哪一种方案得到的、哪一种方案得到的样本精确度最高?本精确度最高?3、考、考虑到到实际情况,你在抽情况,你在抽样中会中会选择哪种方案?哪种方案?为什么?什么?第一第一阶段段第二第二阶段段第三第三阶段段方案方案1 11010个区个区每个区抽每个区抽4 4所学校所学校 每所学校抽每所学校抽3030名教名教师 方案方案2 21010个区个区每个区抽每个区抽2020所学校所学校 每所学校抽每所学校抽6 6名教名教师 方案方案3 3从从1010个区中抽个区中抽5 5个区个区 每个区抽每个区抽1212所学校所学校 每所学校抽每所学校抽2020名教名教师 方案方案4 4从从1010个区中抽个区中抽3 3个区个区 每个区抽每个区抽1010所学校所学校 每所学校抽每所学校抽4040名教名教师 方案方案5 5从从1010个区中抽个区中抽1 1个区个区 每个区抽每个区抽1212所学校所学校 每所学校抽每所学校抽100100名教名教师 浙江工业大学社会调查方法n假设我们的总体是全国所有城市的集合,我们要抽取一个规模为40个城市的样本。n若按简单随机抽样或系统抽样的方法,则首先需要弄到一份全国城市的名单,然后根据随机数表或通过计算抽样间距直接从抽样框中抽取城市;n若按分层抽样的方法,则可以先按城市规模将总体分为特大城市、大城市、中等城市和小城市四类,然后分别从每一类中抽取若干城市,并将这些城市合起来构成样本;n如果采用整群抽样的方法,则可以以省(自治区,直辖市)为抽样单位,从全国31个省(自治区、直辖市)中随机抽取三至五个省(自治区、直辖市),再以所抽中的这些省(自治区、直辖市)中所包含的全部城市的集合作为样本。几种抽样方法的比较浙江工业大学社会调查方法五种概率抽样方法的图示比较简单随机抽随机抽样浙江工业大学社会调查方法五种概率抽样方法的图示比较不按比例分不按比例分层按比例分按比例分层浙江工业大学社会调查方法五种概率抽样方法的图示比较整群抽整群抽样浙江工业大学社会调查方法五种概率抽样方法的图示比较系系统抽抽样浙江工业大学社会调查方法五种概率抽样方法的图示比较多段抽多段抽样浙江工业大学社会调查方法6、PPS抽样 当元素的大小不同,或者元素在总体中的地位不同时,我们需要采用不等概率抽样的方法。比如,从全市几百家企业中抽取20家企业进行调查时,一个有着数万职工的大型企业与一个只有一二百人的小企业所占的地位,显然是很不一样的。如果此时仍然采用等概率抽样的方法,则样本的代表性和精度都会比较差。而如果采用不等概率抽样的方法,使大的企业入选样本的概率大一些,小企业入选样本的概率小一些,这样就可以大大提高估计的精度。社会研究中最重要、也最常用的一种不等概率抽样叫做“概率与元素的规模大小成比例的抽样”(sampling with probability proportionate to size),简称PPS抽样。浙江工业大学社会调查方法假设要从全市100家企业,总共20万名职工中,抽取1000名职工进行调查。已知最大的企业多达16000名职工,而最小的企业则只有200名职工。如果我们采取多段抽样的方法,先从100家企业中随机抽取若干家企业,比如说抽取20家;然后再从这20家企业中分别抽取50名职工(5020=1000)构成样本。第一阶段:入选概率是相同的,即都为20100=20%第二阶段:规模大的企业中每个职工被抽中的概率则为20%(5016000)=0.0625%;规模小的企业中每个职工被抽中的概率为20%(50200)=5%浙江工业大学社会调查方法采用PPS的方法:先将各个元素(即企业)排列起来,然后写出它们的规模、计算它们的规模在总体规模中所占的比例;将它们的比例累计起来,并根据比例的累计数依次写出每一元素所对应的选择号码范围,然后采用随机数表的方法或系统抽样的方法选择号码,号码所对应的元素入选第一阶段样本,最后再从所选样本中进行第二阶段抽样(即从每个被抽中的元素中抽取50名职工)。浙江工业大学社会调查方法用用PPSPPS方法抽取第一阶段样本举例方法抽取第一阶段样本举例序号规模所占比例累计选择号码范围所选号码入样元素企业1企业2企业3企业4企业5企业6企业7企业8企业9企业10企业98企业99企业1003000200016000200120060008006001400420040018006001.5%1%8%0.1%0.6%3%0.4%0.3%0.7%2.1%0.2%0.9%0.3%1.5%2.5%10.5%10.6%11.2%14.2%14.6%14.9%15.6%17.7%98.8%99.7%100%000-014015-024025-104105106-111112-141142-145146-148149-155156-176978-987988-996997-999012048、095133148171995元素1元素2、3元素4元素5元素6元素20浙江工业大学社会调查方法由于规模大的企业其所对应的选择号码范围也大,而选样号码范围大时,被抽中的概率也大(有些特别大的企业还可能抽到不止一个号码,比如企业3就抽到两个号码。那么在第二阶段抽样中,就要从企业3中抽取502=100名职工)。由于规模大的企业在第一阶段抽样时被抽中的概率大于规模小的企业,这样就补偿了第二阶段抽样时规模大的企业中每个职工被抽中的概率小的情况,使得无论规模大还是规模小的企业中,每个职工总的被抽中的概率都是相等的。所以,这种方法最终抽出的样本对总体的代表性也大。浙江工业大学社会调查方法7、户内抽样户内抽样的概念 以家庭为单位时,从入选家庭中抽取一个成年人构成访谈对象的抽样方法。方法之一:科什选择法(kish)方法之二:生日法浙江工业大学社会调查方法科什选择法具体做法:1、调查表编号表编号AB1B2CDE1E2F表数量(N)1/61/12 1/121/61/61/121/121/62、印制选择卡,给每个调查员发一套(八种)、印制选择卡,给每个调查员发一套(八种)浙江工业大学社会调查方法Kish 选择表A 式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11213141516或以上或以上1F 式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223344556或以上或以上6浙江工业大学社会调查方法3.给抽中家庭每个成年人进行编号并排序。方法是男性在前、年级大的在前。序号年龄和性别特征1最年长的男性2次年长的男性n最年幼的男性n+1最年长的女性n+2次年长的女性n+m最年幼的女性序号成员特征1爸爸50岁2儿子23岁3奶奶70岁4妈妈48岁5女儿27岁浙江工业大学社会调查方法4.根据调查表上的编号找出编号相同的那种“选择表”查出中
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:社会调查方法——-抽样.ppt
    链接地址:https://www.zixin.com.cn/doc/1711060.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork