第4章:SPSS基本统计分析.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 基本 统计分析
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,*,河北工大廊坊分校经济系周玉江,*,单击此处编辑母版文本样式,第二级,*,河北工大廊坊分校经济系周玉江,*,单击此处编辑母版标题样式,统计分析的目的在于,研究总体特征,。但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断,。因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的,先决条件,。通过描述性统计分析可以大致了解数据的,分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析,(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。,2025/10/24 周五,1,河北工大廊坊分校经济系周玉江,1.频数分析,通过对数据的加工整理,计算出数据的分布特征;用表格和常用的统计图形,直观的展示数据的分布特点。,我们进行了储蓄存款的问卷调查,其中涉及工作种类、不同年龄层次等和存款之间的关系,如何进行分析呢?,原始数据往往是杂乱无章的,看不出任何规律。例如下面某个居民小区短期存款数据。,基本的统计分析,:对搜集到的原始数据进行概括和描述,而不试图推断已存在数据之外的,任何,事情。包括:,1)频数分析的基本指标,2025/10/24 周五,2,河北工大廊坊分校经济系周玉江,居民小区短期存款数据(百元),2025/10/24 周五,3,河北工大廊坊分校经济系周玉江,(3)累计频率,其中,f,i,为变量在第,i,个区间取值的个数。显然,0频数1。,为了讨论问题的方便,有时还希望知道,连续的多个区间,中变量取值个数占样本总数的比例。,频率逐级累加所得到的值称为累加频数或累加百分比。,2)频数分析的基本操作,(1),定类变量,数据的频数分析例,2025/10/24 周五,6,河北工大廊坊分校经济系周玉江,(2)频数分析步骤,分析:显然,,户口,和,职业,都是,定类变量,,直接按,变量的取值,所形成的,自动分组,直接统计频数。,A),将“,居民储蓄存款调查数据.sav,”数据集打开。,B),分析,描述性统计 频率,弹出频数分析的对话框,数据集中的所有变量均出现在左边的列表框中。,例1:,对于居民储蓄存款调查数据,对储户的户口结构和职业结构分别进行分析,前者给出饼图,后者给出条形图.,2025/10/24 周五,7,河北工大廊坊分校经济系周玉江,条形图和直方图的不同,条形图:,1.用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;,2.各矩形通常是分开排列的;,3.主要用于展示分类数据。,直方图:,1.用面积表示各组频数的多少,矩形的高度表示每一组的频数密度,宽度表示各组的组距;,2.由于分组数据具有连续性,各矩形通常是连续排列;,3.主要用于展示数值型数据。,2025/10/24 周五,8,河北工大廊坊分校经济系周玉江,D),【统计量】按钮,,输出的描述统计量,C),将变量,户口,移入,变量,窗口。可以同时对多个变量进行频 数分析,只要将其移入变量窗口即可。,条形图,,,适用于,定序,和,定类,变量的分析。条形图的纵坐标可以是,频数,,也可以是,频率,。,E),【图形】按钮,,输出图形的格式设置,定距变量一般用直方图表示,而定序及定类变量则用条形图或饼图表示。,2025/10/24 周五,9,河北工大廊坊分校经济系周玉江,饼图,适合,所有变量。,饼图是圆内扇形的面积表示频数变化的图形,主要用于表现,数据的结构,与,组成,。其中,扇形面积,的大小,既可以表现,频数,的大小,也可以表现,频率,的大小。,直方图,,,适用于,定距数量,。,直方图,之间,无间隔,,可以在直方图上附加正态分布曲线,便于数据正态分布的比较。,操作:,本例只适合选择条形图,。,图表值,,纵轴可以选择为频率,也可选择为百分比。,操作:,选择纵轴为频数,。,2025/10/24 周五,10,河北工大廊坊分校经济系周玉江,F),【格式】按钮,,输出频数表及频数图的格式设置,注意,:按,变量值,排序,仅对,定距变量,有效。如果,定类变量,选择了,直方图,,这里的,排序,设置,无效,。,操作:,选择输出的频数按降序排列。,B)多变量表输出格式,比较变量:,将多个变量结果对比输出。,按变量组织输出:,多个,变量的统计结果分别输出。,本模块,适用于,同时,计算,多个变量,的,频数,时的,输出选择,。,2025/10/24 周五,11,河北工大廊坊分校经济系周玉江,如果分类数多于,n,则,禁止,输出频数分布表。默认值为10.,本例的类为2,不用设置本条。,利用同样的方法,计算变量职称的频数分析,,只是,输出图形时选择,条形图,。,C),排除具有多个类别的表,2025/10/24 周五,12,河北工大廊坊分校经济系周玉江,(3)变量“户口”频数分析输出结果,样本数量,居民储蓄被调查者户口结构,2025/10/24 周五,13,河北工大廊坊分校经济系周玉江,2025/10/24 周五,14,河北工大廊坊分校经济系周玉江,(4)储蓄存款调查问卷职称变量频数分析例,储蓄存款被调查者的职称结构分布表,2025/10/24 周五,15,河北工大廊坊分校经济系周玉江,储蓄存款被调查者的,职业,结构,频数,降序排列分布图,2025/10/24 周五,16,河北工大廊坊分校经济系周玉江,2025/10/24 周五,17,河北工大廊坊分校经济系周玉江,条图,(Bar Charts),饼图,(Pie Charts),直方图,(Histograms),2025/10/24 周五,18,河北工大廊坊分校经济系周玉江,(5)结论的简单分析,本次调查的样本总量为313,有效样本313,其中城镇客户223人,占总数的71.2%;农村客户90人,占总数的28.8%.城镇客户明显多于农村客户。,本次调查者的职业分布是:商业服务业最多,达到总储户的23%;其次是一般农户,如果加上果农、菜农,将达到总储户的18.5%,构成了储蓄存款的生力军。,因此,,这两个职业是银行部门的主要客户及服务对象,,因此有必要制定相应服务政策予以支持与倾斜。,A),客户的城乡结构分析,B),客户的职业结构分析,2025/10/24 周五,19,河北工大廊坊分校经济系周玉江,3)定距数量的组距分组频数分析例,例2,:根据居民储蓄存款调查数据,分析储户,一次性存款,的数量分布。,这里的问题是对一次性存款数量进行频数分析。,由于一次性存款是数量标志,是连续型变量,,不可能对每一个数据进行分析,需要计算存款数量的,极差,,,然后,分组,,,对组中数据的,频数,进行分析:,a),将存款金额数据分成五组:500以下、5002000、20003500、35005000、5000以上。,b),对分组后的数据序列进行频数分析。,(1)储户一次性存款数量的分析思路,2025/10/24 周五,20,河北工大廊坊分校经济系周玉江,(2)对一次性存款数据进行分组,对一次性存款进行分组,确定每一个数据属于的组。,a),点击,转换,重新编码成不同变量,弹出分组设置对话框。,b),在左边的变量列表中,选择“存款金额”移入数字变量列表中。,c),在输出变量,的,变量名称,文本框中输入,s,,用于存放生成的分组变量。,点击按钮【,更改,】后,数字变量列表栏目出现,操作:,a5(存款数量),s,d),点击按钮【,旧值和新值,】,进入组区间对应的,2025/10/24 周五,21,河北工大廊坊分校经济系周玉江,操作:,设置区间对应值:,小于500 1,500 2000 2,2000 3500 3,35005000 4,大于5000 5,。,设置界面见下页图。设置完成后点击【,继续,】按钮,回到变量设置界面。,e),点击【,OK,】按钮,完成分组设置,这时数据编辑窗口的数据集中增加了分组序列,s,。,a),分析,描述性统计 频率,,弹出频数分析的对话框,数据集中的所有变量均出现在左边的列表框中。,组值对话框。,(3)对分组变量s进行频数分析的实现,2025/10/24 周五,22,河北工大廊坊分校经济系周玉江,操作:,将分组变量s移入,Variable,列表框中,。,b),点击【,图表,】按钮,设置图形,2025/10/24 周五,23,河北工大廊坊分校经济系周玉江,附加正太分布曲线。,操作,:,选,c),设置输出格式。,按频数升序排序,操作,:,选,d),点击【,OK,】按钮,完成频数的计算与作图。,a),从输出的频数表可以看出,被调查者的近一半(48.6%)一次性存款:在500元以下,在20003500的客户为4.8%最少,而大于5000的达到了9.8%。,b),从图形可以看出,频数并不,是标准的正态分布,附加的正态分布曲线明显右偏,即一次存款的金额偏低的占较大比例,也有少数金额偏高的储户。,输出,直方图,,适用于数量标志,。,(4)储户一次性存款数量的结构分析,2025/10/24 周五,24,河北工大廊坊分校经济系周玉江,一次性存款在500元以下。,c),一次性存款金额偏少的存款客户更多一些。一次性存款超过5000元的储户也有相当的比例。,2025/10/24 周五,25,河北工大廊坊分校经济系周玉江,2025/10/24 周五,26,河北工大廊坊分校经济系周玉江,利用SPSS的频数分析计算出所有样本的存款金额的四分位数;然后,按照户口类型对数据进行拆分,并重新计算分位数,分别得到城镇和农村户口储户户口的存款金额的四分位数。各分位数的计算结果如下表所示:,2025/10/24 周五,27,河北工大廊坊分校经济系周玉江,2025/10/24 周五,28,河北工大廊坊分校经济系周玉江,从第一张表中我们可以看出,有25%的人一次存款金额在134元以下,50%的人在600元以下,75%的人在1500元以下。这些数据更加证实了金额呈右偏分布的结论。,下面一张表表明:,城镇储户有223人,一次存款金额的四分位数差分别是700(900-200)元和1600(2500-900)元;农村储户有90人,一次存款金额的四分位数差分,2025/10/24 周五,29,河北工大廊坊分校经济系周玉江,2.描述性统计,描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。,集中趋势的特征值,:算术平均数、调和平均数、几何平均数、众数、中位数等。,其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料,。,离散趋势的特征值,:全距、内距、平均差、方差、标准差、标准误、离散系数等。其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。,分布特征值:,偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。,2025/10/24 周五,30,河北工大廊坊分校经济系周玉江,操作过程,SPSS的【描述】命令专门用于计算各种描述统计性统计量。,选择菜单【分析】【描述统计】【描述】,2025/10/24 周五,31,河北工大廊坊分校经济系周玉江,2025/10/24 周五,32,河北工大廊坊分校经济系周玉江,3.探索性分析,调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。,它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,对数据分析更进一步,。,探索分析一般通过数据文件在分组与不分组的情况下获得常用,统计量和图形,。一般以图形方式输出,直观帮助研究者确定,奇异值、影响点、还可以进行假设检验,,以及确定研究者要使用的某种统计方式是否合适。,在打开的数据文件上,选择如下命令:选择菜单“【分析】【描述统计】【探索】”,打开对话框。,2025/10/24 周五,33,河北工大廊坊分校经济系周玉江,更确切地说:,目的:,对数据进行初步考察,用途:,计算整体或分组数据的描述性统计指标,输出描述性统计图:茎叶图、直方图、箱式图,正态性检验、方差齐性检验,检查数据的错误,辨认奇异值,2025/10/24 周五,34,河北工大廊坊分校经济系周玉江,2025/10/24 周五,35,河北工大廊坊分校经济系周玉江,因变量列表:,待分析的变量名称,例如将存款金额作为研究变量。,因子列表,:从源变量框中选择一个或多个变量进入因子列表,分组变量可以将数据按照该观察值进行分组分析。,标准个案:,在源变量表中指定一个变量作为观察值的标识变量。,在输出栏中,选择,两者都,,表示输出图形及描述统计量。,选择【,统计量,】按钮,选择想要计算的描述统计量。如图所示,2025/10/24 周五,36,河北工大廊坊分校经济系周玉江,对所要计算的变量的频数分布及其统计量值作图 打开“Plots对话框”,出现如下图:,1、输出图形:箱式图、茎叶图、直方图2、正态性检验及图示3、Levene方差齐性检验,2025/10/24 周五,37,河北工大廊坊分校经济系周玉江,缺失值处理1、某观测在所选择的变量中有缺失值时,该观测不参与全部分析2、仅在与该变量有关的分析中视为缺失值3、缺失值做为一个组别输出,2025/10/24 周五,38,河北工大廊坊分校经济系周玉江,例:居民储蓄调查,描述城乡居民存取款金额的差别,检查存取款金额的离群点和极端值,对存取款金额进行正态性检验和方差齐性检验,以便进一步选择分析方法。,2025/10/24 周五,39,河北工大廊坊分校经济系周玉江,2025/10/24 周五,40,河北工大廊坊分校经济系周玉江,2025/10/24 周五,41,河北工大廊坊分校经济系周玉江,样本量n,不拒绝 H,0,若p-值,拒绝 H,0,2025/10/24 周五,64,河北工大廊坊分校经济系周玉江,(5)交叉分组下的频数分析应用举例,利用居民储蓄调查数据进行分析,实现以下目标:,1、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度。,2、分析城镇和农村储户对什么合算的认同是否一致。,分析:,1、该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。,2、该问题列联表的行变量为户口,列变量为什么合算,在列联表的基础上进行卡方检验。,2025/10/24 周五,65,河北工大廊坊分校经济系周玉江,2025/10/24 周五,66,河北工大廊坊分校经济系周玉江,2025/10/24 周五,67,河北工大廊坊分校经济系周玉江,2025/10/24 周五,68,河北工大廊坊分校经济系周玉江,列联分析,行列变量间的关系,两变量是否相互独立。,两变量是否有共变趋势。,一变量的变化多大程度上能由另一变量的变化来解释。,2025/10/24 周五,70,河北工大廊坊分校经济系周玉江,2025/10/24 周五,71,河北工大廊坊分校经济系周玉江,对列联表中行列变量的分析,除上述卡方检验方法之外,SPSS还提供了其他测度变量间相关关系的检验方法,包括:,适用于两定类变量的方法:,名义,框中列出的方法属该类方法。,适用于两定序变量的方法:,有序,框中列出的方法属该类方法。,适用于一定类变量、一定距变量的方法:,按区间标定,框中的,Eta,方法属该类方法。,其他方法。,(5)SPSS中列联表分析的其他方法,2025/10/24 周五,72,河北工大廊坊分校经济系周玉江,2025/10/24 周五,74,河北工大廊坊分校经济系周玉江,5.多选项分析(频数分析和交叉分析),多选项问题的概念:多选项问题是根据实际调查的需要,要求被调查者从问卷给出的若干个可选答案中选择一个以上的答案。目前,市场研究或许多领域对某事物评价的研究中常常遇到这样的问题。,可以选多个,分为限选和不限选:,限选:如在11种工作种类中,选你喜欢的,最多可选4种(,Var1-Var4),;求所有人喜欢各种工作的频数或频率。,不限选:如在所列的20种电器中,你家所拥有的电器,不限选(Var1-Var20),求所有被调查家庭拥有各种电器的频数或频率。,2025/10/24 周五,75,河北工大廊坊分校经济系周玉江,(1)多选项问题的分解,多,选项二分法及其编码,(multiple dichotomies method):,多选项二分法是将多选项问题中的每一个答案设为一个SPSS变量,每个变量值有0或1两个取值,分别表示选择了该答案和不选择该答案。如对下面问题有9个可能的答案,每个可选择的答案由一个变量表示,每个变量的值只能有表明“是”和“否”的两个代码0或者1。,左边的表格为向顾客发放的颜色调查,在选择服装时,您喜欢什么颜色作为主体颜色,在答案的“”中打“,”(可多选),这是一组问题,每个问题均有两个答案,回答者只能选择其中一种。在建立数据文件时,变量名使用相同的变量主名,后面加以不同序号组成,本组问题的9个变量名可以是color1-color9。而答案的编码规则为:回答“是”变量值为1,回答“否”变量值为0,其他值为缺失值。,2025/10/24 周五,76,河北工大廊坊分校经济系周玉江,多,选项分类法及其编码(multiple category method):,多选项分类法中,首先应估计多选项问题最多可能出现的答案个数;然后为每个答案设置一个SPSS变量,变量取值为多选项问题中的所有可选答案。如上面有关选择服装的主体颜色,您可以选择喜欢的三种,在提供的10种答案前上选择。,1、红 2、橙 3、黄 4、绿 5、青,6、蓝 7、紫 8、黑 9、白10说不清,这是一个问题,可以有三个答案。在建立数据文件时,要建立三个变量color1-color3表示回答者选择的三个颜色。,如选择结果为1、红、6、蓝、8、黑,则变量,color1的值为1,变量,color2的值为6,变量,color3的值为8。,2025/10/24 周五,77,河北工大廊坊分校经济系周玉江,(2)多选项分析的基本操作,首先将每个题的若干答案组成一个综合变量即变量集,然后对综合变量的各种取值进行分析。只有通过定义多选项变量集,spss才能确定应对哪些变量取相同值的个案数进行累加。,多选项分析是通过,分析-多重响应,中的各项功能实现的。,定义变量集:,(1)从左边的变量中将多选变量集的变量选择到,集合中的变量,框中,建立多选二分变量集或多选分类变量集。,(2)在,将变量编码为,框中指定多选变量集中的变量是按照那种方法编码的。,二分法,表示以多选二分法编码,并在,计数值,中输入用哪个数值来表示选中该选项。,类别,表示以多选分类法编码,并在,范围,框中输入变量取值的最小值和最大值。,2025/10/24 周五,78,河北工大廊坊分校经济系周玉江,(3)为多选项变量集命名,系统会自动在该名字前加字符$。,(4)单击,添加,按钮将定义好的多选项变量集加到,多响应集,框中。Spss可以定义多个多选项变量集。,2.,频数:,对多选变量集进行频数分析。从,多响应集,中把待分析的多选项变量集选择到tables for框中;,3.,交叉表:,对多选变量集与其他变量集或与原基本变量进行交叉表分析。,2025/10/24 周五,79,河北工大廊坊分校经济系周玉江,利用居民储蓄调查数据进行分析,实现以下两个分析目标:,1.分析储户的储蓄目的;,2.分析不同年龄段储户的储蓄目的。,(3)多选项分析的应用举例,分析,1.为进行多选项分析,首先定义名为,X,的多选项变量集,其中包括a7_1、a7_2、a7_3三个变量,然后对多选项变量集进行频数分析;,2.对不同年龄段储户储蓄目的进行分析,采用多选项交叉分组下的频数分析。,2025/10/24 周五,81,河北工大廊坊分校经济系周玉江,频数分析,2025/10/24 周五,82,河北工大廊坊分校经济系周玉江,交叉表,2025/10/24 周五,83,河北工大廊坊分校经济系周玉江,2025/10/24 周五,84,河北工大廊坊分校经济系周玉江,(1)选择列联表的行变量并定义取值范围;(2)选择列联表的列变量并定义取值范围;(3)选择列联表的控制变量并定义取值范围;(,4),单击,选项,按钮选择列联表的输出内容和计算方法。,跨响应集匹配变量,选项表示,如果列联表的行列变量均为多选项变量集时,第一个变量集的第一个变量与第二个变量集的第一个变量作交叉分组,依次类推。结果中:注意Pct of Responses(占总回答数的)和Pct of Case(占总个案数)的区别。,2025/10/24 周五,85,河北工大廊坊分校经济系周玉江,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




第4章:SPSS基本统计分析.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12519483.html