欢迎来到咨信网! | 成为共赢成为共赢 咨信网助力知识提升 | 自信网络旗下运营:咨信网 自信AI创作助手 自信AI导航
咨信网
全部分类
  • 包罗万象   教育专区 >
  • 品牌综合   考试专区 >
  • 管理财经   行业资料 >
  • 环境建筑   通信科技 >
  • 法律文献   文学艺术 >
  • 学术论文   百科休闲 >
  • 应用文书   研究报告 >
  • ImageVerifierCode 换一换
    首页 咨信网 > 资源分类 > PPTX文档下载
    分享到微信 分享到微博 分享到QQ空间

    因子分析的过程.pptx

    • 资源ID:1545437       资源大小:2.88MB        全文页数:43页
    • 资源格式: PPTX        下载积分:10金币
    微信登录下载
    验证码下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    验证码: 获取验证码
    温馨提示:
    支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    开通VIP
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    声明    |    会员权益      获赠5币      写作写作
    1、填表:    下载求助     索取发票    退款申请
    2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
    6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    7、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

    因子分析的过程.pptx

    1、好裁缝做上衣,要测量上体长、手臂长、胸围等14个指标。这14个指标是相关的,可以找出几个反映上衣特征的综合指标,加工出的上衣大多数人都能穿,当然特体除外。这两个不相关的指标就是上衣的型和号。而他们所采用的方法就是因子分析方法。2024/4/19 周五14.3因子分析4.3.14.3.1因子分析的数理统计背景因子分析的数理统计背景pp主要用于数据化简和降维主要用于数据化简和降维将相关性较强的几个变量归在同一个类中,每一类赋予新的名称,成为一个因子,反映事物的一个方面,或者说一个维度。更可进一步推出因子的值,然后用这些因子代替原来变量进行其他统计分析。设有n个样本,每个样本观测p个变量。为了对变量

    2、进行比较,并消除由于观测量纲的差异及数量级所造成的影响,将样本观测数据进行标准化处理。使标准化后的变量的均值为0,方差为1。2024/4/19 周五2X=(x1,x2,xp)T,是可观测的随机向量,且向量均值E(X)0,协方差阵cov(X),且协方差阵与相关矩阵R相等;F(F1,F2,Fm)T,mp,是不可测的向量,其向量均值E(F)0,协方差矩阵cov(F)I,即向量F的各分量是相互独立的;=(1,2,p)T与F相互独立,且E()0,协方差阵是对角阵,说明各分量之间也是相互独立的。则下列模型被称为因子模型:x1=a11F1+a12F2+a1mFm+1x2=a21F1+a22F2+a2mFm+

    3、2xp=ap1F1+ap2F2+apmFm+p2024/4/19 周五3F1,F2,Fm,被称作公共因子(也称主因子),在各个原观测变量的表达式中都出现,是相互独立的不可观测的理论变量。1,2,p,被称作特殊因子,是向量X的分量Xi(i1,2,n)所特有的因子。aij称作因子载荷,aij的绝对值越大,表明Xi与Fj的相依程度越大。2024/4/19 周五44.3.24.3.2因子分析的过程因子分析的过程pp问题的定义问题的定义pp计算并检验协方差(相关)矩阵计算并检验协方差(相关)矩阵巴特利特球体检验KMO测度pp选择因子分析方法(选择因子分析方法(methodoffactoranalysis

    4、methodoffactoranalysis)主成分分析法是一种值得推荐的方法,同时也是应用比较广泛的一类方法。pp确定因子数目(确定因子数目(numberoffactorsnumberoffactors)除了经验判断外,特征值法是选用较多的判断方法;因子碎石图(screeplot)提供了因子数目和特征值大小的图形表示。2024/4/19 周五5pp因子旋转(因子旋转(rotationoffactorsrotationoffactors)因子旋转目的是使某些变量在某个因子上负载高,而在其它因子上的负载则显著的低。pp因子解释(因子解释(interpretationoffactorsinterp

    5、retationoffactors)通过在因子上具有较高负载变量的意义进行pp因子得分(因子得分(factorscoresfactorscores)pp模型的适合度(模型的适合度(modelfitnessmodelfitness)模型是否适合,其判断常基于残差矩阵。2024/4/19 周五6pp例子:例子:用因子分析法分析评价西部地区用因子分析法分析评价西部地区的的人口人口素质素质,唐万梅,唐万梅.运筹与管理,运筹与管理,2005,4:85-892005,4:85-89由于我国地区经济发展的不平衡,使各地区人口素质水平存在一定差异,尤其在西部地区。为了从宏观上把握西部地区的人口素质水平,使用因

    6、子分析法进行定量分析。考虑到各指标数据的差异以及使得分析结果更加有效,首先将样本数据进行标准化处理,处理后的数据消除了量纲之间的差异。保存在文件“西部地区人口素质.sav”中。2024/4/19 周五7抚养比X1文盲率X2人均受教育年X3妇女平均存活子女数X4平均预期寿命X5高等学校数X6高等学校毕业生人数X7专利申请受理量X8专利申请授权量X9教育经费X10AnalyzeDatareductionFactor2024/4/19 周五82024/4/19 周五9输出各个分析变量的初始共同度,特征值以及解释方差的百分比2024/4/19 周五102024/4/19 周五112024/4/19 周

    7、五12KMO测度值大于0.5巴特利特球体检验值查表也可以通过2024/4/19 周五13因子载荷矩阵旋转后的因子载荷矩阵2024/4/19 周五14Component123抚养比(%)-.489.419.676文盲率(%)-.724.595-.277人均受教育年数(年).624-.714.243妇女平均存活子女数-.410-.147.848平均预期寿命(岁).782-.436-.115高等学校数(所).886.284.316高等学校毕业生人数.909.292.136专利申请受理量(件).921.307-.060专利申请授权量(件).920.326-.069教育经费(万元).916.287.14

    8、3Component123抚养比(%)-.042-.423.832文盲率(%)-.323-.923.014人均受教育年数(年).170.964-.030妇女平均存活子女数-.251.130.910平均预期寿命(岁).381.721-.387高等学校数(所).940.279.069高等学校毕业生人数.927.239-.108专利申请受理量(件).908.185-.296专利申请授权量(件).915.165-.303教育经费(万元).932.249-.1042024/4/19 周五15因子F1F2F3被解释指标X6,X7,X8,X9,X10X2,X3,X5X1,X4因子命名科教因子人力因子负担因子

    9、2024/4/19 周五16地区名称因子得分总因子得分排名F1F2F3内蒙古1.54251.592-0.22831.277广西2.51491.82320.3142.03774重庆2.78151.8454-0.56612.0773四川5.02312.1943-0.75173.58441贵州1.24270.53361.47061.14848云南1.770.48740.97061.40695西藏-0.3788-1.19210.6715-0.361412陕西3.3431.77890.28242.56862甘肃1.22360.74830.66031.04669青海0.02840.11591.09480.

    10、214111宁夏0.43011.01331.0790.640610新疆1.53541.41440.48581.346262024/4/19 周五17地区名称人口综合素质的排名按F1排名按F2排名按F3排名内蒙古76510广西4438重庆33211四川11112贵州8891云南55104西藏1212125陕西2249甘肃9986青海1111112宁夏101073新疆6767pp分类是各个学科领域都普遍存在的问题分类是各个学科领域都普遍存在的问题例如,人口学中研究人口生育分类模式、人口死亡分类模式;营销学中进行市场细分、竞争对手确定等等,都需要对研究对象进行分类。随着多元统计技术的发展,对事物的分

    11、类在定量研究方面取得了极大的进步。pp聚类分析(聚类分析(clusteranalysisclusteranalysis)根据事物本身的特性研究个体分类)根据事物本身的特性研究个体分类是多元分析与当代分类学结合的产物,又称为群分析、点群分析或簇类分析。2024/4/19 周五184.4聚类分析4.4.14.4.1聚类分析的原理聚类分析的原理比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。聚类分析不必事先知道分类对象的结构,从一批样品的多个观测指标中,找出能度量样品之间或指标(变量)之间相似程度或亲疏关系的统计量,构成一个对称相似性矩阵,并按相似程度的大小,把样品或变量逐

    12、一归类。2024/4/19 周五194.4.24.4.2聚类分析的步骤聚类分析的步骤pp 数据标准化数据标准化为了消除不同变量的单位对聚类结果的影响,应当首先对所有的数据标准化。可以通过SPSS软件中Analyze菜单下的Classify选择HierachicalClusterAnalysis,打开HierachicalClusterAnalysis对话框,并点击Method按钮,然后在其中的transformvalues部分来完成数据标准化的转换。pp 计算对象之间的计算对象之间的“距离距离”将个案看成多维空间的一个点,引用多维空间中点的距离概念,定义不相似测度。距离越小,表示两者之间的关系

    13、越紧密,相似特征越多,就越有可能分在同一类;相反,距离越大,表示两者之间差异性越大。通过计算对象之间的两两“距离”,得到“相似关系”矩阵。在具体的计算中,“距离”有多种表达。2024/4/19 周五20pp选择类与类之间的距离定义选择类与类之间的距离定义可由类的“代表点”间的距离表示。用两类之间的距离最近(或最远)的点代表;用两类中所有点之间距离(平方的)的平均值,又称为组间连接法(between-groupslinkage);按照某一规则,选择类中的某一点,代表该类。pp聚类聚类把每个点(对象)作为一类(称为第一层的类);找出距离最小(或最大)的,从而得出距离最近(或最远)的两类i与j,把它

    14、们合并为层次更高的一类。如果同时有几个距离一样最小(或最大),则同时把所涉及的点作为一类;重复,直至所有的点(对象)都并入一个大类。pp分类分类依据实际需求,确定以第几层的类为最终的分类标准。2024/4/19 周五214.4.34.4.3聚类分析的主要方法聚类分析的主要方法pp系统聚类法系统聚类法也称为分层聚类法(HierarchicalCluster),它是聚类分析中应用最广泛的一种方法pp动态聚类法动态聚类法也称快速聚类法,或K-均值聚类法(K-meansCluster)pp二阶段聚类二阶段聚类是一个揭示数据集自然分组的探索性分析工具2024/4/19 周五22系统聚类法pp基本思想基本

    15、思想开始将样品和指标各视为一类,根据类与类之间的距离或相似程度将最相似的类加以合并,再计算新类与其他类之间的相似程度,并选择最相似的类加以合并。每合并一次就减少一类,不断继续这一过程,直到所有样品或指标合并为一类为止。pp数据文件数据文件cluster1.sav“Analyze”“Classify”“HierarchicalCluster”2024/4/19 周五23第一列表示聚类分析的第几步;第二、三列表示本步骤类中哪两个个案或者小类聚成一类;第四列是个案距离或小类距离;第五、第六列表示本步骤类中参与聚类的是个案还是小类,0表示个案,非0表示由第几步聚类生成的小类参与本步骤类;第七列标识本步

    16、骤类的结果将在以下第几步中用到。pp习题习题数据文件cluster3.sav是关于SPSS公司对所出售的产品的调查数据。SPSS公司的统计软件中包括很多不同的模块,调查表中要求客户标出自己经常使用的模块,1代表经常使用,0代表不经常使用。现要求对这九个变量进行分类,为公司下一步的决策提供依据。2024/4/19 周五28动态聚类pp基本原理基本原理在一开始就按照一定的方法选取一批聚类中心(ClusterCenter),让样品向最近的聚心凝聚,形成初始分类,然后按最近距离原则不断修改不合理分类,直至合理。当要聚成的类数已知时,使用快速聚类可以很快地将观测量分到各类中去,其特点是处理速度快、占用内

    17、存少。pp数据文件数据文件cluster2.sav是我国16个地区农民在1982年支出情况的抽样调查数据的汇总资料,每个地区都调查了反映每人平均生活消费支出情况的6个指标。“Analyze”“Classify”“K-MeansCluster”2024/4/19 周五29Iterateandclassify默认选项。表示聚类过程中选择或指定初始类中心点,按照K-means的迭代算法不断调整类中心点。Classifyonly聚类过程中只使用初始的类中心点而不做调整,迭代次数也进行一次。ConvergenceCriterion:K-Means算法的收敛准则,输入范围在01之间,且不等于1。默认值为0

    18、。若输入数值为0.01,表示两次迭代计算的最小类中心的变化距离小于初始类中心距离的1%时迭代停止。Userunningmeans:选择该项,表示在每个个案被分配到一类后立即计算新的类中心;反之,则在完成了所有个案的一次分配后,再计算各类的类中心。注意,对于大数据样本,选择该项会大大增加计算量和计算时间。ANOVAtable,该方差分析是以聚类分析产生的类为控制变量的单因素方差分析,并输出各变量的方差分析表。Excludecaseslistwise将带有缺失值的个案从分析中剔除。Excludecasespairwise只有当个案的所有聚类变量值全部缺失时,才将其从分析中剔除,否则根据所有其他非缺

    19、失变量值,将其分配至最接近的一类中。二阶段聚类pp基本原理基本原理可处理分类变量和连续型变量。综合处理多项-正态分布的数据。自动确定最优聚类数,有效地分析大样本。step1构建聚类特征树;step2使用聚集聚类法对聚类特征树的结点进行分组,产生不同聚类数的指标,比较Schwarz-Bayesian或Akaike信息准则确定最优类数。pp数据文件数据文件cluster4.sav,保存的是157个各种不同车型的数据。包括汽车生产厂家、汽车型号、各种型号汽车的销售额、价格和燃油效率等相关数据。要求对这157个不同型号的汽车,用二阶段聚类分析方法进行分类。“Analyze”“Classify”“Two

    20、StepCluster”2024/4/19 周五33选定变量列表中参与运算的变量,按数据类型分别移动到“CategoricalVariables”窗口和“ContinuousVariables”窗口;在“DistanceMeasure”(距离测度)部分确定聚类相似性计算方式;在“NumberofClusters”(聚类数)部分指定聚类分析中聚类数的确定方式。既可以选定“Determineautomatically”(系统自动确定聚类数),也可以使用“Specifyfixed”(固定聚类数),指定一个正整数作为聚类数;此外,如果是希望系统确定聚类数目,还需要在“ClusteringCriteri

    21、on”(聚类准则)部分选定确定聚类数目的算法,使用“SchwarzsBayesianCriterion(BIC)”即贝叶斯信息准则或“AkaikesInformationCriterion(AIC)”即Akaike信息准则。2024/4/19 周五342024/4/19 周五35对聚类结果的输出进行设置Createclustermembershipvariable(创建聚类成员变量)表示将在工作数据文件中创建名为tsc_n的新变量,以保存每一个观测量所属的分类。同时,也可以在这个子对话框中指定将聚类模型及聚类特征树输出到不同的XML格式文件中。2024/4/19 周五36二阶聚类分析的结果主要

    22、通过“聚类浏览器”来查看聚类浏览器包含左右两个面板,主视图位于左侧,链接或辅助视图位于右侧。主视图包括模型摘要和聚类视图,链接/辅助视图包括预测变量的重要性、聚类大小、单元格分布和聚类比较四种。聚类视图。在左侧主面板下方单击“View”右侧的下拉列表,从中选择“Clusters”,即可看到聚类视图,其中包含了每个聚类的名称、大小和概要。2024/4/19 周五38聚类预测变量重要性视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框,从中选择“PredictorImportance”,即可切换到“聚类预测变量重要性视图”,该视图显示评估模型时每个变量的相对重要性。2024/4/19

    23、 周五39聚类大小视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框,从中选择“ClusterSizes”,即可切换到“聚类大小视图”。该视图显示每个聚类的饼图。并在每个分区上显示每个聚类占总数的百分比。2024/4/19 周五40单元格分布视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框,从中选择“CellDistribution”,切换到“单元格分布视图”,如没有显示出对应的视图,可在聚类视图中单击表格中的某一个单元格,则可看到相应的单元格分布视图。2024/4/19 周五41聚类比较视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框,从中选择“ClusterComparison”,然后在左侧选择“聚类”主面板中聚类列的顶部(按住Ctrl键单击可选择多个聚类进行比较)2024/4/19 周五42pp习题习题用因子分析和聚类分析考察美国某城市地区经济发展水平对美国某城市12个地区经济指标的调查数据进行因子分析后,得到两个新变量(因子得分),第一个因子主要概括了社会福利情况,命名为福利条件因子;第二个因子主要概括了人的情况,称为人口因子。数据保存在文件“12个地区经济指标.sav”中。据此对12个调查区进行聚类分析。要求聚为两类、三类。然后作散点图比较分为两类和三类的结果。2024/4/19 周五43


    注意事项

    本文(因子分析的过程.pptx)为本站上传会员【可****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表




    页脚通栏广告
    关于我们 - 网站声明 - 诚招英才 - 文档分销 - 便捷服务 - 联系我们 - 成长足迹

    Copyright ©2010-2024   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:4008-655-100    投诉/维权电话:4009-655-100   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   



    关注我们 :gzh.png  weibo.png  LOFTER.png