北京大学心理测量课件.ppt

上传人：xrp****65

文档编号：13055841

上传时间：2026-01-12

格式：PPT

页数：217

大小：1.39MB

下载积分：10 金币

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档保存到电脑，查找使用更方便

10 金币

下载 开通VIP

还剩页未读，继续阅读

举报
申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：
如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

特殊限制：
部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。

关键词：
北京大学心理测量课件

资源描述：

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,心理测量,心理测量的基本理论,心理测量的理论基础,心理测量的基本概念,心理测量：依据一定的心理学和教育学理论，使用测验对人的心理特质进行定量描述的过程。,心理测量的特征分类,按测验功能：智力测验、能力测验、人格测验、成就测验。,按测验对象：个别测验、团体测验。,按测验方式：纸笔测验、口头测验、电脑测验、操作测验。,按测验目的：描述性测验、诊断性测验、预示性测验。,按测验难度：速度测验、难度测验。,按测验要求：最高作为测验、典型作为测验。,按测验性质：构造性测验、投射性测验。,按测验解释：常模参照测验、标准参照测验。,按测验应用：教育测验、职业测验、临床测验,经典测量理论,心理特质：表现在一个人身上所特有的相对稳定的行为方式。,心理特质具有内部性、一致性、抽象性、稳定性、层次性、可预测性等特点。,CTT,的心理特质可测性假设：心理特质是一种客观存在，凡客观存在的事物都有其数量，凡有数量的东西都可以测量。,真分数,T,分数：测量没有误差时所得到的真值。,CTT,的真分数理论模型：,X=T+E,，观测分数是真分数和测量误差的和。,对于同一被试用平行的测验反复多次测验，观察分数的平均值会接近真分数。,SX2=ST2+SE2,，实得分数的变异等与真分数的变异加上误差的变异。,ST2=SV2+SI2,，真分数的变异包括与测量目的有关的变异（有效变异）和与测量目的无关的变异（无效变异）两部分。,所以，,SX2=SV2+SI2+SE2,历年真题,真分数模型,X=T+E,中，,E,表示的是（,B,）（,2007,，全国统考）,A.,系统误差,B.,随机误差,C.,抽样误差,D.,标准误差,测量的信度,信度（,reliability,）：测量结果的稳定性程度。,定义,1,：一组测量分数的真分数的变异数与实得分数得变异数的比率,定义,2,：一组测量分数的真分数的变异数与实得分数相关系数的平方,定义,3,：一个测验与任一个平行测验的相关系数,信度的作用,1,、评价测验的好坏，反映随机误差的大小。注：系统误差与信度无关。,2,、解释个人测验的分数，,X 1.96SE T X+1.96SE,，标准误,SE=,，,S,x,：所得分数标准差，,r,xx,：测验信度。,3,、比较两种测验，差异的标准误,SE,d,=S,：相同尺度标准分数的标准差，,r,xx,r,YY,：两个测验的信度。,信度系数的估计,重测信度：同一个测验对同一组被试施测两次，两次测验分数的相关系数。,前提：测量的心理特质必须稳定，遗忘与练习效果基本抵消，两次施测间隔期间被试没有更多的学习或训练。,优缺点：能提供测验结果是否随时间变化，预测被试将来行为的依据。容易受练习、记忆的影响。,副本信度：同一组被试在两个平行测验上得分的相关系数。,同时施测：等值性系数,前后施测：稳定性与等值性系数,前提：两份测验在题目内容、数量、形式、难度、区分度、指导语、完成时间等相似。在时间、成本上要有条件做两个测验。,优缺点：只能减少而不能完全排除练习、记忆的影响。平行测验难找。,分半信度：将一个测验分成相等的两半，被试在这两半测验得分的相关系数。,计算时注意校正：,两半方差同质：,斯皮尔曼,-,布朗公式：,r=2r,hh,/(1+,r,hh,),，,r,hh,：两半分数间的相关系数。,两半方差不同质：,弗朗那根,(Flanagan),公式：,卢仑,(,Rulon,),公式：,Sa2,、,Sb2,：两半测验的方差，,Sd2,：两测验分数差的方差,前提：一次施测，没有副本，测验可分成两半。,特点：同一测验可以有多个分半信度值。,同质性信度：测验内部所有题目的一致性程度。,评分者信度：多个评分者给同一批被试评分的一致性程度。,肯德尔和谐系数,信度的影响因素,被试越异质，信度越高,r,n,=,r,o,：原被试信度，,S,o,2,：原被试方差，,S,n,2,：新被试方差,信度的影响因素,条目数适当增加，信度提高,r,kk,=,K,：测验改变后长度与原长度之比，,r,xx,：原测验信度，,r,kk,：新测验信度,团体平均水平太高或太低，信度降低,主试不按规定施测，评分标准不一，信度降低,测试情境,测验条目越多，信度越高，时间过长，信度降低，难度过大或过易，信度降低,两次测验间隔时间越短，信度越高,信度改进,适当增加测验长度,难度接近正态分布，控制在中等水平,提高项目区分度,选取恰当的被试团体,主试、评分者、场地,历年真题,（华东师大,2002,）某测验的被试为,25,年级的小学生，已知信度是,0.85,，标准差为,10,，现欲知道仅用于,4,年级时信度是多少，,4,年级的标准差是,5,。,历年真题,（华南师大,2001,）已知某量表的分半信度为,0.63,，请算出原长度的信度系数。,解：,r,kk,=1.26/1.63=0.77,历年真题,将测验对等分半后，两半测验得分的相关系数为,0.60,，校正后该测验的分半信度是（,B,）（,2007,，全国统考）,A.0.70 B.0.75 C.0.80 D.0.85,什么是测验的信度？影响信度的主要因素有哪些？（,2007,，全国统考）,答：（,1,）信度是测量结果的稳定性或一致性程度。,（,2,）影响因素：被试、主试、施测情境、测量工具、施测时间间隔、评分计分,测量的效度,指一个测验或量表实际能测出其所要测的心理特质的程度。,效度系数,r=S,v,2/S,x,2,，,S,v,：有效方差，,S,X,：总方差。,效度是个相对的概念,效度是测量的系统误差和随机误差的综合反映,判断效度要从多方面,内容效度,测验内容对要测量的内容取样的适当程度。,适用于成就测验和某些职业测验，不适用于能力测验、人格测验,好的内容效度需要具备的条件：,确定好内容的范围,确定好题目所测的内容,内容效度的确定,专家判断法,复本法,再测法,经验法,注：要避免与表面效度相混淆。其实，表面效度不能算是一种效度，它不反映测验实际测量的东西。它是外行人对某个测验从表面上看好像是测某种心理特质的一种现象。当外行人认为某个测验能有效地测得某种心理特质时，该测验就被认为有较高的表面效度。一般来说，最佳行为测验往往表面效度高，其他测验则希望表面效度低。,结构效度,又称构想效度。指一个测验实际测到所要测量的理论结构和特质的程度，或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。适用于能力测验、人格测验。,主要取决于理论，没有单一的数量指标,结构效度的确定,测验内法：确定测验内容效度，分析被试对项目的反应过程，考察测验的同质性。,测验间法：,相容效度：被试在新旧两个同类测验上分数的相关较高。,区分效度：与测验不同构想的测验分数相关较低。,因素效度：对一组测验进行因素分析，找每个测验和公共因素的相关。,效标关联法：根据测验得分分成高分组低分组，考察在特质上是否有差异。,多特质,-,多方法矩阵法：,相容效度和区分效度法的综合运用，其原理是若用多种极不相同的方法测量同一种特质相关很高,(,用极为相似的方法测量不同特质相关很低,),，则说明测量效度较高。,实验操作法,实证效度,又称效标效度。指一个测验对处于特定情境中的个体的行为进行估计的有效性。,效标：被预测的行为是衡量测验是否有效的标准。,同时效度：效标资料和测验分数同时收集,预测效度：效标资料在测验分数收集后过一段时间才能收集到。,好的效标：真实反映观念效标的重要侧面，稳定可靠，客观，简单成本低。,实证效度的确定,相关法,分组法,命中率法,功利率法,总命中率：,(B+C)/(A+B+C+D),正命中率：,B/(A+B),历年真题,以学习成绩为效标，得到某一智力测验的效标关联效度为,0.80,。将此测验用于预测时，其测验结果可解释学习成绩变异的（,C,）（,2007,，全国统考）,A.16%B.20%C.64%D.80%,效度的影响因素,测验的构成：,条目质量,条目数量：,r=,n,：测验增长倍数，,r,xy,：原测验效度，,r,xx,：原测验信度,测验的实施,被试：,身心状态,样本特点,效标：是否线性,信度,提高效度的方法,精心编制测验量表，避免出现较大的系统误差。,妥善组织测验，控制随机误差。,创设标准的应试情境，让每个被试都能发挥正常的水平。,选好正确的效标、定好恰当的效标测量，正确地使用有关公式。,信度与效度的关系,信度高是效度高的必要而不充分条件,效度受信度制约,r,XY,2,r,XX,例：（华东师大,2002,）效度与信度的关系,心理测量的误差,测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。,系统误差：由与测量目的无关的因素引起的一种恒定而有规律的误差。只影响准确性。,随机误差：由与测量目的无关的、偶然因素引起的、而又不易控制的误差。影响准确性和一致性,测量的随机误差来源及控制,测验项目,施测环境,被试,测量的系统误差来源及控制,测验项目,施测环境,被试,测量误差的估计,心理测验的项目分析,题目的难度,项目的难易程度,二分法记分项目：通过率，,P=R/N,，,R,：通过该项目人数，,N,：总人数。,极端分组法：当被试人数较多时，则可以先将被试依照测验总分从高到低排列，分成三组，总分最高的,27%,被试称为高分组,(N,H,),总分最低的,27%,被试为低分组,(N,L,),，分别计算高分组和低分组的通过率，然后求项目的难度。,P=(P,H,+P,L,)/2,非二分法记分项目：,难度的确定：取决于测验的目的和测验性质,难度的等距变换：将,P,值化为,Z,分数（查表），,=13+4*Z,（,）,难度影响测验分数的分布形态，离散程度,历年真题,某项测验中，绝大部分题目的难度值,P,较大，那么被试的分数（,A,B,D,）（,2007,，全国统考）,A.,集中在高分端,B.,平均数小于中数,C.,中数大于众数,D.,分布呈现负偏态,题目的区分度,指测验项目对被试心理品质水平差异的区分能力。效标分数多用测验总分（内部效标）,项目鉴别指数：,D=P,H,-P,L,D,越高越好。,0.40,以上很好，,0.30-0.39,良好，,0.20-0.29,尚可，,0.19,及以下差,极端组划分：一般,27%,，分布比正态平坦：可以升高到,33%,，如果样本量少,(100),，可以,50%,例：（华南师大,2001,）已知某测题高分组通过人数是,70,，低分组通过人数,38,，其鉴别指数是多少？该鉴别指数能否被接受？,解：,D=P,H,-P,L,=0.70 0.38=0.32,，鉴别指数良好,相关法,项目分数与效标分数或总分的相关,相关越高，区分度越高,点二列相关：,rpb,=,二列相关：,rb,=,相关：,r,=,积差相关,不同计算方法，区分度不同，各项目要采取同一计算方法,样本容量大小影响相关法区分度大小，因此需要检验显著性,分组标准影响鉴别值,被试样本同质性越高，区分度越小,题目的综合分析和筛选,区分度与难度的关系：,难度越接近,0.50,，项目潜在的区分度越大，而难度越接近,1.00,或,0,时，项目的潜在区分度越小。,使项目的难度分布广一些，梯度大一些，使整个测验的难度分布呈正态分布，且平均水平保持在,0.50,左右。,心理测验编制的基本程序,确定测验目的,测量对象：测什么人,测量目标：测什么特质,测验用途：为什么测,拟定编制计划,全面、有代表性,各个内容的权重,二向细目表,设计测试项目,搜集有关资料,选择项目形式,编写和修订条目,搜集有关资料,丰富性,普遍性,趣味性,选择项目形式,使被试容易明了测验做法，做测验时不会弄错,做法简明省时,计分省时省力，经济,编写和修订条目,代表性,条目范围与编制计划项目范围一致,有一定难度分布,精炼明了,初编题量要多于最终题量,测验项目说明要简明,预测试和分析,试测,对象、情境、时限、被试反应,项目分析,难度、区分度等,合成测验,项目选择,项目编排,编造复本,项目选择,区分度大,难度视测验目的而定,项目编排,并列直进,整个测验按照测验项目材料性质归为若干分测验，同一分测验难度由易到难。,混合螺旋,先将各类测验项目按照难度分成若干层次，再把不同性质测验项目组合，交叉排列，难度由易到难。,编造复本,测量同种特质,题目不重复,题型、题量、难度分布相等,测验使用的标准化,施测过程,评分计分,分数解释,施测过程,情境,指导语,时限,评分计分,记录反应情况,有计分键,对反应分类,分数解释,鉴定测验,信度,效度,编写测验手册,目的、功用,理论背景、选择项目的依据,测验实施方法、时限、注意事项,标准答案、计分方法，常模等解释资料,信效度,常模、解释,测验目标与命题双向细目表,明确测量目标，也就是明确测量什么心理功能，是测能力、人格，还是测学业成绩。不仅如此，还要进一步把目标具体化。例：瑟斯顿的智力,7,因素理论,命题双向细目表：内容,x,完成目标,题目编制技术,搜集有关资料（丰富、普遍性）,选择项目形式（使被试容易明了测验做法，做测验时不会弄错，做法简明省时，计分省时省力，经济）,编写和修订条目（代表性，条目范围与编制计划项目范围一致，有一定难度分布，精炼明了，初编题量要多于最终题量，测验项目说明要简明）,预测试和分析,试测,项目分析,心理测验的施测,1,、测验的设计,所选测验必须适合测量的目的,所选测验必须符合心理测量学的要求,施测的程序和步骤,施测前准备：,准备好测验材料,熟练掌握施测手续,熟记测验指导语并能用口语清楚而流利地说出来,指导语,测验情境,测验焦虑,与受测者建立良好的协调关系,评分技术,测验分数的解释,叙述的解释,溯因的解释,预测的解释,评价的解释,报告测验分数,用当事人所理解的语言,保证当事人知道这个测验测量什么或预测什么,让当事人知道常模是什么团体,让当事人知道分数只是一个估计,让当事人知道如何运用分数,考虑测验分数对当事人的影响,结果向无关人员保密,对低分者解释要谨慎小心,报告测验分数应设法了解当事人的心理感受,测验常模,常模：常模团体的分数分布。,确定有关的比较团体,获得该团体成员的测验分数,把原始分数转化为量表，该量表能把个人分数表示成在这个团体内的相对位置。,常模团体,群体的构成必须明确界定,标准化样本必须是所要测量群体的一个代表性取样,取样过程必须详尽描述,样本大小适当,注意常模的时间性,一般常模和特殊常模相结合,分数转换与合成,原始分数：被试反应计算出来的测验分数。,导出分数：在原始分数转换的基础上，按照一定规则，经过统计处理后获得的具有一定参考点和单位，可以相互比较的分数,分数转换：按某种规则将原始分数转化为导出分数的过程,百分等级分数：,P,R,=100 (100R-50)/N,R,：排名顺序的序号，,N,为被试总人数。,具有可比性，易于计算、解释方便，不受总体分布正态性影响，单位不等，只有顺序性，不能推断差异程度。,标准分数：,Z=,Z,分数分布与原始形态相同，经常有负数、小数点、单位过大。,正态化的,Z,分数：将对应百分等级看作正态分布曲线下的面积，求,Z,值。,T,分数：,T=10Z+50,历年真题,将,Z,分数转换成,T,分数时，需要进行（,C,）（,2007,，全国统考）,A.,正态化转换,B.,非正态化转换,C.,线性转换,D.,非线性转换,标准分数变式：,Z=AZ+B,等单位、便于进一步分析，正态分布下可以将导出分数和百分等级相互换算，可以将几个测验上的分数直接比较，分数过于抽象，不易理解，非正态分布变式得到的分数不可相互比较。,标准九分数：正态分布曲线横轴分,9,段。,各种导出分数的关系,分数合成,几个分数或几个预测源组合起来，以获得一个合成分数或作总的预测。,项目的组合，分测验的组合，测验或预测源的组合,用什么方法，什么形式，多少种及何种测验来合成分数？,临床诊断：直觉合成,高度综合性,灵活针对性,主观加权,没有精确的数量指标,加权求和：,X,C,=X,1,+X,2,+,X,n,Z,C,=Z,1,+Z,2,+Z,n,Z,C,=W,1,Z,1,+W,2,Z,2,+,W,n,Z,n,多重回归：,=a+b,1,x,1,+b,2,x,2,+,b,n,x,n,线性，连续变量，预测源和效标能同时获得,多重划分：在各个特质上都确定一个标准，从而把成绩划分为合格与不合格两类。所有测验都合格才算合格。,最有效的预测源放在最前面。,常模的编制,确定有关的比较团体。,获得该团体成员的测验分数。,把原始分数转化为量表分数。,几种常用的常模,发展量表,心理年龄,一组可区分不同年龄组的题目,一个常模团体,常模表,易于理解和解释,可以和同年龄团体直接比较,年级当量,10,个月间隔,只适用于一般课程，在各年级间有系统改变,解释比较困难,常被误用为标准,商数,教育商数,EQ=(,教育年龄,(EA)/,实际年龄,(CA)*100,有时意义不明确,(EQ=0),课程开设,成就商数,AQ,AQ=(EQ/IQ)*100,可以评价学生，也可以评价老师,智商和学业成就中等程度相关,百分等级，,Z,分数等,标准参照测验,标准参照测验：又称目标参照测验，当一个测验是以某一明确界定的内容范围为基础编制而成，并且其分数是参照该内容范围所要求的绝对标准进行解释。,作用：了解个体在所规定的测量内容上的行为水平，因此其出发点是个体本身的绝对水平，而不再是个体间的水平差异。,标准参照测验的题目分析,内容范围的确定：双向细目表,内容效度分析：专家评定,难度、区分度分析：预测试,前测,-,后测,已接受教学组,-,未接受教学组,对照组,难度分析：通过率，大多数情况下作为区分度分析的基础,区分度分析：,难度差值,掌握组,-,未掌握组鉴别指数,D=P,A,P,B,个人获得指数,DIG,：前测中错误回答某项目而在后测中能够正确回答的被试人数比例,相关系数,标准参照测验的信度与效度,分类一致性信度：考察被试在同一测验的两次施测中或两个复本的施测中是否被分在同一类中。,P,0,=(A+D)/(A+B+C+D),分数分界点的科学确定是评估测验分类一致性的前提，报告标准参照测验的分类一致性信度时，必须同时提供测验的分数分界点，以及测验长度等资料。,方差分析法：荷伊特信度,MS,人：被试均方，,MS,人、题：交互作用,内容效度,命题细目表,专家评定,效标关联效度,决策效度（预测源测验，效标测验）,结构效度目前关注不多,标准参照测验的分数解释,如何确定分界点：,专家判定法,Nedelsky,方法：由专家来判断处于临界水平的被试在每一题上有能力排除的错误选择项，从而计算其正确回答的可能性，再求出每一题上正确回答的可能性之和，即为测验分数分界点。,Angoff,方法：由专家直接判断处于临界水平的被试在某测验的每一题目正确作答的可能性,(,记为,Pi),设每一题的满分为,Fi,，则该测验的分数分界点,=,FiPi,Angoff,方法在实际运用中较多。,效标组预测法,临界组法：由专家判定和选择一组正处于临界水平的被试，将测验施测于该组被试，计算他们在测验上的平均成绩。（抽象、主观）,对照组法：掌握组和非掌握组原始分数分布曲线的交叉点。,心理测验理论的新发展,项目反映理论,概化理论,经典测验理论的局限,信度估计精度不高（真分数方差和误差分数方差不可知，严格平行测验不存在）,误差指标笼统单一,SE=,各种参数估计对样本依赖太大,指标之间配套较差（试题难度、被试水平参照系不同）,项目反应理论,潜在特质理论：心理特质的物理、生理属性不明，只能借助可观察的间接变量来鉴别、定义、探查。,潜在特质空间：对于某一特殊行为的发展起作用的所有潜在特质的集合。,心理测量学者首先关心的是查明潜在特质空间的维度，查明各维特质在决定人的行为时所作的贡献的大小。,题目,总分回归与项目特征曲线,人们提出用能稳定反映被试水平的潜在特质变量替代卷面总分作为回归曲线的自变量，这样的回归曲线被称作为项目特征曲线,(Item Characteristic Curve,，简称为,ICC),，记作为,P,（,）。,项目特征曲线是一条中心对称的,S,型曲线。,拟合：,项目特征函数：正态卵形曲线，,Logistic,函数。,决定,S,型曲线走向有三个参数：,a,、,b,、,c,的范围从负无穷到正无穷，,P(,),渐进于,1,，习惯上,采用标准,Z,分数形式。,c,：伪机遇水平参数，相当于,CTT,里的猜测参数,b,：题目难度，,P(,)=0.5(1+c),，,b,值增大，曲线向右平移,a,：题目区分度，陡峭参数，是曲线拐点处切线斜率的函数值。若记过拐点的切线夹角为,A,，则,a=,模型参数估计：多用计算机,优点：,题目参数跨群体不变（建设题库）,潜在特质量表的可选择性（测验等值）,参数设计科学,引进了具有可加性的信息函数,应用：题库建设，编制常模参照性测验，标准参照性测验，计算机自适应测验,概化理论,分数方差测量学：测验误差的来源多种多样，各种误差在误差总量中所占的比也不相同。,测验情境关系：在不同的测验情境关系下，测量误差的结构不同，误差量也不同。由此测验编制者可以通过改变测验情境关系达到改善测量，降低测量误差的目的。概化理论认为，研究测量必须先研究测验情境关系。,测验情境关系是由一个测量目标和若干个测量侧面构成的。,测量目标：测量者希望通过测量用测量数据描绘的那些实体。,测量侧面：除了测量目标方差，其余的都是误差方差，这些误差的来源都称作为测量侧面。,任何测量都是依赖于特定的测验情境关系的，测验情境关系中的测量目标、测量侧面、测量侧面的水平都是会变化的，它们的变化会引起测验误差的来源、测验误差的大小、真分数的种类以及测验信度的变化，同时测验分数的解释范围也发生变化。,测验施测之前必须进行测验设计。目标的界定，测量侧面的选择，各侧面水平的界定。,数据采集方法,交叉采集：所有测量目标在所有测量侧面的所有水平上均被测量，信息最丰富。,嵌套采集：某个侧面的各个水平分别被包含在另一个侧面的各个水平之中，最简单。,混合采集：兼有两种方法,测量的侧面越多，测量的水平数越多，对测验的分析越完善，但是后续统计分析越困难,第一阶段：,G,研究,方差分量分析,总方差：测量目标主效应方差，测量侧面主效应方差，交互效应方差,利用样本方差估计各种效应的期望均方,第二阶段：,D,研究,提供各种测量方案下的测验误差估计值,相对误差方差：所有与测量目标有关的交互效应方差之和。,绝对误差方差：除测量目标效应方差之外的所有方差之和。,概化系数：衡量常模参照性测验稳定性，,G,系数是测量目标效应方差与测量目标效应方差加相对误差方差之和的比。,依存系数：衡量标准参照性测验稳定性和一致性，,系数是测量目标效应方差与总效应方差之比,两个系数类似于,CTT,中的信度,效度：可以在原测量设计的测验情境关系下，在,D,研究中应用,G,研究结果直接计算求取，所得值的确切含义是,:,用某一侧面的重复数据估计测量目标一般水平时的效度。,注意,样本数据的代表性，科学抽样，对施测条件控制。,若测验侧面过多，不仅会有实测组织的困难，还会有模型设计和计量分析的困难。,测验等值,多个测验形式，找到不同测验形式之间的转换关系，把所有不同形式的测验分数都转换到同一个分数系统上。,等值转换是多个不同测验形式分数系统的转换，导出分数转换是同一个测验形式不同分数系统的转换。,寻找等值关系：同一种心理特质,寻找预测关系：可以不同。,等值条件：同质性，等信度，公平性，可递推性，对称性，样本不变性,经典理论等值和项目反映理论等值,测验分数等值和项目参数等值,水平等值和垂直等值,测验等值设计,锚测验,数据平滑（样本）,等值标准误差（抽样）,等值偏差（等值方法）,等值结果表示,列表,公式,图示,等值计算方法,百分位等值,线性等值,等值设计,随机分组,每组施测一个测验,随机分组,每组施测各测验,随机分组,每组施测一个测验，锚测验每组施测,非随机分组,每组施测一个测验，锚测验每组施测,心理测验的应用,成就测验又称教育测验、学绩测验，用来描述现状，指明一个人已经学会了什么和能做什么。,成就测验的编制,由学科专家与测验编制专家共同完成，其步骤与一般心理测验的编制程序相同。,确定测验目的，选定测验编制的方法,考察还是诊断，常模参照还是目标参照,分析测量目标，拟订测验编制计划,双向细目表，题型，题量,编题征题与选题组卷,编题征题试测组卷,调查测验质量参数，编制测验常模,难度、区分度、信度、效度、常模,编写测验指导书，正式出版发行,成就测验的标准化,命题组卷标准化,测验目标，试题的措辞、难度、区分度，题型比例、题量,施测标准化,环境、时间、指导语、主试,评分标准化,标准答案、评分细则、评分者人数,测验分数解释标准化,是常模参照还是目标参照,智力测验,智力测验：对智力个体差异的测量,个体智力测验,一位主试对一位被试的测验,比内,-,西蒙量表,（,1,）比西量表是第一个采用复杂任务来测量高级心理过程的测验。以前的测验主要测量感知觉、运动等低级心理过程。,（,2,）比西量表首次采用年龄作为智力的标准，这样可以对测验作出通俗易懂的解释。,（,3,）比西量表首次从整体上测量智力，也就是测量智力的普通因素，而以往心理学家把感觉辨别力、记忆力、注意力等割裂开来测量。,不足：,（,1,）施测和记分没有标准化。,（,2,）常模团体的代表性不够，因而有些项目的安排位置不当。,（,3,）测验项目过少。,斯坦福,-,比内量表,（,1,）信度,复本信度：,L,和,M,相关在,0.830.95,之间。,再测信度：高于,0.90,。,（,2,）效度,内容效度：测验内容属于公认的智力范畴。,效标关联效度：与学业成绩、受教育年限的相关在,0.40.75,之间。,结构效度：假设智力发展随年龄增长，先快后慢（证据：随年龄增长，再测稳定性逐步提高）；,存在,G,因素（证据：各项目与测验总分的平均相关为,0.66,）,中国比内测验,内容：,51,题,指标：离差智商,年龄范围：,2,岁,18,岁,生活常识,知觉速度及观察力,空间知觉力和想象力,记忆力,语言能力,判断推理能力,韦克斯勒（,Wechsler,）智力测验,当时的智力测验存在下列问题：,测验项目引不起成人的兴趣；,过多的项目涉及语词的操作；,指导语过分强调速度，牺牲了准确性；,计算心理年龄，不适合成人测验要求。,韦氏测验的特点,（,1,）,1012,个分测验：使用多个分测验，不仅可以得到总,IQ,，还可以分析个体在智力上的强项和弱点；,（,2,）言语量表和操作量表各由,56,个分测验组成，可以单独评价言语或操作的各项智力成分，体现了左右脑功能的整合，而且可以显示个体的职业能力倾向。,（,3,）共同的,IQ,计分系统：对所有测验和所有年龄组，,IQ,平均为,100,，标准差为,15,。而且每个分测验的平均分为,10,，标准差接近,3,分。这样就可以比较被试的各项分测验分数，了解其相对强弱。,（,4,）不同年龄组有相同的分测验：例如，,WAIS-R,，,WISC-R,，,WPPSI-R,有相同的,8,个核心分测验。这不仅方便施测者，而且有助于测验之间的相互比较。,韦氏成人智力量表,共有,11,个分测验，其中,6,个言语量表（常识、数字广度、词汇、算术、理解和类同），,5,个操作量表（填图、图片排列、积木图案、物体拼凑、数字符号）,韦氏儿童智力量表,12,个分测验：,5,个言语测验（常识、类同、算术、词汇、理解），,5,个操作测验（填图、图片排列、积木图案、拼图、译玛），,2,个备用测验（背数和迷津）。,适用年龄：,616,岁,韦氏幼儿智力量表,年龄：,46.5,岁,11,个分测验：,5,个言语测验（常识、理解、词汇、算术、类同），,5,个操作测验（填图、迷津、积木图案、句子复述），,2,个备用测验（动物房、几何图案）。,优点,（,1,）具有复杂的结构，能够较好地反映智力的整体和各个侧面；,（,2,）各年龄组都接受相同的分测验，可以相互比较，并节省指导测验的时间；,（,3,）用离差智商代替比率智商，克服了计算成人智商的困难。,（,4,）采用因素分析法研究结构效度更具有理论意义。,（,5,）各量表之间相互衔接，适用的年龄范围可以从幼儿直到老年。,缺点,（,1,）施测程序复杂费时；,（,2,）对于测量智力极高或极低的被试不大适用；,（,3,）缺乏充分的效度资料。,团体智力测验,陆军测验,一战时在,Yerkes,领导下编制。,陆军甲种（,）测验,8,个分测验：,照令行事、算术、常识、异同（同反义词）、字句重组、填数、类比推理、理解,效度：与军官评定、斯比量表、教师评定、学业成绩的相关,陆军乙种（,）测验,7,个分测验：迷津、立方体分析、补足数列、译码、数字校对、图画补缺、几何形分析,测试对象：母语非英语的被试和文盲被试,效度：与甲种测验的相关,瑞文推理测验,瑞文标准推理测验,瑞文彩图推理测验,瑞文高级推理测验,联合型瑞文测验（彩色,+,标准）,瑞文标准推理测验中国修订本,修订者：张厚粲（,1985,年）,取样：大、中、小城市,年龄：,5,岁,成人,信度：分半信度、再测信度,认知能力测验,桑代克,初级型：口头、词汇、关系概念、多重智力和数量概念,文字测验：词汇、句子填充、语词分类、语词类推,数量测验：数的大小比较、数列补充、建立关系,非文字测验：图形分类、图形推理、图形综合,传统智力测验的结构效度,不同智力测验有着不同的理论基础，其结构也不同，解释也不同，因此，应针对不同情况选择不同量表，也不能笼统地说一个人的智力如何。,传统智力测验的功能,还不够精细，无法精确诊断。,不能贴标签，更主要的是要解决问题。,传统智力测验的公平性,1.,性别差异,传统智力测验中有利于男性和女性的项目的不平衡,2,职业差异,经历对智力的影响,3,文化和教育差异,城乡差别、种族差别,能否编制出绝对公平的测验？,4.,年龄（时代）差异：人是不是越来越聪明？,传统智力测验的预测效度（智商的稳定性与不稳定性）,智力随年龄成熟而发展,不同年龄的智力成分是否相同？,智力是随年龄而增长的吗？,一个人的智商是否终身不变？,早期智力开发有无必要？,智力随环境而变化,智力中的遗传与环境的关系,同一家庭中成长的孩子，其所处的环境是否相同？,智力随个性特质的不同而产生不同变化,人格、动机、情绪对智力发展的影响，而传统智力测验没有考虑这些因素的影响。,学习困难儿童在自我批评和自我监控方面尤为不足。,高智商的人，其智力发展速率快。,积极的人格（进取心、面对挫折的态度）能促进智力的成长。,历年真题,世界上第一个智力量表是,(A),（,2007,，全国统考）,A.,比纳,-,西蒙量表,B.,斯坦福,-,比纳量表,C.,韦克斯勒智力量表,D.,瑞文推理测验,能力倾向测验,能力倾向测验的产生原因,智力测验的局限：大部分智力测验只测量了言语能力和数目及抽象符号的关系能力，无法测得一些具体的能力。,个体能力倾向的差异,因素分析技术的发展,来自实际的需要,能力倾向测验的特点,能力倾向测验的预测目的性更强,能力倾向测验预测失败比预测成功更准确,测验的编制,每个分测验针对一种能力，应该是相互独立的。,重视特殊团体常模的建立,测验结果的解释,注意被试与常模性质之间的差异。,具体能力倾向测验介绍,学术能力倾向测验（,SAT,）,美国的高考测验,语言：反义词、句子填充、类比推理、阅读理解,数学：算术、代数、几何,分辨能力倾向测验（,Differential Aptitude Test,DAT,）,适用于初中和高中学生的教育咨询及就业指导,言语推理,数的能力,抽象思维,文书速度与准确性,机械推理,空间关系,语言运用：拼写,语言运用：文法,一般能力倾向成套测验（,GATB,）,综合式职业性向测验（,36,个职业群常模）。,一般智力：,言语能力,数的能力,空间关系理解力,形状知觉能力,文书知觉能力,动作协调能力,手指灵巧性,手部灵巧性,特殊能力测验,一、音乐能力测验,（一）西肖尔音乐才能测验,音调、音量、时间音程、节奏、音色、音调,（二）音乐能力测验图,（,1,）,T,测验：音调形象（旋律、和声）,（,2,）,R,测验：节奏形象（速度、节拍）,（,3,）,S,测验：音乐感受（短句、平衡、风格等）,二、美术能力测验,（一）梅尔美术判断力测验,包括,10,对的绘画作品，一幅是公认的名画，另一幅稍作改动，要求被试判断哪一幅更好。,（二）格雷福斯图案判断测验,由,90,套二维或三维的空间抽象图案组成，每一套包括,23,个同一图案的变式，它们在整体性、平衡性、对称性等方面有所区别，要求被试判断哪一图案更好。,（三）霍恩美术能力问卷,包括两部分：（,1,）要求被试画出,20,种常见的物体或几何图形；（,2,）在长方框规定的基本线条内作图。,三、机械能力测验,（一）空间关系测验,1,明尼苏达机械拼合测验,要求被试拼排随机摆放的机械物体。,2,明尼苏达空间关系测验,要求被试尽快将木块放入相应的几何形状的槽中。,3,明尼苏达书面形式拼板测验,包括,64,道选择题，每题包括一个分解几何图形题和,5,个拼凑成整体的选择图案，要求被试选择正确的答案。,（二）,Bennett,机械理解能力测验,适用范围：,912,年级,限时：,30,分钟,测量对实际情况中对机械关系和物理定律的理解。,创造力测验,发散思维研究与创造力测验,吉尔福特发散思维测验,词语流畅：迅速写出包含一个指定字母的单词。,观念流畅：迅速列举属于某一种类的事物的名称，如“能燃烧的液体”有,联想流畅：列举近义词。,表达流畅：写出每个词都以指定字母开头的四词句。如“,KUYI”,，”,Keep Up Your Interest”“Kill Useless Yellow Insects”,非常用途：报纸可以用于,解释比喻：“一个女人的美丽就像秋天，它,”,效用测验：尽可能列举一件东西的各种用途,故事命题：,推断结果：“假若人们不再需要睡眠，会出现什么情况？”,职业象征：蜡烛,老师,图形组合：类似七巧板，包括,4,种形状（圆、三角形、长方形、梯形），可以重复使用，可以改变大小。,绘图：把一简单图形复杂化，组成尽可能多的各种物体的图形。,火柴问题：,装饰：以尽可能多的不同设计修饰一般物体的轮廓图。,托伦斯创造性思维测验,言语的创造性思维测验,包括,7,项活动：,1,发问：呈现一张图画，要求列举为了了解图中之事而需要询问的所有问题。,2,猜测原因：列举图中之事发生的所有可能原因。,3,猜测结果：列举图中之事的所有可能结果。,4,产品改进：对给定玩具提出改进意见。,5,非凡用途：列举某物不同寻常的可能用途。,6,不平凡的疑问：对活动,5,中所示物体提出不同寻常的疑问。,7,推想结果：列举一种假想事件的所有可能结果。,从流畅性、变通性、独特性三个方面计分。,图形的创造性思维测验,1,建构图画,要求被试把一张边缘为曲线的颜色鲜明的纸片贴在一张空白纸上，然后以此为出发点，画一个非同寻常的能说明一段有兴趣的振奋人心的故事的图画。,2,完成图画：利用少量不规则的线条画出物体的略图。,3,利用成对的短平行线（,A,本）或圆（,B,本）尽可能多地画出不同的图。,从流畅性、变通性、独特性、精确性,4,个方面来评分。,人格测验,通过一定的方法，对在人的行为中起稳定的调节作用的心理特质和行为倾向进行定量分析，以便进一步预测个人未来的行为,自陈量表,让被试自己提供关于自己人格特征的报告。,基本假设：只有被试自己最了解自己。,是否式,二择一式,是否折中式,文字等级式,数字等级式,自陈量表的特点,测量工具一般为调查表。,题量较大。,在同一测验中往往包含几个分量表，测多个特质。,通常采用纸笔测验，因而可以团体施测。,计分规则简单而客观。,自陈量表的问题,社会称许性,自我防御：掩饰,默认,折中,自陈量表的编制方法,逻辑分析法（爱德华个人偏好量表（,EPPS,）、詹金斯活动调查表、显性焦虑量表。）,确定要测量的特质编写题目编制问卷,因素分析法（,16PF,、,EPQ,）,施测大量题目相关题目构成因素，即人格特质,经验法（,MMPI,）,分组：选取具有某一特征的效标组，对照

展开阅读全文

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

关于本文

本文标题：北京大学心理测量课件.ppt
链接地址：https://www.zixin.com.cn/doc/13055841.html

xrp****65

内容提供者实名认证

平台协调中心【客服】

相似文档自信AI助手

黑龙江省虎林市高中化学 2.2《水的电离和溶液的酸碱性》课件2 新人教版选修4.ppt
2025年大学大四（水产养殖学）水产动物营养调控综合测试题及答案.doc
2025年高职（新能源汽车检测与维修）新能源汽车故障诊断综合测试题及答案.doc
2025年高职第二学年（供应链管理）供应链风险管理专项测试卷.doc
九年级政治-第一课历史的足迹课件-教科版.ppt
2025年大学大一（康复医学概论）康复治疗技术分类阶段测试试题及答案.doc
高中生物必修一第五章第二节《细胞的能量“通货”——ATP》课件.ppt
2025年高职（观光农业）观光农业项目策划阶段测试题及答案.doc
初三化学.ppt

搜索标签自信AI导航

北京大学 心理测量课件