心理测量学 第十一讲 测验效度.pdf
《心理测量学 第十一讲 测验效度.pdf》由会员分享,可在线阅读,更多相关《心理测量学 第十一讲 测验效度.pdf(89页珍藏版)》请在咨信网上搜索。
1、心理测量学第H-讲测验效度)教育与心理测验标准 1999年美国教育研究协会(American Educational Research Association,AERA)、美 国心理学会(American Psychological Association,APA)和美国国家教育测量学会(National Council on Measurement in Education,NCME)3家机构共同颁布了新版的教育与 心理测验标准(Standards for Educational and Psychological Testing)o-标准是教育与心理测验领域中的一份权威 性文献,体现了测验
2、领域中的行业标准,是测 验工作者和测验研究人员的一本重要的参考书。在1999年之前,颁布标准的3家机构曾经 颁布过5个有关测验开发和使用的文件。(1)1954年由APA颁布的关于心理测验和 诊断技术的技术建议(2)1955年由国家教育协会颁布、由AERA 和NCME编制的关于成就测验的技术建议(3)1966年由APA出版、由APA,AERA和 NCME共同编制的教育与心理测验及手册 的标准(4)3家机构于1974年对第3个文件的修订版(5)1985年颁布了标准的第5个版本对效度的重新定义和分类 85年版本:效度被定义为“从测验所做 出推论的适当性或合理性的程度”。根据证据来源不同,证据被划分为
3、来自“构念(construct)”、来自内容(content)和来自标准(criterion)3种,效度也被箱 应地划分为3种。99年版本:效度被定义为“关于测验分数的 特定解释所得到的支持程度。这种支持来自累 积的证据或理论。这种解释是测验应用的基 础。”“在本标准中,所有的分数都被视为 对构念的测量”。-在99年版标准中,没有再沿用把效度分为 构念、内容和效度标准的3种分类法。关于 Construct。关于construct的解释是:“测验所测量的 概念或特性(the concept or the characteristic that a test is designed to meas
4、ure)o”使用术语概念(concept),可能比使用术语 construct,更好,但是,我们使用后者的原 因是为了强调,这些范畴是为了将经验组织 进定律性陈述而精心创造的。(Cronbach)中译为“结构”的人并没有准确理解 construct本身的涵义在英语中,与“概念(concept)”相比,construct更强调建造、创造、人为的意思。所以,认为译为“构念”会更好,既强调 了建造、创造的意思,又体现了概念的意思。效度概述效度所要回答的问题:(1)测验测量的是什么?(2)对它所测量的东西测量到什么程度?效度的概念CTT认为,效度(validity)是指一个测验或量 表实际能测出其所要
5、测的心理特质的程度。效度概念的理解效度是一个相对的概念:(1)效度是相对 于一定的测量目的而言的;(2)只能达到 某种程度上的准确。效度是测量的随机误差和系统误差的综合反映 判断一个测量是否有效要从多方面收集 证据效度的数学定义及基本原理。一组测验分数的总变异(62。)包括三部分:真实的(稳定的)、与测量目的有关的 变异(。)真实的、但出自无关来源的变异(62sp)随机误差的变异(Se)二者关系如下:62O=62CO+62sp+62e CTT将测量效度定义为:在一列测量中,与测量目的有关的真实变异数(由所要测量 的变因引起的有效变异数)与总变异数(实 得变异数)的比率。val=62CO/620
6、=r2XY效度概念发展的四阶段-最初测验是用来评定个体在指定的内容领域已 经学会了什么东西第二阶段时,重点则转到预测现在或将来 某个时候,不同的个体在一定的情境中会怎 样反应?同一个体在不同的指定情境中又会 怎样反应?所要预测的行为在情境中的表现 逐渐被称为效标。在90年代出现两种主要趋向:加强理论 趋向;心理学理论与通过经验和实验的 假设检验之间密切联系。日益认识到构念(结构construct)在描述 和理解人类行为中的重要性。构念是一种 广泛的范畴,源自直接可观察的行为变量 共同具有的一般特性。构念又是一种理论 实体,本身无法直接观察。-99年的标准认为,就说明测验测量 什么东西而言,构念
7、效度逐渐被认为是 基本的、包括一切的效度概念。Validity/Validation Content validity Construct validity Predictive validity、Concurrent validity 1999年的标准改以Validation来说明心理测验的有效性的评估。I把Validation译成:效度验证、考验效度、|效化 Validation是一种用以了解测验得分的意义的 科学研究(Scientific inquiry into test score meaning),并指出Validation研究的两个目的,Validity for measurem
8、ent与Validity for decisions总而言之,Validation一词的使用,贝U在强 调效度的动态过程。)效度与信度的关系:信度是效度的必要条件(necessary condition)而非充分条件(sufficient condition)o效度是 测验的首要条件,而信度是效度不可缺少的 辅助品。信度系数的平方根是效度系数的最高限%表示校正后的效度系数,Qy表示实得的 效度系数,为测验的信度,Tyy为效标的信 度测验的效度受它的信度制约。根据效度和信度的定义有:心二S。始2。和XX=62?020 又因为62T=62co+62sp 所以可得到:r2xY=62co/62o=(6
9、2T62Sp)/62o=rXx-o2sp/o2o 因为62sp 0所以r2XY rxx这就是说,一个测验的效度总是受它的信度所制约的。效度的估计:由于真分数方差是无法估计的,因此对测验的 效度的检验就难以依靠心理计量学的理论。但由于潜在心理特质之间及与人的外显 行为之间有密切的关系,因此我们可以通 过逻辑的和实证的方法对效度进行间接的 验证。内容效度定义:content related valicHty,又称内容关联效 度。验证测验内容效度的程序 确定所要测量的全部内容范围:将测验目的具体化为不同层次的测验目标 确定每一层次测验目标在整个测验中所占的比 重 编制测验双向细目表 按比例随机抽取测
10、验题目 请专家对测题的代表性、测题对测验目的的适 合性进行分析)内容效度的确定。题目样本与总体得分相关法两测验的相关法处理后的重测法内容效度比十内容效度与表面效度表面效度(face validity)表面效度会影响被试的测验动机适当的表面效度内容效度的应用-成就测验-教育测量中的标准参照测验 职业测验效标关联效度 效标:即效度标准(valicHty criterion),是指独 立于测验结果,反映测验目的的行为参照,也 称效标行为。-理解:用来检验效度的参照标准;用来显示 测验所欲测量的特性的变量。例如:智力测验,它的效标可以有哪些呢?飞行员选拔测验的效标有哪些呢?企业的招聘 测验的效标。观念
11、效标与效标的测量选择效标时首先要进行逻辑分析,判断被 试的某种行为表现与所要测量的心理特质间 是否有对应关系,如果所测特质是该行为表 现的决定因素或主要影响因素,则这一行为 表现就可作为相应测验的效标。*观念效标是指从概念上确定所要选择的测验 效标是什么。观念效标确定后就要将其数量化,即以具 体的测量指标表示效标行为水平的高低,这 就是效标的测量。效标所具有的特点:有效性可靠性客观性实用性I常用的效标:学业成就(academic achievement)实际工作表现(job performance)对照组(contrasted groups)精神病诊断(psychiatric diagnosi
12、s)特殊训练课程成绩(performance in specialized training)评定(ratings)先前己有的测验(previously available tests)I效标关联效度定义:效标关联效度(criterion-related validity)也称为统计效度(statistical validity)或实证效 度(empirical validity)o以测验分数和效度标准之间的相关系数,来表示测验效度的高低,所以又称之为统 计效度。由于它以实践的效果来作为检验 测验是否有效的标准,所以也称为实证效 度。实际上是一个测验对于特定情境中的 个体行为进行预测时的有效性
13、程度。同时效度(concurrent validity)和:预测效度(predictive validity):同时效度:测验分数与效标资料的取得约在同 一时间内连续完成,计算这两种资料的相关系 数即代表测验的同时效度。指测验与同时获得 的效标行为的一致性程度。预测效度:在测验分数取得一段时间后力 获得效标资料,计算这两种资料间的相关系 数就代表测验的预测效度。指测验结果对效 标行为的预测程度。-预测效度和同时效度之间的逻辑区分,不是根 据时间而是根据测验目标。同时效度多用于诊断现在的状态,检查 和测量现有的某种能力或特质的有效性。预测效度则预测将来的结果,表明测 验对某种行为的预测的有效性。
14、“某人具有这种能力吗?”能力吗?”-“某人的心理正常吗?”问题吗?”“某人会有这种“某人会出心理“某人有资格当优秀飞行员吗?”“某人具备 成为优秀飞行员的必要条件吗?”效标关联效度的估计方法:相关系数法 区分法或分组检验法思路:被试接受测验后,让他们工作一段时间,再根据工作成绩(效标测量结果)分为两个极端 组(成功与不成功,合格与不合格),然后检 验这两组被试原来的测验分数是否具有统计学 上的差异显著性。重叠量另一个版本:计算出成功组中低于失败组 平均数的人数,再计算出失败组中超过成 功组平均数的人数,两数相加除以两组总 人数即为重叠量。计算出处于两组分数分布的共同区域的人数 百分比命中率或取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 第十一讲 测验效度 第十一 测验
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。