探索增值评价的中国路向_基于美国实践经验的批判性分析_韩玉梅.pdf
《探索增值评价的中国路向_基于美国实践经验的批判性分析_韩玉梅.pdf》由会员分享,可在线阅读,更多相关《探索增值评价的中国路向_基于美国实践经验的批判性分析_韩玉梅.pdf(18页珍藏版)》请在咨信网上搜索。
1、DOI:10.16382/ki.1000-5560.2023.02.006探索增值评价的中国路向:基于美国实践经验的批判性分析*韩玉梅1,2 美 严文蕃3蒋 丹1(1.西南大学西南民族教育与心理研究中心,重庆 400715;2.西南大学教育政策研究所,重庆 400715;3.美国马萨诸塞大学波士顿分校,波士顿 02125-3393)摘要:本文采用国际比较和批判性分析的视角,以教师增值评价为抓手,借鉴美国增值评价的理论和实践探索经验,批判性审思教师增值评价的本质特性、技术边界、应用限度、融合趋势、实施条件等问题,多方位探寻增值评价在中国教育评价体系中的价值路向、技术路向、应用路向、发展路向和实践
2、路向。分析发现,教师增值评价具有以学生成绩增幅结果为依据诊断教师贡献度、以学生成绩增长的因果效应表征狭义“教师效能”、以增值模型为核心技术测度“增值”、以特定年级学科教师为适评对象等本质特征和局限,因此,在充分肯定和最大化发挥其循证导向和技术优势的同时,要避免对其价值的过分夸大和泛化。增值模型在信效度和统计偏误等技术层面依然存在激烈争议和未解难题,应针对性开展国际前沿技术探索,以破立并举的原则实现本土化技术突破与创新。美国教师增值评价政策演进和大量实证研究证明,增值评价结果服务高利害决策存在较高风险,应强化其诊断功能。增值评价与多元评价方法的融合趋势成为国际共识,应以价值多元化为导向,以利益相
3、关主体的多元协商为原则,构建增值评价与多元化测评方法及多样化证据的系统性融合机制。增值评价从理论走向实践,须逐步在全国学生学业成就及进步程度测评体系和工具体系建设、动态追踪数据库建设、专业团队建设、全过程反馈机制建设等方面做好充足准备,最大化实现增值评价可能为整个教育评价体系所“增”之“值”。关键词:增值评价;教师增值评价;教师效能;批判性分析 一、引言作为教育评价体系中的一种重要理念和方法,增值评价一直颇具争议性。2020 年 10 月,中共中央国务院印发了深化新时代教育评价改革总体方案(以下简称“方案”),提出要“探索增值评价”,引领教育研究者围绕增值评价开展理论、技术、实践等多层面的探索
4、,通过国际比较及本土化的研究与实践,摸索出一条适宜新时代中国特色教育评价体系的增值评价路径。20 世纪 80 年代以来,增值评价在美国被广泛应用于学校评价、教师评价等教育评价体系中。其中,增值评价在教师评价体系中的应用引发了学术界旷日持久的争鸣与批判,也在实践层面掀起了一线教育者的长期对抗与质疑,经历了由占主导地位、大规模推广到与其他评价方式融合式发展和限定性、综合性应用的态势变革。在我国,增值评价一直处于理论探索和以研究为目的的小范围试验阶段,尚未在政策和实践层面开展实质性的大规模探索。20 世纪末,少数学者开始尝试将增值评价 的理念和方法技术引入到我国素质教育评价体系中(张兴,1998)。
5、21 世纪以来,一些学者尝试运用增值评价模型在我国样本地区开展学校效能、教师效能评价的实证研究(马晓强等,2006;边玉芳等,2007;邵 *基金项目:国家社会科学基金一般项目“西藏自治区教育脱贫攻坚典型案例研究”(20BMZ147)。JOURNAL OF EAST CHINA NORMAL UNIVERSITYEducational Sciences No.2,202363越洋等,2020)。方案发布以来,在“新时代教育评价改革”战略视域下探讨增值评价的研究数量激增,研究热度攀升到前所未有的高度(郭元祥等,2021)。众多学者积极肯定了增值评价的价值,认为相比过程评价,增值评价既关注过程,又
6、重视起点,具有较为合理的评价理念及科学的统计方法,保证了更加公平、公正、客观、科学的判断和比较,应该成为新时期我国教育评价的重要方式(杨小微,2020;邵越洋等,2020;边玉芳等,2015)。不可否认,增值评价具有强有力的量化表征能力及追求教育评价科学化、客观化的价值逻辑起点,可以为促进我国教育高质量发展带来新思路。然而从总体上来看,国内已有关于增值评价的研究重引荐与褒奖,轻批判和反思,对增值评价的弊端与局限、未解的难题与挑战、国际发展动态及实践证据剖析相对不足。当前,在深化新时代教育评价改革战略带来的重要机遇和利好形势下,中国增值评价的本土路径何在?如何理性研判增值评价的本质特性与利弊优缺
7、,客观把握增值评价在我国教育评价体系中的价值定位、技术边界和发展路向?如何在实践中最大化发挥增值评价的优势,为建设富有时代特征、彰显中国特色、体现世界水平的教育评价体系做出应有的贡献?围绕这些基本问题,遵循“坚持中国特色,扎根中国,融通中外”的原则,本文采用国际比较和批判性分析的视角,以教师增值评价为抓手,借鉴美国增值评价的理论与实践探索经验,批判性审思教师增值评价的本质特性、技术边界、应用限度、融合趋势、实施条件等问题,多方位地深入探寻增值评价在中国教育评价体系中的价值路向、技术路向、应用路向、发展路向和实践路向。二、价值路向:理性研判本质特性,探索增值评价的价值定位任何一种教育评价方法都是
8、优势与风险并存的,在考量和选择增值评价方法的适切性和价值路向时,首先需要思考和权衡增值评价相较于其他方法所独具有的本质特性,从而明晰其在特定文化背景下和教育评价体系中的价值定位(NRC,2010,p.56)。(一)研判教师增值评价的内涵与本质特征“增值”(value-added)的概念来源于经济学领域,本意是指商品总价值扣除生产成本、中间投入后额外增加的价值部分,反映的是产品核心要素所贡献的价值(Deardorff,2016)。引申到其他领域,“增值”泛指特定物品(或服务、人员)超出标准预期额外创造的更多“价值”。1971 年,教育经济学家埃里克哈努谢克(Eric Hanushek)发表文章探
9、讨教师特征变量与学生成绩之间的关系,从教育投入产出的视角首次将经济学中的“增值”概念引入教育研究领域,将教师特征等影响因素变量视为投入成本,将学生成绩视为教育过程产出的“商品”,将一定时期后学习成绩的增长变化视为“增值”,并构建教育生产函数模型来定量刻画教师特征等参数与学生成绩增长的关系(Hanushek,1971)。这一研究确立了教育学领域中“增值”概念的原初涵义,即学生在学习过程中受到教师等变量影响后,其成绩在特定时间段的增长幅度,反映了教师等关键要素对学生成绩产出所贡献的价值增量。基于拉夫尔W.泰勒(Ralph W.Tyler)的经典“目标结果”导向评估理论,即主张评价是将实际教育结果与
10、预期目标之间进行比较的过程,“增值评价”(value-added assessment)是基于学生成绩增长实际结果和预期结果之差值,来对教师、学校等影响因素的效能和贡献度进行评价的一种理念,旨在满足教育当局对教育目标和结果及其实现进程的监测需求,以及对学校和教育者促进学生学习的效能的研判需求(Sanders&Horn,1994)。根据不同的测评目的,增值评价可以运用到教师评价、学校评价等教育评价子体系中。在教师评价子体系,增值评价即指以特定周期中学生学业成就增长幅度为评价依据,对教师促进学生学业增长的效能或贡献度进行评判的理念和手段(Darling-Hammond et al.,2012)。换
11、言之,教师增值评价是检测学生特定时间段内学业成绩的实际增长在多大程度上归因于教师效能的测评手段,被视为衡量教师质量水平的重要标尺。图 1 简要呈现了教师增值评价中“增值”的二步测算方法。首先,采用增值模型(value-added mod-el),代入教师所教学生的标准化测试起点成绩数据(如 3 年级数学成绩)、学生个体特征变量数据、学华东师范大学学报(教育科学版)2023 年 第 2 期教育评价64校层面控制变量数据、教师变量数据等进行测算,预测出学生在特定时段后(如一学年)的成绩增幅均值(即 4 年级数学成绩预测增幅均值);其次,将学生同等时期实际成绩增幅均值(4 年级数学成绩实际增幅均值)
12、与预测成绩增幅均值进行比较,所得的差值即为教师的“增值”分值,即教师效能估算值,该分值越高,表示教师效能越高,反之则越低(SDP,2012)。3年级4年级100908070605040成绩实际增幅预测增幅教师效能估算值=学生成绩实际增幅均值-学生成绩预测增幅均值图 1 教师增值评价的概念图示(来源:译自哈佛大学教育政策研究中心战略数据项目组报告)依据上述内涵阐释,可以基本把握教师增值评价的几个本质特性:其一,以学生成绩增幅结果为依据诊断教师贡献度。教师是促进学生学习的关键,学生学业成就在一定程度上是教师等关键因素综合作用的产出结果。教师增值评价通过学生标准化测试手段和特定周期成绩增幅数据实现对
13、学生学习进步程度的量化测度,以此作为重要参数来衡量教师对学生成绩增长的贡献度,这为教师评价提供了一种便利的操作方法和数量化的精准描述。相较于主观的课堂观察法、学生调查法和传统的终结性成绩评估法等,增值评价采用一种纵向的视野将学生学业成就的起点纳入考量范畴,控制背景变量和影响因素,检测特定周期学生成绩的纵向发展变化与“净增长”程度,实现了测评客体在时空维度由定点向过程、由绝对向相对、由静态向动态的跨越。这一评价方式为教师效能评判提供了更加立体、公正的客观依据,为教师促进学生学习的贡献度评估提供了形成性、诊断性工具,为教育产出结果、教师质量水平和教育投入产出效益的定量刻画提供了可行方案,具有主观测
14、评方法无法比拟的特性(Amrein-Beardsley et al.,2016)。然而,教师增值评价理念并未从根本上摆脱结果取向的桎梏。一方面,学生成绩增幅是以不同时段同一标准化考试成绩为基础数据的测算结果,尽管避免了静态考试成绩绝对值的偏误,但依然难以克服甚至强化了师生对考试结果的追求,这为美国基础教育领域不期望看到的“为考试而教”的现象埋下了伏笔。另一方面,基于学生成绩“增值”结果评价教师效能的价值取向隐含了将学生成绩增幅视同为教师教学结果的逻辑,对增值评价结果的倚重容易重蹈教师质量与学生成绩简单捆绑的“唯分数”覆辙。其二,以学生成绩增长的因果效应表征狭义的“教师效能”。教师效能(teac
15、her effectiveness)是教师评价的客体。对教师效能的界定影响着教师评价所采用的标准和方法,不同教师评价方法也反映了对教师效能不同内涵维度的侧重。美国国家教师质量综合中心(National Comprehensive Center for Teach-er Quality)发布的一份关于教师效能的报告较为综合地指出了教师效能内涵的五个维度,包括:教师对学生有高期望并帮助学生提高学习成绩的能力;培养学生积极情感态度价值观、个人效能感及合作精神的能力;使用不同教学资源按照学生需求设计和提供学习机会、实时监测评价学生发展的能力;促进课堂和学校多元化发展及培养学生公民意识的能力;与其他利益
16、相关者合作促进学生成长发展的能力(Goe et al.,2008)。教师增值评价采用了上述教师效能第一维度的狭义界定,仅指向了以学生成绩提韩玉梅等:探索增值评价的中国路向:基于美国实践经验的批判性分析65高为标识的教师教学成果的评价范畴(陈玉琨,2007,第 130 页),是统计学意义上教师对学生成绩增幅产生的因果效应。换言之,在增值评价体系中,教师效能被狭义地表征为学生在特定时间段内接受某教师的教育后其学习成绩的变化差异(McCaffrey et al.,2003,pp.915)。这一立场在“力争上游”(Raceto the Top)项目行动纲要对“有效教师”(effective teach
17、er)的操作性界定中得到了印证。该文件将“有效教师”界定为“所教学生成绩至少在一个年级水平、一个学年测评中达到了预期增长指标的教师”(US-DOE,2009,p.12)。在这样的评价标尺下,学生成绩增长幅度均值高的教师被归类为“高效能教师”,反之为“低效能教师”,甚至“不合格教师”(Kupermintz,2003,pp.292293)。由此产生的问题是,教师效能可以依据学生成绩来被认知和判定吗?长期以来,众多学者研究教师和学生成绩之间的关系,认为教师效能是最重大的影响学生学习和学业成就增长的关键因素(Sanders&Horn,1998;Johnson,2015),其水平差异化是导致学生学习差异
18、化的重要原因(Darling-Ham-mond,2000),因此以学生成绩为标准来评价教师具有高度的合理性和可操作性(Millman,1997;Tucker&Stronge,2005,p.15)。然而,也有大量采用大规模学生标准化测试数据分析学生成绩影响因素的研究发现,教师对学生学习成就的解释力仅占所有影响因素的 1%14%,而更具有解释力的影响因素来自于学校和教育体制机制等层面(ASA,2014)。众多学者主张,教师对学生学习的影响并不是唯一或者最强的影响因素,即便统计模型能够在一定程度上筛除其他变量的统计噪音,但依旧不可避免地会遗留一些影响(Haertel,2013,p.5)。争议之下,将
19、学生成绩作为教师效能高低的主要评判依据,尤其将基于学生成绩的增值评价结果与高利害的教师问责挂钩,其合理性和公平性不仅值得怀疑,甚至会导致负向的抑制作用(Everson,2017)。上述争议可以反映出,增值评价对教师效能的量化表征在本质上具有双重限度:一是增值评价所测度的教师效能仅聚焦教师促进学生成绩增长的“净效应”,而不能等同于广义、多元的“效能”;二是增值评价对教师效应的测度是以对其他影响因素变量的人为控制为假设条件的,而其能够在多大程度上满足前提假设、精准辨别教师及其他影响因素对学生学习成绩的影响效应差异是长期以来有关增值评价方法论的争议和未解难题所在。其三,以增值模型为核心技术实现“增值
20、”的测度。增值评价理念得以实现的核心技术在于增值模型的科学构建。增值模型(value-added modeling,VAM)是借助计算机软件和学生学业成就数据库中相关数据来统计分析学生成绩增长情况以及教师等教育要素效能高低的数学统计模型(Amrein-Beardsley,2008)。构建教师增值模型的目的是在排除或控制外部影响变量的情况下,测算学生特定时期的成绩预期增长净值与同期实际增长值的差值,并用这个差值无偏倚地反映教师对学生学业成绩增长的因果效应,或称贡献度(Koedel et al.,2015)。从理论上讲,在统计模型建构合理、前提假设条件满足、各项学生成绩测评工具信效度高的情况下,这
21、一目标是能够实现的。但现实中,这些条件往往难以实现。随着统计技术和教育大数据的发展,增值模型处于持续的动态变化与修订完善进程中。首先,增值模型并非唯一的基于学生成绩的教师评价模型。在增值模型诞生之前,甚至到今天,教育统计学专家们一直在持续探索和构建多样化的模型来测评学生成绩与教师效能之间的影响关系。美国各州教育决策者也根据各州实际需求采纳了不同类型的基于学生成绩的统计模型,如状态模型、交股模型、成长模型等(NRC,2010,pp.34)。其次,在各类增值模型及其变式中,从简单的线性模型,到成就累计函数模型、固定效应回归模型、双步骤平均残差增值模型等,更多更复杂的遗漏变量不断被纳入模型,以便更加
22、科学地衡量教师效能对学生成绩的贡献度。然而,如何精准地遴选协同变量、如何有力地解释测量误差等依然是当前增值评价技术领域面临的重大难题(Koedel et al.,2015)。实际上,不同类型的增值模型抑或其他基于学生成绩的测评模型都有其特色与局限,没有任何一个模型是万能的或绝对精准的。但值得肯定的是,多元化模型的探索为全美各州自主建构和完善本土化的教师评价体系提供了丰富的工具选项和组合空间。随着人们对学生学习、教师效能及二者关系的认知能力提升、统计分析技术的日益完善、教育大数据挖掘技术的发展,以及各级各类学生成长发展与学业成就监测追踪数华东师范大学学报(教育科学版)2023 年 第 2 期教育
23、评价66据库的建立与健全,增值模型必将不断完善。其四,以特定年级学科教师为增值评价的主要适评对象。学生的连续性标准化测试成绩是增值评价测算所倚赖的基础数据,因此增值评价的适切性在很大程度上受限于学生特定周期内标准化测试成绩数据的可获取性和质量,并不普适于所有科目、所有年级、所有教师。在美国,以国家教育进步考试(National Assessment of Educational Progress,NAEP)、适当年度进步测试(Adequate Yearly Progress,AYP)、各级各类州级学业成就测试(State Achievement Tests)等为代表的标准化学业水平测试较多适用
24、于公立学校的数学、阅读等主要科目,部分测试覆盖科学、历史、经济、地理等学科。从时间维度来看,有的测试是年度测评,有的以三年级、五年级、八年级为主要测试对象。为避免大量缺失数据造成的统计偏误,适合参与增值评价的教师须满足特定的基本条件,即:确保其学生既参加了特定年级特定学科的基线测评(如三年级数学测试)、在测评阶段持续在该教师班级接受教育,且参加了后续学年的同类测评(如四年级数学测试)(Opper,2019)。为满足上述条件,增值评价无形中为其适宜对象设置了门槛,不能广泛应用于所有教师和学生。这一适用性限度导致增值评价的可推广性和公平公正性受到削弱。一方面,它难以推广到学生成绩数据获取性低的区域
25、、学科和教师对象群体,难以在采用不同测评标准和测评工具的地域范围、年度区间进行被评教师效能的跨群体、跨时空比较。另一方面,被评教师对象的公平公正性被削弱。尽管学生学习往往是多学科教师共同作用的结果,数学、阅读等主要科目的教师却要背负起学生学习成就增长结果的主要责任,接受基于增值评价结果的问责。(二)锚定增值评价在中国特色教育评价体系中的价值定位从以上对增值评价内涵和本质特性的剖析中可见其具有显著的优势和特色,但其暴露的局限更提醒我们要理性认识和谨慎明确增值评价在我国建设新时代中国特色教育评价体系中可能发挥的价值,避免过分夸大和泛化应用。其一,应充分肯定和最大化发挥增值评价的循证导向和技术优势,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 探索 增值 评价 中国 基于 美国 实践经验 批判性 分析 韩玉梅
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。