SNARC效应量大小及置信区间的可信问题的实例分析.pdf
《SNARC效应量大小及置信区间的可信问题的实例分析.pdf》由会员分享,可在线阅读,更多相关《SNARC效应量大小及置信区间的可信问题的实例分析.pdf(7页珍藏版)》请在咨信网上搜索。
1、心理学探新2 0 2 3,Vol.43,No.1,77-83PSYCHOLOGICALEXPLORATIONSNARC效应量大小及置信区间的可信问题的实例分析何华(苏州大学教育学院,苏州2 1512 3)摘要:通过实例分析SNARC效应量和置信区间可信度问题。(1)效应量是心理学实验结果报告中一个非常重要的部分,依据SNARC效应量的特殊性提出一种新的统计方法(在线性回归模型中引入混合虚拟变量)处理Aleottia等(2 0 2 0)的开放实验数据,尽管该方法比一般方法更复杂。(2)参数的区间估计是一种基本统计推断形式。根据枢轴量分布,置信区间在一定置信度下可估计总体参数所在的可能范围。文章通
2、过构建一个特殊实例分析了置信区间的估计过程,并和假设检验、贝叶斯统计进行对比分析,结果显示,虽然置信区间可以用来估计参数,但是存在依据某置信区间无法作出正确估计的情况,通过贝叶斯统计能分析出其中原因。关键词:SNARC效应;虚拟变量;假设检验;置信区间;先验分布;后验分布;贝叶斯统计中图分类号:B841.21SNARC效应量大小分析SNARC 效应(spatial-numerical association ofresponse codes effect,SNARC effect)本质上反映的是数量具有空间表征,即,在人脑中存在一条心理数字线,小数(1,2,3,4)表征在左侧空间,而大数(6,
3、7,8,9)表征在右侧空间(Dehaene,Bossini,&Giraux,1993)。其获得的一个最为简单的实验流程为:“+”在屏幕中央呈现30 0 ms,消失后随机出现一个小数(或大数)30 0 ms,被试既快又准确地以双手食指按键判断该数是大于5还是小于5(刺激5不出现在屏幕上)。这个实验用到的任务是数字大小判断(当然还存在其他种类的任务),实验一般采用重复测量实验设计,数据分析采用重复测量方差分析和线性回归分析(Lorch&Myers,1990)。线性回归分析最终会得到一个一元一次线性回归方程,该方程被用来描述SANRC效应。SNARC效应的线性回归方程一般是指,反应时差异(右侧减左侧
4、)在数字(1,2,3,4,6,7,8,9)上的线性回归,并可以一般性的一元一次线性回归模型描述:DRT=o+,N+其中,N为数字1、2、3、4、6、7、8、9,是预测变量;DRT是右侧反应时减去左侧反应时的差值。该线性模型中的回归系数,可以为正或负值,正负表文献标识码:A(1)文章编号:10 0 3-518 4(2 0 2 3)0 1-0 0 7 7-0 7明SNARC效应的方向不同。SNARC效应具有普遍性和跨文化性,西方研究者在以西方人为被试和以数字(1,2,3,4,6,7,8,9)为实验材料时,均可稳定获得数字SNARC效应,在描述SNARC效应的一元一次线性回归方程中,回归系数是负值。
5、而在以希伯来语或波斯语为母语的被试身上,也可稳定获得数字SNARC效应,但方向则和西方人的相反,因此回归系数是正值。SNARC效应的效应量大小就是该线性方程的回归系数大小,或者为该线性方程的斜率的绝对值,与正负号无关。另外,对该方程要进行回归方程的显著性检验和回归系数的显著性检验,检验是欲以证实因变量确实是和自变量呈现线性关系。因为只有一个预测变量,所以这两种检验结果是一致的。查阅国内外文献发现,需要比较SNARC效应量大小的研究为数众多,如,跨通道研究需要比较在单通道和跨通道条件下SNARC效应量大小的改变,以此来判断一个通道的数字加工是否影响到了另一个通道的数字加工;还有,不同空间维度(水
6、平、垂直和矢量维度)的SNARC效应比较,以此来判断哪个维度下的SNARC效应量可能是最大的;另外还有发展性的研究(如,小学生、初中生和大学生),等等。因为具体的研究内容不同,这些研究中*基金项目:江苏省教育学会“十三五”教育科研规划重点课题(19 B1N2SZ18)。通讯作者:何华,E-mail:t o u g a o l u n w e n 2 0 0 6 16 3.c o m。78的SNARC效应量的比较具有各自的具体意义。但是其中的共同之处在于,需要通过考察SNARC效应量的改变来分析出某个自变量因素是否在其中起了作用。另外还有一个统计上的共同需求,就是如何采取合适有效的统计方法来进行
7、比较分析。前述提到的研究中,需要比较的SANRC效应量大小至少是两组之间,这是最少的和最简单的,当然,也可能有四组甚至更多组之间,这种情形就比较复杂了。考虑到简单和具有代表性,选取三组之间的SNARC效应量进行比较分析,而且以Aleottia,G i r o l a m o b,Massaccesic 和Priftis发表在2 0 2 0 年Cognition上的论文“Numbers around Descartes:A preregisteredstudy on the three-dimensional SNARC effect”里的开放式数据为分析对象。分析过程中曾向论文作者Aleott
8、ia和Priftis(通讯作者)咨询该研究相关事宜以准确把握其数据含义。Aleottia等(2 0 2 0)的研究是有关数字的三维空间表征问题,为当前首个对三维(水平、垂直和矢量)SNARC效应的研究。Aleottia等(2 0 2 0)指出了前人研究存在的一些问题后,创造性设计出一种特殊反应装置(如下图1所示),真正解决了三维空间上的按键反应问题。研究得到,三维SNARC效应的效应量值是基本相等的(且都是负值),存在三维的数字的心理空间表征。Aleottia等(2 0 2 0)采用了频率主义(经典统计分析)和计算贝叶斯因子两种方法对结果进行了分析并得到最终结论,这两种分析方法下的结果大多完全
9、一致,但从Aleottia等(2020)的结果分析可以看到,在面对经典统计分析下的边缘显著情况,他们都会进一步进行贝叶斯分析以期得到更准确的判断。具体而言,为探索三个空间维度上SNARC效应的情况(即,三个维度上的SNARC效应的效应量或回归系数大小是否有显著差异),Aleottia等(2 0 2 0)进行了如下分析:对每个维度都进行了线性回归分析,并通过经典的单样本t检验和贝叶斯单样本t检验均得到回归方程是显著的。进一步,为了比较三个维度上SNARC效应量大小,Aleottia等(2 0 2 0)通过经典配对样本t检验和贝叶斯配对样本t检验均得到,三个维度上的SNARC效应量大小无显著差异。
10、经典配对样本t检验方法因简便实用而基本为前人研究所采用。但是,多重比较分析容易增加犯I型错误的概率,Ale-ottia等(2 0 2 0)所做经典配对样本t检验存在不可靠的可能性。比较SNARC效应量还可以有其他统计心理学探新思路,如,在线性回归模型中引人虚拟变量方法,下面详细介绍。图1Aleottia等(2 0 2 0)研究中专门设计的反应盒如果两个或多个样本组中的线性模型设定是相同的(即为同向),则这几组之间的回归系数大小是可以比较的,而且这种比较在多数实证分析中都是非常必要的。在数字加工的SNARC效应研究中也存在同样情况。以Aleottia等(2 0 2 0)的研究为例,其实验得到三个
11、维度(水平轴、垂直轴和矢量轴)的SNARC效应量大小显著且方向一致,则可确定数字认知存在心理的三维空间表征,因此比较三个维度(水平轴、垂直轴和矢量轴)的SNARC效应量大小是可行且必要的。由(1)式,三个维度的SNARC效应量的比较其实就是比较如下三个模型的回归系数大小是否存在差异:水平轴SNARC效应模型:DRT=oH+inN+H(1a)垂直轴SNARC效应模型:DRT=ov+ivN+uv(1b)矢量轴SNARC效应模型:DRTs=os+isN+us(1c)考虑到三个模型中的回归系数和常数项不等,采取加法乘法式混合引人虚拟变量得到如下线性模型(Wooldridge,2009/2010)。DR
12、T=Bo+8id,+8,d,*N+8,d,+8fd*N+iN+u2023年第43卷第1期该模型以水平轴为对照,且d1(矢量轴)和d2(垂直轴)均为虚拟变量。当两个虚拟变量都取0时,则表示为水平轴SNARC效应模型,且为对照组;当垂直轴取1,矢量轴取0,则表示为垂直轴SNARC效应模型;当垂直轴取O时,矢量轴取1,则表示矢量轴SNARC效应模型。N为数字1、2、3、4、6、7、8、9。因此,结合两个虚拟变量的不同取值,可得到:水平轴SNARC效应模型(d,=d,=O):DRT=o+,N+矢量轴SNARC效应模型(d=1,d,=0):DRT=(+8)+(82+)N+垂直轴 SNARC效应模型(d,
13、=O,d,=1):DRT=(o+3)+(84+)N+据此,检验垂直轴、矢量轴和水平轴之间的回归系数大小是否存在显著差异,就是检验H。:8 或8 4=0。依此类推,如果(2)式中的虚拟变量d,为水平轴、d为矢量轴,垂直轴为参照记为0,当两个虚拟变量都取0 则表示垂直轴,这样垂直轴就是对照组;当水平轴取1,矢量轴取0,则表示水平轴(d,=1,d=0);当水平轴取0,矢量轴取1,则表示矢量轴(di=0,dz=1)。据此,检验水平轴、矢量轴和垂直轴之间的回归系数大小是否存在显著差异,最终都可归结为检验H:82或4=0。下面即是利用Aleotti等(2 0 2 0)的公开数据通过 SPSS(SPSS S
14、tatistics 21,IBM,NY,USA)对模型(2)进行回归分析和F检验,最终得到方差分析表(表1)和两个回归系数表(表2 和表3)。可以看到,不论以哪个轴为参照轴,方差分析表都是相同的(即都是表1形式),这表明存在SNARC效应。而且,当以水平轴为参照时,在回归系数大小比较上,其他两轴均与其无显著差异(表2);当以垂直轴为参照时,在回归系数大小比较上,其他两轴均与其无显著差异(表3)。结果表明,存在数字的空间三维表征。因此,可以看到,通过引入虚拟变量对回归系数大小的分析和Aleotti 等(2 0 2 0)的分析结果是一致的。表1方差分析表平方和df回归23546.837残差7590
15、.847总计31137.684何华SNARC效应量大小及置信区间的可信问题的实例分析(2)非标准化系数标准系数B标准误差(常量)66.406N-11.804d21.50621.374-0.281-1.006d38.79821.374-0.508-1.815d,*N1.006d*N2.417表3回归系数表(垂直轴为参照)非标准化系数标准系数(2a)B标准误差(常量)27.609(2b)N-9.386d38.798d17.292(2c)di*N-2.417d*N-1.411由前面分析可知,引人交乘项检验某个或某几个变量的系数是否存在组间差异,只需在一般线性模型中加人交乘项即可,但这一方法背后存在隐
16、含的假设条件。对于数字认知的SNARC效应的一般线性模型(1)式,这个隐含的假设条件是,三组的误差项应具有相同的分布(因为估计时是将三组样本混合在一起进行估计的),即,o=。国内夏帆(2 0 0 8)给出了证明,一元线性回归模型中引入一个虚拟变量时,其中的虚拟变量回归参数b的显著性检验和两正态独立总体均值比较t检验是等效的。通过前面实例分析得到,混合引入两个虚拟变量后的结果也是等效的。引入虚拟变量的好处之一是可能会减弱假阳性。2置信区间估计的可信问题分析第一部分的分析中提到贝叶斯检验在心理学研究中已开始得到应用。贝叶斯学派认为概率是主观、先验和可变化的,是从有到变化;而频数派认为概率是从无到有
17、到相对稳定,是客观的。若只从客观性角度看,似乎频数派的统计方法的可信度相对更高,但实际情况是否真是如此呢?而且现在心理学实验的检验结果报告除了列出t值(或z值)大小,还需要需要提供“Cohensd值”,也有进一步提均方F54709.36711.1670.00018421.7142379表2 回归系数表(水平轴为参照)Sig.15.1144.3942.6510.8974.4523.7490.0790.2680.7913.7490.1900.64515.1141.8272.6510.714 3.54121.3740.5081.81521.3740.2260.8093.749-0.19-0.6453
18、.749-0.111-0.3762Sig.供置信区间的。因此,和第一部分一样,下面仍从实例出发对置信区间的可信问题进行分析。需要指出的是,虽然依据实例分析统计问题研究是初步的,但从数学角度来看,其不失为一种发现某些统计问题甚至质疑某些统计观点的重要手段。0.0000.0000.3280.0860.527Sig.0.0840.0020.0860.4290.5270.71180区间估计与假设检验是传统的推断统计中两种重要的统计方法。参数估计包括参数的点估计和区间估计。设x1,x 2,x n 是来自总体X的样本,总体X分布函数为F(x,)(0 为未知参数),现建立两个统计量T(x 1,x 2,x)及
19、T(1,x2,x)并满足不等式T(1,x2,x)T,(x1,2,x),则称T,T,为随机区间 RI(Random Interval,RI)。设(0 1)为一给定常数,若满足关系式 PIT T,I=l-,RI 作为参数的估计,则称 RI是参数置信水平为1-的区间估计,此时RI被称为置信区间 CI(Confidence Interval,CI),为显著性水平,T,(x 1,x 2,x n)和T,(1,2,x,)分别为上、下置信限。根据枢轴量分布,置信区间在一定置信度下可估计总体参数的可能范围。2.1例题及解答例1:假设某私立学校规定学生升学标准之一为近6 次英语考试平均分不低于10 1分(总分为1
20、20),对A学生进行了6 次考试后得到如下分数:85,90,95,96,101,103。问A学生在=0.05下是否达到英语人学标准?解法一:样本均值和标准差分别为X=95,s=6.723,置信度为0.9 5的均值置信区间为(9 5-2.0 15x6.723/V5,+),计算得到(8 8.9 42,+),10 1落人其中,依据该置信区间A学生达到人学标准(置信区间法)。假设检验解法如下:构建假设Ho:o101,Hi:o-2.0 15,接受原假设Ho,A 学生达到人学标准。解法二:置信度为0.9 5的均值置信区间为(8,9 5+2.015 x6.723/V5),计算得到(-,10 1.0 58),
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SNARC 效应 大小 置信区间 可信 问题 实例 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。