变异语言学视角下英语情态构式多元定量研究.pdf
《变异语言学视角下英语情态构式多元定量研究.pdf》由会员分享,可在线阅读,更多相关《变异语言学视角下英语情态构式多元定量研究.pdf(12页珍藏版)》请在咨信网上搜索。
1、14语料库语言学 2022年 第9卷 第2期变异语言学视角下英语情态 构式多元定量研究1*大连海事大学李思雨 戴雅宁 孟庆楠提要:本研究采用基于语料库的变异语言学视角,借助COHA语料库,对影响must、have to、have got to三种构式变体选择的主要因素及其在美式英语中的历时演化路径进行定量研究。结果表明:在18102009年,美式英语在表达“必须”这一含义时,出现了must逐渐被have to取代的趋势;影响must、have to、have got to三种变体选择的主要因素按照重要性排序依次为“时态”“体裁”以及“年代”。此外,通过进一步分析三种变体的演化规律,本研究认为英
2、语中存在主要情态动词逐渐被半情态动词1取代的趋势。情态动词must的部分含义正逐渐由半情态动词have to表达,而半情态动词have got to的使用频率却呈下降趋势。关键词:主要情态动词、半情态动词、多元定量研究、构式交替1 引言语言是联系社会成员的工具,人们通过语言传达思想、表达情感,由此社会才成为一个联系紧密的整体。然而人的交往活动并不是按照一成不变的规则进行的,沟通方式需要根据环境、人群、主题等进行适当、灵活的调整。因此交际时,为了达到某种目的、传达某种意愿、表达某种情感,说话人常常需要根据情况改变语言方式,从而使沟通更加顺畅有效。情态系统就集中体现了这种语言的变化方式,成为许多语
3、言学家、哲学家及逻辑学家长期研究的课题。情态是一个语义概念,可以由多种语法类别来实现,并且存在“一义多形”的现象。例如:should与ought to、shall与be destined to、will与be willing to等,每组中的词具有相似的语义及语用功能,可称之为“构式交替”现象。Perek(2015)指出,如果仅关注构式本身,而非探索构式之间的关系,就无法处理构式交替现象。*本研究是辽宁省社会科学规划基金青年项目“基于原美国杨百翰大学系列语料库的英语构式交替现象研究”(L21CYY004)的阶段性成果。孟庆楠为本文通讯作者。作者贡献:李思雨:数据收集、数据分析、讨论结论、初稿撰
4、写、字数占比(40%);戴雅宁:数据收集、数据分析、讨论结论、初稿撰写、字数占比(40%);孟庆楠:选题构思、研究方法、字数占比(20%)、修改润色。SJ00082939 语料库语言学 第18辑正文.indd 1423-1-10 下午6:5115李思雨 戴雅宁 孟庆楠Gries(2003)提出每个构式都存在基于自身功能而形成的范畴,不同构式范畴有重合的可能,但事实上差异多于共性。结合语言“经济性”原则,笔者认为两个或多个具有相似语义、语用功能的构式并不完全相同。语言使用者对几个相似构式的选择会受到语言内外部因素的限制,例如主语的有生性、时态、小句的取向、体裁、年代、说话人职业、社会阶级和性别等
5、(孟庆楠、罗卫华 2020)。语言学家对情态的研究取得了丰硕成果,国外学者的研究主要涉及以下三个方面:对情态系统整体进行研究(Depraetere&Reed 2006);从语义及语用层面对语义相近的情态动词加以区分(Cappelle et al.2019);分析近代英式英语中表达义务、认识的情态动词及半情态动词的变化规律(Smith 2003)。但这些研究缺乏对影响情态动词选择的句法层面因素的讨论,且缺乏大量可靠数据支持。国内学者则侧重于英语情态语用方面的研究,如与英语教学紧密结合的英语情态研究(高秋萍 2009)、利用情态理论系统分析法庭上的交叉质询(王振华 2004)等,但缺乏对情态系统历
6、时演化路径的深入探讨。2 研究背景与研究问题英语情态系统不断变化,主要情态动词的使用频数不断减少、意义趋向单一化;而半情态动词的使用频数日益增加,因此主要情态动词面临被半情态动词取代的风险(Krug 2000;Leech 2003)。关于must与have to的区别,很多研究者从语义、语用层面进行分析,得出must与have to都表示“必须,必要”,但是must通常为“内在驱动”,即说话人本身的主观需要;have to通常为“客观必须”,及客观因素促使“不得不做”某事。同时,Close&Aarts(2010)利用当代英语口语历时语料库(DCPSE),通过语义标注,将情态动词的语义分为认识情
7、态和义务情态,随后进行频数的统计和对比分析,得出情态动词must的使用频数减少与半情态动词have to的使用频数增加存在一定关联。这为研究情态系统历时变化提供了窗口,为后来研究者探究情态动词使用频数减少是否与半情态动词使用频数增加有必然联系提供了参考。但该论文得出的结论是基于当代英语口语语料库的,此结论在书面语中是否依然成立不得而知。金婷茹(2018)对语料进行层次聚类分析,从而区分must和have to,但是侧重于对比中国英语学习者与本族语学习者在学习、运用情态表达时存在哪些不同,同时忽略了对have got to的研究,也缺乏对情态系统历时变化的深入探讨。基于以上背景,笔者将借助离线版
8、美式英语历时语料库(COHA),重点探讨以下三个问题:(1)must、have to及have got to三种构式变体在美式英语中具体呈现怎样的分布情况及历时演化规律?(2)对must、have to及have got to三种构式变体选择影响显著的因素有哪些,重要程度如何?(3)以must为代表的主要情态动词是否正在逐渐被以have to为代表的半情态动词所取代?SJ00082939 语料库语言学 第18辑正文.indd 1523-1-10 下午6:5116变异语言学视角下英语情态构式多元定量研究3 理论框架及研究方法本研究采用基于语料库的变异语言学研究范式。该研究范式的基本假设为:语言使
9、用者所具有的内在语法知识是动态的、概率化的,语言的变异现象也具有概率属性(Bod et al.2003)。由“概率语法观”(Bresnan 2007)可知,语言使用者在选择不同构式变体的时候,会被诸多语言学内、外部因素所影响。本族语使用者,或许可以在不了解must、have to及have got to细微差别的情况下,在特定的语境中正确选择、使用这三种构式变体,但却无法道出这三种构式变体之间的细微差别。大型历时语料库为探索制约三种构式变体使用的因素提供了帮助。基于上述理论框架,本研究采用了多因素分析的研究方法。与传统的语言使用频数的描述性方法不同的是,这种新式研究方法会随机抽取适量语料库数据
10、,随后推测出影响构式交替的因素,从而进行人工标注。利用统计学软件,基于回归分析和分类模型等探索性方法,从多个变量中筛选出对特定构式变体选择影响最为显著的因素,而非把统计各种语言变体形符频数作为最关键的研究因素。最后,结合相关语言学理论,解读其蕴含的功能根据。多因素分析比单因素分析、本族语使用者内省式分析等研究方法更加客观、科学,不仅能全面细致地刻画语言现象,还能考察语言特征,并探索这些语言特征与语境变量是如何相互影响的(许家金 2020)。4 语料来源与标注为了探究1920世纪美式英语中have to、have got to、must之间的细微差别,并快速提取相关语料,本研究选用离线版本的CO
11、HA语料库。COHA语料库是一个包含约4亿词的大型历时语料库,涵盖了小说、杂志、报纸和非虚构四种体裁,涵盖题材广且具有代表性,能够较为全面地反映美式英语在1920世纪的变化特征。该语料库中的语料已进行了词形还原及词性标注,便于检索、提取、分析含有关键词及其搭配词的语料。本研究所涉及的反应变量为表达“必须”“不得不”的义务情态动词及半情态动词,即:must、have to及have got to。研究仅关注表达义务的情态动词must和半情态动词 have to、have got to,对于must作名词、must表示推测(如 must have done、must be+名词等)及have to
12、、have got to中的have是实义动词等情况均不讨论。首先,笔者通过 Perl 编程,对语料进行了初步筛选,发现符合本研究要求的含有must、have to、have got to的语料分别有400,000余条、190,000余条、1,800余条。出于可操作性和含有must和have to的符合条件的语料比例大致为21的情况,笔者按照21的比例分别抽取含有must和have to的语料。抽取0.4%的包含must的语料(包含陈述句、疑问句),得到包含1,600余条语料的原始数据样本;按0.2%SJ00082939 语料库语言学 第18辑正文.indd 1623-1-10 下午6:511
13、7李思雨 戴雅宁 孟庆楠抽取含有have to的语料(包含陈述句、疑问句),得到380条原始语料。考虑到含有have got to的语料总数较少,为了对其进行详细的研究,笔者按12%抽取,得到216条原始语料。手动标注部分变量时,笔者删除了表示认识情态的must以及have是实义动词的have to、have got to等不符合研究要求的语料。此外,笔者还删除了离线版本语料库中的乱码语料。经过严格筛选后最终得到符合本研究所有要求的1,791条语料,其中包含情态动词must的语料有1,065条,包含半情态动词have to的语料有517条,包含半情态动词have got to的语料有209条。
14、同时,笔者核对了语料库中的原文,结合关键词的上下文语境,对少数较难标注的语料逐一进行了标注。在选取和标注影响三种构式变体的变量时,笔者参照了其他学者对 must、have to、have got to 的研究,同时学习了Szmrecsanyi et al.(2016)对相关变量的分类及标注方式,最后选择了9个可能影响该组情态构式变体的预测变量。为便于后续分析,笔者将变量的因素水平大多设置为三个,如表1所示。表1 预测变量的名称、因素水平及标注依据变量名称因素水平标注依据时态现在时时态为一般现在时、现在进行体、现在完成体过去时时态为一般过去时、过去进行体、过去完成体(包含must、have to
15、、have got to前有would等)其他must、have to、have got to前有shall、will等表示将来时间的词体裁报纸根据语料库中各条语料的体裁类别进行标注小说非虚构杂志主语的有生性无生主语为组织、机构、国家或形式主语 it有生主语为有生命的人或高等动物其他缺少主语主语的代词性代词主语为人称代词、指示代词、疑问代词、关系代词或不定代词名词主语为(并列的)名词短语或名词性从句其他主语空缺或由表示存现的there 充当虚位主语(待续)SJ00082939 语料库语言学 第18辑正文.indd 1723-1-10 下午6:5118变异语言学视角下英语情态构式多元定量研究变量
16、名称因素水平标注依据动词的语法及物性不及物must、have to、have got to之后的动词为不及物动词及物must、have to、have got to 之后的动词为单及物动词、双及物动词、复杂及物动词、及物的短语动词或介词动词其他must、have to、have got to 之后为系动词或是用于标记时体特征的助动词 be/have小句类型主句must、have to、have got to 所在小句为简单句、并列句或主从复合句的主句从句must、have to、have got to 所在小句为定语从句、状语从句或名词性从句其他must、have to、have got to
17、 所在小句为省略句,或是作为独立的插入语成分小句的取向否定must、have to、have got to 所在小句表示否定的语用含义(包括肯定的修辞问句)肯定must、have to、have got to 所在小句表示肯定的语用含义(包括否定的修辞问句)中立must、have to、have got to 所在小句为特殊疑问句或是无明显语义倾向的一般疑问句动词的动态性动态must、have to、have got to 之后为表示动作、事件、状态变化或言语行为类动词静态must、have to、have got to 之后为表示状态、感知、思想、情感类动词年份18102009根据各条语料所
18、对应的具体年份进行标注,随后通过 R 语言中的 as.numeric 函数将字符型变量转化为数值型变量5 数据分析与讨论在对所有变量都进行标注后,笔者运用R软件,对数据进行条件推断决策树和随机森林分析,探究影响must、have to和have got to三种构式变体选择的主要因素。5.1 影响三种构式变体选择的多因素分析条件推断决策树模型的算法原理是:首先进行卡方检验,根据结果决定选取分类特征,如果该分类特征对反应变量的影响显著,则可选取该分类特征进入决策树模型,从而构建最佳决策树模型,将进入模型的数据进行分类和预测。与(续表)SJ00082939 语料库语言学 第18辑正文.indd 1
19、823-1-10 下午6:5119李思雨 戴雅宁 孟庆楠反应变量关联最紧密的变量被选取作为第一个分类变量,其他变量根据与反应变量的相关性程度,依次参与模型构建。本研究采用的方法是,在R统计软件中加载 party 程序包,使用ctree 函数构建条件推断决策树模型,对全部数据进行统计。笔者将上节所标记的9个变量作为模型的预测变量,反应变量为构式变体类型。由于该变量为分类型变量,因此在条件推断决策模型中,呈现结果时,在最底端使用条形图的形式。图1中的椭圆节点代表预测变量,顶部是节点序号。每个椭圆节点下会有两个分支,分支上标记的是预测变量分裂的条件。模型最底端的条形图即为叶节点,代表符合每种分裂条件
20、组合的数据集,条形图顶部有节点序号及数据总量,底端条形图浅灰色部分、深灰色部分、黑色部分分别代表have got to、have to以及must所占比例,笔者将这三种构式变体简记为g、h、m。预测变量在树形图中所处的层次越高,意味着其对反应变量的影响越大。通过将显著性水平设置为0.05,将末枝最少数据总量设置为30,笔者构建了四层条件推断决策树模型,以便于最后呈现的可视化结果清晰直观、方便解读。数据统计后的结果如图1所示。图1 影响must、haveto、havegotto三种构式变体选择因素的条件推断决策树模型由条件推断决策树统计结果可知,决策树模型整体具有高度显著性(P 0.001)。笔
21、者利用混淆矩阵(confusion matrix),得出模型分类准确率为71.1%,远高于基准分类准确率59.5%(计算方式:1,065/1,065+517+209)。即该决策树模型根据变量特征正确分类的构式变体数量,占整个数据集中构式变体数量的71.1%。由图1可知,最终共有六个预测变量被选取进入了条件推断决策树模型,分别为:体裁、年代、时态、动词的语法及物性、主语的代词性和动词的动态性。通过SJ00082939 语料库语言学 第18辑正文.indd 1923-1-10 下午6:5120变异语言学视角下英语情态构式多元定量研究观察决策树的顶部节点可知,影响三种构式变体选择最显著的因素是“时态
22、”。在构式变体所在语句为“现在时”的情况下,多倾向于使用must来表达“必须”的含义,而在其他情况下,则更倾向于使用have to这一能够进行屈折变化的表达。从条件推断决策树的第二层来看,影响构式变体选择的次要因素是“年代”和“体裁”。由节点2的统计数据可知,在表达“过去”和“将来”含义的语料中,1884年以前,have to的使用频数明显高于另外两种构式,而have got to的使用频数也高于must;而在1884年以后,have to所占比例进一步升高,must的使用频数也呈上升趋势,have got to却几乎消失。这一历时演化路径在图形中部的节点8处依然能够得到体现,虽然受体裁影响,
23、have got to所占比例较高,但是总体上have got to的使用频数在历时演变中呈下降趋势,而must和have to的使用频数则呈上升趋势。在节点15中,1954年前,must所占比例最高;1954年后,have got to的使用频数变化并不明显,而must所占比例却呈明显下降趋势,have to的使用频数依然呈上升趋势。由此可以推断,在美式英语历时演化的进程中,时态并不会对三种构式变体的选择产生决定性影响,不管三种构式变体是哪种时态,在表达“必须”这一含义时,must可能正逐渐被have to所取代,这一现象也与Close&Aarts(2010)的观点一致。除了“年代”这一关键
24、预测变量,“体裁”也在构式变体的选择中起到了关键作用。由节点7的数据可知,在小说这一非正式语体当中,have got to的使用频数高于另外两种构式变体,而在报纸、杂志、非虚构等正式语体当中,have got to的使用频数大幅下降,must所占比例显著上升。这一变化趋势在节点19的数据当中也得到了显著体现,在杂志和报纸中,must的使用频数已经略高于其他两种语体,在非虚构语体中must的使用频数则更高,占据绝对优势。由此可见,在正式语体当中,当表达“必须”这一含义时,倾向于使用must。同时have to也有微弱的上升趋势,并且根据上文的分析,have to在历时演变中更占优势,而have
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变异 语言学 视角 英语 情态 多元 定量 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。