学术汉语中自我提及语的学科分布考察_周启红.pdf
《学术汉语中自我提及语的学科分布考察_周启红.pdf》由会员分享,可在线阅读,更多相关《学术汉语中自我提及语的学科分布考察_周启红.pdf(11页珍藏版)》请在咨信网上搜索。
1、当代修辞学 2023 年第 2 期(总 236 期)学术汉语中自我提及语的学科分布考察*周启红1、2王海峰2(1 四川外国语大学中国语言文化学院,重庆 400031;2 北京大学对外汉语教育学院,北京 100871)提要本文通过自建现代汉语学术论文语料库,考察自我提及语如“我们”“我”“笔者”“本文”等的学科分布。研究发现,“我们”在软学科和硬学科论文中均有使用,而“我”仅出现在文学、历史和哲学论文中,其使用受学者身份等因素制约;作者自称名词“笔者”在软学科论文中有不同程度的使用,在硬学科中仅生物学论文有少量使用;抽象主体名词“本文”在软硬学科论文中使用较为普遍。总体上,不同自我提及语在软硬学
2、科论文中的使用受主观性影响,呈现一个连续统。通过对应分析的多元统计发现,与自我提及语共现的动词呈现出多样性。其中,语言学论文自我提及语的使用表现介于软学科和硬学科之间。关键词学术汉语自我提及语软学科硬学科学科分布一、引言在学术语言中,自我提及语指作者在论述过程中用于指称自我的人称代词或名词。它们表示作者在论文写作过程中鲜明的立场,承担着权威性的责任(Hyland 2005:53),如英语中的“I、we”以及汉语中的“我、我们、笔者、本文”等。自我提及语属于立场表达的主体(主语/施事/动作发出者)部分,反映作者如何处理与读者、命题和客观世界的关系,是学术论文中重要的部分。学术英语中的自我提及语研
3、究成果丰富,研究领域涵盖了使用频次(吴格奇、潘春雷2010;陈庆斌 2021)、身份建构(Ivanic1998;吴格奇 2013:165)、人际意义(秦枫、郎曼 2013)、二语者运用/习得(Can Cangir 2019)、语体差异(黄蓉等 2016)、学科差异(Nausa 2020)、跨文化跨学科对比(Lehman 2018)等方面。相较于学术英语研究而言,学术汉语的自我提及语研究尚属起步阶段。现有学术汉语研究存在下列问题:语料规模较小(如刘锐、黄启庆、王珊2021 等),学科较为单一(如于晖、张少杰 2021 等),对自我提及语的功能、学科分布及其对应38*感谢匿名审稿人提出的宝贵意见。
4、本文在王海峰教授读书会上多次讨论,感谢各位同门不吝赐教。本文通讯作者王海峰。DOI:10.16027/31-2043/h.2023.02.003关系缺少考察(如吴格奇、潘春雷 2010)等。有鉴于此,本研究通过对自建语料库进行标注和分析,回答以下问题:1)自我提及语的表现形式及语篇功能有哪些?2)自我提及语在各学科中的总体分布及其差异是什么?二、研究语料和研究方法本研究收集硬学科和软学科语料,硬学科语料包括数学、物理、生物、计算机,软学科语料包括文学、历史、哲学和语言学。为了保证语料来源时间的一致性,本研究主要采用各学科期刊的2019 年第1 期。各学科语料均为 CSSCI 和 CSCD 期刊
5、来源,各学科期刊的选择我们请教了相关专业的教授,得到领域专家的推荐。自建语料共 320 篇,每个学科各 40 篇,总字数为4134709 个,总词数为 2389235 个。本研究采用定量与定性结合的分析方法。首先对原始语料进行分词、词性标注和抽取,由研究团队开发的“SYNLP 助手 10”“SY 立场标记语抽取与统计 10”两个工具完成以上任务,前者对语料进行分词和词性标注,后者抽取自我提及语的语料。然后,由两位语言学及应用语言学专业的博士生进行统一标注。标注中需要结合语境区分作者与非作者用法/指称,根据语义特征判别是否属于自我提及语用法,属于自我提及语用法就标注为“1”,不属于自我提及语用法
6、就标注为“0”,标注完成后进行分类、统计和研究。遇到标注不一致的情况,即经过讨论后重新标注,以保证肯德尔和谐系数(Kendalls Tau)达到 08 以上。三、自我提及语的形式与语篇功能根据实际语料,本文将自我提及语表现形式分为三类,具体成员如下:1)人称代词:我、我们、本人2)作者自称名词:笔者3)抽象主体名词:本文、拙文、拙著、文章、本实验、本研究、本项目31人称代词考察发现,“我”在软学科中有所使用,“我们”在软硬学科中均有使用,“本人”仅偶现于软学科中,我们重点讨论前两项。311“我”汉语学术语篇中第一人称代词“我”是作者自称,代表行文作者表达立场。(1)我觉得这与其说是一种理论,还
7、不如说是看待诗歌文本的一个视角。(文学)下列情况中的“我”不属于自我提及语,予以排除:(2)他在自传中写道:“,我身患肺结核”(文学)自我提及语“我”的具体语篇功能主要可以概括为两种:个人观点构建和文章向导。个人观点构建旨在营造表达主体对认知对象的看法,突出作者个人见解。例如:(3)我的理解是,意见和人的个性或者说自我意识联系在一起。(哲学)诸如此类的表达还有“我的评析”“提出我的解释”“就我所见”等。48文章向导是指表达主体引导读者理解文章,提示论述视角,指示述及范围或相关问题等。例如:(4)这里,我从一名史学工作者的角度,谈谈自己的看法。(历史)考察结果显示,“我”的用例仅在文学、历史、哲
8、学语料中发现,使用者多为学界权威专家,旨在强调个人看法。例如:(5)请允许我就新时代中国世界史学科建设问题说一些想法(历史)例(5)出自北京大学历史学系著名教授钱乘旦在中国历史研究院成立大会上的讲话。312“我们”在学术语篇中,“我们”的语篇功能主要有三种:个人观点构建、集体观点构建和文章向导。第一,个人观点构建。虽然“我们”是集体指代,不同于“我”的个人指代,但仍可表达个人观点建构。在文学、历史、哲学和语言学语料中,独作在表达个人观点时常使用“我们”。例如:(6)我们认为:,“唐乐”歌辞代表了其中一条途径。(文学)例(6)论文作者署名为一人,属于个人观点的构建。我们发现,“我们”作为个人观点
9、的构建功能常体现在软学科中,在硬学科中极少使用。第二,集体观点构建。硬学科团队合作较多,一篇文章中多位作者属于普遍现象,所以“我们”指称多位共同作者,属于集体观点的构建。例如:(7)我们发现坡向与萌生能力也有一定的关系(生物)例(7)作者数量为两人,“我们”表达的是集体观点的构建。第三,文章向导。即提示操作过程等(Tang John 1999)。(8)我们进一步简化了它的输入结构和学习过程。(计算机)32作者自称名词作者自称名词成员主要是“笔者”。“笔者”字面意思为“执笔的人”“写这篇文章的人”(田松 2018)。在学术论文中“笔者”的使用频率常高于“我”,介于第一人称“我”与隐身第三人称(“
10、执笔者”)之间(王鸿博 2018)。从语用层面看,“笔者”比“我”更适当、更委婉(王殿雷2012)。在观点构建和文章向导等语篇功能上,“笔者”比“我”具有客观性。“笔者”在文学、历史、哲学和语言学等软学科中均有用例。例如:(9)根据笔者数年来的考证及掌握的一手资料来看(文学)硬学科中仅在生物学语料中发现 6 例,其他硬学科未发现用例。(10)笔者实验室前期对根系内生真菌进行了初步调查。(生物)33抽象主体名词抽象主体名词用于指称作者所写的文章。不同于前两类的是,抽象主体名词目的是隐藏作者,更具客观性。主要包括“本文”“拙文”“拙著”“文章”“本研究”“本实验”“本项目”。其成员比较多,本小节重
11、点分析在各学科中高频出现的“本文”,其余成员统计结果见 41。在学术语篇中,“本文”是指作者、研究团队所写的这篇“文章”。例如:(11)本文旨在介绍这一文本设计思想和结果。(语言学)“本”有“自己方面”的意思,“本文”相当于“这篇文章”。在学术语篇中,“本文”表达立场58主体,功能主要是引出客体。“客体”与所做研究相关,包括研究对象、研究结论、研究问题等。(12)本文采用应用最广泛的 Lee 模型(物理)在学术论文中,常用指称客体的还有“本研究”“本节”,用于提示研究的客体内容。通过对语料分析,我们发现“本文”与“我们”的功能有重叠。表达立场主体时,“本文”可以替换成“我们”。例如:(13)a
12、 本文尝试从汉语语言特性出发,对进行讨论。(语言学)b 我们尝试从汉语语言特性出发,对进行讨论。例(13)a 句的“本文”可以替换成“我们”。不过,使用“本文”“本研究”是为了凸显客观性,使用“我们”是为了增强与读者的互动性。“本文”可以用“我们”替换,但是使用“我们”的有些例句难以用“本文”替换。例如:(14)a 我们以下面两例句进行测试?(语言学)b?本文以下面两例句进行测试?例(14)b 句用“本文”替换显得不自然,因为“测试”是只有“人”才能发出的动作,抽象名词“本文”与“测试”搭配可接受度低。此外,类似的动词还有“演示”“概括”“阅读”“看出”等。综上,“本文”主要指“作者所写的文章
13、”,即指示对象而非指示自己,因此隐藏了作者,具有客观性。作者使用“本文”,而不用“我/我们”,有“去主观化”的作用,降低了文章或研究内容的主观性,它是作者故意将自己放到偏离话语中心位置的一种话语组织策略。但是我们也发现“本文”的功能也在漂移,具有了指人特征,例如“本文尝试”“本文讨论”“本文发现”等。四、自我提及语的分布及其相关对应关系41自我提及语的学科分布为了发现不同自我提及语的特点,我们对其在不同学科的分布情况进行了考察,总体结果如表 1 和表 2。文学历史哲学语言学数学物理生物计算机我44(480)23(374)50(323)0(92)0000我们246(300)120(190)528
14、(550)296(337)298(329)19(27)28(30)490本人1(44)2(35)2(33)0000(1)0(1)笔者576046370060本文535848228166164105827拙文10000000拙著10000000文章4(289)0(57)0(14)4(54)8(10)0(2)10(14)4(9)本实验0004010014本研究260249012250768续表文学历史哲学语言学数学物理生物计算机本项目00000001总计4093226766184642053991343平均每万词1149743201729552634146717552893注:单位为“例”。总频次
15、是指在语料库检索直接出现的数量,标准化后的频数称为“频率”,是指按照每万词出现的频次。()里表示原始频次,例如“我”44(480),480 是原始检索的频次,44 是作者自我提及的频次。“笔者”57,数字后没有括号的表示 57 例均指作者。表 1自我提及语在各学科期刊论文中的总体使用情况表 1 显示自我提及语的总体学科分布,值得注意的有四点:第一,总体上使用自我提及语频率最高的是语言学(2955/每万词)和计算机(2893/每万词),使用频率最低的是物理(1467/每万词)和历史(743/每万词)。第二,文学、历史、哲学、语言学和数学高频使用的自我提及语为“我们”,物理和计算机高频使用的自我提
16、及语为“本文”,而生物高频使用的自我提及语是“本研究”。同时表 1 显示,各科语料均使用了“我们”和“本文”。第三,学术语言讲求“客观性”,硬学科均未发现第一人称代词“我”的用例。这与硬学科多以实验数据为基准,更强调客观性(impersonality)(吴忠华、旁继贤 2009)相关,因此不使用主观性极强的第一人称单数形式;而在软学科中使用自我提及语的第一人称代词“我”,主要是凸显个人主观意志。第四,语言学、数学、生物、物理以及计算机科学不使用“我”“本人”,数学、物理和计算机不使用“本人”,生物和物理“我们”使用的频率远远低于其他学科。可以看出,为了凸显客观性,作者有意隐藏立场主体。而软学科
17、中的文学、历史和哲学均有所使用,是作者为了凸显立场主体。从软学科硬学科两个大类来看,自我提及语各小类数据对比见表 2:软学科硬学科FreqNormFreqFreqNormFreq2p第一人称(单)11708800911300 第一人称(复)119089483579074100 作者自称名词20015060061411100 抽象主体名词512384157814928262000 注:单位为“例”。()内为每万词出现的频率,p005。Freq 为原始频次,NormFreq 为标准频次,标准频次=原始频次/语料库大小*10000。表 2软学科与硬学科论文中自我提及语各小类对比表2 显示,四类自我提
18、及语在软学科和硬学科两个大类之间的差异性均达到了显著水平。第一人称单数(我)、第一人称复数(我们)、作者指向名词(笔者)、抽象主体名词(本文、文章、本实验、本研究、本项目)均呈现显著差异。这说明,软硬学科在自我提及语使用方面存在显著差异,学科对学术78语言词语存在选择倾向。从使用频率来看,硬学科使用抽象名词(1492/万词)高于软学科(384/万词),软硬学科均使用第一人称复数,硬学科几乎不使用第一人称单数和作者自称名词。42自我提及语共现动词的多样性考察与自我提及语共现的动词情况,可以帮助我们了解其语篇特性。我们发现,自我提及语共现动词呈现多样性特征。词语的多样性,即类符与型符之比(type
19、-token ratio,简称 TT),也就是文本中词语种类数与词语总个数的比值。本小节的多样性是借用词语多样性的计算方法来计算节点词(自我提及语)与共现动词的多样性。刘锐等(2021)计算共现词(搭配)多样性公式为:V=TT(1C)(1)V 表示多样性,TT(type-token ratio)表示型符和类符的比值,1C 表示权重,C表示高频项目(high-frequency item)的占比。刘文指出高频项目是指共现词前几位总数占总的共现词数量的比值。但公式(1)有一定缺陷,它未考虑到,如果 C=1,(1C)结果为 0,V 整体为 0,不能进行多类语料或多学科词语多样性的比较。该公式对高频项
20、目的确定不够科学,取前多少位高频词是一个人为调节的参数,不具有普遍性,不同学科需要针对性调整。因此,本文提出一种相对合理的,可以根据实际情况动态调整高频项目个数的方案。根据“齐普夫定律”(Zipf s law):词出现的绝对频率 f 与按绝对频率从大到小编号的序号 r 的乘积大体上稳定于一个常数(Zipf 1949:24):rf=C(2)图 1生物学科语料前 100 词频图公式(2)显示,r 表示词频排序序号,f 表示序号为 r 对应的词频,C 表示一个常数。齐普夫定律呈现幂律分布,语料库中词频和词语位序信息成反比,词频越高,词语的位序数越小(越靠前)。高频词语会集中出现在按词频从高到低排序的
21、“头部”,而低频词会呈现一个长尾效应。例如,图 1是生物学语料中的词频与位次关系图,词频从高到低前三位分别是“的”(9733 次),“和”(3309 次),“生态”(3104 次)。图 1 显示,横轴为位次信息,从左向右为高频前 100 词的位次信息,纵轴为词语对应的频次信息。从横轴来看,越靠近左边位次靠前,词频越高;第一位词语“的”频次最高为 9733 次,第二位词语“和”的频次为 3309 次,从第一位到第二位呈“断崖式”下降,从第二位“和”到第三位的“生态”下降趋势远远小于从第一位到第二位。受齐普夫定律和数学思想“梯度”(gradient)(图 2)的启发,可以在“断崖”处做一个分界线确
22、定高频的位次信息。引进梯度下降概念来确定高频词语的位次信息,梯度绝对值最大处代表变化最快的地方,这当然并不是严格意义上的数学意义的梯度求解过程;我们引进梯度是为了找到下降最大的位置,即依据共现词的频次信88图 2梯度下降示意图息做一个从高到低的排序,找到梯度绝对值最大值即高频词的分界线,具体思路如下:已知某词语的所有共现词集合 CN,(cifreq,cirank)CN,其中cifreq,cirank分别表示共现词ci的词频和降序排序序号,根据齐普夫定律,可知:cifreq*cirank=k,k 为常数;定义ci处的梯度为 grad(ci)=(ci+1freqci1freq)/2,当i=1 时,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学术 汉语 自我 提及 学科 分布 考察 周启红
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。