汉传佛典汉英平行语料库建设研究.pdf
《汉传佛典汉英平行语料库建设研究.pdf》由会员分享,可在线阅读,更多相关《汉传佛典汉英平行语料库建设研究.pdf(5页珍藏版)》请在咨信网上搜索。
1、文化创新比较研究第 22 期文化产业汉传佛典是中华传统文化的有机组成部分袁其数量众多袁内涵深厚遥在与世界文化交流的历史进程中袁佛典的对外译介极具挑战性遥 2023 年习近平总书记在中国共产党与世界政党高层对话会上提出野要共同倡导加强国际人文交流合作袁探讨构建全球文明对话合作网络袁丰富交流内容袁拓展合作渠道袁促进各国人民相知相亲袁 共同推动人类文明发展进步冶1遥因此袁积极推进中华文明与世界其他文明的交流沟通袁是时代对中国学者提出的必然要求遥正如潘汉传佛典汉英平行语料库建设研究马杰森渊绍兴文理学院 外国语学院袁浙江绍兴 312000冤摘要院汉传佛典在英语世界的译介是中华传统文化外译的重要组成部分袁
2、汉传佛典汉英平行语料库的创建有助于中华传统文化的翻译与传播遥 基于汉传佛典汉英平行语料库建设的背景和现状袁运用语料库语言学尧机器翻译理论和中古汉传佛典语言的相关特点袁对汉传佛典汉英平行语料库建设过程中的语料采集尧语料对齐尧文本分词等进行了分析袁并对翻译记忆库尧术语库和语料库的相关应用进行了实操性较强的阐释袁从而创建一个汉英字数达到 1 000 万级别的大型汉传佛典汉英平行语料库袁为神经网络机器翻译模型预训练提供精确的双语语料袁提升机器翻译佛典的质量袁以促进中华文化典籍外译模式的推陈出新袁助力中华传统文化野走出去冶遥关键词院汉传佛典曰平行语料库曰采集曰对齐曰分词曰应用中图分类号院G122文献标识
3、码院A文章编号院2096-4110渊2023冤08渊a冤-0101-05On Constructing a Chinese-English Parallel Corpus ofChinese Buddhist ScripturesMA Jiesen(School of Foreign Languages,Shaoxing University,Shaoxing Zhejiang,312000,China)Abstract:The translation of Chinese Buddhist scriptures into English is an important part of tra
4、nslating traditionalChinese culture into the world.The construction of a Chinese-English parallel corpus of Chinese Buddhist scriptureswill facilitate the translation and dissemination of traditional Chinese culture.Based on the background and current sit鄄uation of the construction of the Chinese-En
5、glish parallel corpus of Chinese Buddhist scriptures,the corpus linguistics,machine translation theory and relevant features of the language of the ancient Chinese Buddhist scriptures are appliedto analyze the text collection,alignment and segmentation in the process of the construction of this para
6、llel corpus ofChinese Buddhist scriptures.And the related applications of translation memory,terminology and corpus are explainedin a practical way.It aims to build a large Chinese-English parallel corpus of Chinese Buddhist scriptures with 10 mil鄄lion Chinese and English words so as to provide accu
7、rate bilingual corpus for the pre-training of neural network ma鄄chine translation models and to improve the quality of machine translation of Buddhist scriptures.This will promote theinnovation of translation mode of Chinese cultural classics and going abroad of traditional Chinese culture.Key words
8、:Chinese Buddhist scriptures;Parallel corpus;Collection;Alignment;Segmentation;Application基金项目院教育部人文社会科学研究青年基金项目野佛教十三经汉英平行语料库建设与应用研究冶渊项目编号院19YJCZH116冤遥作者简介院马杰森渊1979-冤袁男袁湖南邵阳人袁硕士袁讲师袁研究方向院翻译理论与实践遥101文化创新比较研究文化产业第 22 期文国先生所言袁野汉籍英译不是外国人的专利袁 中国学者和翻译工作者应该理直气壮地勇于承担这一工作冶2遥近年来袁随着机器翻译的快速发展袁神经网络机器翻译渊以下简称野NMT冶冤
9、的准确性和高效性早已超越了普通人类译者袁特别是 ChatGPT 这个基于神经网络架构训练而成的生成型预训练变换模型袁超越了一般人的知识翻译能力袁 使得翻译产业开始步入大生产时代遥基于野平行语料库在语言对比尧翻译研究尧翻译教学尧自动翻译尧双语词典编纂和自然语言处理等领域具有重大的理论意义和应用价值冶3袁 创建大型汉传佛典汉英平行语料库袁 以促进汉传佛典外译事业袁就显得尤为必要遥1 汉传佛典汉英平行语料库建设的现状据马伟德渊Marcus Bingenheimer冤统计袁截至2023 年 3 月共有 639 份汉传佛典被译成西方语言袁总计 1 421 个译本遥 但我国学者的参与度较低袁译介数量很少袁
10、这与我国作为汉传佛典的主要传承与发展者的身份严重不符遥 汉传佛典的英译虽有纸质或电子类汉英佛学双语词典袁比如袁苏慧廉渊W.E.Soothill冤与何乐益渊Lewis Hodous冤合编的叶中国佛典术语双语词典曳尧陈观胜与李培茱编著的叶中英佛典双语词典曳尧派伊渊Michael Pye冤和李雪涛等合编的叶多语对照中国佛典术语辞典曳袁以及穆勒渊C.Muller冤主持编辑的在线电子词典等可资参考袁 但此类双语词典仅限于对佛典术语提供解释和对应的英译袁 很少像平行语料库那样提供真实的例句或上下文语境袁 因此在汉传佛典外译实践中很难满足实际需要遥到目前为止袁 我国尚无可资利用的汉传佛典汉英平行语料库遥国外
11、虽有佛典平行语料库袁但数量很少袁且并非用于翻译目的遥 东京大学 SAT 大正藏文本数据委员会创建的佛典平行语料库渊BDK-SATparallel corpus冤提供中文检索袁可查找对应的英译和上下文袁 但只限于日本佛经传道协会版权所有的译本袁作为翻译参考价值有限遥 另外袁挪威奥斯陆大学人文学系创办的佛典文献宝库渊Thesaurus Literatu鄄rae Buddhicae冤袁该文库是梵尧中尧藏尧英袁多语平行语料库袁提供搜索功能遥不过该库提供的英译本多译自梵文本或藏文本袁用于汉英翻译参考价值不大遥由此可见袁 现有汉传佛典平行语料库资源与汉传佛典在世界文化中的地位不对称袁 很难满足学界在汉传佛
12、典外译和研究方面的需要遥2 汉传佛典汉英平行语料库创建的实践路径汉传佛典汉英平行语料库是以语料库语言学理论为指导袁考虑机助翻译尧机器翻译的需求及中古汉传佛典语言的特点而创建的遥 建设的总目标是收录汉传佛典较重要的 100 部典籍及名家英译本袁 使其库容量达到 1 000 万汉英字数的规模袁 以充分发挥汉传佛典汉英平行语料库在计算机辅助翻译尧 双语词典编纂尧NMT 模型预训练尧典籍翻译研究和教学尧中华文化外译方面的利用价值遥 建设的过程涵盖语料的采集尧清洗尧对齐尧记忆库和术语库的提取尧语料库的导出和文本分词尧词性标注等方面袁基本路径如图 1 所示遥图 1汉传佛典汉英平行语料库建设的基本路径2.1
13、 汉传佛典汉英语料的采集汉传佛典浩如烟海袁经典甚多袁如果将凡有英译本的汉传佛典全部收入语料库进行汉英句对齐袁规模之大袁小型科研团队很难完成遥 无论样本有多大袁除非它充分涵盖特定话语传播的体裁和语境的范围袁否则样本仍然是部分的和不完整的4遥 因此汉传佛典汉英平行语料库在建设过程中对典籍的采集需有所规划袁所选典籍要能涵盖经尧律尧论三藏和不同历史时代袁以确保所选典籍样本的代表性和平衡性遥在建设初期袁 宜选择对中国佛教影响最大及最能体现中国佛教基本精神的 13 部佛经袁即以叶心经曳叶金刚经曳叶坛经曳叶维摩诘经曳叶法华经曳等为主袁有计划有102文化创新比较研究第 22 期文化产业步骤地收录不同历史时代的
14、经尧律尧论三藏典籍及其英译本袁最终达到 1 000 万字数的适当规模遥确定好佛典后袁还得解决以下 3 个问题遥 第一袁如何选取汉译本的问题遥 有些典籍在历史上汉译本众多袁如何进行选择呢钥鉴于建设的是汉英平行语料库而非单语语料库袁 因此汉译本选择主要取决于英译本所依底本遥 比如袁叶法华经曳现存有竺法护尧鸠摩罗什等 3 个译本袁 然众多英译本多以鸠摩罗什本为底本袁故对叶法华经曳的采集便只选鸠摩罗什本遥 有时袁应该遵循英译者的做法袁以某汉译本为主导袁添加源自参考本中的修订或补缺信息袁并加以备注遥第二袁如何选择英译本的问题遥有些佛典英译本并非译自汉语本袁而是梵文本或藏文本袁比如袁叶楞伽经曳有柯利睿渊T
15、homas Cleary冤译自梵语本的英译本袁叶维摩诘经曳有瑟曼渊Robert Thurman冤译自藏文本的英译本袁这些译本虽出自名家之笔袁但考虑到梵文本或藏文本的内容和汉语本有较大出入袁故需舍弃遥还有某些重要经典袁如叶金刚经曳袁其英译历史有 100 多年袁英译本非常丰富袁 因此要注意均匀选取各个时期的译本袁以方便后续开展历时研究遥对于同一时期不同典籍的译本也要尽可能多收集袁 以方便后续的共时研究遥 第三袁如何利用现有相关资源的问题遥 在确定汉尧英译本后袁为减少扫描尧文字识别等工作袁尽量采用现有网络电子佛典资源遥不过对于采集的语料袁需要注意版权问题遥2.2 汉传佛典汉英语料的清洗与对齐语料清洗
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 汉传 佛典 汉英 平行 语料库 建设 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。