![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于改进AHP和模糊理论的小型语料库评测研究.pdf
《基于改进AHP和模糊理论的小型语料库评测研究.pdf》由会员分享,可在线阅读,更多相关《基于改进AHP和模糊理论的小型语料库评测研究.pdf(4页珍藏版)》请在咨信网上搜索。
1、科学技术创新 2023.25在 20 世纪 50 年代后期,作为一种新兴的学科和新的研究方法,语料库语言学逐渐发展起来,将计算机快速大量准确检索和统计语料的功能与语言学的各项研究相结合1。随着计算机存储数据设备的成本下降,研究者针对研究所需开始建立多种小型语料库2。但是,到目前为止,语料库建库的标准及规范尚未得到统一,导致不同语料库的设计和构建出现很大差异。因此,建立合理的评测指标体系并选取有效的方法来评测小型语料库的可用性是目前亟需解决的问题。1基本理论1.1改进 AHPAHP3-5法由美国匹兹堡大学教授 Saaty 提出,是一种多属性层次权重决策分析方法,主要通过运用网络系统理论和多目标综
2、合评价对定性问题进行定量分析。目前,针对 AHP 法的研究,主要从以下 7 个方面展开6:(1)一致性的检验与改进;(2)标度选择;(3)不确定性问题;(4)排序方法;(5)判断矩阵的灵敏度分析;(6)与其它决策方法的结合;(7)群组决策的研究。AHP 要求比较某两个指标之间的重要性,建立两两比较判断矩阵,然而传统的九标度存在 2 个问题7:(1)“重要性”的概念较为模糊,特别是在 1 至 9中给出相对重要性的定量判断是很困难的;(2)在评价指标较多的情况下,一致性(consistency index,CI)很难保证,如果存在严重不一致时,需要重新构建判断矩阵。针对上述问题,有关学者8提出了
3、0,1,2 三标度法,其有利于制表以及收集专家信息,易被决策者接受;在评价制表较多时,能有效提高一致性,且评价结果也比较接近复杂判断的结果。基于此,我们运用这种标度来代替传统的九标度判别。假设有指标 xi与 xj,hij为两个指标重要性比较的取值,那么三标度判别指标重要性如表 1 所示。表1三标度判别指标重要性比较本文中小型语料库评测指标权重的计算步骤如下:步骤 1,原始判断矩阵的构建将各元素相对准则层 K 的重要性进行比较。根据表1 的方法,进行两两比较,最后获得判断矩阵 A。(1)步骤 2,处理判断矩阵对 A 的相对重要性权值 ri进行比较,(2)式(2)中:ri是 A 的第 i 行向量各
4、分量的和。基于此,采用ix与jx相比较 更加重要 同等重要 不重要 ijh 2 1 0 基于改进 AHP 和模糊理论的小型语料库评测研究贺娜娜,朱红磊,李苹(河南中医药大学,河南 郑州)摘要:基于小型语料库评测研究的空白,建立了基于改进 AHP 和三级模糊综合评价模型的小型语料库的评测模型;为了验证基于改进 AHP 和三级模糊综合评价模型的有效性,以课题组构建的小型语料库为实例进行分析。结果表明:该小型语料库的评测等级为中等,与实际情况相符合,需要进一步对该小型语料库进行完善。为其它小型语料库的评测提供一定的理论参考。关键词:小型语料库;指标;改进 AHP;模糊理论;评测中图分类号院TP391
5、文献标识码院A文章编号院2096-4390渊2023冤25-0120-04基金项目:河南省软科学研究计划项目(232400410445)。作者简介:贺娜娜(1985-),女,博士,讲师,研究方向:中医翻译与对外传播。ijn naA1niijjra120-2023.25 科学技术创新差值法处理 A,假设进行处理后,矩阵为 A,包含的元素为 aij,(3)式(3)中:rj是矩阵 A 的第 j 行向量的各分量的和。步骤 3,小型语料库指标的层次单排序和权重计算针对小型语料库可用性,指标层中的元素的意思是影响指标,上面一层是准则层,影响指标对应准则层权重的计算是层次单排序,我们运用方根法来计算:在加工
6、过的 A中,每行元素进行相乘,然后开 n 次方,同时进行归一化得到权重 Wi,(4)步骤 4,检验评价指标一致性层次单排序情况下,为确保小型语料库指标的辨别在整体上具有传递性和合理性,需检验判断矩阵的一致性。假设一致性指标是 CI,(5)式(5)中:姿max为判断矩阵的最大特征根,(6)进一步计算一致性比 CR(consistency ratio)(7)当 CR1 时,那么判断矩阵的一致性可以接受。式(7),RI 是和矩阵阶数有关的随机一致性的指标,Saaty得出了 RI 的值,见表 2。表 2RI取值1.2模糊综合评价模型模糊综合评价法9,即应用评价因素模糊关系合成机理,依据各个评价因素对被
7、评价对象的隶属度进行综合性评判的一种方法。构建单因素 Bi的评判矩阵 r 和单因素权重集 A,用 Bi的评判矩阵乘以 A,可以获得 Bi的评判集;评判集归一化后,将其视为上一级指标的 R 的行,从而构建上一级指标的 R;依据构造单因素评判方法构建每一级的评判集,从而得出整体评价结果。2实例分析2.1小型语料库评测的指标体系设计小型语料库评测的基础是评测指标体系的构建,指标体系的构建要遵循科学性原则、可行性原则、全面性原则及系统和层次原则,具体含义见表 3。表 3小型语料库评测指标体系构建原则小型语料库的构建,过程繁杂,影响其可用性的因素有许多,因此,搜集整理与可用性有关的信息是最关键的一步。对
8、语料库的可用性进行评测,我们要考虑多个方面。首先,语料库设计。语料库质量的好坏与语料库设计有直接联系,其设计必须按照建库目的和用户需求来进行。其次,语料库实现。在研究语料库实现方面,关键因素主要有:语料采集程序、存储结构、管理程序、检索程序等。再次,语料库标注。语料的加工规范、程序、结果是探究语料库标注的关键因素。最后,语料库维护。可维护性和维护程序可作为研究语料库维护的两个方面。2.2评价对象因素的确定根据表 4 中建立的小型语料库可用性评测指标体系,可维护性的评测指标有 5 种,分别为平衡比例、语料11,1,ijijijjiijrrrrarrrr当当111111,2,3,nnijjinnn
9、ijjkaWina,max1nCIn1max111nijjnnjiiiiia WWn WnWACICRRIn 1 2 3 4 5 6 7 RI 0 0 0.52 0.89 1.12 1.26 1.36 n 8 9 10 11 12 13 14 RI 1.41 1.46 1.49 1.52 1.54 1.56 1.58 原则 含义 科学性原则 指标选取遵循研究对象发展的客观规律 可行性原则 指标简洁实用,便于实测获取 全面性原则 指标体系能够全面反映其运行状态 系统和层次 指标体系由不同层次和因素组成 影响因 素 平衡比 例1u 语料更 新2u 逻辑结构3u 存储 结构4u 重新标注5u 可 用
10、性等级 因素等级 隶属度向量 (1.0000,0.5000,0.2500,0.1250,0.0000)(0.5000,1.0000,0.5000,0.2500,0.1250)(0.2500,0.5000,1.0000,0.5000,0.2500)(0.1250,0.2500,0.5000,1.0000,0.5000)(0.0000,0.1250,0.2500,0.5000,1.0000)表 4小型语料库可维护性各影响因素等级表 5各因素等级的隶属度121-科学技术创新 2023.25更新、逻辑结构、存储结构和重新标注,则该小型语料库的可用性因素集为,将各指标分为5 个等级,于是得出可维护性的各
11、影响因素等级(见表4),各因素等级的隶属度(见表 5)。在一致性原则的基础上,采用归一化,得到因素等级隶属度矩阵 R 为:2.3确定评语集建立小型语料库评测的评语集。根据小型语料库指标体系的特征,在前人制订评语集的经验基础上,定义评语集为V=(很小,较小,中等,较大,很大)=(,)。2.4指标权重的确定2.4.1Delphi调查采用 Delphi 法征集 15 名专家的意见,以三标度为准,将表 4 中的准则层的 5 个方面(平衡比例、语料更新、逻辑结构、存储结构和重新标注)重要程度进行相互比较、对各指标的重要程度进行相互比较。设二级指标可维护性的 5 个三级两两比较后得到的判断矩阵为:由式(5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 AHP 模糊 理论 小型 语料库 评测 研究
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。