分销赏收藏举报申诉 / 7

立即下载 VIP下载

当前位置：首页 > 学术论文 > 毕业论文/毕业设计 > 结合依存图卷积与文本片段搜索的方面情感三元组抽取_徐康.pdf

结合依存图卷积与文本片段搜索的方面情感三元组抽取_徐康.pdf

上传人：自信****多点

文档编号：283784

上传时间：2023-06-30

格式：PDF

页数：7

大小：1.70MB

《结合依存图卷积与文本片段搜索的方面情感三元组抽取_徐康.pdf》由会员分享，可在线阅读，更多相关《结合依存图卷积与文本片段搜索的方面情感三元组抽取_徐康.pdf（7页珍藏版）》请在咨信网上搜索。

1、第 49卷第 4期2023年 4月Computer Engineering 计算机工程结合依存图卷积与文本片段搜索的方面情感三元组抽取徐康，李霏，姬东鸿（武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室，武汉 430040）摘要：现有基于序列标注或文本生成的三元组抽取模型通常未考虑完整文本片段级别的交互，且忽略了句法知识的应用。为解决上述问题，提出一种基于依存图卷积与文本片段搜索的深度学习模型来联合抽取方面情感三元组。通过预训练语言模型 BERT编码层学习句子中每个单词的上下文表达，同时利用图卷积神经网络学习句子单词之间的依存关系和句法标签信息，以捕获远距离的方面词与观点词

2、之间的语义关联关系，并采用文本片段搜索构造候选方面词与观点词及其特征表示，最终使用多个分类器同时进行方面词与观点词抽取及情感极性判断。在ASTE-Data-V2数据集上的实验结果表明，该模型在 14res、14lap、15res和 16res子集上的 F1值相比于 JET模型提升了 10.61、10.54、4.91和 8.48个百分点，具有较高的方面情感三元组抽取效率。关键词：方面情感三元组抽取；图卷积神经网络；深度学习；依存句法分析；文本片段搜索开放科学（资源服务）标志码（OSID）：中文引用格式：徐康，李霏，姬东鸿.结合依存图卷积与文本片段搜索的方面情感三元组抽取 J.计算机工程，2023

3、，49（4）：61-67.英文引用格式：XU K，LI F，JI D H.Aspect sentiment triple extraction by combining dependency graph convolution and text span search J.Computer Engineering，2023，49（4）：61-67.Aspect Sentiment Triple Extraction by Combining Dependency Graph Convolution and Text Span SearchXU Kang，LI Fei，JI Donghong（K

4、ey Laboratory of Aerospace Information Security and Trusted Computing，Ministry of Education，School of Cyber Science and Engineering，Wuhan University，Wuhan 430040，China）【Abstract】Existing studies on the extraction of aspect sentiment triples mostly employ methods based on sequence tagging or text gen

5、eration.These methods consider neither the interactions at the span pair level nor the application of syntactic knowledge.To address these problems，this study proposes a deep learning model based on dependency graph convolution and text span search to jointly extract aspect sentiment triples.The mod

6、el first learns the contextual representation of each word in a sentence through the Bidirectional Encoder Representations from Transformers（BERT）coding layer.It then utilizes a graph convolutional neural network to learn the dependencies and syntactic label information in words to capture the seman

7、tic associations between distant aspect terms and opinion terms.It also uses text span search to construct candidate aspect and opinion terms and their feature representations.Finally，the model extracts aspect and opinion terms and sentiment polarity simultaneously using multiple classifiers.Experim

8、ents on the Aspect Sentiment Triple Extraction（ASTE）-Data-V2 dataset show that the model improves F1 scores by 10.61，10.54，4.91，and 8.48 percentage points on the 14res，14lap，15res，and 16res subsets，respectively，as compared with the JET model，thus demonstrating its effectiveness.【Key words】Aspect Sen

9、timent Triple Extraction（ASTE）；graph convolution neural network；deep learning；dependency syntactic parsing；text span searchDOI：10.19678/j.issn.1000-3428.00645580概述方面级情感分析（Aspect-Based Sentiment Analysis，ABSA）是一种细粒度的情感分析技术1，目的是识别方面术语、对应的情感极性和意见术语2，广泛应用于商品评论、公众观点分析等任务。国际语义评基金项目：国家自然科学基金（621

10、76187）；国家重点研发计划（2017YFC1200500）；教育部哲学社会科学研究重大课题攻关项目（18JZD015）；教育部人文社科青年基金（22YJCZH064）；湖北省自然科学基金（2021CFB385）。作者简介：徐康（1996），男，硕士研究生，主研方向为自然语言处理；李霏，副研究员、博士；姬东鸿，教授、博士。收稿日期：2022-04-26 修回日期：2022-06-08 Email：人工智能与模式识别文章编号：1000-3428（2023）04-0061-07 文献标志码：A 中图分类号：TP3912023年 4月 15日Com

11、puter Engineering 计算机工程测大会 SemEval从 2014 年起连续 3 年将 ABSA 任务作为其子任务并提供了一系列人工标注的基准数据集3-5。但由于现有方面级情感分析研究主要关注方面词抽取6-8、基于方面词的情感极性分类9-11、观点词抽取12-13、方面词和观点词的共同抽取等子任务14-16，然而针对这些子任务均仅解决了细粒度情感分析任务的某一方面，并没有为其提供完整的解决方案，因此文献1提出方面情感三元组抽取（Aspect Sentiment Triplet Extraction，ASTE）任务。该任务的目标是从用

12、户评论中抽取形如（What，How，Why）这样的三元组集合，其中：What代表评论的目标，即方面词；How 代表用户对于评论目标表达的情感极性；Why代表体现相应情感极性的原因，即观点词。例如，从用户评论“the food is not comforting，not appetizing and uncooked.”中，可以抽取（food，negative，not comforting）、（food，negative，not appetizing）、（food，negative，uncooked）三元组集合来刻画用户对于“food”品质的综合评价。此外，文献 1 建立两阶段框

13、架来处理该任务：在第一阶段中，通过序列标注的方法从输入句子中分别抽取带有情感极性的方面词和观点词；在第二阶段中，通过分类器来选择合适的方面词和观点词进行组合。然而，该方法存在两方面的问题：一方面，在第一阶段中将方面词与情感极性相结合的标注方法会导致模型训练和优化过程过于复杂；另一方面，这种基于流水线方式的两阶段方法容易受到错误传播的影响。近年来，学者们陆续提出了基于序列标注17、基于文本生成18-19、基于阅读理解20-21、基于文本片段22等端到端ASTE方法，然而在这些方法中：基于序列标注的方法仅考虑了单个单词的信息而忽略了情感词整体的信息，因此不能很好地处理由多个单词组成的情感词；基于文

14、本生成和阅读理解的方法需要对原始任务进行一定程度的改造，并为其设计相应的问题模板，增加了任务的复杂性；基于文本片段的方法22虽然在预测情感极性时考虑了情感词的完整文本片段的信息，但忽略了依存句法分析在ASTE任务中的重要作用。文献 9-11 利用图神经网络来学习与特定方面词相关的上下文，进而判断特定方面词的情感极性。然而，这些方法并没有考虑到依存句法标签的类别信息，同时也无法以端到端的方式从用户评论中抽取情感三元组。为解决上述问题，本文提出一种基于依存句法知识与文本片段搜索的端到端方面情感三元组抽取模型 ESYNM。该模型利用图卷积神经网络来学习单词之间的依存句法关系，建立方面词与观点词之间的

15、远距离联系，基于依存句法标签的类别信息来判断观点词所表达的情感极性，同时利用文本片段搜索联合进行方面词、观点词预测和情感极性判断以提高计算效率，并在 ASTE-Data-V2数据集上与多种基线模型进行实验对比。1相关工作在方面级的情感分析任务中，现有研究多数仅关注细粒度情感分析任务的某一个子任务。文献 9-11 通过图卷积神经网络来学习依存句法树，然后利用单词之间的依存关系找到与特定方面词相关的句法上下文，进而判断情感极性。文献 23 设计一个双层交互式图卷积网络来融合层次句法图和词汇图。文献 24 提出双图卷积网络 DualGCN 来同时学习句法结构与语义

16、相关性。文献 25 通过图注意力网络来融合句法知识，从而加强方面词之间的交互。然而，单独处理细粒度情感分析任务的某一个子任务面无法进行整体的情感分析。因此，学者们开始考虑多个子任务的联合学习，包括方面词与观点词的共同抽取、方面词及其情感极性抽取26-27等。文献 14使用基于依存树的递归神经网络来捕获方面词与观点词之间的双向传播关系。文献 16 建立一个融入规则的方面词和观点词共同抽取模型。文献 26 采用多目的的标注机制来同时抽取方面词和判定情感极性。文献 1 提出方面情感三元组抽取任务，该任务旨在同时从句子中抽取方面词、观点词，以及与每个方面词相关的情感极性，基于 SemEval 2014

17、、2015和2016相关测评任务的数据集构造基准数据集 ASTE-Data-V1。然而，文献 17 发现 ASTE-Data-V1 数据集遗漏了一个观点词对应多个方面词的情况，在ASTE-Data-V1 数据集的基础上进行修正，发布了ASTE-Data-V2 数据集。在 ASTE 任务中，早期工作主要采用流水线方式，例如 CMLA+1、RINANTE+1和 TwoStage1。这类方法的基本思想是使用统一的标签来抽取方面词和情感极性，同时基于 BIO 标注机制抽取观点词，然后通过分类器将带有情感极性的方面词与观点词配对。然而，这种将情感极性与方面词统一起来的多目的标注方案可能会导致模型特征学习

18、和训练过程过于复杂，同时还存在错误传播问题。近年来，学者们提出了一些端到端方式的ASTE 方法。文献 17 提出一个端到端的模型 JET，该模型设计了一种基于位置感知的标注机制来考虑情感三元组各元素之间的交互信息，以端到端的方式直接输出情感三元组。然而，对于包含多个单词的方面词和观点词，JET 模型并没有将其视为整体，而是逐个处理其中的每个单词，因此忽视了方面词和观点词的整体信息。为解决 JET 模型存在的问题，文献 22 提出基于文本片段的 ASTE 方法来考虑方面词与观点词在完整文本片段之间的交互。除了上述方法之外，部分学者也开始尝试重新定义方面级情感分析任务，然后利用其他领域的方法来解决

19、该问题。文献 18-19 将方面级情感分析的多个子问题重新定义为文本生成问题，然后使用预训练的文本生成模型来统一处理。文献 20 将方面情感三元组抽取任务转换为多轮机器阅读理解任务，通过 3 个轮次的问答从输入句子中得到相应的情感三元组。文献 21 将方面情感三元组任务转换为两个阅读理解问题，其中，一个负责完成方面词抽取，另一个负责完成情感分类和观点词抽取。然而，这些方法需要对原始任务进行重新定义，并依赖人工设计相应模板。在上述工作中，基于文本片段搜索的 ASTE 方62第 49卷第 4期徐康，李霏，姬东鸿：结合依存图卷积与文本片段搜索的方面情感三元组抽取法22在基准数据集上表现最为优越，但

20、忽略了句法知识在 ASTE 任务中的贡献。方面情感三元组抽取示例如图 1 所示。在依存句法树中，通过单词“comforting”与“food”之间的“nsubj”依存弧可以找到方面词“food”与观点词“not comforting”。同时，基于单词“not comforting”与“appetizing”之间的“dep”依存弧以及“appetizing”与“uncooked”的“conj”依存弧，可以进一步建立“food”与距离较远的观点词“appetizing”、“uncooked”之间的联系，从而生成正确的三元组集合。此外，在依存句法树中，还可

21、以观察到“not”与“comforting”、“not”与“appetizing”之间均存在“neg”依存弧，这一信息有助于帮助模型判断观点词“not comforting”和“not appetizing”所表达出来的负面情感极性。基于上述研究，本文通过图卷积神经网络来学习单词之间的依存句法知识，进而帮助发现远距离的方面词、观点词及其情感极性。2基于依存图卷积与文本片段搜索的方面情感三元组抽取模型本文提出的基于依存图卷积和文本片段搜索的ESYNM 模型主要包含预训练语言模型 BERT 编码层、依存图卷积层、文本片段搜索层、方面词和观点词抽取模块和情感极性分类模块 5个部分，如图 2所示，其

22、中 sk代表第 k个文本片段。2.1BERT编码层使用BERT对输入的句子进行编码。假设输入句子 X中包含 N个单词，首先在句子 X前后分别添加特殊符号 CLS 和 SEP，以满足BERT模型的输入要求，然后将其送入BERT模型学习输入句子中每个单词的上下文表达，最后将 BERT模型最后一层的输出作为句子 X的深度向量表达，得到句子编码 H：H=BERT(CLSXSEP)（1）其中：H=h0,h1,hN+1，h0代表特殊符号 CLS 的编码，可将其作为输入句子的全局上下文表达，用于后续任务。2.2依存图卷积层经过 BERT 模型编码得到输入句子中每个单词的上下文向量表达后，基于单词之间的依存句

23、法关系来构建依存句法图网络，然后使用图卷积神经网络来学习单词之间的依存句法知识。对于依存句法树，将其建模为边带有标签的有向图G=(V,E)，其中，V代表图中节点的集合，E代表图中边的集合。ei,j=1(0)代表节点i与j之间存在（不存在）依存关系。图卷积神经网络允许信息随着图中的边不断向远处传播，通过增加图卷积的层数可以帮助模型解决方面词和观点词距离较远的问题。依存图卷积层中第 l层节点的更新方式如式（2）所示：hl+1i=ReLU(j=1Ni,j(Wl hlj+bl)（2）其中：hlj代表句子中的第 i个单词在第 l层图卷积网络中的表达；Wl和bl分别代表第 l 层图卷积网络的权重矩阵和偏置

24、向量；i,j代表邻接强度分布。i,j计算如式（3）所示：i,j=eli,j exp()hliT hjt=1Neli,t exp()hliT ht（3）2.3文本片段搜索层经过依存图卷积层学习句子中单词之间的依存句法关联之后，通过枚举所有可能的文本片段来生成候选方面词和观点词集合。对于文本片段si=xstart()i,xend()i，它既可以是单个单词，又可以是由多个单词组成的短语，其中start(i)和end(i)分别代表文本片段si在输入句子中的起始和终止索引。假设文本片段的最大长度为ls，那么起止索引需满足条件：1start(i)end(i)和end(i)-start(i)ls。例如，当l

25、s设置为 3 时，给定句子“the food was delicious”，通过枚举可以得到“food”、“delicious”、“the food”、“food was”，以及“food was delicious”等候选文本片段。在枚举候选文本片段过程中，会得到各种不同长度的文本片段。在用户评论中，方面词、观点词通常以较短的文本片段长度出现。因此，通过考虑文本片段的长度信息可以帮助模型排除错误的文本片段，进而提高抽取准确率。因此，在拼接文本片段的首尾单词向量表达和最大池化操作之后，额外添加一个文本长度特征向量li，最终文本片段si的向量表达pi如式（4）图 1方面情感三元组抽取示例Fig.

26、1Example of aspect sentiment triplet extraction图 2ESYNM 模型框架Fig.2Framework of the ESYNM model632023年 4月 15日Computer Engineering 计算机工程所示：pi=maxpooling(hstart()i；hend()i)；li（4）2.4方面词和观点词抽取模块在得到候选文本片段的向量表达之后，通过方面词和观点词抽取模块来帮助模型正确识别方面词和观点词边界。该模块可以通过对所有文本片段进行并行预测来提高模型的计算效率。在对候选文本片段进行预测时，为了利用输入句子的完整上下文信息，首

27、先将文本片段向量pi与句子特征向量h0拼接起来得到向量ti，接着将ti送入前馈神经网络，最后由 Softmax函数输出预测的文本片段类别概率yi,AO，计算过程如式（5）、式（6）所示：ti=pi；h0（5）yi,AO=Softmax(WAO ti+bAO)（6）其中：WAO和bAO分别代表权重矩阵和偏置向量。对于文本片段si，其预测类别为最高概率所对应的类别。2.5情感极性分类模块对于给定的候选文本片段对(si,sj)，首先通过最大池化操作得到两者之间的局部上下文特征ci,j，然后将文本片段si、sj的向量表达与ci,j进行拼接得到P(si,sj)，最后由 Softmax 函数来输

28、出预测的情感极性类别概率分布y()si,sj,SP，具体计算过程如式（7）式（9）所示：ci,j=maxpooling(hstart()i+1；hend()j-1)（7）P()si,sj=pi；pj；ci,j（8）y()si,sj,SP=Softmax(WSP P()si,sj+bSP)（9）其中：WSP和bSP分别代表权重矩阵和偏置向量。对于候选文本片段对(si,sj)，其预测的情感极性为最高概率所对应的类别。2.6损失函数方面词与观点词抽取及情感极性判断两个子任务共享底层的 BERT 编码层、依存图卷积层、文本片段搜索层。在最顶层，两个任务分别通过各自独立的分类器，独立进行方面

29、词和观点词的抽取，以及情感极性的判断。对于方面词和观点词抽取，采用多分类交叉熵作为损失函数，如式（10）所示：LAO=-i=1k1y?i,AOln yi,AO（10）其中：k1代表文本片段的类别数量；y?i,AO和yi,AO分别代表当前文本片段在类别 i上的标准概率分布与预测概率分布。对于情感极性分类，同样采用多分类交叉熵作为损失函数，如式（11）所示：LSP=-i=1k2y?()si,sj,SPln y()si,sj,SP（11）其中：k2代表情感极性的类别数量；y?()si,sj,SP和y()si,sj,SP分别代表文本片段对(si,sj)在情感极性类别 i上的标准概率分布与预测概率分布。

30、最终损失函数为上述两部分损失函数的加权之和，如式（12）所示：L=LSP+LAO（12）其中：代表超参数，用于控制方面词和观点词抽取模块的损失函数LAO对最终损失函数L的影响。3实验设置 3.1数据集使用ASTE-Data-V2数据集24作为评测数据集，其标注语料来源于 SemEval-2014 task 43、SemEval-2015 task 124和SemEval-2016 task 55发布的相关数据集。该数据集包含了两个领域的用户评论，其中，14res、15res和16res子集来自Restaurant领域，14lap子集来自Laptop领域。沿用文献 17 的数据集划分方式，将其分

31、为训练集、验证集和测试集。数据集统计信息如表1所示，其中，S代表用户评论句子数量，POS、NEU、NEG分别代表情感极性为积极、中性以及消极的三元组数量。3.2基线模型CMLA+1：首先使用基于多层注意力机制的CMLA 模型20来抽取带有情感极性的方面词和观点词；然后使用分类器来选择合适的方面词和观点词对。RINANTE+1：首先使用基于依存关系挖掘方面词和观点词提取规则的联合模型 RINANTE22来抽取带有情感极性的方面词和观点词；然后通过分类器来选择合适的方面词和观点词对。TwoStage1：抽取情感三元组的过程可以分为两个阶段。第一阶段，采用序列标注的方法从用户评论中分别抽取带有情感极

32、性的方面词和观点词；第二阶段，使用分类器为方面词选择合适的观点词。JET17：基于一种新颖的位置感知的标注机制来考虑情感三元组中各个元素之间的交互信息，最终以端到端的方式从用户评论中抽取三元组。BARTABSA18：首先对方面级情感分析的 7个子任务进行重新定义，将其转化为文本生成问题；然后基表 1ASTE-Data-V2数据集统计信息 Table 1Statistics of the ASTE-Data-V2 datasets单位：个数据集划分类型训练集验证集测试集14resS1 266310492POS1 692404773NEU1665466NEG48011915514lapS90621

33、9328POS817169364NEU1263663NEG51714111615resS605148322POS783185317NEU251125NEG2055314316resS857210326POS1 015252407NEU501129NEG329767864第 49卷第 4期徐康，李霏，姬东鸿：结合依存图卷积与文本片段搜索的方面情感三元组抽取于预训练文本生成模型BART来统一处理所有的子任务。SpanASTE22：利用基于文本片段的 ASTE 模型来进行文本片段级别的交互，并通过一种双通道剪枝策略来降低时间复杂度。3.3评价指标采用精确率、召回率和 F1值作为模型性能评价指标。在

34、评测时，只有当抽取的三元组中方面词、观点词以及对应的情感极性都预测正确时，才将其视为正确的三元组。为了保证实验结果的可靠性，在实验过程中，在每个数据集上均采用不同的随机种子运行 10 次实验，然后取其平均值作为最终结果。4实验结果与分析 4.1主要实验结果表 2给出了不同基线模型和本文提出的 ESYNM模型在 ASTE-Data-V2数据集上的实验结果。对于最优和次优结果，分别通过加粗和下划线标识。由表2可以得到以下结论：1）JET、BARTABSA、SpanASTE、ESYNM 等端到端模型在 4个数据集的各项评测指标上的表现都远超 CMLA+、RINANTE

35、+、TwoStage等流水线模型。这说明相比于流水线方式，端到端方式既可以处理同一方面词存在不同情感极性的问题，又避免了流水线方式存在的错误传播问题，因此可以更好地处理 ASTE任务。2）尽管同为端到端模型，但基于文本片段的SpanASTE和 ESYNM 模型性能显著优于基于序列标注的 JET和基于文本生成的 BARTABSA模型。具体而言：ESYNM 模型的 F1值相比于 JET模型在 14res、14lap、15res、16res数据集上分别提升了 10.61、10.54、4.91、8.48个百分点；相比于BARTABSA模型分别提升了7.76、2.89、3.18、4.69个百分点。这一结

36、果证明了完整的文本片段级别的交互信息对于ASTE任务具有促进作用。3）ESYNM 和 SpanASTE 模型虽然都采用基于文本片段的方法，但 ESYNM 模型在 14res、14lap、16res 等 3 个数据集上的性能表现均优于 SpanASTE模型，仅在 15res 数据集上略劣于 SpanASTE 模型。具体而言，ESYNM 模型在 14res、14lap、16res 等 3 个数据集上的 F1值相比于 SpanASTE模型分别提升了1.16、2.20和 2.05个百分点。这一结果证明了本文提出的使用图卷积神经网络来编码单词之间的依存句法知识的 ESYNM 模型在 ASTE任务上的有效

37、性。4.2消融实验为了验证 ESYNM 模型中特征向量、文本片段长度特征向量和依存图卷积层对模型性能的影响，设计消融实验。在 ASTE-Data-V2数据集上的实验结果如表 3所示，其中，最优结果通过加粗标识。由表3可以看出，3个模块都有助于提高模型的最终性能。具体而言：不使用句子特征向量（w/o CLS）后，模型在14res、14lap、15res以及16res数据集上的F1值分别下降了 0.77、0.79、0.62、0.63个百分点；不使用文本长度特征向量（w/o LenEmb）后，模型在 14res、14lap、15res、16res数据集上的 F1值分别下降了 1.15、1.11、0.

38、93、1.07个百分点；删除了依存图卷积层（w/o Dep）后，模型性能下降最为明显，在4个数据集上的F1值分别下降了2.75、1.40、2.19、2.18个百分点。这一结果表明：句子特征向量和文本长度特征向量可以在一定程度上提高模型性能，但提升作用有限；依存句法知识的引入可以显著提升方面情感三元组的抽取效果。4.3图卷积层数对模型性能的影响由于从消融实验结果可以看出依存图卷积层可以明显提高模型的抽取效果，因此进一步研究依存图卷积层中图卷积层数对模型性能的影响，实验结果如图 3所示。在一般情况下，图卷积层数越多，模型捕获远距离的方面词与观点词之间的依存句法关系能力越强，方面情感三元组抽取效果也

39、越好。由图 3可以看出：当图卷积层数为 2时，ESYNM 模型可以取得最好的结果；当图卷积层数增加时，ESYNM模型在 4个数据集上的指标却有所下降。这说明当表 2不同模型实验结果对比 Table 2Comparison of experimental results of different models%模型CMLA+RINANTE+TwoStageJETBARTABSASpanASTEESYNM14res精确率39.1831.4243.2470.5665.5272.8971.47召回率47.1338.3863.6655.9464.9970.8974.63F1值42.7934.9551.4

40、662.4065.2571.8573.0114lap精确率30.0921.7137.3855.3961.4163.4462.25召回率36.9218.6650.3847.3356.1955.8460.92F1值33.1620.0742.8751.0458.6959.3861.5815res精确率34.5629.8848.0764.4559.1462.1860.06召回率39.8430.0657.7151.9659.3864.4565.12F1值37.0129.9752.3257.5359.2663.2762.4416res精确率41.3425.6846.9670.4266.6069.4571.

41、18召回率42.1022.3064.2458.3768.6871.1773.51F1值41.7223.8754.2163.8367.6270.2672.31表 3消融实验结果 Table 3Results of ablation experiment%模型ESYNMw/o CLSw/o LenEmbw/o DepF1值14res73.0172.2471.8670.2614lap61.5860.7960.4760.1815res62.4461.8261.5160.2516res72.3171.6871.2470.13652023年 4月 15日Computer Engineering 计算机工程

42、信息传播的层数过多时，反而会导致模型学习到错误的句法知识，进而出现过拟合现象。4.4文本片段最大搜索长度对模型性能的影响在基于文本片段的 ASTE方法中，文本片段最大搜索长度对模型最终效果具有一定的影响。使用ASTE-Data-V2 数据集中的 4 个测试集作为基准数据集，将文本片段最大搜索长度由 1逐步增加到 10分别进行实验，实验结果如图4所示。由图4可知，当最大搜索长度为 2时，模型在 4个测试集上均取得了最优结果。随着最大搜索长度的进一步增加，情感三元组抽取的 F1 值虽然偶有波动，但是整体均呈现下降的趋势。这一结果说明：较短的最大搜索长度足以帮助模型找到正确的方面词和观点词；过长最大

43、搜索长度会生成过多的错误候选方面词和观点词，使得模型在方面词和观点词配对过程中生成较多的错误配对结果，最终导致模型性能下降。4.5案例分析通过以下案例来说明依存句法知识在 ASTE 任务中所起的作用，其中，Ground Truth 代表标注的正确情感三元组，用于标记错误情感三元组：Example：Rice is too dry，tuna was nt so fresh either.Ground Truth：（Rice，negative，too dry），（tuna，negative，was nt so fresh）TwoStage：（Rice，negative，too dry），（tuna，

44、negative，was nt so fresh），（Rice，negative，was nt so fresh），（tuna，negative，too dry）ESYNM w/o Dep：（Rice，negative，too dry），（tuna，negative，was nt so fresh），（Rice，negative，dry）ESYNM：（Rice，negative，too dry），（tuna，negative，was nt so fresh）对于案例“Rice is too dry，tuna was nt so fresh either.”：TwoStage模型除了生成正确的结

45、果之外，还额外生成了两个错误的结果“（Rice，negative，was nt so fresh）”和“（tuna，negative，too dry）”；删除了依存图卷积层的 ESYNM 模型（ESYNM w/o Dep），则由于生成了错误的观点词“dry”，导致额外生成了一个错误的三元组；ESYNM 模型由于学习了单词之间的依存关系，因此可以在方面词与观点词之间建立正确的联系，避免了 TwoStage模型存在的错误配对情况，同时 ESYNM 模型还能利用句法标签类别信息来找到合适的观点词边界，以避免生成错误的情感三元组。5结束语本文提出一种端到端的方面情感三元组抽取模型 ESYNM，首先使

46、用 BERT 模型对输入句子进行编码，然后基于对输入句子的依存句法分析结果构建依存句法图网络，同时通过图卷积神经网络来学习句子单词之间的依存关系和依存句法标签类别信息，最后从句子中抽取方面词和观点词并判断其情感极性。在 ASTE-Data-V2 数据集上的实验结果证明了 ESYNM 模型的有效性。但由于现有研究主要关注显式方面词和观点词，然而现实场景中包含了大量的隐式方面词和观点词，因此在后续工作中将研究包含隐式方面词和观点词的方面情感多元组抽取，进一步完善细粒度情感分析研究。参考文献 1 PENG H Y，XU L，BING L D，et al.Knowing What，How and Wh

47、y：a near complete solution for aspect-based sentiment analysis C/Proceedings of AAAI Conference on Artificial Intelligence.Palo Alto，USA：AAAI Press，2020：8600-8607.2 张佳慧.融合位置信息与注意力机制的方面级情感分析研究 D.长春：吉林大学，2021.ZHANG J H.Research on aspective-level sentiment analysis that merge position information and

48、attention mechanism D.Changchun：Jilin University，2021.（in Chinese）3 PONTIKI M，GALANIS D，PAVLOPOULOS J，et al.SemEval-2014 task 4：aspect based sentiment analysis C/Proceedings of the 8th International Workshop on Semantic Evaluation.Stroudsburg，USA：Association for Computational Linguistics，2014：27-35.

49、4 PONTIKI M，GALANIS D，PAPAGEORGIOU H，et al.SemEval-2015 task 12：aspect based sentiment analysis C/Proceedings of the 9th International Workshop on Semantic Evaluation.Stroudsburg，USA：Association for Computational Linguistics，2015：486-495.5 PONTIKI M，GALANIS D，PAPAGEORGIOU H，et al.SemEval-2016 task 5

50、：aspect based sentiment analysis C/Proceedings of the 10th International Workshop on Semantic Evaluation.Stroudsburg，USA：Association for Computational 图 4最大搜索长度对比Fig.4Comparison of maximum search length图 3图卷积层数对比Fig.3Comparison of the number of graph convolution layers66第 49卷第 4期徐康，李霏，姬东鸿：结合依存图卷积与文

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 结合依存图卷文本片段搜索方面情感三元抽取徐康

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。