分销赏收藏举报申诉 / 9

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于T-HDGN模型的对话摘要生成方法.pdf

基于T-HDGN模型的对话摘要生成方法.pdf

上传人：自信****多点

文档编号：2077297

上传时间：2024-05-15

格式：PDF

页数：9

大小：1.81MB

《基于T-HDGN模型的对话摘要生成方法.pdf》由会员分享，可在线阅读，更多相关《基于T-HDGN模型的对话摘要生成方法.pdf（9页珍藏版）》请在咨信网上搜索。

1、第 49卷第 10期2023年 10月Computer Engineering 计算机工程基于 T-HDGN模型的对话摘要生成方法高玮军，刘健，毛文静（兰州理工大学计算机与通信学院，兰州 730050）摘要：随着对话系统和文本摘要生成技术的发展，生成式对话摘要引起了广泛的关注。由于会话中的信息流至少在 2个对话者之间交换，关键信息往往分散在各说话者的不同话语中，因此传统文本摘要模型生成的对话摘要包含冗余或者不正确的内容。针对传统文本摘要模型在生成对话摘要时对会话的上下文理解不充分且难以将说话人与其正确的行动相联系的问题，提出一种基于 T-HDGN 模型的对话摘要生成方法。利用抽取的行动三元

2、组对会话结构进行显式建模，将话语和行动三元组作为 2种不同类型的数据来构建异质对话图，并通过 1个异质图网络对这2种信息进行建模。同时，还增加说话人作为异质节点以促进信息流的传播。此外，在解码阶段使用主题词特征辅助摘要的生成。在 SAMSum数据集上的实验结果表明，所提方法在 ROUGE-1、ROUGE-2、ROUGE-L评价指标上分别达到 42.05%、18.09%、39.48%，相比 Longest-3、PGN、Fast Abs RL等基线模型，能有效地融合信息并且准确地将说话人与其对应动作相关联。关键词：对话摘要；异质图；行动三元组；主题词；异质图网络开放科学（资源服务）标志码（OSID

3、）：中文引用格式：高玮军，刘健，毛文静.基于 T-HDGN 模型的对话摘要生成方法 J.计算机工程，2023，49（10）：80-88.英文引用格式：GAO W J，LIU J，MAO W J.Dialogue summary generation method based on T-HDGN modelJ.Computer Engineering，2023，49（10）：80-88.Dialogue Summary Generation Method Based on T-HDGN ModelGAO Weijun，LIU Jian，MAO Wenjing（School of Computer

4、 and Communication，Lanzhou University of Technology，Lanzhou 730050，China）【Abstract】With the development of dialogue systems and text summary generation technology，generative dialogue summarization has attracted widespread attention.Because the information flow in a conversation is exchanged between

5、at least two interlocutors，key information is often scattered across different discourses of each speaker.Therefore，the dialogue summary generated by traditional text summarization models contains redundant or incorrect content.To address the issue of insufficient understanding of the conversation c

6、ontext and difficulty in linking the speaker with their correct actions in traditional text summarization models，this study proposes a T-HDGN model-based method for generating dialogue summary.The conversation structure is explicitly modeled using extracted action triplets，a heterogeneous dialogue g

7、raph is contrasted using discourse and action triplets as two different types of data，and these two types of information are modeled through the T-HDGN.In addition，speakers are added as heterogeneous nodes to promote the dissemination of information flow.In addition，theme word features are used to a

8、ssist in the generation of abstracts during the decoding phase.Experimental results on the SAMSum dataset show that the proposed method achieves 42.05%，18.09%，and 39.48%of the ROUGE-1、ROUGE-2、ROUGE-L evaluation indicators.Compared with the baseline models，such as Longest-3，PGN，and Fast Abs RL，it can

9、 effectively fuse information and accurately associate the speaker with their corresponding actions.【Key words】dialogue summary；heterogeneous graph；action triplet；topic word；heterogeneous graph networkDOI：10.19678/j.issn.1000-3428.0066219基金项目：国家自然科学基金（61762059）。作者简介：高玮军（1973），男，副教授、硕士，主研方向为高性能计算、自然语

10、言处理、计算机视觉；刘健、毛文静，硕士研究生。收稿日期：2022-11-10 修回日期：2023-01-23 Email：人工智能与模式识别文章编号：1000-3428（2023）10-0080-09 文献标志码：A 中图分类号：TP3910概述对话摘要旨在将会话浓缩成一段包含重要信息的简短文本，使人们不用回顾历史对话就可以快速捕捉到半结构化和多参与者对话的重点。近年来，随着移动电话、电子邮件和社交软件的普及，人们越来越多地使用对话形式分享信息，特别是新冠肺炎疫情在全球大范围的传播，在线多人聊天或会议已成为人们日常工作的重要部分。因此，利用文本摘要技术快速准确地将大量的对话类数据组织成简短

11、、自然和信息丰富的文本成为研究热点。目前，对话摘要的研究方法通常分为抽取式摘要和生成式摘要。抽取式摘要方法是从给定的源对话中抽取若干重要的话语，并将它们重新组合排序形成摘要1-2。这种方法形成的摘要只是重要语句的机械拼接，语义不连贯，不符合人类的摘要习惯。而生成式摘要方法是对原文内容进行语义理解和重构，并用新的语句表达原文信息，从而使生成的结果更像是人类编写的摘要3。随着深度学习的发展，生成式摘要方法已经成为目前研究的主流。现有的文本摘要研究大多都集中在单一参与者的文档上，如新闻以及科学论文摘要等，这些文档通常以第三人称的角度阐述内容，通过段落或章节使得信息流更清晰。与这些结构化文本不同，对话

12、是一种动态的信息流交换过程，通常是非正式的、冗长的和重复的，并伴随着错误的开始、主题漂移和参与者打断4。为了总结非结构化和复杂的对话，文献 5 直接将文档摘要方法应用于对话总结中。尽管指针生成网络、强化学习、预训练语言模型等在结构化文档上取得了重大的进展，但是文档和对话类数据存在固有差异，直接应用文档摘要模型来总结对话面临诸多挑战。为解决上述问题，研究人员采用图结构对会话进行建模，以打破对话的顺序位置，直接将相关的远距离话语相连接，解决远距离依赖问题，并且建模额外的知识。为此，本文提出一种基于 T-HDGN（Topic-word guided

13、 Heterogeneous Dialogue Graph Network）模型的对话摘要生成方法，基于图到序列的框架通过图神经网络挖掘话语内和话语间的语义关系，在解码阶段融入主题词引导摘要生成。本文利用从会话中显式提取的行动三元组（Who，Doing，What）构建对话图以融入说话人与其动作之间正确的对应关系。将行动三元组和话语作为异质数据进行建模，从而得到异质对话图。异质图网络可以更有效地融合信息并捕获句间丰富的语义关系，从而更好地对会话进行编码6。此外，在异质对话图网络中使用信息融合模块和节点位置嵌入 2个特殊模块。信息融合模块旨在帮助话语节点更好地聚合说话人和行动三元组的信息，而位置嵌

14、入模块使话语节点能感知其位置信息。1相关工作 1.1文档摘要与抽取式摘要方法相比，生成式摘要方法被认为更具挑战性。为此，研究人员设计各种方法生成文档摘要。文献 7 提出将序列到序列模型用于生成式文本摘要。文献 8 提出指针生成器网络，允许从源文本复制单词，在解决 OOV（Out Of Vocabulary）问题的同时又可以避免生成重复内容。文献 9 利用强化学习选择摘要所需的正确内容，该方法被证明可以有效提升生成效果。文献 10 使用大规模预训练语言模型 BERT 作为文本上下文编码器以获取更多的语义信息，进一步提高摘要的生成质量。随着图变得越来越普遍，信息更丰富，图神经网络

15、受到越来越多的关注，特别是它非常适用于在自然语言处理，如序列标注11、文本分类12、文本生成13等任务中表示图结构。对于摘要任务，最近也有研究基于图模型的方法探索文档摘要，如抽取实体类型14，利用知识图15以及额外的事实16校正模块。此外，文献 17 通过 Transformer 编码器创建 1个完全连接图，学习成对句子之间的关系。然而，如何构建有效的图结构以获取丰富的语义表示来生成摘要仍然面临挑战。1.2对话摘要对话摘要研究主要集中在会议、闲聊、客户服务、医疗对话等领域。然而，由于缺乏公开可用的资源，因此在各领域只是进行了一些初步工作。早期的研究人员基于模板或使用多句压缩的方法来抽取对话摘要

16、18，但这些方法很难生成简洁自然的摘要，尤其是面对会话这种特殊的文本结构。而生成式对话摘要方法能够有效解决这些问题。文献 19 根据会议数据集 AMI 构建 1 个新的对话摘要数据集，并通过句子门控机制来联合建模交互行为和摘要之间的显式关系。文献 5 提出 1 个新的生成式对话摘要数据集，并且基于序列的模型验证其性能。由于参与者的多重性和频繁出现的共指现象，因此模型生成的对话摘要存在事实不一致的问题。为此，文献 20 通过说话人感知的自注意力机制来处理参与者和他们的相关人称代词之间的复杂关系。一些研究还利用对话分析生成对话摘要，如利用主题段21、会话阶段22或关键点序列23。第 49卷第 1

17、0期高玮军，刘健，毛文静：基于 T-HDGN模型的对话摘要生成方法0概述对话摘要旨在将会话浓缩成一段包含重要信息的简短文本，使人们不用回顾历史对话就可以快速捕捉到半结构化和多参与者对话的重点。近年来，随着移动电话、电子邮件和社交软件的普及，人们越来越多地使用对话形式分享信息，特别是新冠肺炎疫情在全球大范围的传播，在线多人聊天或会议已成为人们日常工作的重要部分。因此，利用文本摘要技术快速准确地将大量的对话类数据组织成简短、自然和信息丰富的文本成为研究热点。目前，对话摘要的研究方法通常分为抽取式摘要和生成式摘要。抽取式摘要方法是从给定的源对话中抽取若干重要的话语，并将它们重新组合排序形成摘要1-

18、2。这种方法形成的摘要只是重要语句的机械拼接，语义不连贯，不符合人类的摘要习惯。而生成式摘要方法是对原文内容进行语义理解和重构，并用新的语句表达原文信息，从而使生成的结果更像是人类编写的摘要3。随着深度学习的发展，生成式摘要方法已经成为目前研究的主流。现有的文本摘要研究大多都集中在单一参与者的文档上，如新闻以及科学论文摘要等，这些文档通常以第三人称的角度阐述内容，通过段落或章节使得信息流更清晰。与这些结构化文本不同，对话是一种动态的信息流交换过程，通常是非正式的、冗长的和重复的，并伴随着错误的开始、主题漂移和参与者打断4。为了总结非结构化和复杂的对话，文献 5 直

19、接将文档摘要方法应用于对话总结中。尽管指针生成网络、强化学习、预训练语言模型等在结构化文档上取得了重大的进展，但是文档和对话类数据存在固有差异，直接应用文档摘要模型来总结对话面临诸多挑战。为解决上述问题，研究人员采用图结构对会话进行建模，以打破对话的顺序位置，直接将相关的远距离话语相连接，解决远距离依赖问题，并且建模额外的知识。为此，本文提出一种基于 T-HDGN（Topic-word guided Heterogeneous Dialogue Graph Network）模型的对话摘要生成方法，基于图到序列的框架通过图神经网络挖掘话语内和话语间的语义关系，在解码阶段融入

20、主题词引导摘要生成。本文利用从会话中显式提取的行动三元组（Who，Doing，What）构建对话图以融入说话人与其动作之间正确的对应关系。将行动三元组和话语作为异质数据进行建模，从而得到异质对话图。异质图网络可以更有效地融合信息并捕获句间丰富的语义关系，从而更好地对会话进行编码6。此外，在异质对话图网络中使用信息融合模块和节点位置嵌入 2个特殊模块。信息融合模块旨在帮助话语节点更好地聚合说话人和行动三元组的信息，而位置嵌入模块使话语节点能感知其位置信息。1相关工作 1.1文档摘要与抽取式摘要方法相比，生成式摘要方法被认为更具挑战性。为此，研究人员设计各种方法生成文档摘要。文献 7 提出将序列到

21、序列模型用于生成式文本摘要。文献 8 提出指针生成器网络，允许从源文本复制单词，在解决 OOV（Out Of Vocabulary）问题的同时又可以避免生成重复内容。文献 9 利用强化学习选择摘要所需的正确内容，该方法被证明可以有效提升生成效果。文献 10 使用大规模预训练语言模型 BERT 作为文本上下文编码器以获取更多的语义信息，进一步提高摘要的生成质量。随着图变得越来越普遍，信息更丰富，图神经网络受到越来越多的关注，特别是它非常适用于在自然语言处理，如序列标注11、文本分类12、文本生成13等任务中表示图结构。对于摘要任务，最近也有研究基于图模型的方法探索文档摘要，如抽

22、取实体类型14，利用知识图15以及额外的事实16校正模块。此外，文献 17 通过 Transformer 编码器创建 1个完全连接图，学习成对句子之间的关系。然而，如何构建有效的图结构以获取丰富的语义表示来生成摘要仍然面临挑战。1.2对话摘要对话摘要研究主要集中在会议、闲聊、客户服务、医疗对话等领域。然而，由于缺乏公开可用的资源，因此在各领域只是进行了一些初步工作。早期的研究人员基于模板或使用多句压缩的方法来抽取对话摘要18，但这些方法很难生成简洁自然的摘要，尤其是面对会话这种特殊的文本结构。而生成式对话摘要方法能够有效解决这些问题。文献 19 根据会议数据集 AMI 构建 1 个新的对话摘要

23、数据集，并通过句子门控机制来联合建模交互行为和摘要之间的显式关系。文献 5 提出 1 个新的生成式对话摘要数据集，并且基于序列的模型验证其性能。由于参与者的多重性和频繁出现的共指现象，因此模型生成的对话摘要存在事实不一致的问题。为此，文献 20 通过说话人感知的自注意力机制来处理参与者和他们的相关人称代词之间的复杂关系。一些研究还利用对话分析生成对话摘要，如利用主题段21、会话阶段22或关键点序列23。812023年 10月 15日Computer Engineering 计算机工程综上所述，现有的对话摘要模型主要基于循环神经网络（Recurrent Neural Network，RNN）的序

24、列到序列模型进行优化改进。尽管相关的研究已经取得了一定成果，但是对话具有多参与者以及突出信息分散在整个会话中的特点，使得摘要模型难以集中在许多信息性的话语上。此外，当前模型对识别不同说话者的行为以及他们如何相互作用或相互引用的关注较少，难以将说话者及其对应的动作联系起来，从而产生错误的推理。为了缓解这些问题，受基于图方法的启发，本文基于图模型的方法进一步探索对话摘要。2异质对话图构建 2.1图符号定义对于给定的会话C=u0u1un，将异质对话图定义为 1 个有向图G=(VEAR)，其中，V是节点集合，包含 3 种节点V=Vu Va Vs，E是边集合。不同类型的节点和边分别有各自的类型映射函数，

25、节点类型的映射函数为(v)：V A，边类型的映射函数为(e)：E R。2.2话语-行动图构建完全依赖神经模型很难从对话中获得具体的事实特征，为了帮助模型更好地理解会话中说话人与其行为之间正确的联系，本文从会话中提取行动三元组（Who，Doing，What），将其作为先验知识构建对话图。首先，基于以下规则将第一人称的话语转换为第三人称观点的形式：1）用当前说话人或周围说话人的名字替换第一或第二人称代词；2）根据斯坦福CoreNLP 检索会话中的共指簇以替换第三人称代词，例如，Amanda 对 Jerry 说：“Ill bring it to you tomorrow”被转换为“Amand

26、all bring cakes to Jerry tomorrow”。然后，使用开源信息抽取系统 OpenIE 对转换后的对话提取行动三元组（Who，Doing，What），即主谓宾信息。行动三元组如图 1所示。话语-行动图如图 2 所示，通过将话语和各行动三元组视为不同类型的节点以构建话语-行动图。本文考虑到出现具体事实特征的话语以及其周围话语往往是重要话语，将抽取出的各行动三元组作为行动节点，并且将它与出现该具体动作的话语以及下一位说话人的话语相连接，使得模型关注重要话语并理解说话人与其对应动作的正确联系。此外，本文将话语和行动节点之间的边定义为action边。2.3话语-对话者图构建由于

27、会话包含多个对话者以及各自对应的话语，因此将对话者和话语视为不同类型的节点。将说话人与其对应的话语通过 talk边进行连接。话语-对话者图如图 3所示。本文综合上述话语-行动图以及话语-对话者图，构建最终的异质对话图。此外，为了促进信息流在整个图上的传播，本文添加 2 种反向边 rev-action 和rev-talk。异质对话图具有对话者、话语和行动节点3 种，以及 action、talk、rev-action 和 rev-talk 4 种类型的边。异质对话图如图 4所示。3T-HDGN模型主题词引导的异质对话图网络（T-HDGN）结构图 3话语-对话者图Fig.3Utterance-sp

28、eaker graph图 4异质对话图Fig.4Heterogeneous dialogue graph图 2话语-行动图Fig.2Utterance-action graph图 1行动三元组Fig.1Action triplets82第 49卷第 10期高玮军，刘健，毛文静：基于 T-HDGN模型的对话摘要生成方法如图 5所示。T-HDGN主要由节点编码器、图编码器以及主题词引导的解码器 3部分组成。节点编码器旨在初始化每个图节点；图编码器用来捕获会话结构信息并得到更高级的节点表示；主题词引导的解码器在指针机制和覆盖机制中融入主题词特征以辅助摘要的生成。3.1节点编码器节点编码器为每个图节

30、0vin=hn；hn。节点表示h0vi将被传递给图编码器以学习更高级的表示，而词语表示h0vin将与更新的节点表示相连接以获得最终的词语表示。3.2图编码器在得到各节点的初始表示后将它们输入到 1 个图编码器中，利用图编码器捕获会话结构信息并得到更高级的节点表示。本文使用文献 24 提出的Heterogeneous Graph Transformer 作为图编码器，针对异质性问题，采用与类型相关的参数进行建模。异质图 Transformer层结构如图 6所示。Heterogeneous Graph Transformer 主要包括 3 个模块：1）异质相互注意力用来计算源节点和目标节点的注意力

31、得分Attention(set)；2）异质消息传递为每个源节点生成消息向量MMsg(set)，并传播特定类型的信息；3）特定目标的信息聚合使用注意力分数作为权重来聚合从源节点到目标节点的信息。本文通过 1个消息融合过程和节点位置编码使异质图上的学习过程更有效。图 5T-HDGN模型结构Fig.5Structure of T-HDGN model图 6异质图 Transformer层Fig.6Transformer layer of heterogeneous graph 832023年 10月 15日Computer Engineering 计算机工程3.2.1异质相互注意力对于给定的一条边e

32、=(st)以及它们的节点和边类型映射函数和，本文根据节点类型将第(l-1)层的源节点表示h()l-1s和目标节点表示h()l-1t分别映射为关键向量k(l)s=K-Linear(l)(s)(h(l-1)s)和查询向量q(l)t=Q-Linear(l)(t)(h(l-1)t)，使用 1 个与边类型相关的矩阵WAttention(l)(e)以聚合边类型信息，并计算源节点 s 和目标节点 t 之间的得分(set)。最后，对于每个目标节点 t，本文对所有目标节点的邻居节点s N(t)使用Softmax获得归一化的注意力得分Attention(l)(set)。如果目标节

33、点为话语节点，源节点为对话者节点，不计算它们之间的注意力得分。得分(set)和注意力得分Attention(l)(set)的计算式如式（1）和式（2）所示：(set)=(k(l)sWAttention(l)(e)q(l)Tt)（1）AAttention(l)(set)=Softmaxs N(t)(set)（2）3.2.2异质消息传递在与类型相关的线性投影下，本文将源节点（行动节点和对话者节点）的表示h(l-1)s映射为向量m(l)s=M-Linear(l)(s)(h(l-1)s)，并添加与边类型有关的矩阵WMSG(l)(e)，得到最终的消息向量MMsg()l(set)，计

34、算式如式（3）所示：MMsg(l)(set)=m(l)sWMSG(l)(e)（3）3.2.3特定目标的聚合基于目标节点的类型，该过程分为 2 种情况：1）当目标节点不是话语节点时，首先使用注意力得分加权求和消息向量MMsg:h(l)t=s N(t)(AAttention(l)(set)MMsg(l)(set)；2）当目标节点是话语节点时，本文通过消息融合过程将信息更有效地聚合到话语节点中。在消息融合过程中，由于注意力是 1 个归一化的分布，因此当目标为话语类型的节点聚合来自行动和对话者类型的源节点信息时，话语节点可能会更倾向于对话者节点而忽视行动节点。为此，本文使用行动节点的注意力权重加权对应

35、的消息向量并添加对话者信息。其计算式如下：sa=(s N(t)(s)=action)（4）ss=(s N(t)(s)=speaker)（5）h(l)t=s sa(AAttention(l)(set)MMsg(l)(set)+MMsg(l)(set)（6）最终，在得到聚合后的消息向量h(l)t后，根据目标节点类型，本文通过 1 个线性映射把它映射回目标节点类型，并采用残差连接得到更新后的节点表示h(l)t=A-Linear(l)(t)(Sigmoid(h(l)t)+h(l-1)t。3.2.4位置编码由于对话本质上是连续序列，因此部分上下文信息也将沿着这个顺序流动，而原始异质图不能直接建模话语之间

36、的时间顺序。为了节点能够感知其位置信息，本文添加节点位置信息。对于对话者和行动节点其位置都置为 0。对于话语节点vi，将其位置pvi与源对话中的话语顺序相关联。最终本文为每个节点添加位置信息：h(l)vi=h(l)vi+Wpospvi，Wpos表示1个可学习的位置参数矩阵。在得到添加位置信息的节点表示h()lvi之后，将其与对应的初始词语表示h0vin拼接，并进一步映射得到最终的词语表示hvin=F_Linear(h()lvi；h0vin)。3.3主题词引导的解码器主题关键词是主题信息常见的表示形式，体现了文档的关键内容。因此，本文在解码过程中使用主题关键词引导摘要的生成。传统的编码器-解码器

37、模型只使用源文本作为输入，导致生成的摘要中缺乏主题词信息。为此，本文在指针机制和覆盖机制中注入主题词以增强摘要中的主题关键词信息。本文将 1 次会话中所有行动三元组的 Who、Doing 和 What 作为主题关键词K=k1k2km，并且将所有主题关键词表示ki的均值作为主题信息表示-k。此外，本文用图中所有节点词语表示hvin的均值作为解码器的初始状态s0。具体计算式如下：-k=1ni=1nki（7）s0=AAverage()vi Gn 1|vihvin（8）3.3.1覆盖机制由于注意力机制会反复关注输入序列中的某些单词，因此会出现摘要自我重复的现象，尤其是对话者的

38、名字和重要动作。因此，本文引入覆盖机制来解决这个问题，通过历史注意力来影响当前注意力计算，首先将注意力分布at之和作为覆盖向量ct，ct表示单词从注意力机制受到的覆盖程度。传统的覆盖机制只涉及解码器状态st和编码器隐藏状态hvin，难以关注到主题词信息。因此，本文修改了注意力的构成部分，将主题词添加到覆盖机制中，计算式如式（9）和式（10）所示：ct=t=0t-1at（9）at=Softmax(vTTanh(Whhvin+Wsst+Wccti+Wk-k+bAttention)（10）其中：v、Wh、Ws、Wc、Wk和bAttention是可学习参数。通过注意力得分加权编码器隐藏状态，得到上下文

39、向量h*t：h*t=iatihvin（11）在解码步骤 t 时刻，解码器状态st、上下文向量84第 49卷第 10期高玮军，刘健，毛文静：基于 T-HDGN模型的对话摘要生成方法h*t和主题向量-k通过 2个线性层产生词汇分布Pvocab，计算式如式（12）所示：Pvocab=Softmax(V(Vsth*t-k+b)+b)（12）其中：V、V、b和b是可学习参数。3.3.2指针机制受固定词汇表的限制，在生成摘要时可能会丢失一些主题词信息。因此需要引入指针机制来扩展目标词汇表使其包含主题词，通过指针网络决定从固定词汇表生成 1 个单词还是根据注意力分布at直接从输入序列复制 1 个单词。为此

40、，本文将主题词添加到开关的计算中，使解码器根据状态st、主题向量-k、上下文向量h*t和解码器输入xt共同计算指针开关pgen。具体计算式如式（13）所示：pgen=(wTh*h*t+wTsst+wTxxt+wTk-k+bptr)（13）其中：为 Sigmoid激活函数；wTh*、wTs、wTx和wTk均为可学习参数；bptr为偏置项。最终，在扩展词汇上的概率分布如式（14）所示：P(w)=pgenPvocab(w)+(1-pgen)i：wi=wati（14）对于每个时间步长 t，使用超参数加权覆盖损失imin()aticti并参与主损失函数计算，复合损失函数由目标词w*t的负对数似然损失和覆

41、盖损失 2部分组成。复合损失函数定义如式（15）所示：lloss t=-logaP(w*t)+imin(aticti)（15）4实验 4.1数据集为验证所提模型的可行性和有效性，本文在SAMSum 数据集上进行相关实验。SAMSum 数据集是 1个关于现实生活中各种场景下的英文对话数据集，包括闲聊、安排会议、讨论事件以及与同学讨论大学作业等话题。数据集中源对话的平均对话长度为 126.7（Token数），平均话语数为 11.1。每句话语均包含对话者的名字，大多数对话只有 2个对话人（约占所有对话的 75%），其余是 3 个或更多人之间的对话

42、。表 1 所示为 SAMSum 数据集的相关信息，包括每次会话中对话者数、话语数以及行动三元组这三者的平均数，“#”表示对应的统计总数，长度是指Token数。4.2实验环境与参数设置本文实验平台使用开源的深度学习框架PyTorch，编译语言为 Python3.6版本。由于深度学习模型对计算资源的要求相对较高，因此采用 GPU 进行训练来提高效率。在训练阶段，使用 Adam 优化器对模型进行优化，并使用最大梯度范数为 2 的梯度裁剪。节点编码器和指针解码器的维度都设为 300。在测试过程中，使用集束搜索（Beam Search）方法生成最

43、终的结果。集束搜索衡量了搜索空间和得到最优解概率的双重因素，每步会根据集束宽度 K 保留概率最大的K 个结果并继续按照词表搜索，直到生成过程结束。在模型测试阶段，本文设置 Beam Search的束宽为 5。具体实验参数如表 2所示。4.3评价标准本文实验采用自动文本摘要领域常用的评价工具 ROUGE 中的 ROUGE-1、ROUGE-2以及 ROUGE-L这 3 类评价指标的 F1 值来评估摘要质量。其中，ROUGE-1代表了自动文本摘要的信息量，ROUGE-2侧重于评估对话摘要的流畅性，而 ROUGE-L则基于最长公共子序列，可以认为是摘要对原文信息的覆盖量。ROUGE 值度量了生成的摘要

44、与目标摘要的接近程度。4.4结果分析4.4.1基准实验对比分析为验证所提方法在生成式对话摘要任务中的效果，本文选取了 7种基线模型进行对比实验。1）Longest-3 是一种提取式摘要方法，选取最长的三句话语按长度排序作为摘要。2）Seq2Seq+Attention是由 RUSH等7提出，使用基于 Attention机制的编码器来学习输入文本的潜在软对齐，以提供摘要信息。3）PGN8是指针生成网络，使用指针机制和覆盖机制解决了生成式文本摘要中的 OOV 和摘要重复问题。4）Transformer 是由 VASWANI 等25提出，是一种利用 Self-Attention机制实现快速并行的序

45、列到序列模型。表 1SAMSum 数据集相关信息 Table 1Related information of SAMSum dataset单位：个数据集训练集验证集测试集#对话14 732818819#对话者2.402.392.36#话语11.1310.7211.24#行动三元组6.726.486.81表 2实验参数设置Table 2Experimental parameter settings实验参数词嵌入维度图编码器维度节点编码器维度学习率Dropout图层数/层数值1002003000.0010.51852023年 10月 15日Computer Engineering 计算机工程5）F

46、ast Abs RL9是一种基于两阶段式的摘要模型，首先由抽取器选择重要句子，然后生成器对抽取出的句子重写得到最终摘要。6）Fast Abs RL Enhanced是 Fast Abs RL 的变形，由于原模型可能会选择 1个人的话语而没有关于其他对话者的信息，因此它将所有其他对话者的名字添加到话语的结尾。7）T-GAT 是本文模型的变形，将异质图层替换为同质图层的图注意力网络（Graph Attention Network，GAT）26。考虑到计算资源有限，本文没有使用预训练语言模型（如 BERT）。因此，为了公平起见，本文只和未使用预训练语言模型的方法进行比较。不同模

47、型的实验结果对比如表 3所示，Separator是人为添加的1个标记来分隔话语。从表 3 可以看出，与原模型相比，使用了分隔符（Separator）使得对应模型的性能有所增加，这是因为通过人工添加特殊标记改善了语篇结构。与传统的抽取式方法 Longest-3 相比，T-HDGN 在 ROUGE评价指标上获得了较大的提高，说明生成式方法具有明显的优势。与表现较优的 Fast Abs RL Enhanced模型相比，在不需要使用强化学习策略和简化训练过程的情况下，T-HDGN 模型在 ROUGE 得分上依然具有优势。与同质网络 T-GAT相比，基于异质图网络的 T-HDGN 模型在 ROUGE-1

48、、ROUGE-2、ROUGE-L上分别提升了 0.70、0.98 和 0.61 个百分点，表明异质性建模具有一定的有效性。此外，T-HDGN 模型的性能均优于其他生成式方法 Seq2Seq+Attention、PGN 和 Transformer，说明通过图结构对会话进行建模时，异质图网络可以有效地融合信息并捕获语句间丰富的语义关系，解决了对会话上下文理解不充分的问题。此外，使用行动三元组有助于模型理解说话人与其对应动作之间的正确关系，提高摘要的生成质量。4.4.2消融实验为验证该模型中主要模块对生成对话摘要的有效性，本文进行消融实验，验证对话图中行动节点和对话者节点这 2

49、种不同类型节点的有效性。消融实验结果如表 4 所示，T-HDGN w/o action 表示移除对话图中的行动三元组节点，T-HDGN w/o speaker 表示移除对话图中的对话者节点。缺失行动三元组节点和对话者节点均降低了模型生成摘要的效果。其中，移除行动三元组节点使得 ROUGE-1、ROUGE-2、ROUGE-L评分分别降低了0.48、0.67 和 0.71 个百分点，这表明加入行动三元组（Who，Doing，What）有助于模型更充分地对会话上下文建模。此外，如果直接移除图中的对话者节点，将造成话语没有对应的说话人。因此，本文首先在话语前面加上说话人，然后移除对话者节点。实验结果表

50、明，移除对话者节点也导致了模型性能下降，说明异质性建模对话者节点能够更充分地学习到会话的上下文表示，有利于最终摘要的生成。此外，为了验证在指针机制和覆盖机制中融入主题词对生成摘要的有效性，同样进行消融实验，结果如表5所示。T-HDGN w/o TP表示移除主题词的指针机制，T-HDGN w/o TC表示移除主题词的覆盖机制。从表 5可以看出，在移除了覆盖机制和指针机制中的主题词后，模型性能都不如完整的T-HDGN模型，说明对于关键信息分散在不同话语中的会话，主题关键词有利于模型生成信息丰富且真实的对话摘要。4.4.3对话者数和转换数对模型的影响为了探究会话中对话人数和转换数对 ROUGH指标的

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 HDGN 模型对话摘要生成方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。