基于自注意力和长短期记忆网络的管制信息抽取模型.pdf

上传人：自信****多点

文档编号：579941

上传时间：2024-01-02

格式：PDF

页数：3

大小：2.09MB

《基于自注意力和长短期记忆网络的管制信息抽取模型.pdf》由会员分享，可在线阅读，更多相关《基于自注意力和长短期记忆网络的管制信息抽取模型.pdf（3页珍藏版）》请在咨信网上搜索。

1、AutomaticControlSySystem&Equipment自动控制系统与装置电气自动化2 0 2 3年第45卷第4期于自注意力和长短期记忆网络的管制信息抽取模型王雪川，王煊”，杨涛，雷宁，王磊（1.北京首都国际机场股份有限公司，北京10 1317；2.中国电子科技集团公司第二十八研究所空中交通管理系统与技术国家重点实验室，江苏南京2 10 0 0 7）摘要：管制指令的正确理解对飞行安全具有重要意义，从指令中提取管制信息有助于管制员的理解。为实现管制信息的自动提取，提出了一种新的管制信息抽取模型。模型基于自注意力和长短期记忆网络，将管制指令转换成标签序列，并学习标签之间的长距离依赖性，

2、实现管制信息的精确抽取。通过试验可知，新模型对管制信息的抽取精度不低于97%。由此可见，新模型可赋予计算机对管制信息的自动提取能力，辅助管制员工作，保障飞行安全。关键词：管制指令；信息抽取；长距离依赖性；自注意力网络；长短期记忆网络D0I:10.3969/j.issn.1000-3886.2023.04.024中图分类号V355.11文献标志码A文章编号10 0 0-38 8 6(2 0 2 3)0 4-0 0 7 6-0 3Regulation Information Extraction Model Basedon Self-attention and Long Short-term Me

3、mory NetworkWang Xuechuan,Wang Xuan,Yang Tao,Lei Ning,Wang Lei(1.Bejing Capital International Airport Co.,Ltd.,Beijing 101317,China;2.State Key Laboratory of Air Traffic Management System and Technology,Nanjing Jiangsu 210007,China)Abstract:The correct understanding of the control instruction is of

4、great significance to flight safety,and the extraction of control informationfrom the instruction will help the controllers understanding.In order to realize the automatic extraction of regulatory information,anew regulatory information extraction model was proposed.Based on self-attention and long

5、short-term memory network,the modelconverted regulatory instructions into label sequences,and learned long-distance dependencies between labels to achieve accurateextraction of regulatory information.The experiment shows that the precision of the new model is not less than 97%.It can be seenthat the

6、 new model can endow the computer with the ability to automatically extract control information,assist the controller andensureflight safety.Keywords:control instruction;information extraction;long-distance dependency;self-attention network;long short-term memory network0引言空中交通管制员使用管制指令引导航空器飞行，长期以来，

7、因管制指令理解错误而导致的飞行事故不胜枚举。加强空管系统对指令的解析将有助于管制员及时发现错误，对保障航空运输安全具有重大意义。由于管制指令是非结构的，需要人工智能算法辅助抽取关键信息。当前的方法可分为三类：一是基于语法规则抽取管制信息2；二是基于机器学习，使用隐马尔可夫模型3抽取管制信息；三是基于深度学习，构建卷积神经网络4或循环神经网络5-7 抽取管制信息。管制指令包含航班呼号、动作、朝向、停机位、滑行道等待点和跑道等信息，涉及航空器飞行全过程。为规范管制指令，国际民航组织做出了明确规定8，具有以下特点：包含大量专业术语；具有固定结构和规则。但在实际管制中，管制员发送的管制指令会出现重复、

8、隐字、口语或加字现象。这使得指令结构被破坏，词语顺序被扰乱，信息间依赖距离增加，上下文呈现随机分布，导致基于语法规则方法难以有效提取管制信息。基于机器学习和深度学习的方法虽然具有鲁棒性，但未考虑管制信息间依赖距离增加的情况，导致模型仍具有一定误差。定稿日期：2 0 2 2-0 3-0 876ElectricalAutomation本文基于自注意力网络（self-attentionnetwork，SA N）和长短期记忆（longshort-termmemory，LST M）网络，提出一种新的管制信息抽取模型，可以有效捕捉信息之间的长距离依赖关系，更精确地抽取管制信息1基本网络1.1LSTM网络基

9、本原理循环神经网络（recurrentneuralnetwork，R NN）可用于处理序列问题，通过引人定向循环方式，更好处理输人序列间的关联问题。LSTM是RNN的一种变形结构，可解决RNN的梯度消失和梯度弥散问题，核心是LSTM单元，包括了输入门、输出门、遗忘门和记忆单元，记忆单元用于存储某时间段的历史信息。定义输人文本序列为x=x1,2，,x T，其中：T为序列长度。LSTM网络在t时刻的输出计算如式（1）所示i,=o(Wxix,+Whht-1+Waci-1+b,)f,=o(Wwx,+Whr-1+Wagci-1+by)c,=fic,-1+i,tanh(Wex,+Whcht-1+b.)(1

10、)0,=o(Wox,+Whohi-1+Wcoc,+b.)(h,=o,tanh(c,)式中：x,为在序列位置t上的字符；h，为位置t上的模型隐藏状态；i,f.o,分别为位置t上输入门、遗忘门和输出门的输出序列；c,ElectricalAutomation77AutomaticControlSystem&Equipment自动控制系统与装置电气自动化2 0 2 3年第45卷第4期为位置t上的记忆单元状态；（）为sigmoid函数，且tanh（z）=2g（2 z）-1;Wi、W、W*。、W*。为输入门、遗忘门、输出门和记忆单元的连接权重，*=x,h,c;b,、b、b。b.为输人门、遗忘门、输出门和记

11、忆单元的偏置项。LSTM从前向后训练，在位置t上无法学习后面的语义信息。而管制指令中的信息依赖上下文内容，需要使用双向LSTM网络（BiLSTM）BiLSTM的网络结构如图1所示，由两个方向相反的LSTM网络组成，正向LSTM网络和反向LSTM网络分别从序列的首尾两个方向处理输人序列。正向LSTM网络捕获目标位置词的上文特征，反向LSTM网络捕获目标位置词的下文特征，拼接后输出结果，因此同时学习了信息的上下文内容。输出LSTMJLSTMLSTMLSTM单元单元单元单元一反向正向JLSTMJLSTMLSTMLSTM单元单元单元单元输入图1BiLSTM网络结构1.2SAN网络基本原理SAN网络学习

12、较长距离信息间的依赖关系，SAN网络由多头自注意力组成。多头注意力的核心是缩放点积注意力，工作机制描述如下：QKattention(Q,K,V)=softmax(2)式中：Q为查询向量；K是键向量；V为值向量；Va为比例压缩因子。通过QK计算Q和K之间的相似度，经过softmax归一化处理得到权重矩阵，并对V加权求和。多头注意力由多个比例点积注意力组合构成。如图2 所示，Q、K 和V经过线性变换得到多头注意力中不同比例点积注意力的输入向量，经过式（2）计算得到输出结果，然后将所有比例点积注意力的输出向量进行拼接后，再线性映射，得到多头注意力的输出向量。线性拼接h比例点积注意力机制性贷性线性性线

13、性我性线性线性线性VKV图2多头注意力结构网络堆叠而成。管制指令经过第一层BiLSTM-SAN网络处理后得到语义特征，再与第一层中BiLSTM输出拼接，生成第二层Bi-LSTM-SAN网络的输人向量。经过第二层BiLSTM-SAN网络的处理后得到标签序列。在此基础上，多头自注意力工作机制描述如下：Multihead(Q,K,V)=concate(hd,.,hd,)wo(3)hd,=attention(Qw?,Kw,Vw)式中：concate为拼接处理；hd；为注意力数量，i=1，,h；w oWK、WY为第i个连接权重将Q、K、V线性映射到线性空间得到的输出向量，拼接后映射到输出空间；Wo为线性

14、映射权重。2管制信息抽取模型管制意图抽取模型的结构如图3所示，由两层BiLSTM-SAN输出SAN3iSLSTM拼接SAN输入图3管制意图抽取模型结构假设输人序列x=x,2，,，输出标签=1,y2，,，经过BiLSTM后得到状态向量H，再输人SAN网络，输出H=Multihead(H,H,H）,拼接得到输出H=H ,H 。然后,将H输人第二层BiLSTM-SAN网络，SAN网络计算标签间的注意力值，输出y=yi,y2，,y r，可捕捉标签间长距离依赖关系。y为时刻t输出，y,eR,M|；M|为标签类型总数。经过softmax归一化处理得到y,对应标签c,cEO，|M I的概率ptc，选择最大概

15、率对应的标签类别作为输出y=C。训练模型时需构建数据集，定义损失函数和优化算法。使用BIO法标注管制指令，形成标签序列。其中B表示信息起始字，I表示信息非起始字，0 表示非信息字。针对不同类型信息表示如下：航班呼号用FL表示，动作用AC表示，停机位用SP表示，滑行道用TW表示，等待点用WP表示，跑道用RW表示，高度用HT表示，朝向用DI表示在训练时选择交叉熵作为损失函数，定义如下：Z.2y.log(pa)IMI1L(4)一N式中：N为训练数据量；IM|为标签类别数；yi为样本i类别为c的真实标签;Pl为模型预测位置t上的字属于标签c的概率。在反向传播计算中选择随机梯度下降（stochastic

16、gradientdescent，SGD）作为优化算法。3仿真分析采集50 0 0 条真实管制指令数据进行验证。随机选择450 0条作为训练集，50 0 条指令作为测试集。数据在不同运行场景中的分布如图4所示。数据分布较为均匀，数量在50 0 10 0 0之间。模型的训练参数如表1所示。78ElectricalAutomation本AutomaticControlSystem&Equipment自动控制系统与装置电气自动化2 0 2 3年第45卷第4期120010008006004002000推出滑出进跑道起飞落地脱离进停开车等待跑道机位管控指令图4管制指令数据分布在训练过程中，SCD算法参数为

17、:=0.9,学习率=110-2。模型训练结果如图5所示，在经过2 0 0 轮的训练之后，训练误差收敛至2.32%，使用测试集进行验证，测试误差为2.45%。仿真结果可验证该管制信息抽取模型的有效性。1.00.90.80.70.60.50.40.30.20.10050100150200训练次数/次图5模型训练结果4丝结束语文提出一种基于SAN和LSTM网络的管制信息抽取模型（上接第7 5页）当加入虚拟阻抗控制系统后，在相同电网阻抗条件下，并网电流的THD得到明显改善,如图6(b)所示。试验结果验证了所提出的虚拟阻抗控制策略对于提高LCL型逆变器系统在弱电网条件下并网适应性、工作稳定性和有效性。4

18、绍结束语（1）当电网短路容量相对较小时，传统电网电压前馈控制引人的不稳定区域主要位于低频段，严重影响了LCL型逆变器的并网适应性和系统控制稳定性。（2）提出一种基于并网电流反馈的虚拟阻抗控制系统，并通过在低频段引入超前相角以补偿电压前馈引人的相角滞后（3）5k W单相LCL并网逆变器原理样机试验充分验证了本文所提出的控制策略的有效性和正确性。后续拟进一步针对数字控制的延时环节和不同电网电压前馈比例因数等因素，对所提出的LCL型并网逆变器虚拟阻抗控制系统的适应性进行深人分析和研究。参考文献：【1】陈新，韦徽，胡雪峰，等三相并网逆变器LCL滤波器的研究及新型有源阻尼控制J.电工技术学报，2 0 1

19、4，2 9（6）：7 1-7 9.【2 李建文，阮筱菲，李永刚，等。弱电网下多LCL型并网逆变器谐振模态分析J太阳能学报，2 0 2 1，42（2）：346-355.表1训练参数参数数值参数数值批次大小16学习率1 10-2输入句子长度40随机丢弃率0.1在管制指令结构受随机扰乱，信息间依赖距离增加的情况下，仍能精准抽取管制信息。该模型可辅助空管系统解析管制指令，为管制辅助决策和场面冲突告警等应用提供有效支撑参考文献：【1王爱国陆空通话与飞行安全J：中国民用航空，2 0 0 6（1）：6 9-70.【2 陈亚青，蒋豪，韩丹管制指令语音识别在模拟飞行界面的实现J.计算机系统应用，2 0 16，2

20、 5（11）：2 6 5-2 6 9.【3李春利，董冠灵，郭倩：基于HMM的空管指令语音识别研究C】/智能运输系统学术研讨会，天津：2 0 0 7.【4杨金锋，卢薇冰，贾桂敏，等基于深度卷积神经网络的陆空通话语义一致性校验J中国民航大学学报，2 0 18，36（1）：37 41.5 LU Y J,SHI Y H,JIA G M,et al.A new method for semanticconsistency verification of aviation radiotelephony communication basedon LSTM-RNN C.IEEE International

21、Conference on Digital SignalProcessing(DSP),2016:422-426.6 JIAG M,LU Y J,LU W B,et al.Verification method for Chineseaviation radiotelephony readbacks based on LSTM-RNNJ.ElectronicsLetters,2017,53(6):401-403.【7 李丹，贾桂敏，程方圆，等陆空通话复诵语义自动化校验BiLSTM模型J信号处理，2 0 19，35（1）：57-6 4.【8 中国民用航空总局空中交通无线电通话用语指南M成都：西南

22、交通大学出版社，2 0 0 5.【作者简介】王雪川（198 7 一），男，四川茂县人，工程师，学士，主要从事空中交通管理理论研究工作。王煊（198 9一），男，江苏南京人，高级工程师，博士，主要从事自然语言处理方法研究工作。杨涛（198 5一），男，安徽合肥人，高级工程师，学士，主要从事空中交通管理理论研究工作。雷宁（198 2 一），女，四川内江人，工程师，硕士，主要从事空中交通管理理论研究工作。王磊（198 8），男，山东临沂人，工程师，硕士，主要从事空中交通管理理论研究工作。3 XU J,XIE S,TANG T.Improved control strategy with grid-v

23、oltagefeedforward for LCL-filter-based inverter connected to weak grid J.IET Power Electron.,2014,7(10):2660-2671.4】汪春江，孙建军，宫金武。并网逆变器与电网阻抗交互失稳机理及阻尼策略J.电工技术学报，2 0 2 0，35（2）：50 3-511.5】郭利辉。三相并网逆变器的LCL滤波器设计及其有源阻尼策略研究J，电力电容器与无功补偿，2 0 17，38（4）：18 3-18 8.【6 王俊峰，杨艳蓉。DSTATCOM并网侧LCL滤波器设计研究J电力电容器与无功补偿，2 0 17，

24、38（2）：52-57.7 陆庆，张建，郑崇伟.LCL滤波器参数性能的比较J现代电子技术,2 0 15,38(2)：12 1-12 3.8 SUN J.Impedance-based stability criterion for grid-connected invertersJ.IEEE Transaction On Power Electronics,2011,26(11):3075-3078.【9鲍陈磊，阮新波，王学华，等.基于PI调节器和电容电流反馈有源阻尼的LCL型并网逆变器闭环参数设计J.中国电机工程学报，2012,32(25):133-142.10 WANG J,YAO J,HU H,et al.Impedance-based stability analysis ofsingle-phase inverter connected to weak grid with voltage feed-forwardcontrol C.IEEE Applied Power Electrics Conference and Exposition(APEC),California,2016:2182-2186.【作者简介】史沁鹏（197 9一），男，山西沁水人，硕士，高级工程师，研究方向：发电、综合能源及微电网技术及应用。

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于注意力长短记忆网络管制信息抽取模型

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。