基于时延神经网络模型的舰船辐射噪声目标识别.pdf
《基于时延神经网络模型的舰船辐射噪声目标识别.pdf》由会员分享,可在线阅读,更多相关《基于时延神经网络模型的舰船辐射噪声目标识别.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 42 卷 第 5 期Vol.42,No.52023 年 9 月Journal of Applied AcousticsSeptember,2023 研究报告 基于时延神经网络模型的舰船辐射噪声目标识别赵乾坤刘 峰梁秀兵汪 涛宋永强(军事科学院国防科技创新研究院北京100071)摘要:水声目标被动识别是水声信号处理领域的研究热点之一。深度学习作为一种数据驱动方法,以其对非线性系统的良好拟合能力,为水声目标识别领域提供了新思路。该文采用一种基于时延神经网络模型的舰船辐射噪声目标识别方法,该方法利用目标的短时平稳特性和长时关联特性对目标的声纹特征进行建模,使用梅尔谱图提取目标信号的初级特征,再通
2、过融合注意力机制和时延神经网络的深度学习模型实现高级特性提取,最后利用余弦相似度实现不同目标的类别划分。该方法在ShipsEar数据集和自行采集的数据进行测试验证,目标识别准确率分别达到79.2%和73.9%,可证明该方法的有效性。关键词:水声目标识别;舰船辐射噪声;时延神经网络;注意力机制中图法分类号:TB566文献标识码:A文章编号:1000-310X(2023)05-1033-09DOI:10.11684/j.issn.1000-310X.2023.05.017Target recognition of ship radiated noise based on time delay ne
3、uralnetwork modelZHAO QiankunLIU FengLIANG XiubingWANG TaoSONG Yongqiang(National Innovation Lnstitute of Defense Technology,Academy of Military Sciences,Beijing 100071,China)Abstract:Passive recognition of underwater acoustic targets is one of the research hotspots in the fieldof underwater acousti
4、c signal processing.As a data-driven method,deep learning provides a new idea forunderwater acoustic target recognition because of its good fitting ability to nonlinear systems.This articleadopts a ship radiated noise target recognition method based on the time delay neural network(TDNN)model.This m
5、ethod uses the short-term stationary and long-term correlation characteristics of the target tomodel the voiceprint features of the target.The Mel spectrum is used to extract the primary features of thetarget signal,and then advanced feature extraction is achieved through a deep learning model that
6、integratesattention mechanism and time-delay neural network.Finally,cosine similarity is used to achieve classificationof different targets.This method was tested and validated on the ShipsEar dataset and self collected data,andthe target recognition accuracy reached 79.2%and 73.9%,respectively,demo
7、nstrating the effectiveness of theproposed method.Keywords:Underwater acoustic target recognition;Ship radiated noise;Time delay neural network;Attention mechanism2023-06-13收稿;2023-07-28定稿国家自然科学基金项目(62201608)作者简介:赵乾坤(1992),男,吉林白山人,硕士研究生,研究方向:水声信号处理。通信作者 E-mail:liufeng_10342023 年 9 月0 引言水声目标识别技术对维护海洋
8、权益、海洋资源开发具有十分重要的作用,在反潜、鱼雷防御、海底地形勘探等领域应用广泛1。前期研究表明,水声信道受海洋环境的影响会产生多径、衰减、畸变等复杂变化,多种类别的水声信号耦合在一起,使得舰船信号往往淹没在背景噪声之中。同时,舰船辐射噪声具有较大的类内差异性和类间相似性,使得同类型目标在不同的航行状态和环境下,具有不同的噪声辐射特性。除此之外,水声目标类别十分广泛,如渔船、货轮、军舰等水面目标;潜艇、海洋生物、钻井平台等水下目标,这些问题都增加了水声信号的识别难度。因此,水声信号目标识别一直是国内外水声领域公认的难题。传统的水声信号特征提取方法经过多年的发展,已经从简单的时域或频域特征发展
9、到时-频结合、人耳听觉感知、高阶统计量等特征分析方法。其中,时频分析方法提供了时间域与频率域的联合分布信息,可以清楚地描述信号频率随时间变化的关系,是目前最为常用的特征提取方法,如短时傅里叶变换(Short time Fourier transform,STFT)2、梅尔频率倒谱系数(Mel-Frequency cepstral coefficients,MFCC)3、希尔伯特-黄变换(Hilbert-Huang trans-form,HHT)等。分类器设计方面,常用的方法包括隐马尔科夫模型(Hidden Markov model,HMM)、高斯混合模型(Gaussian mixed mode
10、l,GMM)、支持向量机(Support vector machine,SVM)以及级联分类器等都在水声信号识别中得到了应用。然而,传统方法的参数有限无法对大规模数据和海洋环境进行建模,系统部署后难以进行数据的迭代更新,这些问题都使得水声信号依然长期依赖人工判读。近年来,深度学习技术的快速发展,以其对非线性系统的良好拟合能力,为水声目标识别领域提供了新思路。基于深度学习的水声目标识别算法可以利用神经网络自动地学习特征并完成分类。越来越多的研究人员开始采用深度学习进行声目标识别研究,并借助深度神经网络实现特征优化和目标识别45,可有效提高自动识别系统的泛化能力和环境适应性。Kamal等6首先将深
11、度置信网络(Deep belief network,DBN)模型应用于水声信号被动目标识别任务中,在40个类别的目标共1000个测试样本的测试集上取得了90.23%的分类正确率,结果表明利用深度学习模型进行水下目标识是一种可行的途径。王强等7从3类目标的实测水声数据库中提取梅尔倒谱特征及傅里叶变换特征,比较了DBN、卷积神经网络(Convolutionalneural networks,CNN)、SVM的识别率,其中DBN的识别率最高。Yue等8使用CNN和DBN对16种不同类型的水声目标进行了分类,在有监督和无监督的情况下,其准确率分别达到94.75%和96.96%,其结果优于对比实验中SV
12、M和Wndchrm(用于生物图像分析的开源程序)的识别精度。考虑到水声目标信号的时序性质,也有学者应用时序模型开展智能识别研究。张少康等9应用长短时记忆(Long short-term memory,LSTM)网络分别对水下目标噪声的时域时间序列数据、频谱数据、梅尔倒谱数据进行深层次特征提取与识别,并使用实际水声目标噪声信号对该方法进行了验证。结果表明,在上述3种输入数据情况下,采用LSTM模型均能有效实现水下目标噪声特征提取与智能识别。Li等10提出了一种基于时延神经网络(Timedelay neural network,TDNN)的分类器,用滤波器组(Filter bank,Fbank)提
13、取包含频谱信息的特征作为网络的输入,实验结果表明,该方法比SVM等传统方法具有更高的分类精度,且在真实环境下的三重分类实验中准确率达到90%以上,说明该分类器在建模时间序列和表示复杂非线性关系方面具有很大的优势。随着注意力机制(Attention)在自然语言处理领域的成功应用,许多学者将注意力机制运用到水下目标识别领域,也取得了不错的识别效果。Li 等11提出了一种基于注意机制和迁移学习的船舶辐射噪声识别方法,在公共数据集上实现了99%的识别准确率;徐承等12将多维自注意力机制引入多特征融合水下目标识别框架,分别在特征维度和时间维度高效完成深层次目标弱信息特征抽取,显著提升了识别效果。经以上研
14、究启发,本文尝试基于注意力机制和TDNN构建深度网络架构,进行有效地舰船辐射噪声数据深层特征挖掘和分类识别。结果表明,本文验证的网络架构方法有效。第42卷 第5期赵乾坤等:基于时延神经网络模型的舰船辐射噪声目标识别10351 方法介绍1.1Fbank初级特征提取人耳在不同频率下的感知是多样化和非线性的,基于人耳听觉特征的MFCC和Fbank被广泛应用,它们都使用梅尔滤波器组,不同之处在于Fbank特征没有进行离散余弦变换,离散余弦变换去除了各维信号之间的相关性,这也使得没有进行此步骤的Fbank特征更具有声音的本质信息,且比MFCC计算量更小13。Fbank特征不仅可以改善声信号的线性感知能力
15、,能更好地表征声频的在低频部分的频域特征,提高声纹识别的性能,而且在声纹识别实验中发现Fbank特征比MFCC特征表现更好。由于水声目标识别与声纹识别的任务相似性,所以本文采用Fbank特征输入后续网络,如图1所示,它的一般步骤是:预加重、分帧、加窗、STFT、梅尔滤波等。?FFT?Fbank图1Fbank特征提取流程Fig.1 Fbank feature extraction process预加重:主要是对高频部分进行补偿,将舰船辐射噪声信号输入传递函数的高通滤波器进行处理,能够提升高频的能量,帮助提升识别的效果。对于n时刻信号的采样值xn,经过预加重处理后得到的输出:y n=xn a xn
16、 1,(1)其中,a为预加重系数,取值一般在0.91之间。分帧:舰船辐射噪声信号具有短时平稳性,为了能在短时“小段”上进行傅里叶变换,将信号按照给定长度切割成一个个小段,称之为分帧。为了避免分帧后的相邻帧变化过大,一般会保留一些两帧间的重叠区域。加窗:是在信号分帧后对每一帧乘上一个不断移动的有限长窗函数的过程。窗外的值设定为0,其目的是消除各个帧两端可能会造成的信号不连续性,避免出现吉布斯效应。本文使用汉明窗:w(n,a)=(1 a)acos(2nN 1),06n6N 1,0,其他,(2)其中,N 为窗口长度。快速傅里叶变换(FFT):为了将信号从时域转换到频域,得到频谱上的能量分布,便于观察
17、不同的信号特性。在乘上汉明窗后,每帧要经过FFT以得到各帧的频谱。假设采样点是N,则计算如下:xk=N1n=0 xnej2Nkn,0 6 k 6 N 1.(3)梅尔滤波器组:将功率谱通过一组梅尔刻度的三角滤波器来提取频带,滤波器组中的每个滤波器都是三角形的,中心频率为f(m),中心频率处的响应为1,并向0线性减小,直到达到两个相邻滤波器的中心频率,其中响应为0,各f(m)之间的间隔随着m值的增大而增宽。经过FFT 的信号分别与每个滤波器进行频率相乘累加,得到的值即为该帧数据在该滤波器对应频段的能量值。单独滤波器的表达式为Hm(k)=0,k f(m 1),2(k f(m 1)(f(m+1)f(m
18、 1)(f(m)f(m 1),f(m 1)k f(m),2(f(m+1)k)(f(m+1)f(m 1)(f(m)f(m 1),f(m)k f(m+1),(4)式(4)中,M1m=0Hm(k)=1。10362023 年 9 月最后,计算每个滤波器组输出的对数能量为s(m)=ln(N1k=0|Xa(k)|2Hm(k),0 6 m 6 M.(5)得到梅尔频谱图如图2所示。7060504030201004321020100-10-20-30-40-50?/dB?/sFbank图2梅尔频谱图Fig.2 Mel spectrum1.2基于TDNN模型的高级特征提取水声信号是一种典型的时序信号,存在着时间关
19、联特性。本实验利用改进的TDNN沿时间轴采用一维卷积结构作为特征提取器14,将水声信号有区别地嵌入到一个向量空间中,利用水声信号的短时平稳特性提取帧级特征,然后将声频的帧级特征的均值和标准差连接起来作为长时特征,最后通过前馈网络实现目标类别的划分。深度特征提取网络依次由1个TDNN模块(卷积核长度为5)、3个带有压缩激励和分层类残差连接的残差块(SE-Res2Block)、1个TDNN模块(卷积核长度为1)和1个注意力统计池化模块(Attentive statistics pool-ing,ASP)组成。其中TDNN模块均包含ReLU激活层和一个批处理规范化层(Batch normalizat
20、ion,BN)。而且,由于神经网络可以学习分层特征,这些更深层次的特征是最复杂的,应该与舰船类别密切相关,更浅的特征图也有助于提取更鲁棒的舰船声纹嵌入码。因此,采用的网络模型连接所有SE-Res2Block的输出特征,多层特征聚合(Multi-layerfeature aggregation,MFA)之后,用一个全连接层(Fully connected layer,FC)处理连接的信息,输入到ASP后,生成得到帧维度的均值向量和标准差向量15,再经过一个 FC生成192维度的特征,然后用AAM-Softmax方式进行分类识别。具体网络结构如表1所示,其中T 为时间帧数,k表示卷积核长度,d表示
21、空洞卷积维度。表1深层特征提取网络结构Table 1Deep feature extraction networkstructure层结构输入维度输出维度0Conv1D+ReLU+BN(k=5,d=1)80T512T1SE-Res2Block(k=3,d=2)512T512T2SE-Res2Block(k=3,d=3)512T512T3SE-Res2Block(k=3,d=4)512T512T4Conv1D+ReLU+BN(k=1,d=1)1536T1536T5ASP+BN1536T307216FC+BN3072119217AAM-Softmax分类1921S1其中,SE-Res2Block模
22、块作为特征建模模块,如图3所示,由两个相同的带有ReLU激活层和BN层的TDNN模块、1个带有ReLU激活层和BN层的分层类残差连接的残差块(Res2Block)、1个压缩激励模块(Squeeze-and-excitation block,SE-Block)和1个从输入到输出的直接连接构成。一维Res2Net模块将输入通道平均分成8个部分,如图4所示,第一个特征图保留,不进行变换,这是对前一层特征的复用,同时也降低了参数量和计算量。从第二个特征图开始,都经过一个3 512的一维卷积,并且当前特征图的卷积结果,会与后一个特征图进行残差连接(逐元素相加)。然后,后一个特征图再进行3 512的一维卷
23、积。最后,将所有输出通道部分合并为Res2Block输出。这样使得层内融合了不同尺度的特征,可获得更强的表征。整体网络模型13层Res2Block的空洞卷积膨胀率d分别为2、3、4。Conv1DReLUBNRes2Conv1DReLUBNConv1DReLUBNSE-Blockk/k/k/?图3SE-Res2Block结构示意图Fig.3 SE-Res2Block structure diagram第42卷 第5期赵乾坤等:基于时延神经网络模型的舰船辐射噪声目标识别1037X1X2X3X4X5X6X7X8Y1Y2Y3Y4Y5Y6Y7Y83?5121?1?3?5123?5123?5123?512
24、3?5123?5121?1图4Res2Conv1DReLUBN结构Fig.4 Res2Conv1DReLUBN structure在SE-Res2Block的最后使用了SE-Block,它是现代卷积神经网络所必备的结构,引入通道注意力机制,对通道间的依赖关系进行了建模,可增强有用的通道和抑制无用的通道,能够有效地提升性能,而且计算量并不大。基本思路如图5所示,是将一个T 1 512的特征图的每个特征通道都映射成一个值(常用全局平均池化,即:取该特征通道的均值,代表该通道),从而特征图会映射为一个向量,长度与特征通道数一致。之后,向量通过FC(与用1维卷积等价)进行降维,输出长度为特征通道数的1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 神经网络 模型 舰船 辐射 噪声 目标 识别
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。