基于自适应软掩模的语音混合特征增强分析.pdf
《基于自适应软掩模的语音混合特征增强分析.pdf》由会员分享,可在线阅读,更多相关《基于自适应软掩模的语音混合特征增强分析.pdf(4页珍藏版)》请在咨信网上搜索。
1、66ELECTRONIC ENGINEERING&PRODUCT WORLD 2023.8$电子产品世界Design设计应用&Application智能应用基于自适应软掩模的语音混合特征增强分析Speech mixing feature enhancement analysis based on adaptive soft mask闫泽愿(新乡职业技术学院,信息工程学院,河南新乡453000)摘 要:为了提高语音混合特征增强效果,设计了一种以自适应软掩模与混合特征共同分析算法来实现。以混合特征分析可以消除单一梅尔域滤波器无法提供高频特征的缺陷。研究结果表明:选择融合相位自适应软掩模方式时,能够
2、最大程度去除背景噪声。以本文融合相位差自适应软掩模可以获得比IRM更显著优势,经过优化处理的语音特征与学习目标构建得到的语音增强算法能够促进语音质量的明显提升。以自适应软掩模与混合特征训练神经网络处理获得优秀的信 噪比,达到更优的算法性能。关键词:语音增强;自适应软掩模;DNN;混合特征目前,音频处理技术获得了众多学者的关注与研究,相关语音处理技术也得到了开发应用1-2。例如,在开展语音增强时,需要根据语音特征来判断语音信息,各项语音特征对应的语音信息也存在差异,实际性能也具有明显区别3。但根据传统语音特征进行分析时,滤波器存在较大限制,并不能对人耳听觉非线性过程达到良好匹配性,这对系统语音增
3、强过程具有明显阻碍4。其中,梅尔滤波器组在高频率段表现为更加稀疏的特点,由此造成高频特征丢失的结果,按照人耳耳蜗结构构建的伽马通滤波器组能够非常准确体现人耳基底膜结构特征,同时实现优异鲁棒性能5,6。根据上述研究结果,本文设计了一种以自适应软掩模与混合特征共同分析的算法来实现语音增强的效果。以混合特征进行分析时,可以消除单一梅尔域滤波器无法提供高频特征的缺陷。1 本文方案选择IRM作为学习目标时,可以根据语音能量与噪语音强度比例将其设置于 01 区间内。采用 IRM 建立学习目标时,可以获得较小失真度的增强语音,同时有效消除背景残留噪声。关于上述传统学习目标控制情况,本文开发了一种以语音相位差
4、实现的自适应软掩模语音增强方法。上述学习目标综合考虑了语音幅度与相位差,能够对问题形成更深刻的理解。以混合特征组成深度神经网络输入,再以融合相位参数的自适应软掩模来实现语音增强的效果。此算法由训练与测试 2 个过程构成,从图 1 中可以看到包含混合特征与融合相位的系统框图。图1 本文语音增强算法系统 2023.8电子产品世界设计应用Design&Application智能应用1.1 训练阶段训练阶段第 1 步先对纯净语音、信号噪声、含噪语音实施预处理,之后利用 Gammatone 滤波器对上述音频信号开展时频分解,由此获得耳蜗值。进行反向调优时采用最小均方误差法进行处理,结果见式(1):EVt
5、 fVt ftsoft=T1tT=1(,)(,)soft)2(1)式中,Vt fsoft(,)与 Vt fsoft(,)分别对应第 t 帧与第 f 频带最优时频掩蔽参数与采用网络模型估计得到的输出结果,T 为语音帧的总数量。1.2 测试阶段测试阶段先提取获得语音特征参数,再将其输入神经网络模型内,并根据网络模型确定学习目标。综合考虑测试集含噪语音特征与时频掩蔽值确定增强语音特征,最终利用含噪相位完成语音数据的重构。2 实验结果与分析2.1 实验数据的选取为了对本文混合特征与自适应软掩模过程的性能特点进行验证,从IEEE语音数据库内选出90条独立语音,信号频率保持一致。按照同样信噪比对剩余 20
6、 条纯净语音与噪声后半段进行混合处理形成测试集。2.2 对比实验分析根据表 1 给出的对比算法对本文混合与学习目标进行有效性测试。表1 对比实验内容及其编号对比算法算法所使用的特征和学习目标算法1采用MFCC特征和IRM来训练DNN算法2采用混合特征和IRM来训练DNN算法3采用混合特征自适应软掩模来训练DNN以对比算法 1 进行处理是为了对本文混合特征性能优异性进行验证,根据对比算法 2 与 3 可知,本文建立的融合相位自适应软掩模能够满足有效性要求。为实现对本文算法性能的更直观判断,将语音置于 Factory 噪声环境中,控制信噪比为 5 dB 条件下获得增强算法时域波形。为综合分析本文算
7、法的实际处理性能,设置了PESQ 与 STOI 两个指标对混合特征与自适应软掩模进行有效性验证,得到表 24 中在不同噪声与信噪比环境中的 PESQ 与 STOI。根据表 2 可知,带噪语音信噪比为-5dB 的情况下,算法 1 与 2 显示,对于各噪声条件,PESQ 值提升了 0.11 的均值水平,STOI 值则获得了 0.02的提升。会与算法 2、3 相比,PESQ 值提升了 0.21,同时 STOI 提升了 0.02。表2 信噪比为-5dB的性能对比信噪比PinkFactoryWhitePESQSTOIPESQSTOIPESQSTOI带噪语音 1.2406 0.5851 1.3697 0.
8、5631 1.3352 0.6527算法11.5534 0.6862 1.5569 0.6279 1.8699 0.7581算法21.7685 0.7215 1.5678 0.6480 1.9852 0.7583算法31.9063 0.7372 1.8326 0.6832 2.2042 0.7751根据表 3 可知,带噪语音信噪比为 0dB 的条件下,各噪声下的 PESQ 值都提升达到 0.18,STOI 值提升了0.01。与算法 2、3 相比,PESQ 值提升了 0.16,同时STOI 提升了 0.01。表3 信噪比为0dB的性能对比信噪比PinkFactoryWhitePESQSTOIPE
9、SQSTOIPESQSTOI带噪语音 1.5285 0.6862 1.6079 0.6674 1.4695 0.7354算法12.0611 0.8071 1.8923 0.7559 2.2604 0.8379算法22.2108 0.8214 2.1517 0.7879 2.4040 0.8346算法32.4015 0.8305 2.3451 0.7951 2.4879 0.8497对表 4 进行分析可知,设置带噪语音信噪比 5dB 的条件下,各种噪声下的 PESQ 值都提升了近 0.12,此时STOI 值提升了 0.01。PESQ 值提升 0.16,STOI 指标提升 0.01。68ELECT
10、RONIC ENGINEERING&PRODUCT WORLD 2023.8$电子产品世界Design设计应用&Application智能应用表4 信噪比为5dB的性能对比信噪比PinkFactoryWhitePESQSTOIPESQSTOIPESQSTOI带噪语音 1.8554 0.7928 1.9261 0.7807 1.7930 0.8114算法12.4975 0.8841 2.4493 0.8664 2.6581 0.8982算法22.6582 0.8917 2.5654 0.8799 2.7428 0.8954算法32.8259 0.9072 2.7158 0.8885 2.9157
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 自适应 软掩模 语音 混合 特征 增强 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。