基于KH-KELM的鸟类声音分类识别.pdf
《基于KH-KELM的鸟类声音分类识别.pdf》由会员分享,可在线阅读,更多相关《基于KH-KELM的鸟类声音分类识别.pdf(7页珍藏版)》请在咨信网上搜索。
1、文章编号:2096-3424(2023)03-0279-07DOI:10.3969/j.issn.2096-3424.2023.03.013基于 KH-KELM 的鸟类声音分类识别沈希忠,陈菱(上海应用技术大学电气与电子工程学院,上海201418)摘要:鸟鸣是鸟类生物学最重要的特征之一,鸟鸣特征参数的选取和鸟鸣分类提高精度是学者们一直研究的方向。基于鸟鸣识别技术提出基于磷虾群优化的核极限学习机(KH-KELM)分类模型:采用 Mel 频率倒谱系数(MFCC)对上海周边具有代表性的 30 种鸟类声音信号进行特征提取,提取出的特征参数用极限学习机(ELM)作为基础分类模型进行识别和分类,结合核函数
2、思想优化基础模型并使用磷虾群算法(KHA)对训练参数优选,实现对鸟鸣信号的识别分类。为验证磷虾群算法优化的核极限学习机分类模型的分类效果和分类稳定性,对 5、10、20 和 30 种鸟类声音信号进行分类,测试结果表明,与极限学习机(ELM)、反向传播神经网络(BP)、支持向量机(SVM)和核极限学习机(KELM)分类模型对比,并与基于遗传算法(GA)、粒子群算法(PSO)和蚁群算法(ACO)优化的核极限学习机(KELM)模型对比,磷虾群算法优化的核极限学习机分类模型的分类识别率分别为 99.65%、97.79%、94.48%和 89.21%,具有最好的分类精度、分类稳定性和更强的泛化能力。关键
3、词:鸟鸣信号;Mel 频率倒谱系数;核极限学习机;磷虾群算法;分类识别中图分类号:TN911.73文献标志码:ABird sound classification and recognition based on KH-KELMSHENXizhong,CHENLing(SchoolofElectricalandElectronicEngineering,ShanghaiInstituteofTechnology,Shanghai201418,China)Abstract:Birdsong is one of the most important features of bird biology
4、.The selection of bird songcharacteristicparametersandtheimprovementofbirdsongclassificationaccuracyhavebeentheresearchdirections of scholars.Based on birdsong recognition technology,a kernel extreme learning machineclassificationmodelbasedonkrillherdoptimizationwasproposed.Themelfrequencycepstralco
5、efficient(MFCC)was used to extract the features of the representative 30 kinds of bird sound signals aroundShanghai.The extracted feature parameters were identified and classified by extreme learning machine(ELM)asthebasicclassificationmodel.Thebasicmodelwasoptimizedwiththecombinationofthekernelfunc
6、tionidea.Thekrillherdalgorithm(KHA)algorithmwasusedtooptimizethetrainingparametersfortherealizationoftherecognitionandclassificationofbirdsongsignals.Inordertoverifytheclassificationperformanceandstabilityofthekrillherd-optimizedkernelextremelearningmachine(KEML)classificationmodel,5,10,20and30birds
7、oundsignalswereclassifiedandcomparedwiththeELM,BP,SVMandKELM收稿日期:2022-07-07作者简介:沈希忠(1968-),男,教授,博士,主要研究方向为语音信号处理、图像处理与识别和人工智能等。E-mail:引文格式:沈希忠,陈菱.基于 KH-KELM 的鸟类声音分类识别 J.应用技术学报,2023,23(3):279-285.Citation:SHENXizhong,CHENLing.BirdsoundclassificationandrecognitionbasedonKH-KELMJ.JournalofTechnology,20
8、23,23(3):279-285.第 23 卷第 3 期应用技术学报Vol.23No.32023 年9 月JOURNAL OF TECHNOLOGYSept.2023http:/classification models,as well as the KELM model based on genetic algorithm(GA),particle swarmoptimization(PSO)and ant colony optimization(ACO).The results showed that the classificationrecognitionratesofthekrill
9、herdoptimizationkernelextremelearningmachineclassificationmodelwere99.65%,97.79%,94.48%and89.21%,respectively,withhigherclassificationaccuracy,stabilityandstrongergeneralizationability.Key words:bird sound;Mel frequency cepstral coefficient(MFCC);kernel extreme learning machine(KELM);krillherdalgori
10、thm(KHA);classificationandidentification鸟类作为环境生态系统不可或缺的指示生物之一,其种类的确定对生物多样性保护和生态平衡优化等起着十分重要的作用。鸟鸣声蕴含了丰富的鸟类生态学信息,其相关的研究成果可应用于鸟类行为分析与监护和生态环境状态监测等领域1。20 世纪 50 年代开始国内外学者不断提出特征提取算法2-3和各个分类模型4-5来实现特定声音的识别和分类。各种语音信号处理方法也被应用于鸟类声音特征的提取和分类中6,并不断有学者提出新的优化算法来提高分类准确率。早在 1997 年,McIlraith 等7利用反向传播和多元统计数据分析6 种原产于曼尼托
11、巴的鸟类鸟鸣特点,并获得了82%93%的泛化性能的正确识别率。Lucio 等8用支持向量机(supportvectormachines,SVM)分类器对鸟类鸣声频谱图提取出的 3 种纹理特征进行分类识别,实现最佳识别率 77.56%。魏静明等9在提取纹理特征的算法上增加和差统计法,验证了对鸟鸣声识别的有效性。程龙等10在 Mel 频率倒谱系数(Melfrequencycepstralcoefficient,MFCC)算法对鸟鸣信号进行快速傅里叶变换之前,增加经验模态分解算法,改进后的 MFCC 算法算对 7 种鸟声的识别率达到 70.09%。谢云澄11在基于图像识别的传统驱鸟设备中加入基于深度
12、学习的声音检测模块,对包含 3 种鸟类和 3 种环境声音的 6 种声音进行识别,最后得到最高 93.9%的识别准确率。极限学习机(extremelearningmachine,ELM)是一种自提出以来一直被很多学者,用来解决生活中的很多回归和分类问题的单隐层前向神经网络训练算法。Yang 等12采用局部三元模式提取面部图像特征,并构建面部图像的性别识别极限分类系统,识别准确率达到 87.13%。林伟铭等13将 ELM应用于阿尔茨海默病的诊断,准确率达到 87.62%。张 婷 慧 等14使 用 粒 子 群 算 法(particle swarmoptimization,PSO)优化混合核极限学习机
13、(kernelextremelearningmachine,KELM)参数,构建遥感影像信息分类模型,可达到 92.67%的分类准确率。鸟类对环境质量的变化很敏感,通过户外放置拾音器采集飞过的鸟类声音并识别其种类,分析鸟类种类的变化从而反馈环境质量的变化,并对变化做出相应措施,更好保护生态环境。为了验证KELM 在鸟类声音识别方面的效果,本文在 ELM理论的研究基础上,结合核函数理论和磷虾群算法(krillherdalgorithm,KHA)对使用 MFCC 算法特征提取的上海常出现的 30 种鸟类鸟鸣信号进行识别和分类,最后与 ELM、反向传播神经网络(backpropagation,BP)
14、、SVM、KELM 分类模型进行对比研究,通过识别的准确率来确定其结果的可靠性。1KELM 原理1.1KELMELM 是 Huang 等15提出的一种单隐层前向神 经 网 络(single-hidden layer feed forwardnetwork,SLFN)的训练算法,它随机分配隐藏层并分析确定 SLFN 的输出权重。ELM 训练指对输入数据先进行随机特征映射,再进行线性参数求解从而得出分类或预测结果。相比于传统的很多模型训练算法,ELM 是一种具有竞争力的机器学习技术,ELM 理论简单,实现速度快,有较强的泛化性能和鲁棒性,提出的框架可以使用多种特征映射函数或内核,而且所提出的方法可
15、以直接应用于多分类任务。SLFN 网络结构如图 1 所示。xi,ti i=1,2,Nxi1 nti1 m mg(x)对于 N 个不同的训练数据,是一个(n 为输入数据的维度)输入向量,是一个(为类的数量)的条目等于 1 的输出向量。含有个隐藏节点且激活函数为的数学模型可表示为:280应用技术学报第 23 卷http:/Ni=1igi(xj)=Ni=1ig(ixj+bi)=oj,j=1,2,N(1)i(i,bi)H=T式中:为第 i 个隐藏节点的权值;是随机产生的隐藏节点参数。式(1)也可表达为:。其中:H=g(1x1+b1)g(Nx1+bN).g(1xN+b1)g(NxN+bN)NN,=T1.
16、TNNm,T=tT1.tTNNm(2)g(i,bi,xi)式中:H 为隐藏层输出矩阵;是激活函数,通常用 Sigmoid 函数;T 是训练数据的目标矩阵。ELM 明显不同于传统的前馈神经网络的是,训练过程中唯一需要优化的参数是隐藏节点和输出节点之间的输出权重。在数学上,通过 ELM 训练 SLFN 可以转化为解决正则化最小二乘问题,不需要额外的迭代步骤来调整 SLFN 的参数,这比BP 类算法更有效。ELM 通过最小化以下损失函数来确定输出权重:minH T2,RNm(3)推导可得式(3)的最优解为:*=H1T(4)H1H式中,为的逆矩阵。实际问题中,训练样本的数量 N 明显大于隐藏节点的数量
17、,这种情况下,不存在 H 方阵,故也不存在 H 的逆矩阵。Huang 等16提供了另一种寻找最小范数最小二乘解的方法:=(HTH+1CI)1HTT(5)HTN N式中:是 H 的转置;C 是惩罚系数;I 是的单位矩阵。由于 ELM 在训练前随机选择参数,难以保证其稳定性和持续性,此时可以定义 1 个核函数:ELM=HHT:ELMi,j=h(xi).h(xj)=K(xi,xj)(6)K(xi,xj)h()式中:为核函数;为隐藏层神经元输出函数。KELM 的分类模型的输出可表达为:f(x)=h(x)HT(1CI+HHT)1T=K(x,x1).K(x,xn)T(1CI+ELM)1T(7)HKELM
18、模型无需使用随机参数,即不需要知道隐藏层输出矩阵,可有效增加模型的鲁棒性和稳定性。1.2核函数选择针对鸟类声音识别问题,核函数的选取很重要,对比多项式核函数、径向基(radialbasisfunction,RBF)核函数、线性核函数和 Sigmoid 核函数,发现 RBF 核函数的 ELM 的分类模型对鸟类识别有更好表现。RBF 核函数是一种学习能力强、所需确定的参数比较少的局部性核函数17,其定义如下:K(x,xi)=exp(|x xi|2),0(8)xi式中:为核函数中心;为函数宽度参数。2磷虾群寻优算法Mi(k)Ni(k)Fi(k)Ri(k)KHA 是 Gandomi 等18提出的一种优
19、化算法,以磷虾群中每只磷虾觅食过程中的活动和状态的更新创建 KHA 的寻优过程。KHA 中,磷虾个体 i的第 k 次移动速度由诱导运动、觅食运动以及随机扩散组成,可以表示为:Mi(k)=Ni(k)+Fi(k)+Ri(k)(9)iNi(k)(1)磷虾个体 的诱导运动定义为:Ni(k)=Nmaxai(k)+rNi(k1)(10)Nmaxr 0,1Ni(k1)ai(k)a(k)i=a(k)ilocal+a(k)itargeta(k)ilocala(k)itarget式中:为最大诱导速度;为诱导运动的惯性权重;为前一次诱导运动;为诱导运动源;,为相邻磷虾之间产生的方向引导;为最优磷虾产生的方向引导。1
20、in11j imh(x)t(1,b1)(L,bL)x图1SLFN 网络结构Fig.1NetworkstructureofSLFN第 3 期沈希忠,等:基于 KH-KELM 的鸟类声音分类识别281http:/iFi(k)(2)磷虾个体 的觅食运动定义为:Fi(k)=vf(k)i+fF(k1)i(11)vff 0,1Fi(k1)i(k)(k)i=(k)ifood+(k)ibest(k)ifoodi(k)ibesti式中:为觅食速度;为觅食运动的惯性权重;为前一次觅食运动;为觅食运动源;,为食物对磷虾 的吸引力;为从迭代开始到当前时刻的最优适应度对磷虾 的吸引力。i(3)磷虾个体 的随机扩散过程:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 KH KELM 鸟类 声音 分类 识别
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。