基于高阶门控卷积的面部识别算法在电站身份识别中的应用.pdf
《基于高阶门控卷积的面部识别算法在电站身份识别中的应用.pdf》由会员分享,可在线阅读,更多相关《基于高阶门控卷积的面部识别算法在电站身份识别中的应用.pdf(5页珍藏版)》请在咨信网上搜索。
1、2023 年 8 月 25 日第 7 卷 第 16 期现代信息科技Modern Information TechnologyAug.2023 Vol.7 No.161341342023.082023.08收稿日期:2023-03-03基于高阶门控卷积的面部识别算法在电站身份识别中的应用高森(南京南瑞继保电气有限公司,江苏 南京 211102)摘 要:电站安全与国家安全和人民生产生活息息相关,因此对电站的出入人员进行准确的身份识别尤为重要。针对电站出入人员携带安全帽导致的面部特征采集不完全等问题,文章提出了融合高阶门控卷积模块对 MTCNN 和FaceNet 网络模型进行改进增强,通过显式建模人
2、脸面部特征向量之间的高阶关联,使得模型可以学习到更加准确的特征映射函数,从而提高面部识别的准确率。在 LFW 数据集上,提出的改进方法相比于原 Facenet 模型的 99.63%的准确率提高到了 99.68%的准确率。最后,在电站的实际应用场景中,出入识别的准确率分别为 99.12%和 98.93%。关键词:电站;面部识别;高阶门控卷积中图分类号:TP391.4 文献标识码:A 文章编号:2096-4706(2023)16-0134-05Application of Facial Recognition Algorithm Based on High-order Gated Convolut
3、ion for Power Station IdentificationGAO Sen(Nanjing NanruiJibao Electric Co.,Ltd.,Nanjing 211102,China)Abstract:The security of the power station is closely related to national security and peoples production and life,so it is particularly important to accurately identify the access personnel of the
4、 power station.Aiming at the problems such as incomplete collection of facial features caused by helmets carried by power station access personnel,this paper proposes to improve and enhance the MTCNN and FaceNet network models by integrating high-order gated convolution modules.By explicitly modelin
5、g the high-order correlation between facial feature vectors,the model can learn more accurate feature mapping functions to improve the accuracy of facial identification.On the LFW dataset,the improved method proposed in this paper improves the accuracy of the original FaceNet model by 99.63%to 99.68
6、%.Finally,in the actual application scenario of the power station,the accuracy of the access identification is 99.12%and 98.93%respectively.Keywords:power station;facial identification;high-order gated convolution0 引 言电网和电站在国家安全、社会稳定以及人们的生产生活中承担着十分重要的角色,因此电网和电站的安全一直受到国家和人民的重视和关注。运用精确和稳定的识别系统对电网和电站出入
7、人员进行准确的身份识别对电网和电站的安全有着重要保障。由于出入电站和电网的工作人员大部分人会携带绝缘手套和佩戴安全帽等,所以传统的基于指纹识别的方法不易于使用,且由于佩戴安全帽的原因会给面部识别带来巨大挑战。除此之外,利用虹膜特征对员工身份进行检测和识别的方式虽然准确度高,但是代价高昂。综合考虑,人脸识别更适用于电站和电网出入人员的身份识别。人脸识别的发展历经手工提取特征到深度学习,在深度学习崛起之前,人脸检测主要通过手工DOI:10.19850/ki.2096-4706.2023.16.029设计提取特征获取面部信息,此类方法具有速度快,实现简单等特点,但是检测精度较低。例如早期的人脸识别技
8、术1,2主要是建立在子空间特征向量学习和特征模式统计学习上。例如利用 SIFT 特征进行空间学习,首先选取固定数量的矩形区域进行预处理,之后根据特征映射的空间统计以及预先设定的先验阈值来提升面部识别的鲁棒性。随着深度学习技术的进一步发展,通过设计合理的神经网络模型在大量数据上进行训练来获得面部和非面部的分类器使得人脸识别的可靠性和鲁棒性跨越式增强。Hinton 等人提出了在当年 ImageNet大赛上的冠军方法 AlexNet3,该模型是深度学习在计算机视觉任务上应用的里程碑。深度学习的巨大成功促进了深度学习算法和人脸识别的结合,例如张等人4提出的 MTCNN,通过分级训练并使用三个子卷积神经
9、网络来提升人脸识别的准确率。Sun 等人5提出的 DeepID 将人脸图像分割成多个图块输入给深度网络进行训练来提升网络对特征的学习和表示能力。现代信息科技8月下16期.indd 134现代信息科技8月下16期.indd 1342023/8/15 17:38:232023/8/15 17:38:231351352023.082023.08第 16 期再有,谷歌提出的 FaceNet6模型通过学习获得一个特征映射函数将输入映射为特征空间的身份向量,在利用相似度函数来比较特征向量的相似度来进行面部识别,该模型在 LFW 人脸识别数据集上获得了99.63%的识别准确率。由此可见,深度学习相比于传统的
10、特征提取方法能够学习到更加有用和更具表示能力的特征。本文针对电站门禁场景的特殊需求,利用高阶门控卷积对 MTCNN 和 FaceNet 进行改进来提升模型的特征学习和表示能力进而提升人脸识别的准确率。最后,深度学习在人脸识别上的应用进一步推动了人脸识别技术在各种实际场景的落地和应用,例如视频监控、身份识别、游戏娱乐等诸多领域。1 本文方法作为计算机视觉领域的热点研究问题,人脸识别算法已经取得了较好的结果7-12,但是距离实际应用的要求还尚有不足,例如实际场景中捕获的人脸图片可能会受到光照、遮挡、面部快速移动等各种因素的影响,进行特征向量相似度计算时会产生较大的偏差导致无法正确识别。为有效缓解上
11、述难点,本文提出了融合高阶门控卷积进一步增强模型的特征学习和表示能力。实验结果表明,改进之后的 i-FaceNet 相比于原 FaceNet 网络人脸识别的准确率和运行速度显著提升。人脸识别主要包含检测和识别,其中前者是后者的基础,本文使用 i-MTCNN 网络作为面部检测算法并使用 i-FaceNet 网络对面部特征进行识别,最后通过特征向量的相似度比较,对输入面部图片进行识别进而对进出员工的身份进行判定,如图 1 所示。1.1 高阶门控卷积高阶门控卷积主要是通过门控卷积和递归操作来建模特征向量之间的高阶关联,具有推理效率高、扩展性强以及平移不变性等特点。一般的卷积运算(互相关运算)没有显式
12、地对特征空间中任意两个特征向量的关联进行建模,而引入这种特征信息交互可以显著提升模型的特征学习和表达能力。如图2 所示,该结构主要是通过 11 卷积、基于深度的卷积以及基于元素相加等操作来实现。11卷积11卷积11卷积11卷积输入特征特征i邻域特征 j0邻域特征 j1邻域特征 j2基于元素相加基于元素相加基于元素相加输出特征基于深度的卷积图 2 高阶(3 阶)门控卷积示意图假定输入特征向量为,H 表示特征向量的高,W 表示特征向量的宽,C 表示特征向量的通道数,1 阶门控卷积操作可以被表示为:其中,为 11 卷积,用于通道之间的特征信息交互,为基于深度的卷积,j0为 i的邻域特征,Y 表示特征
13、向量 i 与其邻域特征 j0的一阶特征交互输出。在上述操作的基础上,再对门控卷积结构应用递归方法来实现更高阶的门控卷积结构从而来显式地考虑特征向量之间的高阶依赖关系。1.2 GC-MTCNN 模型为应对复杂场景下的人脸检测,多任务级联人脸检测方法 MTCNN 于 2016 年被张等人提出。如图 3 所示(自上而下分别为 P-Net 网络、R-Net 网络、O-Net 网络),该框架是一种适用于多任务的人脸检测模型,主要包含三个卷积神经网络级联模型,可以同时对输入图像进行面部区域检测和面部特征点检测。该模型具备结构简单、精度高、易于集成?(GC-MTCNN)?(GC-MTCNN)?(GC-Fac
14、eNet)?(GC-FaceNet)?图 1 本文方法 i-FaceNet 结构示意图高森:基于高阶门控卷积的面部识别算法在电站身份识别中的应用现代信息科技8月下16期.indd 135现代信息科技8月下16期.indd 1352023/8/15 17:38:232023/8/15 17:38:23136136第 16 期现代信息科技2023.082023.08使用等特点。具体来说,为了得到更加精细化和更加准确的模型,利用多个子网络(P-Net、R-Net、O-Net)的输出不断修正检测结果,最终得到一个最优的模型用于人脸检测。其中 P-Net 为面部区域提议模型,该模型会首先对输入进行处理,
15、输出经过处理和校准的人脸图像,R-Net 对这些区域进行进一步精细化处理,对其中置信度较低和错误的提议区域进行舍弃,输出置信度较高的面部提议区域,最后 O-Net 对这些提议区域再进一步处理输出最终的面部区域和面部关键点坐标。image33卷积22池化33卷积33卷积11卷积分类回归11211411323316551012123image33卷积22池化22卷积分类回归1121143364442811112824243image33卷积33池化分类回归112112564464101064232332484831112833卷积33池化22卷积33128关键点检测114111033卷积33池化3
16、3卷积33池化图 3 MTCNN 网络结构图本文对其中 33 卷积使用高阶(3 阶)门控卷积进行替换获得了新的网络结构模型 GC-MTCNN。与MTCNN的训练过程类似,如图3所示,本文对三个子网络分别逐次训练,首先对 P-Net 进行训练,得到可能的面部建议区域,再输入给 R-Net网络,进一步对这些建议区域进行校准和筛选,最后输入给 O-Net 网络进行训练。1.3 GC-FaceNet 模型FaceNet 模型最初由谷歌团队于 2015 年提出,主要用于人脸识别、人脸聚类以及人脸验证,如图4 所示。CNNCNNCNN?图 4 FaceNet 模型结构其中,输入图片分为三类,即锚样本、正样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 门控 卷积 面部 识别 算法 电站 身份 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。