基于变分自编码器的人脸表情识别.pdf

上传人：自信****多点

文档编号：633660

上传时间：2024-01-19

格式：PDF

页数：6

大小：3.14MB

《基于变分自编码器的人脸表情识别.pdf》由会员分享，可在线阅读，更多相关《基于变分自编码器的人脸表情识别.pdf（6页珍藏版）》请在咨信网上搜索。

1、第卷第期计算机应用与软件年月基于变分自编码器的人脸表情识别党宏社王淼陆馨蕊王汝明（陕西科技大学电气与控制工程学院陕西西安）（潍坊英轩实业有限公司山东潍坊）收稿日期：。陕西省自然科学基金项目（）。党宏社，教授，主研领域：图像处理，计算机控制，工业过程与优化。王淼，硕士生。陆馨蕊，硕士生。王汝明，工程师。摘要为了在样本量较小的表情数据集上实现较高准确率的表情识别，将无监督特征学习应用于表情识别中，在传统自编码器网络的基础上，将变分自编码器引入人脸表情识别中，提出一种基于变分自编码器改进的人脸表情识别方法，使用大量无表情标签的人脸数据集对变分自编码器进行无监督训练，将变分自编码器

2、中编码网络部分输出的低维特征输入到卷积神经网络中，由变分自编码器的编码网络和卷积神经网络两部分构成完整的表情识别网络；使用带表情标签的人脸表情数据集对网络进行训练。在、数据库进行分类实验，实验结果表明，该算法具有一定的表情识别能力。关键词计算机表情识别变分自编码器无监督卷积神经网络中图分类号文献标志码：（，）（，），引言人脸表情是人类交流过程中表达情感最自然、最直观的方式之一，且的有用信息是通过表情来传达的。因此，近年来人脸表情逐渐成为图像处理领域研究的热门，在教育、陪伴机器人、侦察、医疗等领域具有广泛的应用价值和深远的研究意义。传统的人脸表情识别方法主要是在人为手动提取特征的基础上

3、，再使用支持向量机（）进行表情分类。如（）、梯度方向直方图（）等，但这种手工特征的表示能力较差，且光照、性别、个体差异及人为干扰等因素对其影响较大。目前深度学习在许多领域取得了较好的结果，并在某些任务中超越了传统方法。所以研究者开始将深度学习应用于表情识别中。基于深度学习的方法第期党宏社，等：基于变分自编码器的人脸表情识别可以自动学习到人脸图像中复杂的特征描述，具有较强的鲁棒性且可以避免人为手工提取特征造成的误差，使得深度学习成为人脸表情识别领域的研究热潮。但有监督学习需要大量的带标签样本进行网络训练以保证模型的效果，无法直接在数据量较小的样本中得到较好的结果，然而在实际中，利用人工

4、标记大量表情数据是非常费时耗力的事情。在面对海量无标记的数据时，无监督的特征学习正逐渐成为研究的新热点。文献将生成对抗网络（）应用于人脸表情识别中。文献在表情识别中使用了去噪自编码器、稀疏自编码器、自编码器构成了层的堆栈混合式自编码器。受文献的启发，本文在传统自编码器网络的基础上，将卷积变分自编码器引入人脸表情识别中，提出一种基于卷积变分自编码器的人脸表情识别方法，首先利用卷积神经网络构建卷积变分自编码器。然后利用人脸识别领域中大量的无标签的人脸样本作为特征学习所需的数据，对卷积变分自编码器进行无监督训练；然后将变分自编码器中编码网络部分输出的低维特征输入到卷积神经网络中，构成表情识

5、别网络；最后使用表情数据集对表情识别网络进行有监督训练，得到训练好的完整的表情识别网络。表情识别算法设计整体框架假设输入的原始人脸数据集，需要经过变分自编码器得到原始人脸图像的重构人脸数据集，原始人脸数据集经过编码网络后均值向量和标准差向量，经过重参数技巧后得到隐变量，隐变量中包含的特征信息。图为本文人脸表情识别算法的整体框架，系统分为部分：（）变分自编码网络的无监督训练：使用卷积神经网络设计一种合适的变分自编码器，先使用无表情标签的人脸数据集无监督训练变分自编码网络。（）表情识别网络的设计：利用预训练好的变分自编码器的编码网络和卷积神经网络构成表情识别网络。将经过变分

6、自编码器中编码网络输出的低维特征（即隐变量）作为卷积网络的输入，经过卷积网络后得到分类结果。（）表情识别网络的有监督训练：使用带标签的人脸表情数据集训练卷积网络和分类层，通过反向传播调整表情识别网络的网络权重，以达到更好的表情分类效果。图基于变分自编码器的人脸表情识别系统框架算法流程表情识别主要分为表情特征提取和特征分类两步，而表情特征提取作为表情识别的关键步骤，直接影响着识别结果的好坏，为了提高表情特征提取能力，本文采用变分自编码器的思想，通过变分自编码器中解码网络不断重构编码网络输出的隐变量，使得重构图像尽可能地接近输入的原始图像，从而提高特征提取能力。（）无监督训练变分自编码器：在

7、对变分自编码器进行无监督训练阶段，使用无表情标签的人脸数据集作为网络输入，通过变分自编码器将输入的高维数据映射为均值向量和标准差向量，利用重参数技巧，（，）得到隐变量特征，再利用解码器将低维隐特征变量还原成高维特征得到重构的人脸图像，通过不断地优化原始人脸图像和重构的人脸图像之间的误差，使重构的人脸图像尽可能地还原原始人脸图像，从而保障隐变量中包含的原始人脸特征信息通过解码网络后能尽可能还原出原始人脸图像。利用变分自编码器的无监督特征学习过程为表情识别网络提供良好的初始参数，从而达到提高网络的特征提取能力的目的。（）有监督训练卷积网络：使用带表情标签的人脸表情数据经过编码器得到的

8、低维特征和表情标签对卷积网络部分进行有监督训练，通过反向传播算法调整网络权重，最终得到训练好的表情识别网络。（）人脸表情图像分类：输入表情数据集的测试数据，使用已经训练好的完整的表情识别网络进行表情分类识别。网络设计本文提出一种基于的表情识别方法，该方法是在的基础上设计一种新的表情识别网络，该表情识别网络由变分自编码器中的编码网络和卷积神经网络两部分组成。计算机应用与软件年变分自编码器（）是等提出的，是采用两个神经网络建立了两个模型，分别是和。本文设计的变分自编码器的网络结构如图所示，其中：、分别表示输入输出图像的高、宽、通道数；表示卷积核的大小；、分别表示步长及填充。变分自编

9、码器的编码网络的输入是大小的人脸图像，自编码器中有个卷积核大小为、步长为、边界填充的卷积层，其中每个卷积层后均采用批量归一化（）和激活函数；卷积层后连接两个全连接层，第一个全连接层有个神经元，第二个全连接层输出通过重参数技巧得到的维隐变量。为了能够还原出大小的人脸图像，解码网络中先连接一个具有个神经元的全连接层，然后是个与卷积操作作用相反的卷积核大小是为、步长为的反卷积层组成，每个反卷积层后采用和激活函数。当输入为大小的人脸图像经过编码网络后得到均值向量和标准差向量，经过重参数技巧后得到维的隐变量特征，然后再经过解码网络还原出大小的人脸图像。图网络结

10、构示意图在对使用无监督训练完成后，使用训练好的实现的人脸表情识别网络，如图所示该网络由变分自编码器的编码部分和卷积神经网络两部分组成。将预训练后的卷积变分自编码网络中编码网络输出的隐变量作为卷积神经网络的输入，构建完整的表情识别网络，使用带表情标签的人脸表情数据对表情识别网络中的卷积神经网络部分进行有监督训练。的原始人脸图像经过编码网络后得到维的特征，将维的一维特征使用函数重构成的矩阵，然后将其作为卷积神经网络的输入。卷积神经网络部分包括两个卷积核为、步长为的卷积层，两个池化窗口为、步长为的最大池化层，以及神经元个数为的全连接层和神经元个数为的层。为了防止过拟合，

11、在全连接层加入了参数设置为的层。图使用改进的表情识别网络实验验证实验环境实验采用的深度学习软件框架是，实验的第期党宏社，等：基于变分自编码器的人脸表情识别硬件平台为（）（），内存为，为的。数据集以及数据预处理本文采用的数据集有（）人脸数据集、表情数据集和数据集。其中无表情标签的数据集用来对卷积变分自编码器进行无监督特征学习，和人脸表情数据集均用来验证基于卷积变分自编码器的人脸表情识别算法的表情分类性能。人脸数据集中包含个名人的幅人脸图像，图像大小均为，数据集是用来训练卷积变分自编码器。数据集共幅，是在实验室环境下对名日本女性所表现出的种基本表

12、情采集构成的数据集。数据集是表情识别中比较常用的数据库，此数据库包含了采集自名测试人员的段表情图片序列，显示了表情从平静到剧烈，选取每段表情序列的最后至帧图像构成表情识别数据集。在实验前，需要对用到的所有数据集进行预处理，将所有图像的尺寸均缩放到大小作为网络的输入。重建人脸图像的结果分析为验证卷积变分自编码器有较好的重建人脸图像的能力，使用人脸数据集分别对卷积变分自编码器和卷积自编码器进行无监督训练，然后将重建的人脸图像可视化。自编码器将输入的高维人脸数据直接通过编码部分得到低维的隐向量，然后隐向量通过解码部分重构成原始图像，这个过程类似于数据压缩。而变分自编码器是基于变分贝叶斯推

13、断的生成式网络。如图和图所示，分别为自编码器和卷积变分自编码器重建的人脸图像，其中第一行是原始的图像，第二行是重建的人脸图像。通过对比重建的人脸图像的清晰度可以看出卷积变分自编码器重建人脸图像的能力优于自编码器，即隐层变量能包含更多的原始人脸特征信息，所以文中用卷积变分自编码器来进行特征提取。图原始图像与器重建的人脸图像的对比图原始图像与重建的人脸图像的对比表情分类结果分析本文的评价准则是表情分类的准确率，定义见式（）。（）式中：为第类表情的样本量；为第类中识别正确的样本数量。为了测试和评估人脸表情识别模型的分类效果，分别将预处理好的和数据集作为测试数据，图和图所示分别

14、是在数据集和数据集上表情识别结果的混淆矩阵。图数据集上的混淆矩阵图数据集上的混淆矩阵计算机应用与软件年图和图中对角线部分是各类表情的识别率，其余部分数据为某表情被误分为其他类别的概率。通过对比各类表情的识别率得：无论是数据集还是数据集，本文算法在高兴（）表情上的识别正确率最高；在数据集中，厌恶和害怕这两种表情上的正确率明显偏低，而在数据集上自然（）的识别率偏低。通过对数据集中原表情图像分析得：高兴表情的表情特征更加明显，而其他表情的表情特征有相似之处，所以更容易分类错误。为了进一步验证本文算法的识别效果，设计了以下对比实验：实验：直接使用表情数据集训练一个层的卷积神

15、经网络。实验：使用变分自编码器的编码部分进行特征提取，然后直接对提取的特征输入分类层分类。实验：本文算法。表中列出了几个对比实验分别在和数据集上的识别率，在对比实验中采用的网络的网络结构和参数与本文算法相同，分析表中数据发现，使用变分自编码器后在和数据集上的识别率比未使用自编码器的识别率分别提高了百分点和百分点；但将变分自编码器编码网络的输出特征直接输入到进行分类和与本文算法相比，本文算法的识别率略胜一筹。表对比实验的实验结果（）对比实验实验实验实验表中列举了不同表情识别方法在和数据集上识别率的对比结果，如：文献中利用的博弈思想不断增强特征提取能

16、力和分类能力；文献中使用卷积神经网络提取人脸特征，并使用最大池化方法降维，进行分类；文献中将改进的应用于表情识别中。对比表中数据，无论是传统方法还是基于的表情识别方法均取得了一定的效果，但是相比较而言，本文方法的识别效果更好。人脸表情识别部分结果示例如图所示，图（）为识别正确的结果图。图（）为识别错误的结果图。图（）中左侧图像的表情标签是厌恶，但是从右侧的柱形图中可以看出，该表情被识别成伤心的概率最大。表不同方法在数据集和数据集上对比（）（）（）本文（）识别正确的结果图（）识别错误的结果图图人脸表情识别部分结果示例结语针对由于样本不足导致网络模型难以训练，从而影响识

17、别结果的情况，本文提出的基于变分自编码器改进的人脸表情识别方法，通过无监督学习的方式使变分自编码网络有良好的特征提取能力，从而为表网络提供良好的初始参数，在一定程度上解决了因样本不足而导致的过拟合问题。通过实验验证了本文方法在表情识别方面是有效的。下一步将以野外表情数据集作为研究的对象，使网络在野外表情识别方面具有较好的识别能力。参考文献，（）：（下转第页）第期汪恒，等：基于的事件机制响应调度的实时性分析制的精确使用提供参考，也为剖析其他的实时性提供一定的借鉴。参考文献，：？：韩东奇，陈永恒实时性分析与改善方法测试科技创新导报，（）：张文君，陈香兰，李曦嵌入式实时操作系统的

18、分析评测方法计算机系统应用，（）：赵立业，张激，游夏实时操作系统的性能分析和评估计算机工程，（）：，：刘淼，王田苗，魏洪兴，等基于的嵌入式数控系统实时性分析计算机工程，（）：，：，（）：沈志刚，燕雪松，赵权仿真中方法的实现电力行业信息化年会，：，：，（）：谭琦嵌入式操作系统通信和同步机制的研究长沙：长沙理工大学，：朱旭东，张健事件标志组中存在的问题及解决方法计算机工程，（）程玉娟嵌入式实时操作系统的内核分析及应用研究苏州：苏州大学，杨癑，邵浩然，张索非与内核分析及选型研究科技视界，（）：与权威指南版吴常玉，曹孟娟，王丽红，译北京：清华大学出版社，：（上接第页），（）：刘芾，李茂军，胡建文，等基于低像素人脸图像的表情识别激光与光电子学进展，（）：，（）：李婷婷，胡玉龙，魏枫林基于改进的人脸表情识别算法及应用吉林大学学报（理学版），（）：张志禹，王瑞琼，魏敏敏，等堆栈式混合自编码器的人脸表情识别方法计算机工程与应用，（）：，（）：，：，：，：，（）：，：卢官明，何嘉利，闫静杰，等一种用于人脸表情识别的卷积神经网络南京邮电大学学报（自然科学版），（）：，（）：杨旭，尚振宏基于改进的人脸表情识别激光与光电子学进展，（）：

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于编码器表情识别

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。