基于改进YOLO v5的手语字母语的识别方法.pdf
《基于改进YOLO v5的手语字母语的识别方法.pdf》由会员分享,可在线阅读,更多相关《基于改进YOLO v5的手语字母语的识别方法.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 年 月南京工程学院学报(自然科学版)().:./.投稿网址:/.基于改进 的手语字母语的识别方法潘 格许有熊刘晓锋(南京工程学院自动化学院 江苏 南京)摘 要:针对传统手势识别方法计算量大、难以实时识别的问题研究一种基于改进 的轻量化手语检测识别方法.首先用 替换 的主干网络然后利用 模块和 模块替换 颈部网络中的 和 模块最后通过 的预测部分生成预测框.在此基础上利用 算法生成适合手势的先验框加快网络检测手势.与其他网络算法对比分析可知改进算法在保持精度基本不变的情况下可大幅减少网络参数提高网络的检测速度.关键词:轻量化手语识别中图分类号:.收稿日期:基金项目:南京工程学院大
2、学生科技创新基金项目()作者简介:潘格硕士研究生研究方向为机器视觉.:.引文格式:潘格许有熊刘晓锋.基于改进 的手语字母语的识别方法.南京工程学院学报(自然科学版)():.手语是聋哑人交流的信息载体手语识别是人机交互研究的重要领域.手势识别被广泛应用于虚拟现实系统、互动游戏平台、手语识别和控制机器人等领域.在人机交互过程中为了使计算机快速、准确地识别手势并理解其含义提高手势识别的准确率和速度显得尤为重要.传统的手势识别算法是利用人体手部区域的颜色特征来实现容易受到环境变化的干扰.基于卷积神经网络的手势识别对环境的适应能力更好鲁棒性更强.文献利用 算法南京工程学院学报(自然科学版)年 月对手势进
3、行识别检测精度高但是检测时间较长不能达到实时检测的水平文献利用多尺度卷积特征融合的 算法对手势进行识别在提高精度情况下降低了检测速度文献采用基于改进 算法的手势识别在实时性和检测精度上同时取得了不错的结果文献通过在 中融入 注意力机制和 自适应特征融合机制精度提升比较明显.现有手势识别方法虽然精度较高但是对运算要求高难以实时检测和移植到便携设备.为实现实时手语识别本文选用在速度和精度方面均表现优异的 目标检测算法为基础与轻量化网络、相互融合并利用算法对锚框进行设定.在保持精度不变的情况下本文方法大幅降低了模型参数量和运算量.算法介绍目标检测的基本任务是判别图像中被检测的目标类别并确定目标所在位
4、置、大小和置信度.目标检测算法主要分为双阶段和单阶段检测两种.双阶段检测精度高但是速度慢常用的双阶段算法有、算法等单阶段检测速度快但是精度比双阶段检测低常用的单阶段算法有 和 算法.是一种单阶段目标检测模型经过 个版本的迭代后在速度和精确度上都得到了较大提高.算法根据网络结构深度和宽度分为、.为了满足实时检测的速度要求本文选用模型复杂程度最低、速度最快的 .图 为 网络结构图网络分为输入端、特征提取端、颈部端、输出端 四个部分:)输入端采用 数据增强以随机比例、随机裁剪和随机顺序将四幅图像拼接丰富检测物体背景提高小目标的检测效果自适应锚定框根据不同的目标检测数据集利用 聚类算法自动确定初始锚框
5、的大小.通过自适应图像缩放减少图像中黑边节省计算能力并提高检测速度)特征提取端采用 网络结构利用()结构进行切片操作提高速度 并且方便导出其他模型.带残差的结构可以避免梯度消失和网络退化空间池化塔结构进行图像尺寸统一)颈部端采用自顶向下的特征金字塔 结构和自底向上的 组合结构组合结构中采用不带残差的 结构加强了网络的特征融合能力)输出端采用 作为边界框损失函数利用加权 对非极大值进行抑制从而获得图 网络结构图第 卷第 期潘 格等:基于改进 的手语字母语的识别方法最优目标框.输出层共有 个尺寸的输出通道分别对应大中小三个视野.算法改进.基于 算法的先验框选取 算法在识别过程中会使用先验框先验框符
6、合数据集可以提高训练精度.预设的先验框大小是对 数据集聚类获得和手语数据集的匹配度不高.本论文的研究对象仅限于手势语言手语数据集中对象大小相近宽高比相近.因此通过 聚类方法对手语数据进行聚类可以获得更好的识别结果.采用 聚类方法得到其对应的先验框大小其在原图大小具体为对应小尺寸特征图()、()、()对应 中 尺 寸 特 征 图()、()、()对 应 大 尺 寸 特 征 图()、()、().用 替换特征提取网络 算法采用 作为基础的特征提取网络模型的分类精度表现优异但是层数、模型参数过多、计算量大.网络以深度可分离卷积替换标准卷积可以降低模型参数量和计算量.为了将模型移植到计算处理能力有限的移动
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于改进YOLO v5的手语字母语的识别方法 基于 改进 YOLO v5 手语 字母 识别 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。