基于OCR识别技术的工程机械结构件管理方法及系统.pdf
《基于OCR识别技术的工程机械结构件管理方法及系统.pdf》由会员分享,可在线阅读,更多相关《基于OCR识别技术的工程机械结构件管理方法及系统.pdf(4页珍藏版)》请在咨信网上搜索。
1、2023.04 建设机械技术与管理 890 引 言工程机械领域结构件铭牌型式主要为:二维码、RFID、NFC 及钢印码。在上述铭牌型式中,二维码非永久识别标识,不利于永久保存;RFID 和 NFC 型式需要较大的硬件投入和结构更改费用。因此,目前工程机械领域普遍采用钢印的型式进行铭牌唯一标识。目前市场上对钢印型式铭牌的识别主要采用 OCR 识别技术,而 OCR 识别技术是将图像信息进行处理转换成文字的过程。目前市面上,钢印文字成像的方式主要有扫描头和摄像头两种,扫描头成像是一行一行扫描,将光信号转换为电信号,电信号再变为数字信号,这种成像质量高,但是价格昂贵,且不便于携带。而摄像头成像方式基于
2、小孔成像原理,其几乎无任何硬件成本,且便于携带,目前这种方式比较受银行及各商企的青睐1-3。因此,在不改变结构的前提中,基于这种钢印的永久识别标识,采用 OCR 识别技术,实现工程机械结构件的自动管理,在手持移动终端只要对准铭牌进行拍照,确定无误的图片上传至算法云服务器,云服务器将计算的结果返回至手持移动终端。整个识别链路简单、便捷及快速,不仅可以做到省时省力,而且可以做到实时有效追溯,保证了物流管理系统、标准节租赁系统和数字资产管理系统的有效运行。1 系统整体设计基于 OCR 识别技术的工程机械结构件管理方法及系统主要由手持移动终端 APP 和 OCR 识别算法服务器两部分组成。在该系统中,
3、采用 OCR 识别技术,利用手持移动终端APP 进行结构件铭牌序列号管理。其具体的结构框图如下所示:基于 OCR 识别技术的工程机械结构件管理方法及系统Structural Component Management Methods and Systems for Construction Machinery Based on OCR Recognition Technology刘琴(中联重科股份有限公司,湖南 长沙 410013)摘要:目前工程机械领域铭牌的录入完全采用人工进行手写登记再录入系统,导致录入效率低且无法有效追溯,因此为了实现高效自动化录入,提出了一种基于 OCR 识别技术的工程机
4、械结构件管理方法及系统,主要用于物流管理系统、标准节租赁系统及数字化资产管理系统等。在该系统中,以手持移动终端 APP 为载体,手持移动终端 APP 提取图片,将图片上传至算法云服务器,算法云服务器将识别的结果返回给手持移动终端 APP,至此实现了整个识别链路。目前该系统在物流管理系统和标准节租赁系统上运行良好且稳定,经实验室验证和上线试用验证,识别准确率为94.5%,有比较好的产品应用性。关键词:OCR 识别技术;工程机械结构件管理方法及系统;手持移动终端 APP;算法云服务器中图分类号:TP391.4 文献标识码:B 图 1 基于 OCR 识别技术的工程机械结构件管理方法及系统框图手持移动
5、终端APPOCR识别算法服务器为了保证传输的速度和图片的清晰度,在手持移动终端 APP 端截取 320*448 的屏幕裁剪框,用户拍照确定后以base64 格式上传至 OCR 算法服务器。在算法服务器端,首先对 base64 图片进行转码,转码成功后对图片进行预处理,经文字定位、文字方向识别、文字识别及后处理等操作,输出最终识别结果,并以 http 通讯的方式将结果返回给手持移动终端。其具体的实现方案如下图所示:图 2 基于 OCR 识别技术的工程机械结构件管理系统方案框图 320*448的屏幕裁剪框,拍摄铭牌图片手持移动终端APPBase64图片OCR识别算法服务器Base64图片转码图片预
6、处理resize归一化检测模型后处理优化输出结果,并转为json格式 hp通讯,返回结果给APP方向分类模型识别模型模糊判定,对检测的图片进行模糊判定,舍弃模糊图,提示用户重拍。判断字符长度,对不符合字符长度的图片,提示用户重拍90建设机械技术与管理 2023.04 在上述方案中,根据工程机械结构件铭牌规则,提出了一种对检测图片进行模糊判定的方案,根据实验测试结果,确定一个阈值,小于该阈值则表示检测图片模糊,舍弃该模糊图,返回模糊结果,提示用户重拍。在上述方案中,根据工程机械结构件铭牌字符长度规则,提出了一种判断字符长度的方案,对不符合字符长度的图片,返回不符合字符长度的结果,提示用户重拍。上
7、述业务方案与算法的有效融合,可以保证拍的图片清晰且有效,避免无效图片的输入,从另一层面保证了算法的准确率。2 OCR 识别技术OCR(optical character recognition)文字识别是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程4。文字识别算法目前主要分为以下几类:端到端方法或两阶段方法5。经实验验证,本文采用两阶段方法,主要包含文本检测和文本识别,文本检测任务是找出图像或视频中的文字位置,也就是定位问题。既给定输入图像或视频,找出文本的区域,可以是单字符位置或者整个文本行位置。而文本识别任务是识别一个固定区域的文本内容。由于受使用习惯影响,在
8、两阶段方法中加入方向分类器,以增加多角度识别的鲁棒性。2.1 文字检测文本检测目前一般是自然场景文本检测,而自然场景的文本检测由于文本多样性、复杂的背景和干扰、文本密集重叠及局部一致性问题导致检测难度加大。针对上述难题,衍生出了很多基于深度学习的文本检测算法,解决自然场景下的文字检测问题,这些方法可以分为基于回归和基于分割的文本检测方法。由于识别的铭牌包含各种位置类别的文字,因此采取基于分割的文本检测方法。基于分割的主流文本检测方法主要包括:Pixellink、Seglink+、PAN、MSR 和 DBNet6。其中,DB 算法由于结构简单,无需繁琐的后处理,以及在开源数据上拥有良好的精度和性
9、能,因此,选择了 DB 这个主流算法。DBNet 针对基于分割的方法需要使用阈值进行二值化处理而导致后处理耗时的问题,提出了可学习阈值并巧妙地设计了一个近似于阶跃函数的二值化函数,使得分割网络在训练的时候能端对端的学习文本分割的阈值。自动调节阈值不仅带来精度的提升,同时简化了后处理,提高了文本检测的性能。图 3 为采用 DB 算法计算得到的塔机结构件序列号检测示例。2.2 文字方向分类在图 3 中,为了提升检测框中的文字识别效果,保持文字的一致性,对检测结果进行仿射变换,保证识别的文本框是正的水平方向。但是问题是:变换后的图像是竖直方向,则旋转 90 度后,变为水平方向。但是变为水平方向后,文
10、本可能是颠倒的。因此需要对文字方向进行矫正,需要引入方向分类器,对于颠倒的文本,只需要采用方向分类器进行矫正后再识别即可。图 4 为方向分类器的分类效果,可准确检测出检测框中字符的角度。图 4 为塔机结构件文字方向分类示例。2.3 文字识别文本识别在文本检测后面,将图像信息转换为文字信息。根据实际场景可以把文本识别任务分为两个大类:规则文本识别和不规则文本识别。由于工程机械领域的铭图 3 塔机结构件文字检测示例(第一行图为原图,第二行图为检测后进行透视变换后的定位框图)图 4 塔机结构件文字方向分类(第一行图为原图,第二行图为检测后进行透视变换后的定位框图,第三行为根据定位框进行文字方向分类的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 OCR 识别 技术 工程机械 结构件 管理 方法 系统
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。