AR SAM在邮包测量上的应用研究.pdf
《AR SAM在邮包测量上的应用研究.pdf》由会员分享,可在线阅读,更多相关《AR SAM在邮包测量上的应用研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、第39 卷第5期2023年9 月DOl:10.13955/j.yzyj.2023.05.02.06邮政研究Studies onPostsVol.39 No.5Sept.2023AR+SAM在邮包测量上的应用研究李岩,王彦明,孙宁,王月春*(石家庄邮电职业技术学院,河北石家庄0 50 0 2 1)摘要:详细介绍了一种智能测量系统,该系统主要由终端App和后台服务器组成,可以实现对待测物体的快速和精确测量。在包裹揽收作业中,系统可以自动生成最小包围盒,准确计算物体的长、宽、高和体积,从而提升揽收效率,优化揽收流程,节约人力成本。关键词:AR;SA M;包裹揽收;体积测量;智能;自动计费中图分类号:
2、F61文献标识码:A随着电子商务的蓬勃发展,邮政快递包裹处理量急剧增长,仅在2 0 2 2 年的元旦假期,就处理了超过2 1.3亿件包裹。随着服务深人到千家万户,收件员计费的准确、标准、方便、快捷化越来越成为管理人员关注的问题。依据中国邮政邮件计费规则,邮件资费收取的依据是重量和体积,按照既定资费标准和计算公式计算。目前,揽收人员使用电子秤和刻度尺分别测量邮件的重量和体积。然而,在体积测量方面,使用刻度尺的步骤繁琐且效率低下、准确度不够。此外,复杂的资费计算使寄件人不得不依赖揽投人员的计费结果。随着移动设备硬件性能的提升以及增强现实和深度学习算法的快速发展,使得利用移动设备摄像头实现邮件体积的
3、智能测量成为可能。因此,如何将先进的增强现实和物体识别技术应用于物流快递行业,实现一键测量物体体积,并自动计算给定重量和区域的邮费,从而节约时间成本并提升寄件基金项目:河北省高等学校科学技术研究项目资助(项目名称:基于VIO算法的AR量方软件研究与实现;项目编号:ZC2022067)。作者简介:李岩(19 8 8 一),男,山西灵丘人,硕士,讲师,主要从事虚拟现实、增强现实研究;王彦明(19 9 5一),男,河北辛集人,硕士,讲师,主要从事大数据与人工智能研究;孙宁(19 9 0 一),男,河北行唐人,硕士,讲师,主要从事机器学习、图像识别等研究;王月春(19 7 3一),男,河北迁安人,通信
4、作者,副教授,主要从事大数据、云计算、人工智能等研究。收稿日期:2 0 2 3-0 5-31人体验,成为邮政服务的一个值得深入研究的课题。本文试图通过增强现实(AR)技术、图像分割技术,研究智能测量系统的开发方案,以期解决传统测量效率和准确度低、计费繁琐的问题。1智能测量系统技术方案选择智能测量系统的研究与开发,旨在创建一个用于揽收人员测量邮件尺寸的智能测量系统,力图便捷、高效、易推广。在系统性能方面,尽可能做到人机友好,减少用户的操作步骤,实现一键式测量。此外,系统直接显示计费结果,无需工作人员进行二次计算,能显著缩短测量时间,从而大幅提升整体工作效率,改善用户体验,同时节约人力成本。在系统
5、推广方面,注意两个重要因素:一是测量设备应具有易于普及性,因为手机是在现代生活中普及性较强的移动设备,因此系统应满足把手机作为客户端安装运行的条件,并且兼容iOS和Android本刊网址:8第5期系统;二是服务成本需要保持在合理的较低水平,推广使用该系统不仅能提升作业效率,还可以降低企业的成本。在当今科技高速发展的环境中,有许多技术可以应用于物体测量并满足上述需求,包括计算机视觉技术、激光测距技术、传感器技术以及AR技术。计算机视觉技术是一种基于图像处理的测量方法,能够实现对图像中物体的尺寸、形状、位置等信息的检测和识别。然而,由于计算机视觉技术对光照条件、拍摄角度等因素较为敏感,且需要复杂的
6、算法支持,因此在实际应用中存在精度不高、计算复杂度大等问题。激光测距技术通过发射激光束并接收其反射回来的光束来测量距离,从而计算出物体的大小。尽管这种技术的精度相对较高,但是激光测距设备通常价格较高,且需要专业人员进行操作,不适合大规模推广使用。传感器技术通过传感器测量物体的尺寸、质量等信息。传感器种类繁多,包括超声波传感器、红外传感器等。然而,这种技术需要硬件设备支持,安装和维护成本相对较高,且可能受到温度、湿度等环境因素的影响。AR技术通过在现实环境中加入虚拟的计算机生成的信息,使用户能够在现实环境中实时地感知和互动。AR技术结合了计算机视觉和传感器技术的优点,同时降低了硬件设备的依赖性,
7、且具有良好的用户交互体验。对比各种技术优劣,系统选择AR技术作为环境识别技术。AR技术在特定应用场景中存在一定的局限性,例如无法直接支撑物体的选择与分割,因此需要引人其他技术以实现更准确的测量。目前,有多种技术可以实现物体的选择与分割,例如传统的图像处理技术、传感器技术及深度学习技术。传统的图像处理技术,如边缘检测、阈值分割等,虽然实现简单,但在处理复杂场景和不规则形状物体时,准确度难以保证。传感器技术,例如红外传感器或超声波传感器,能够提供相对准确的测量结果,但需要特定的硬件设备支持,增加了系统的复杂性和成本。深度学习是一种模仿人脑工作原理的机器学习算法,能够从大量数据中自动学习和提取复杂特
8、征。对于邮包测量问题,深度学习可以自动提取出邮包的特征,从而实现精确的邮包分割。综上所述,鉴于深度学习技术在处理复杂场景和不规则形状物体上的优越性,以及其强大的自我学习和适应一9李岩等:AR+SAM在邮包测量上的应用研究1.1AR环境认知在计算机视觉识别和测量邮件过程中,环境认知是一个重要步骤,也是AR技术的核心之一;其通过采集视图和相机位置参数来识别当前会话场景,理解视图与相机的位置关系,并构建环境的三维结构信息。在现有的AR技术中,主要框架包括苹果的ARKit、谷歌的ARCore、微软的HoloLens以及跨平台的ARFoundation等。ARKit是苹果公司开发的一种AR开发框架,能够
9、为iOS设备提供强大的AR功能。ARKit支持空间追踪、环境理解、物体检测与跟踪等功能。但是,ARKit只能用于iOS设备,无法适用于其他操作系统。ARCore是谷歌公司开发的AR技术,功能与ARKit相似,同时,ARCore只能用于Android设备,无法适用于其他操作系统。微软的HoloLens则是一款具备自我运算能力的混合现实(MR)设备,可以在真实世界中展现和交互虚拟物体。HoloLens提供了强大的空间追踪、物体识别和手势识别等功能,但其硬件价格昂贵,且主要面向企业用户。ARFoundation是一款Unity引擎提供的跨平台的AR开发框架,其集成了ARKit和ARCore,能够在i
10、OS和安卓设备上提供统一的开发接口,简化了跨平台开发的复杂性。此外,ARFoundation还支持各种AR特性,如空间追踪、平面检测、光照估计、物体跟踪等。综合比较,系统选择使用ARFoundation作为开发框架。ARFoundation能够兼顾iOS和安卓两大主流平台,同时具备了ARKit和ARCore的主要特性,无论是在功能性、兼容性,还是易用性、普及难度方面,都能满足系统的需求。ARFoundation为智能测量系统提供具备环境认知能力的AR会话,主要提供已识别的特征点群(点云)。每个特征点包含当前会话场景下此点的三维坐标数据和一个唯一标识符。此外,ARFoundation还能生成与用
11、户当前在屏幕上看到图像一致的二维图像。在测量系统中,确定位于待测物体内部的特征点群即可以确定该物体的最小包围盒及其顶点,再通过测量顶点之间的距离来计算包围盒的体积。然而现有的AR框架并不提供物体边缘识别功能。第39 卷能力,系统选择深度学习作为邮包选择与分割的核心技术。第5期因此本研究提出了一种筛选待测物体内特征点群的方案:首先,利用Unity场景与屏幕坐标转换API将所有特征点转换为屏幕坐标点;其次,引导用户触摸屏幕上待测量物体区域,并记录手指坐标点;最后,将当前位图、转换后的特征点列表和触摸坐标上传至服务器。服务器根据用户触摸坐标确定待测物体区域,并筛选位于该区域内部特征点群并返回给终端。
12、这样,复杂的三维边缘识别问题就转化为相对简单的二维边缘识别问题。终端接收到服务器回传的特征点列表,则可以根据该点云生成最小包围盒,对包围盒标记顶点,测量边长,从而计算出物体体积。1.2服务器图片分割模型服务器接收到终端传递参数后,根据手指触摸点位置选择待分割平面图像中物体,并对其进行分割。在过去的几年里,深度学习的进步使得图片分割的准确度显著提升。现在,有许多预训练的深度学习模型可以用于物体分割,包括U-Net、M a s kR-CNN、YO LA C T 和 SAM等。U-Net是一个用于生物医学图像分割的卷积神经网络(CNN),其使用一种对称的编码一解码结构,通过跳跃连接捕获不同级别的特征
13、。Mask R-CNN则是一种基于区域的卷积神经网络(R-CNN),其在检测到的目标区域上应用一个额外的全连接网络,以产生精确的物体掩膜。YOLACT是一种用于实例分割的实时方法,其将实例分割视为直接生成预测掩膜和预测框的问题。SAM是一种新型的深度学习模型,其主要特点是可以处理任意形状和大小的物体,并且可以在各种背景下工作。不同于其他模型,SAM使用一种特殊的物体感知机制,能够在每一个像素点上生成精确的分割掩膜。这使得SAM在处理多样化和复杂的邮包测量任务时,表现出了极高的准确度和鲁棒性。尽管其他模型在特定场景下也有优秀的表现,但是考虑到邮政物流场景中物品形状、大小和背景的多样性,SAM模型
14、是本系统的理想选择。因此,本研究将使用SAM模型进行邮包测量任务的实现,以达到高测量精确度和效率的目标。在SAM模型中,输入的数据是一张位图和识别点坐标,输出的数据是与输入图像像素相同遮罩矩阵。其中,选中物体的区域内坐标点被标记为TRUE,其他区域为FALSE。获得遮罩矩阵后,对一10邮政研究特征点列表进行遍历。当特征点坐标在遮罩矩阵中对应位置的值为TRUE时,将该特征点标记为待测物体内部的特征点。1.3通信方案在终端和服务器之间的信息传递方面,常见的通信协议主要有 HTTP、T CP/I P、FT P、W e b So c k e t等。TCP/IP是一个包括网络互连、传输控制和应用程序接口
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AR SAM在邮包测量上的应用研究 SAM 邮包 测量 应用 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。