分销赏收藏举报申诉 / 8

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 融合视觉特征增强机制的机器人弱光环境抓取检测.pdf

融合视觉特征增强机制的机器人弱光环境抓取检测.pdf

上传人：自信****多点

文档编号：722393

上传时间：2024-02-23

格式：PDF

页数：8

大小：1.93MB

《融合视觉特征增强机制的机器人弱光环境抓取检测.pdf》由会员分享，可在线阅读，更多相关《融合视觉特征增强机制的机器人弱光环境抓取检测.pdf（8页珍藏版）》请在咨信网上搜索。

1、2023 08 10计算机应用,Journal of Computer Applications2023,43(8):2564-2571ISSN 10019081CODEN JYIIDUhttp：/融合视觉特征增强机制的机器人弱光环境抓取检测李淦1，牛洺第1，2，陈路1，2，3*，杨静4，闫涛1，2，陈斌5，6（1.山西大学计算机与信息技术学院，太原 030006；2.山西大学大数据科学与产业研究院，太原 030006；3.太原卫星发射中心技术部，太原 030027；4.山西大学自动化与软件学院，太原 030031；5.哈尔滨工业大学重庆研究院，重庆 401151；6.哈尔滨工业大学

2、（深圳）国际人工智能研究院，深圳 518055）（通信作者电子邮箱）摘要：现有的机器人抓取操作通常在良好光照条件下开展，此时目标细节清晰、区域对比度高，而在夜间、遮挡等弱光环境下目标的视觉特征微弱，会导致现有的机器人抓取检测模型的检测准确率急剧下降。为提高弱光场景下稀疏、微弱抓取特征的表征能力，提出一种融合视觉特征增强机制的抓取检测模型，通过视觉增强子任务为抓取检测施加特征增强约束。对于抓取检测模块，采用仿U-Net框架的编码器-解码器结构实现特征的高效融合；对于弱光增强模块，从局部、全局层面分别提取纹理、颜色信息，以实现兼顾目标细节与视觉效果的特征增强。此外，分别构建弱光Cornell数据集

3、和弱光Jacquard数据集两个新的弱光抓取基准数据集，并基于上述数据集开展对比实验。实验结果表明，所提弱光抓取检测模型在基准数据集上的准确率分别达到了95.5%和87.4%，与生成抓取卷积神经网络（GG-CNN）、生成残差卷积神经网络（GR-ConvNet）等现有抓取检测模型相比，准确率在弱光Cornell数据集提升11.1、1.2个百分点，在弱光Jacquard数据集上提升5.5、5.0个百分点，取得了较好的抓取检测效果。关键词：机器人；抓取检测；弱光成像；深度神经网络；视觉增强中图分类号：TP391.4 文献标志码：ARobotic grasp detection in low-ligh

4、t environment by incorporating visual feature enhancement mechanismLI Gan1，NIU Mingdi1，2，CHEN Lu1，2，3*，YANG Jing4，YAN Tao1，2，CHEN Bin5，6（1.School of Computer and Information Technology，Shanxi University，Taiyuan Shanxi 030006，China；2.Institute of Big Data Science and Industry，Shanxi University，Taiyua

5、n Shanxi 030006，China；3.Technology Department，Taiyuan Satellite Launch Center，Taiyuan Shanxi 030027，China；4.School of Automation and Software Engineering，Shanxi University，Taiyuan Shanxi 030031，China；5.Chongqing Research Institute，Harbin Institute of Technology，Chongqing 401151，China；6.International

6、 Institute of Artificial Intelligence，Harbin Institute of Technology（Shenzhen），Shenzhen Guangdong 518055，China）Abstract:Existing robotic grasping operations are usually performed under well-illuminated conditions with clear object details and high regional contrast.At the same time，for low-light con

7、ditions caused by night and occlusion，where the objects visual features are weak，the detection accuracies of existing robotic grasp detection models decrease dramatically.In order to improve the representation ability of sparse and weak grasp features in low-light scenarios，a grasp detection model i

8、ncorporating visual feature enhancement mechanism was proposed to use the visual enhancement sub-task to impose feature enhancement constraints on grasp detection.In grasp detection module，the U-Net like encoder-decoder structure was adopted to achieve efficient feature fusion.In low-light enhanceme

9、nt module，the texture and color information was respectively extracted from local and global level，thereby balancing the object details and visual effect in feature enhancement.In addition，two low-light grasp datasets called low-light Cornell dataset and low-light Jacquard dataset were constructed a

10、s new benchmark dataset of low-light grasp and used to conduct the comparative experiments.Experimental results show that the accuracies of the proposed low-light grasp detection model are 95.5%and 87.4%on the benchmark datasets respectively，which are 11.1，1.2 percentage points higher on low-light C

11、ornell dataset and 5.5，5.0 percentage points higher on low-light Jacquard dataset than those of the existing grasp detection models，including Generative Grasping Convolutional Neural Network（GG-CNN），and Generative Residual Convolutional Neural Network（GR-ConvNet），indicating that the proposed model h

12、as good grasp detection performance.Key words:robot;grasp detection;low-light imaging;deep neural network;visual enhancement文章编号：1001-9081（2023）08-2564-08DOI：10.11772/j.issn.1001-9081.2023050586收稿日期：20230516；修回日期：20230612；录用日期：20230616。基金项目：国家自然科学基金资助项目（62003200，62006146）；山西省基础研究计划项目（202203021222010

13、）；山西省科技重大专项（202201020101006）。作者简介：李淦（2001），男，山西吕梁人，主要研究方向：抓取检测、深度学习；牛洺第（2000），男，河南平顶山人，硕士研究生，主要研究方向：抓取检测、图像增强；陈路（1991），男，山东聊城人，副教授，博士，CCF会员，主要研究方向：机器人抓取、图像增强；杨静（1990），女，山西太原人，讲师，博士，主要研究方向：机器学习、图像处理；闫涛（1987），男，山西定襄人，副教授，博士，CCF会员，主要研究方向：三维重建；陈斌（1970），男，四川广汉人，教授，博士，主要研究方向：机器视觉。第 8 期李淦等：融合视觉特征增强机制的机器人弱光

14、环境抓取检测0 引言随着大数据、人工智能技术发展，机器人智能化水平不断提高1，作为一项重要的物体操控与人机交互能力，机器人抓取也得到越来越多的关注，广泛应用于智能分拣、家庭服务和水下作业等领域2-4。抓取检测定义为从视觉图像出发，自主检测目标物体上的可抓取部位，它的检测精度直接决定了目标抓取操作的有效性与稳定性，是机器人抓取的重要基础。受目标种类、形态未知，复杂环境干扰和多物体相互遮挡等因素影响，真实场景下的机器人抓取检测仍面临诸多严峻挑战。早期基于分析法的抓取检测算法往往依赖于对目标物理属性与几何结构的建模，如：表面材质、摩擦力、扭矩等，并采用力闭合（Force-closure）或形闭合（

15、Form-closure）策略判断抓取稳定性；但需提供目标物体完整三维模型，上述模型在真实场景下较难生成，且分析法对噪声等干扰的鲁棒性较差。得益于深度神经网络强大的判别特征学习能力，基于深度学习的抓取检测方法正受到愈加广泛的关注。Redmon等5首先引入卷积神经网络（Convolutional Neural Network，CNN）以端到端的方式预测可抓取区域参数，在抓取检测准确性和实时性方面都取得了较好的效果；Asif等6提出一种 GraspNet的CNN体系架构，在保持紧凑模型结构的同时，生成较高质量的抓取检测结果，且适用于低功耗设备；针对小尺寸、多目标、密集分布、任意方向等挑战场景下的抓

16、取检测任务，Wu等7提出特征融合与上采样模块（Fusion and Up-sample Module，FUM），以生成具有精细分辨率的强语义抓取特征；Yu等8结合压缩激励模块与 U-Net 架构，提出压缩激励残差网络（Squeeze and Excitation ResUNet，SE-ResUNet），通过集成通道注意力残差模块，从RGB-D图像中生成抓取估计，并预测每个抓取估计的质量分数。现有机器人抓取任务通常在光照良好条件下开展，此时目标细节清晰、区域对比度高；而在夜间等弱光条件下，目标视觉特征微弱，且与背景融为一体，给有效提取抓取特征带来挑战。经测试，使用亮度降低和添加噪声的Cornel

17、l数据集，文献 9 中生成的残差卷积神经网络（Generative Residual Convolutional Neural Network，GR-ConvNet）准确率从 97.7%下降至94.3%。由图1给出弱光环境下的目标物体抓取检测结果可以看出：直接在弱光图像上进行抓取检测，检测结果数量少、抓取区域质量低，见图1（a）；而本文模型通过添加图像增强任务辅助，能预测更优的抓取区域，如图1（b）所示。图1GR-ConvNet和本文模型的弱光条件下抓取检测结果对比Fig.1Comparison of detection results under low-light conditions b

18、etween GR-ConvNet and our model为解决弱光条件下的视觉检测问题，现有方法往往依赖外置光源补光、红外相机/激光雷达辅助成像等方式，普遍存在能源消耗大、目标细节纹理信息缺失、多源信息融合复杂等不足，难以提供自然、丰富的图像视觉表示。随着图像视觉增强技术的发展，从弱光条件下感光芯片，如：电荷耦合器件（Charge Coupled Device，CCD）或互补金属氧化物半导体（Complementary Metal Oxide Semiconductor，CMOS）采集的稀疏、微弱光信号出发，利用深度学习等特征提取与表征方法，重构弱光信号污染下的图像真实像素值，从而恢复具

19、有清晰局部细节与自然色彩分布的正常光照图像，为解决弱光环境下的抓取检测问题提供了可行解决方案。Ignatov等10提出一种基于生成对抗网络（Generative Adversarial Network，GAN）11的强监督卷积神经网络，将手机的摄像水平提高到单反水平。Sharma等12提出基于分类的动态图像增强，首次将图像增强任务与分类相结合。这些模型对亮度、颜色、对比度、细节、噪声抑制等方面作出极大贡献。然而，受限于光学传感器灵敏度、固有噪声、模型误差等因素，图像增强算法恢复后的图像仍存在不同程度的颜色失真、细节模糊、噪声污染等问题，给可抓取特征的有效提取带来挑战；此外，现有研究13表明，单

20、纯提升图像视觉质量并不一定有助于提升下游任务（如：目标检测、图像分割等）的性能表现。因此，如何有效平衡图像视觉增强与可抓取特征提取之间的权重，在保证图像视觉质量的同时，尽可能提升模型在弱光条件下的抓取检测准确率，便成为亟待解决的关键。针对上述问题，本文提出一种融合视觉特征增强模块的弱光环境抓取检测算法，通过图像增强与抓取检测双任务约束，进一步提取增强后的可抓取特征，兼顾图像视觉质量与抓取检测精度。具体地，首先将弱光图像输入网络进行视觉特征提取，而后将提取特征输入两个不同模块（弱光增强模块和抓取检测模块），最后得到增强后的正常光图像和预测的抓取矩形。本文的主要工作如下：1）提出一种融合视觉特征增

21、强机制的弱光抓取检测网络（Low-light Grasp Detection Network，LGDN），通过图像增强任务约束，提升模型对微弱可抓取特征的增强与提取能力；2）引入全局分支学习颜色矩阵、伽马值等图像信号处理参数，通过与局部分支所学习纹理、结构信息的融合，实现兼顾细节与视觉效果的增强特征学习；3）构建了弱光 Cornell 数据集（Low-light Cornell Dataset）和弱光Jacquard数据集（Low-light Jacquard Dataset），本文模型在这两个数据集上的抓取检测准确率分别为95.5%、87.4%，优于对比模型。1 相关工作 1.1抓取检测近年

22、来随着深度学习的发展，越来越多的研究人员将深度学习应用于抓取检测领域。Jiang等14利用卷积神经网络生成质量、角度和宽度图像，推断对跖抓取位姿，可以推断出多个物体的抓取矩形；Pinto等15使用了一种类似于AlexNet的架构，并表明通过增加数据大小，卷积神经网络可以更好地泛化到新的数据。研究对基于卷积神经网络的抓取检测领域具有开创性的贡献，但由于缺少质量高的数据集以及高性能的网络，这些模型在测试过程中的正确率较低，不利于真实场景下的抓取任务。2565第 43 卷计算机应用基于上述研究，Ainetter等16提出端到端可训练的卷积神经网络架构，结合抓取检测和分割的结果以提升整体抓取精度；Sa

23、tish 等17引入了一种全卷积抓取质量卷积神经网络（Fully Convolutional Grasp Quality Convolutional Neural Network，FC-GQ-CNN），该网络使用数据收集策略和综合训练环境来预测抓取质量；Cao等18提出了一种新型的轻量级抓取检测网络，该网络以RGB与深度图图像为输入，预测抓取矩形的抓取质量、旋转角度和开口宽度；Kumra等9提出一种新的生成残差卷积神经网络GR-ConvNet，该网络能取得较好的抓取检测效果与较高的检测效率。上述工作通过改进卷积神经网络结构、增加网络层数和增加深度图像信息来增强对抓取特征的提取；但它们的网络参数

24、已经达到百万级别，模型推理速度较慢。为提高移动式设备上模型推理的速度，减少模型参数量，Song等19提出了一种分层RGB-D融合的抓取预测模型；为了减少模型可训练参数，Shukla等20提出了一种生成初始神经网络，极大提高了模型推理速度。尽管以上模型对于在公共数据集下的抓取检测模型已经具有良好的性能，但是对于存在噪声、遮挡、光照变化等复杂情况下的抓取检测研究较少。1.2弱光图像增强得益于深度神经网络在特征提取和表征领域的优势，基于深度学习的弱光图像增强方法也得到愈加广泛的关注。Wei等21提出基于视网膜（Retinex）理论的弱光照图像增强网络（RetinexNet），该网络由光照估计和反射层

25、估计两部分组成，可同时估算输入图像的光照和反射信息；Wang等22同样基于Retinex模型，从解耦的角度提出一种新的渐进式Retinex框架，使用相互增强的方式感知弱光照图像的光照和噪声；Liu等23同样基于Retinex模型设计照明估计模块和噪声去除模块来抑制噪声。通过这种方法，可以提高图像的动态范围，并且在一些特定的场景中取得了很好的效果。以上模型都是基于有监督的情况下配对学习，然而获取配对的弱光图像与正常光图像十分耗费人力物力，且大部分网络只适用于静态场景。为解决对配对数据的依赖，Guo等24通过逐步推导构造出了一种像素级别的曲线估计卷积神经网络Zero-DCE（Zero refere

26、nce Deep Curve Estimation），并设计了一系列的零参考训练损失函数，以解决弱光照图像增强问题。Jiang等25提出的EnlightenGAN模型使用一种新颖的注意力图（Attention Map，AM）模块来引入灰度图像的注意力机制到图像增强模型。这种方法可以根据不同区域的灰度值来给予不同的权重，从而提高图像细节的清晰度。Cui等26提出一种轻量级网络，使用新型 Transform 结构来估计图像信号处理（Image Signal Processing，ISP）相关参数，既可以处理弱光增强任务，也可以处理曝光矫正任务。该模型不仅具有良好的还原效果，而

27、且网络参数较少、速度较快，适用于嵌入式设备上的图像处理任务。2 本文模型 2.1网络总体结构本文所提的弱光抓取检测网络主要由特征提取模块（Feature Extraction Module，FEM），抓取检测模块（Grasp Detection Module，GDM）和弱光增强模块（Low-light Enhancement Module，LEM）三部分组成，如图2所示。图2本文弱光抓取检测网络总体结构Fig.2Overall structure of the proposed low-light grasp detection network模型输入为弱光环境下拍摄的低

28、可视RGB图像，该图像经过预处理生成对应的灰度图，与弱光图像一起，作为FEM的输入。FEM融合了EnlightenGAN25中注意力图机制来辅助在暗光条件下的抓取检测特征的提取。通过注意力图机制保留原本图像信息可以有效防止增强过后的过曝现象，防止原本光亮的区域更加光亮。GDM和LEM分别关注抓取特征和增强特征的提取，分别输出可抓取部位参数与增强后的图像。在LEM中通过local模块与 global 模块，分别提取图像的明暗特征与颜色特征。之后通过融合操作，生成正常光RGB图像。通过LEM的辅助增强任务，有助于提升GDM对低对比度抓取特征的提取与判别能力，从而提升模型在弱光场景下的抓取检测精度。

29、在GDM中引入残差块（Residual Block，RB）避免深度卷积后的梯度消失，更好地提取抓取特征。在经过3个卷积转置模块（ConvT2D And BatchNorm，CTAB）后生成3幅图像，分别对应抓取质量（Quality）、抓取角度（Angle）与抓取宽度（Width）。3幅图像融合生成抓取矩形，与正常光图像形成抓取结果。2.2特征提取模块对于输入弱光图像Ilow，FEM 通过级联 4 个下采样模块（Down Sampling，DS）进行渐进式特征提取。每个DS模块由卷积层（Conv2D）、批归一化层（Batch Normalization，BN）、激活层（Rectified Li

30、near Unit，ReLU）和最大值池化层（Max Pooling）构成，如图3所示。最终生成128通道和256通道的特征图（Feature Map），其中128通道特征图IGDM作为GDM的输入进行抓取参数预测，256通道特征图ILEM作为LEM的输入进行弱光图像增强任务。这个过程可以表示为：IGDM=DS(Ilow)3（1）ILEM=DS(Ilow)4（2）其中DS表示下采样模块。图3特征提取模块结构Fig.3 Structure of feature extraction module2566第 8 期李淦等：融合视觉特征增强机制的机器人弱光环境抓取检测2.3抓取检测模块抓

31、取检测模块（GDM）接收来自FEM的128通道特征图，并利用5个残差块（Residual Block，RB）和3个卷积转置模块CTAB（ConvT2D And BatchNorm）进行可抓取区域参数的预测。GDM输出为3个与输入图像相同尺寸的图像，分别为：抓取质量、抓取角度和抓取宽度。3幅图像中同一空间位置所对应的像素值分别代表当前抓取参数所对应的抓取质量、旋转角度和末端执行器张开宽度。为避免模型层数过多易导致的梯度消失、过拟合等问题，在RB模块中，引入跳跃连接使模型能够融合底层特征，从而更好地实现抓取特征融合，如图4所示。此外，为了还原图像细节并保留空间特征，在CTAB模块中使用卷积转置操作

32、，以获得与输入图像尺寸相同的输出特征图。过程可以表示为：Ioutput=CTAB(RB(IGDM)5)3（3）其中：RB表示残差模块，CTAB表示卷积转置模块，Ioutput表示输出特征图。在抓取表示方面，本文使用Morrison等27提出的基于像素的抓取表示方式，即G=(p，w，q)（4）其中：p=(x，y)表示抓取矩形框的几何中心位置；代表抓取矩形框绕水平轴旋转的角度，取值范围为-/2，/2；w为手爪张开的宽度，取值范围为 0，W 像素，W是手抓张开的最大宽度；q表示当前抓取状态所对应的抓取质量，为01的数值，接近1表示更大的抓取成功率27。2.4弱光增强模块对于弱光增强模块LEM，利用局

33、部分支（Local Branch）和全局分支（Global Branch）分别进行弱光特征提取，并通过特征融合进一步提升图像视觉质量，见图5。图5弱光增强模块结构Fig.5Structure of low-light enhancement module局部分支和全局分支局部分支以U-Net28的解码器部分为基础，并采用FEM提取的256通道特征图作为输入，使用双线性插值算法进行上采样，避免图像出现棋盘格效应。通过跳跃连接设计，保留原图的结构信息，对于反射光较强的区域，避免增强后的图像出现过曝现象。同时，在跳跃连接中，引入了EnlightenGAN25的注意力图模块，它可以视为一种权重映射，

34、能够调整原图像像素的强度，使得在暗区域中的像素值增强、亮区域中的像素值减弱。上述调整可以使得在暗光条件下捕捉的图像具有更好的视觉质量，同时兼顾图像细节和对比度之间的平衡。全局分支使用自注意力机制调整全局ISP 相关参数，包括颜色变换矩阵（Colour Matrix）和伽马（Gamma）值。注意力模块来自于 IAT（Illumination Adaptive Transformer）26网络，在模块中Q被初始化为零，作为可学习的全局分量嵌入，而 V、K 由深度可分离卷积（Depthwise Convolution）编码生成。在通过前馈神经网络（Feedforward Neural Network

35、，FNN）后生成颜色变换矩阵和伽马值，用于增强图像色彩，提高图像细节。局部全局融合色彩矩阵和伽马值通过式（5）和预增强图像融合处理后生成正常光。f()=(max(xjMxixj()，)（5）其中：Mxixj是一个33联合颜色变换矩阵，考虑了白平衡和颜色变换矩阵，使用9个查询（query）来控制Mxixj的参数；表示伽马矫正参数；是一个极小值，以防止数值不稳定，本文取值为=1E-8；表示预增强图像。2.5损失函数本文网络的损失函数由两部分构成，分别为对应抓取检测任务的检测损失d和对应弱光增强任务的增强损失e，弱光抓取检测模型的总损失total定义为检测损失与增强损失之和，即：total=e+d

36、（6）采用平滑L1损失作为检测损失d，具体的：d=1nk=1nzk（7）zk=0.5()Gik-Gik2，|Gik-Gik 1时，得到的图像比原始图像暗；当g 1时，得到的图像比原始图像亮；当g=1时，得到的图像与原始图像相同。实验中Gamma值分别取1.2、1.5和2。此外，为图像加入不同的噪声（椒盐噪声（Salt and pepper）、高斯噪声（Gaussian）、高斯白噪声（White Gaussian）、泊松噪声（Poisson）和乘性噪声（Multiplicative），以模拟弱光环境下的成像噪声。弱光处理后的Cornell和Jacquard数据集分别为弱光Cornell数据集和弱

37、光Jacquard数据集，具体如图6所示：图6（a）为Cornell数据集调节不同Gamma值和加入不同噪声后的前后对比；图6（b）为Jacquard数据集调节不同Gamma值和加入不同噪声后的前后对比。3.2实验设置基于弱光 Cornell 和弱光 Jacquard 数据集，在 Intel Xeon Platinum 8255C CPU 2.50 GHz，RTX 3080（10 GB）和Ubuntu 20.14系统上训练模型，实验中将batch size设为8，训练次数设为50；采用Adam优化器，将初始学习率和权值衰减分别设置为0.001和0.000 1。为了避免过拟合，采用了余弦学习策略

38、。为评价模型抓取检测精度，采用Jiang等14提出的矩形度量准则（Rectangle Metric）。具体地，当所预测抓取区域满足以下两个条件时，认为该抓取参数是正确的：1）预测抓取矩形和真实抓取矩形的 Jaccard 值不低于0.25，Jaccard值定义为预测抓取矩形Rp与真实抓取矩形Rg交集和并集的比值，如下所示：J=|Rp Rg|Rp Rg 0.25（11）2）预测抓取矩形与真实抓取矩形之间的抓取方向偏差不高于30，即：|p-g|30。3.3抓取检测定量结果利用所构建的弱光抓取数据集，将本文抓取检测模型与现有模型比较，结果如表1和表2所示，其中在弱光Cornell数据集上对比 5 种模

39、型：生成抓取卷积神经网络（Generative Grasping CNN，GG-CNN）27、AlexNet5、SqueezeNet30、ResNet-5031和 GR-ConvNet9；在弱光 Jacquard 数据集上对比 3 种模型：GG-CNN27、TF-grasp32和GR-ConvNet9。可以看到，在噪声和弱光环境下，对比模型的性能均出现不同程度的下降，如：GR-ConvNet模型9在 Cornell抓取数据集下的准确率为97.7%，而在弱光Cornell数据集上，它的准确率下降至 94.3%；在 Jacquard 抓取数据集上的准确率为94.6%，而在弱光Jacquard数据集

40、上的准确率下降至82.4%，表明弱光和噪声环境对抓取特征的有效提取具有相当程度的干扰作用。通过引入特征增强任务约束，本文模型在弱光Cornell数据集上的抓取准确率达到95.5%，与对比模型相比分别提高 11.5、14.5、6.2、4.8、1.2 个百分点。在弱光Jacquard数据集上的抓取准确率达到87.4%，与对比模型相比分别提高5.5、1.6、5.0个百分点。可以看出所提模型在弱光抓取任务中具有较为显著的优势。3.4抓取检测实验定性结果图7展示了弱光Cornell数据集抓取检测任务的实验结果，图8展示了弱光Jacquard数据集抓取检测任务的实验结果。实验中设置了不同G

41、amma值和添加不同噪声来测试模型的鲁棒性。每幅输出图像分别表示抓取质量分数（Quality）、抓取角度（Angle）和夹爪宽度（Width），同时还输出了抓取结果图。从图7、8可以看出，所提模型在弱光环境下，对于形状、质量各异物体能够取得较好的抓取检测结果，且增强后的RGB图像细节清晰，视觉效果良好。此外，本文模型对于不同亮度、噪声干扰表现出较好的鲁棒性。图6调节不同Gamma值和加入不同噪声后弱光Cornell数据集和弱光Jacquard数据集对比Fig.6Comparison of low-light Cornell dataset and low-light Jacquard data

42、set after adjusting different Gamma values and adding different noises表1不同模型在弱光Cornell数据集上的检测准确率对比（g=1.5，高斯白噪声）单位：%Tab.1Comparison of detection accuracy of different models on low-light Cornell dataset（g=1.5，white Gaussian noise）unit：%模型GG-CNN27AlexNet5SqueezeNet30准确率84.081.089.3模型ResNet-5031GR-Conv

43、Net9本文模型准确率90.794.395.5表2不同模型在弱光Jacquard数据集上的检测准确率对比（g=1.5，高斯白噪声）单位：%Tab.2Comparison of detection accuracy of different model on low-light Jacquard dataset（g=1.5，white Gaussian noise）unit：%模型GG-CNN27TF-grasp32准确率81.985.8模型GR-ConvNet9本文模型准确率82.487.42568第 8 期李淦等：融合视觉特征增强机制的机器人弱光环境抓取检测图9展示了本文模型的多抓取矩形框预

44、测结果，为复杂场景下的机器人抓取提供多样化抓取策略，有助于提高抓取成功率。从图9可以看出，所预测的多个抓取矩形框均匀分布于物体的不同部位，涵盖多种操作结构，机器人可根据具体操作任务选取不同的抓取部位。以剪刀为例，当用于剪持操作时，应选取位于刀柄部位的抓取矩形框；当用于人机交互中向操作人传递操作工具时，应选取位于刀刃部位的抓取矩形框，以提高安全性。图9多抓取框结果对比Fig.9Comparison of multiple grasp box results3.5基于不同亮度和噪声的对比实验进一步，在弱光抓取数据集构建过程中，通过改变亮度、噪声参数，生成不同亮度与噪声组合下的训练样本，从而验证本文

45、所提弱光抓取检测模型在不同干扰条件下的性能表现。具体地：通过调节式（10）中Gamma值g，分别设置为1.2、1.5、2.0来模拟较暗、暗、非常暗亮度的RGB图像，通过添加不同类型的噪声，如添加椒盐噪声、高斯噪声、高斯白噪声、泊松噪声、乘性噪声模拟多样化成像干扰因素。模型在弱光Cornell数据集测试，实验结果如表3所示。表3的实验结果表明，在相同噪声类型下，抓取检测准确率通常在Gamma值为1.2时达到最高；随着图像亮度的不断降低，目标抓取特征的判别度也随之下降，给有效特征的提取与增强带来挑战，导致抓取检测准确率下降。此外，本文模型在不同光照和噪声条件下均表现出较好的鲁棒性，测试集平均正确率

46、为95.0%，进一步证明了本文模型在应对弱光照和图7弱光Cornell数据集上的抓取检测结果Fig.7Grasp detection results on low-light Cornell dataset图8弱光Jacquard数据集上的抓取检测结果Fig.8Grasp detection results on low-light Jacquard dataset表3所提模型在不同Gamma值和噪声类型下的抓取检测结果对比（弱光Cornell数据集）Tab.3Grasp detection results comparison of the proposed algorithm under

47、different Gamma values and noises（low-light Cornell dataset）g值1.21.52.0噪声类型椒盐噪声高斯噪声高斯白噪声泊松噪声乘性噪声椒盐噪声高斯噪声高斯白噪声泊松噪声乘性噪声椒盐噪声高斯噪声高斯白噪声泊松噪声乘性噪声准确率/%96.694.396.695.597.796.697.795.594.494.492.196.692.192.192.12569第 43 卷计算机应用噪声干扰上的有效性。3.6消融实验为验证本文网络中LEM对于抓取检测任务的辅助作用，在弱光Cornell数据集上进行消融实验。在表4中分别对LEM中的Local与G

48、lobal分支进行去除，来验证LEM以及两个分支对于抓取检测任务的辅助作用。实验结果表明，将LEM整个去除后，模型准确率有较大的下降，说明LEM对于抓取检测任务具有辅助作用，可以更好地识别特征。将 Local 分支去除后模型准确率下降至93.2%，而去除 Global分支后模型准确率下降至 94.4%。均说明对于抓取检测任务而言，Local与Global分支对于抓取检测任务具有辅助作用。而去除Local分支后的准确率比去除Global分支后的准确率下降较大，符合Local分支在图像增强的任务中占主要地位的预期。3.7本文模型的不足本文模型在弱光Cornell数据集与弱光Jacquard数据集下

49、取得较好的抓取检测效果，并优于对比模型，但本文模型仍存在一些不足。首先，在机器人抓取检测任务中，抓取检测效果的评估不应仅局限于公开数据集的测试，而应更关注于真实场景下的机器人抓取成功率。由于本文针对弱光条件下的抓取检测任务，在实际场景中获取配对数据较为困难。在后续的研究中，如何在真实弱光场景下开展机器人抓取检测需要进一步研究。其次，随着深度传感器的发展，多数抓取检测模型均以RGB-D图像作为模型输入，与单纯的RGB图像相比具有更高的准确率，而本文在模型在设计过程中只考虑了RGB图像特征的提取，未引入深度图像。后续可设计专门的深度图像特征提取与融合模块，以提高弱光场景下的抓取检测效果。4 结语

50、本文针对弱光场景下的机器人抓取检测问题，从纯视觉角度提出一种基于视觉成像图像的弱光环境抓取检测模型。该模型融合了视觉增强模块辅助完成抓取检测任务，通过视觉增强任务显式地约束稀疏、微弱可抓取特征；并构造了弱光Cornell和弱光Jacquard两个弱光抓取数据集，为抓取检测模型对比提供了测试基准。实验结果表明，现有抓取检测模型在弱光抓取数据集下均出现不同程度的准确率下降，而本文所提模型能够取得最优的抓取检测准确率（弱光Cornell数据集下95.5%，弱光Jacquard数据集下87.4%）。此外，对比实验表明所提模型对于噪声和亮度变化均具有一定的鲁棒性，在弱光Cornell数据集下能够取得95

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 融合视觉特征增强机制机器人弱光环境抓取检测

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。