分销赏收藏举报申诉 / 8

立即下载 VIP下载

当前位置：首页 > 学术论文 > 毕业论文/毕业设计 > 规范透视场景的半监督目标检...及其在保护压板巡检上的应用_韩畅.pdf

规范透视场景的半监督目标检...及其在保护压板巡检上的应用_韩畅.pdf

上传人：自信****多点

文档编号：308033

上传时间：2023-07-31

格式：PDF

页数：8

大小：1.77MB

《规范透视场景的半监督目标检...及其在保护压板巡检上的应用_韩畅.pdf》由会员分享，可在线阅读，更多相关《规范透视场景的半监督目标检...及其在保护压板巡检上的应用_韩畅.pdf（8页珍藏版）》请在咨信网上搜索。

1、第 43 卷第 7 期2023 年 7 月电力自动化设备Electric Power Automation EquipmentVol.43 No.7Jul.2023规范透视场景的半监督目标检测及其在保护压板巡检上的应用韩畅1，韩笑2，陈虹1，钟杰3，戈洋1，曹灿3，马杰3（1.电子科技大学计算机科学与工程学院，四川成都 611731；2.南京工程学院电力工程学院，江苏南京 211167；3.国家电网江苏省电力有限公司连云港供电公司，江苏连云港 222000）摘要：如何快速准确地对继电保护压板的异常状态进行识别，是变电站二次设备巡检工作中亟待解决的技术难题。基于深度学习的

2、通用目标检测算法在向诸如继电保护屏压板检测等特殊化场景的迁移中，不能够充分利用保护屏场景中的规范透视先验特征；此外，人工标注大数据集的困难性一直以来都是通用检测模型迁移至特殊场景时的挑战。针对上述问题，提出了一种适用于保护压板规范化分布特征的半监督目标检测模型，该模型根据压板识别场景的特点对模型框架进行了一系列适应性改进。在模型的半监督训练阶段，使用一致性正则化方法生成伪标签，并基于保护屏压板图像特征，以边缘吸附和点阵行列拟合等方式，优化或剔除伪标签，从而突破了数据标注困难性带来的限制。改进后的模型达到平均精度均值为98.12%的应用级精度，并额外输出图像的逆透视变换参量。该模型被应用于便携式

3、智能终端，辅助工作人员进行继电保护压板状态的巡检工作；模型输出的逆透视变换参量，也可为3D人机交互等下游视觉任务提供技术支撑。关键词：继电保护压板；电力系统智慧化；半监督学习；目标检测算法；逆透视变换中图分类号：TP391.41 文献标志码：ADOI：10.16081/j.epae.2022090260 引言继电保护压板是一种安装于继电保护屏上的重要机械零件。工作人员通过投入或断开保护压板，以选择继电保护的具体功能或决定保护装置是否动作于断路器，因此压板是变电站二次回路的“关键”。在变电检修及日常运行过程中，部分压板的投入或断开状态需要按照调度指令进行人工切换，而为了消除压板状态错误造成的事故

4、隐患，工作人员需要通过人工巡检的方式核对所有压板状态的正确性。被巡检压板的数量极为可观，保护屏上压板布置方式错综复杂，巡检人员的专业基础水平不一，加之缺乏有效的辅助核对工具，导致工作效率低下，误检、漏检时有发生。在以变电站为代表的一次设备巡检工作中，智能化的技术与装备正不断得到推广应用1。然而，在以继电保护压板为代表的二次设备巡检过程中，受到识别准确率不足、复杂背景识别能力弱、图像采集成本高等因素的制约，相关设备难以有效推广应用，因此，如何在便携式智能终端对压板状态进行准确的可视化识别，及时提醒巡检人员压板状态异常的信息，提高压板巡检的数字化水平，已成为变电站二次设备智能巡检过程中亟待解决的技

5、术难题。近10年来，基于深度学习的目标检测技术高速发展。以基于锚框的检测方法为例，2014年提出的基于区域的卷积神经网络（region-based convolutional neural networks，R-CNN）模型2和 2016 年提出的YOLO模型3分别奠定了两阶段和单阶段目标检测模型的技术基础。此后，基于这2类框架的改进与优化层出不穷：单阶段检测技术中，经过多轮改进的YOLOR-D6在保证检测速度的前提下，在COCO2017测试集上的平均精度均值（mean average precision，mAP）达到了57.3%；两阶段目标检测技术也产生了Cascade R-CNN4、Lib

6、ra R-CNN5等改进方案。以深度学习为基础的目标检测模型在2017年前后超越了人眼识别的极限，并逐步在各高精度自动化检测领域得到应用。基于深度学习的目标检测算法曾在变电设备红外图像识别6、输电线路巡检7等电力生产管理过程中得到有效的工程应用，然而，与上述电力一次设备检测工作不同的是，继电保护压板的检测过程仅需满足准实时性标准，但对于精确度要求较高，且保护屏集成的压板数量普遍较多，这给大规模数据集的人工标注带来了极大的困难；同时，继电保护压板的检测场景具有独特的先验特征，或可被用于提升检测方法的精度或扩充数据集样本。现存的压板状态检测方法以传统的图像特征提取手段为主89，此类方法避免了大规模

7、数据集的标注问题，却难以满足精确性的要求，且通常需要苛刻的图像采集条件，因此难以在移动设备上有效应用，以文献 8 所提方法为例，该方法仅能适应本文第4收稿日期：20220329；修回日期：20220720在线出版日期：20221019基金项目：江苏省自然科学基金资助项目（BK20181021）Project supported by the Natural Science Foundation of Jiangsu Province（BK20181021）217电力自动化设备第 43 卷节所述的正面清晰图像集；此外少部分基于深度学习目标检测算法的应用方案10难以解决大规模数据集标注

8、的成本问题，从而不可避免地因数据集规模过小导致模型的严重过拟合现象，也未能充分、良好地利用压板图像的规范分布特征。针对上述问题，本文提出了一种适应于继电保护压板规范化分布特征的半监督目标检测模型，并在较小的标注压板图像数据集和较大的未标注数据集上联合训练，最终使模型的 mAP达到 98.12%的应用级精度。该模型被应用于便携式终端中，辅助工作人员进行继电保护压板状态的高效率巡检工作。同时，该技术可被推广应用于保护端子排连接正确性、断路器控制开关位置正确性等变电站二次设备状态的核检工作中。1 检测场景、对象与方法1.1检测场景：以保护屏为例的规范透视场景本文所述的规范透视场景是指待检测目标主体具

9、有显著透视规律的目标检测场景。继电保护压板检测场景具有鲜明的规范透视场景特征，具体体现在：压板安装于室内保护屏上，排布规范，呈矩形阵列状，具有显著透视规律；压板形制、尺寸统一，相对于图像尺寸较小，且密集度较高；压板之间不存在包含、依附关系。本文旨在设计一种适应复杂光照与拍摄条件的压板状态检测模型，充分利用规范透视场景特征缓解标注监督数据缺失所造成的一系列问题，从而有效提升检测方法的精度。1.2检测预期及对象对压板状态检测模型的预期是能够准确地从通用拍摄设备在工作场景下获取到的压板屏图像中标注出各压板的位置及状态。模型预期与压板分类见附录A图A1，模型的检测对象为图像中的压板位置与状态，压板位置

10、以矩形框边界坐标表示；压板状态可分为停用状态（连片被取下）、投入状态（压板正常连通）与退出状态（压板未连通）3种。大部分采集到的压板图像见图A1（a），其中少部分将由人工标注图像中压板的位置及状态类别，形成标注数据集，剩余的大部分图像不进行任何形式的标注组成未标注数据集，本文使用上述2个数据集对模型进行半监督训练，使其产生如图A1（c）所示的预测结果。1.3检测方法：半监督目标检测模型已有的相关研究和预测试结果显示，在本文的保护屏检测场景下，经典的通用目标检测算法即使仅在较小数据集上监督训练（500 张）亦能够确保mAP在80%以上，故可以认为训练后的经典模型的大部分预测是“基本精确”的。基于

11、这一假设，本文通过改进经典两阶段目标检测方法，使用同一增强的模型框架构建教师模型与学生模型，在较小的监督数据集上训练教师模型11；之后使用一致性正则化方法对教师模型的预测输出进行修正，并结合保护屏图像在透视关系、压板尺寸、排布规律等方面的先验特征，剔除和纠正部分错误的预测框，从而为未标注的数据生成一系列伪标签，并结合监督数据与伪标签联合训练学生模型。反复迭代两学习过程，最终达到提高训练精度的目的。2 模型框架及其适应性改进教师模型与学生模型在架构和训练流程上基本一致。考虑到所使用模型的稳定性、精确性、代表性和拓展性，本文改进增强Faster R-CNN作为模型框架，同时作为对照参考半监督训练效

12、果。本节将介绍模型框架概要、实现细节及其在本文场景下做出的适应性改进。2.1模型框架：增强的Faster R-CNNFaster R-CNN是两阶段目标检测的经典模型，通过调整区域生成网络（region proposal network，RPN），使其与检测头共享同一组图像卷积特征从而大幅提升模型效率。增强的 Faster R-CNN 框架见附录 A图 A2。增强框架使用残差神经网络12作为骨干网络以提取特征图，并使用平衡特征图金字塔网络（balanced feature pyramid network，BFPN）融合提取多尺度的图像特征；图像特征一方面作为RPN的输入，以滑动窗口的方式生成一

13、系列锚框，并经由分类分支与回归分支生成候选框，经由非极大值抑制（non maximum suppression，NMS）等后处理后与图像特征进行兴趣区域调优（region of interest align，RoI Align）5，将结果输入目标检测头；增强框架使用级联边界框回归以提升检测精确度，通过使用多个级联的回归器4，设置递增的交并比（intersection over union，IoU）样本阈值将检测框不断回归至更精确的位置；最终合并级联的检测头的分类结果和末端检测头的回归结果以生成预测框，完成目标检测过程。2.2模型框架的实现细节在模型框架中，本文综合考虑任务复杂性和网络能力，选择

14、了Resnet50-vd作为骨干网络，其网络结构如附录A图A3所示，其对Resnet的主要改进是使用平均池化层代替了原有降采样过程从而减少信息损失。考虑到压板图像的比例特征，在RPN阶段选取（1.0，2.0，3.5）的长宽比及（12，24，48，96，192）的尺寸生成锚框，使用平衡交并比（IoU-balanced）采样以缓解样本“难度”之间的不平衡性，根据IoU的不同将采样阈值内的区间均匀划分为若干个采样单元，并在每单元内随机采样，检测头中的分类与回归过程与RPN过程类似。模型的RoI Align阶段中位于以(x1，y1)与(xM，yN)为顶点的候选框内的任意一点(x，y)处的特征向量F(x

15、，y)可由式（1）插值产生。218第 7 期韩畅，等：规范透视场景的半监督目标检测及其在保护压板巡检上的应用F(x，y)=i=1Mj=1NF(xi，yj)D(x，y)，(xi，yj)MN（1）式中：F为该坐标位置的特征向量；M、N分别为产生插值的区域在横向与纵向的坐标范围；D（，）为两坐标之间的距离函数。2.3模型框架中的适应性改进相对于通用目标检测，压板状态检测存在一定特殊性，即待检测物体之间不存在包含或依存关系，且各物体尺寸相对一致。基于这种特殊性，可对模型框架进行针对性改进。首先，使用完整交并比（complete IoU，CIoU）13损失函数LCIoU增强IoU损失函数，该损失函数由传

16、统IoU损失函数、框A与框B的距离损失函数、两框宽高比损失函数三部分构成，如式（2）所示。LCIoU=LIoU+LDistance+LWH=1-rIoU+2(A，B)dBound+（2）|=42()arctanwAhA-arctanwBhB2=(1-rIoU)+（3）式中：LIoU为传统IoU损失函数；LDistance为框A与框B的距离损失函数；LWH为两框宽高比损失函数；rIoU为两框的IoU；为两框中心点的距离函数；dBound为两框最小外接矩形的对角线长度；为衡量两框宽高比一致性的函数；为调整宽高比损失占全局损失的权重调节函数；wA、hA和wB、hB分别为框A和框B的宽、高。该损失函数

17、可以增强原损失函数在特殊情况下的适应性和精确性。然后，使用“压板区域不相互包含”的先验特征改进NMS过程。考虑如附录A图A4所示的情况，图中错误交叠的预测框之间的IoU值均小于0.5，而二者置信度又均高出阈值（如0.6），传统NMS过程不能正确处理此类反例，本文使用前述先验特征增强NMS判别条件，当某可信的预测框可能包含另一个时，倾向于抛弃内部的预测框。框A与框B发生包含的概率Pinclude为：Pinclude=|SISA-SISB|()1-maxSI/SA，SI/SB（4）式中：SA、SB、SI分别为框A、框B及两框相交部分的面积；、与分别为Pinclude值域范围及其各部分所占比重的调节

18、参数。3 伪标签生成、优化与纠错本节在教师模型预测的基础上，结合一致性正则化相关方法，为未标注数据生成伪标签；分析利用压板图像的先验特征，使用边缘吸附方法优化生成的伪标签坐标；最后利用压板的排列分布特征，使用点阵的行列拟合以及消失点计算的方式，纠正或剔除部分错误预测的伪标签。3.1基于一致性正则化的伪标签生成平滑假设是一致性正则化乃至半监督学习中的重要假设11，该假设认为：若两样本输入在样本空间中足够相似，则其标签也应相似。具体至本文场景，以 Auto-Augment14、Mixup 和 Mosaic 为代表的通用图像样本增强手段所产生的系列输出（见附录A图A5），应当对相同的物体产生相同的分

19、类和相近的预测框位置。基于上述假设，本文使用教师模型对同一张图片的各类数据增广样本进行预测，经逆变换后合并预测结果并执行目标物聚类，之后对于不同样本的预测结果，根据其相对目标物的距离和置信度进行“投票”，最终选取拥有足够“选票”的区域的外接矩形作为软标签。标签的边界框伪监督信息可通过计算某图像坐标(x，y)处的像素属于目标物i边界框的概率Pi(x，y)产生，Pi(x，y)的计算公式为：Pi(x，y)=1NAugk=1NAug1Nkj=1Nk fj(x，y)Bj fj BjPpredkCconf(Bj)D(ci，cBj)/Davg（5）式中：NAug为增强样本数量；Nk为第k个增强样本预测结果中

20、有效候选框的数量；fj为条件判别函数，当内部条件成立时函数值为1，否则为0；Bj为第 j 个预测框；Ppredk为第k个增强样本的预测结果；Cconf(Bj)为预测框Bj的置信度；c为物体或目标框的中心点；Davg为所有合法预测框与目标物中心点距离的调和平均值。对于物体i的边界框，汇总概率Pi(x，y)高于阈值的像素区域，并以该区域的外接矩形作为软标签坐标，并以区域内像素归属i的概率均值作为软标签置信度，根据目标物所有预测结果中各类别的占比生成软标签各分类的置信度。可视化的软标签生成过程见附录A图A6。以图像中某一压板为例，对该压板的预测结果如图A6的左下图所示。对各图进行变换后再进行预测，所

21、得的预测框经逆变换映射至原图，不同的预测框颜色代表不同的类别。区域内各像素归属于该压板区域的概率由图A6的右图中不同颜色的矩形半透明区域叠加后的不透明度进行可视化，软标签各分类的置信度则由区域内各颜色的比例进行可视化展示。3.2基于边缘吸附的伪标签优化压板相对保护屏底板在图像上一般呈现明显的梯度变化，因而本文使用边缘吸附方法优化3.1节生成的伪标签坐标，该方法亦可以作为模型输出的后处理过程以提升模型精度。边缘吸附过程中，当判别边界框未经过、未贴合边缘时，尝试将边界框范围调整至贴合附近的边缘。本文使用一种基于引力梯度的自适应阈值Canny算子15以从边缘信息丰富的保护屏图像中提取边缘。219电

22、力自动化设备第 43 卷经典Canny算子中使用的梯度向量计算方法表示为：|g?=()x2+()y2|Ex2+|Ey2=arctan()y/xarctan|Ex|Ey（6）式中：|g?|为灰度梯度值；为梯度方向角；Ex、Ey分别为x、y方向的偏导值，由22的邻域差分算子近似计算得到。本文引入灰度值引力场改进这一计算方法，点i处的近似梯度向量i计算如下：Ei=jG(mj-mi)|mj-mirij2rij rij（7）式中：G为引力常数；rij为点i、j 之间的坐标向量；mi、mj分别为点i、j 的灰度值。i是对周围所有像素灰度差产生的“场”的合并从而近似梯度向量。使用区域梯度阈值自适应

23、的方法，根据像素点位置周围区域的梯度分布调整局部阈值以保证不损失边缘细节。在执行边缘吸附算法时，若预测框的某个边界未与任何边缘相交，则判别该边界处于目标压板图像外侧，应向内调整；为避免发生错误的边缘吸附，算法不向外部调整边界框。边缘检测效果的对比以及边缘吸附流程如附录A图A7所示。3.3基于行、列拟合与消失点计算的伪标签纠错保护屏压板通常以横向水平、纵向竖直的矩形阵列排布，每行、列压板的坐标均可拟合为直线，并汇于2个消失点，基于拟合生成的行、列直线以及消失点可以排除预测框位置的显著错误。需说明的是，图像的消失点检测问题已有许多有效解决方案，例如使用Hough变换方法16等，这类方案大多需要从图

24、像内正确检测到足够多的直线或直线对，然而当图像背景复杂时，在边缘信息丰富的保护屏图像中检测到的直线精度将被大量噪声所干扰，类似Hough变换的方法易产生部分错误的估计结果，该类方法也浪费了模型的预测结果所包含的信息。经过一致性正则化和边缘吸附的教师模型预测结果附录A图A8所示，但其仍包含数个错误检出的负样本，其中2个远离保护屏区域，另一个则混杂于大量压板图像之间。本节所述的处理过程旨在从该预测结果中排除类似错误。为方便表述，将附录A图A8所示的预测结果抽象为一个带有标签的点阵，需注意不是所有状态压板的图像中心均能充分靠近压板的实际中心（空与投状态压板图像的中心一般落在2个连接旋钮之间，而退状态

25、压板图像的中心则偏向一侧），因此这一抽象过程是通过抽取预测框右上角顶点实现的，抽象点阵如图1所示。行点集初步筛选的步骤如下：统计点阵中各点到最近邻点的距离，取中值作为压板间距估测值，并将其乘以比例系数（如1/5）得到阈值T0，计算点阵规模乘以比例系数（如0.95）记作T1；对于点阵中的每一点，均与其他所有点构成直线，统计与这些直线的距离小于阈值T0的点构成点集S，选择合适的直线使S的规模最大，对于多个相同规模者按照S内各点的最大间距dmax对各直线进行升序排列；根据各直线所对应dmax按比例对步骤中选择的点集S进行投票，统计点阵中各点的投票，选择票数最高且互不重叠的点集S0 Sk，使其总规模高

26、于阈值T1，从而得到行点集的初步划分结果。上述方法要求点阵的行列之间的规模存在显著的差异，否则将无法确定步骤所得投票结果为行点集或列点集；且该方法要求图像的倾角不过分大，否则将存在步骤为斜向点集投票的可能。上述要求并不会显著减少无监督数据集对模型的训练质量，不符合要求的图像由人工判别并剔除，不参与训练过程。图2为上述过程输出的行点集划分示例。使用完全最小二乘法（total least squares，TLS）分别对划分出的行点集进行直线拟合。点 pi=(xi，yi)到直线ax+by+c=0（a2+b2=1）的距离可以表示为|axi+byi+c，因此期望寻找直线参数(a，b，c)以最小化规模为

27、n 的行点集R=pi=(xi，yi)|i1，n 到直线的距离平方和误差，的计算公式为：=i=1n(axi+byi+c)2（8）令对c的偏导为0，则有：图1预测结果坐标点阵Fig.1Dot matrix of prediction results图2行点集划分示例Fig.2Division example of dot matrix in lines220第 7 期韩畅，等：规范透视场景的半监督目标检测及其在保护压板巡检上的应用c=i=1n-2()axi+byi+c=0（9）求解可得c为：c=ani=1nxi+bni=1nyi=ax+by（10）式中：x、y 分别为x1 xn、y1 yn的均值。

28、故可表示为如下形式：=|x1-x y1-y xn-x yn-y|ab 2=(UN)T(UN)（11）式中：N=a，bT，为待求解的参数矩阵。令对N的导数为0，则有：ddN=UTUN+NTUTU=2(UTU)N=0（12）式中：UTU为关于x、y的二阶矩。UTU为对称矩阵，又由于N2=1的限定，故UTU最小特征值对应的特征向量即为所求N。直线拟合结果如图3所示。使用DBSCAN17对TLS过程所求得的行直线簇产生的交点进行聚类，从而生成行消失点。在此基础上，本文使用以下最优化算法完成对点阵的列直线拟合。算法的输入为点集的划分结果R1 Rn与过其消失点Vr=(xVr，yVr)拟合生成的直线lr1

29、lrn，划分中点的集合S=i=1kRi=s1，s2，sk，待拟合的列直线条数为m；输出为列消失点Vc=(xVc，yVc)及对S拟合的m条列直线lc1 lcm。规定矩阵Xa b的p范数为：Xabp=()i=1aj=1b xpij1p（13）直线lr1 lrn、lc1 lcm均以直线倾斜角表示为：F(i，xV，yV)=(x-xV)sin i+(y-yV)cos i=0 xsin i+ycos i-xVsin i-yVcos i=0（14）式中：i为第i条行直线倾斜角，按升序排列。同样地，按照升序排列列直线倾斜角i，本条列直线与前一条列直线倾斜角之差 i=i+1-i，从而构成m-1行的矩阵，如式（1

30、5）所示。=1，2，m-1T（15）联立行、列直线方程（若平行，则向列直线方程中的i值添加一极小量），解得mn个交点坐标，记为Sc，如式（16）所示。Sc=|p11p12 p1mp21p22 p2m pn2pn2 pnm（16）式中：pij为第i行直线与第 j 列直线相交形成的交点。若S的规模为k，则定义每个交点pij与S中每一点的距离向量Dij为：Dij=D(pij，s1)，D(pij，s2)，D(pij，sk)T（17）优化式（18）所示的目标函数FOPT以拟合列直线簇。FOPT=i=1nj=1m Dij+()+-1（18）()=1m-1i=1m-1(i-)（19）式中：i=1nj=1m

31、Dij为所有交点到S内所有点距离的范数；、为超参数；()为相邻直线间夹角的均方差；-为相邻直线间夹角的均值；-1为直线间夹角范数的倒数。值得指出的是，式（18）中的i=1nj=1m Dij用于衡量直线簇lc1 lcm对点集S的拟合程度。在式（18）中设置()的目的是防止直线倾角间的差距过大，设置-1的目的是避免直线簇间的夹角过小而仅拟合某一列点集。在实践中，可以取=-2、=-2。具体而言，最优化计算过程分为2个阶段。1）第一阶段统计给定行的点集规模，选择规模为中值的点集Ri，随机选定列消失点位置V(0)c，过点V(0)c与Ri中各点分别构造|Ri条直线以构造列直线簇参数矩阵计算交点矩阵Sc，此

32、时目标函数是对变量Vc=(xVc，yVc)的二元函数，分别对xVc、yVc求偏导，使用梯度下降法优化该目标函数，迭代生成消失点V*c。2）第二阶段固定列消失点V*c，以第一阶段中的直线构造方法生成列直线倾角参数(0)c，作为迭代初始值输入式（18），此时目标函数是对直线簇倾角c的m元函数，使用梯度下降法优化目标函数，迭代生成列直线簇倾角参数*c。使用上述最优化计算过程，可以计算点到行、列拟合直线的距离，以剔除位置错误的预测点，拟合结果与错误点剔除示例如图4所示。综合使用本节所提方法，可以实现无监督数据集的伪标签的生成、优化与错误剔除。图3直线拟合结果Fig.3Fitting results b

33、y using straight lines221电力自动化设备第 43 卷4 实验与评估4.1数据集及数据增强方法根据图像拍摄环境及识别的复杂程度，对采集到的压板图像进行差异化选择并标注1 000张图像归入4个难度类别，其中500张作为教师模型的监督训练数据，其余500张作为测试集评估模型能力，并针对各类数据集各采集2 500张作为未标注数据以训练学生模型。各数据集采集要求和样本参数如附录A表A1所示。特别地，所采集的无监督样本需确保图像包含且仅包含 1 个保护屏及其上的所有压板，否则将导致伪标签生成错误。本文在教师模型训练阶段与伪标签一致性正则化阶段中均结合应用Auto-Aug

34、ment与Mosaic数据增强方法，另外根据半监督通用目标检测相关研究的经验，使用 Auto-Augment方法进行数据增强时，教师模型训练阶段设置相较于生成伪标签时相等数量的图像变换方式和更高的数据增强强度，一致性正则化阶段的强度被启发式地设置为教师模型训练阶段的40%。4.2半监督训练过程半监督训练由监督和无监督过程交替迭代完成，为确保教师模型的初始准确率，采用AI Studio开源的ResNet50-vd-SSLDv2-FPN模型参数进行初始化18，然后完全在监督数据集上完成第一次 Fine-Tune 过程，此时模型在测试集整体上的 mAP 已达91.89%。再从无监督数据集中按类别随机

35、抽取与当前监督数据集规模大致相同的图像，使用第3节所述方法为这些图像生成伪标签并加入监督数据集内，使用新的监督数据集继续训练该模型，迭代上述过程直至所有无监督数据均被标注。每阶段训练所使用的图像均以 4 1 的比例划分为训练集与验证集，与表A1所示的测试集不存在重叠。实验的训练与测试均运行于2张RTX A6000显卡，使用CUDA11.2与CUDNN-v8.1.1.33架构进行并行化加速。教师模型的第一次训练使用监督数据集中的500张图像，共计250个阶段、迭代7 813次，开始阶段使用线性 warmup 策略执行 250 次，之后以0.002 5的初始学习率和余弦学习率衰减策略调整学习率；使

36、用基于 Adam的优化器完成梯度更新。各训练阶段均选取前一阶段在测试集上拥有最佳表现的模型作为教师模型。之后的训练阶段中，除不使用warmup策略外，仅对学习率与训练阶段数进行调整，其余策略及参数配置不作改变，各训练阶段具体参数及其训练用时见附录A表A2。另考虑到初次训练后的教师模型在大倾角复杂测试集上的 mAP仍不理想，因此第一次伪标签生成时所选择的无监督数据集不包括大倾角复杂数据集。4.3模型效果评估各训练阶段的全局模型损失及在4类测试集上的 mAP如图 5所示。图中：PmAP0.5为 IoU阈值为 0.5时的mAP；波形截断了少量训练初期的极高模型损失数据，如图中黑色点线所示，使用k（k

37、=10）移动平均对损失数据进行平滑处理。由图可见，每个新的无监督训练阶段开始时全局模型损失会有小幅上升，但模型在测试集上的表现基本不受此影响，每个阶段的全局模型损失及模型在验证集和测试集上的表现最终均趋于稳定。为验证本文所增强模型及本文所使用的方法所带来的效果提升，本文使用监督数据训练了包括经典Faster R-CNN与YOLOv3在内的各类目标检测模型，并在4类测试集上进行评估测试。表1为以每类测试集下不同IoU阈值的mAP为评估指标的测试结果。表中：PmAP0.75为 IoU 阈值为 0.75时的 mAP。由表可见：模型本身的适应性、后处理中的边缘吸附方法效果以及无监督训练过程效果均有了明

38、显的提升，其中边缘吸附的后处理流程带来了0.35个半分点的提升，验证了边缘吸附过程在本文场景下的有效性；半监督训练过程带来了5.88个百分点的mAP提升，验证了本文使用的半监督方法对数据集扩充的重要意义；本文方法的PmAP0.5最终达到了98.12%，在正面清晰与大倾角清晰测试集上的效果尤为突出，分别达到了99.72%和99.17%，这意味着适当保证图像的拍摄条件时，本文方法可保证压板识别结果的精确性与稳定性；模型的预测速度可达9帧s，满足准实时性的检测要求；此外，并无迹象表明无监图4拟合结果与错误点剔除示例Fig.4Example of fitting result and error do

39、ts elimination图5各训练阶段的全局模型损失及在测试集上的mAPFig.5Overall model loss and mAP on test setsin each training stage222第 7 期韩畅，等：规范透视场景的半监督目标检测及其在保护压板巡检上的应用督学习阶段对模型效果的提升达到饱和，更大数据规模的无监督学习极有可能进一步提升模型效果。4.4压板图像的可视化比对在压板图像识别结果的基础上，利用3.3节中拟合所得的2组直线簇及其消失点，使用逆透视变换方法1920，完成图像内参数的标定，从而消除图像中的透视形变，进而完成压板图像的可视化比对，方便工作人员检查压

40、板的变动。压板状态识别、逆透视变换与结果对比如附录A图A9所示，其直观展示了3.3节所述的行、列直线拟合以及消失点计算结果应用于下游计算机视觉任务的可行性。图A9（a）、（c）分别展示了本文模型对包含同一块保护屏的2张不同图像的状态识别结果，这2张图像的拍摄角度与光照条件均不相同，其中有6个压板的状态发生了改变，应用第3.3节所述的行、列直线拟合以及消失点计算方法，并进行逆透视变换还原其正面图像分别见图A9（b）、（d），构建2张图像的压板状态矩阵，从而对比状态发生变化的压板并标记压板位置，图A9（e）展示了抽象化的对比结果。5 结论本文以继电保护压板屏为研究对象，重点研究规范化透视场景下的目

41、标检测精度提升方法，在对Faster R-CNN模型进行适应性增强的基础上，提出一种使用一致性正则化与保护屏透视先验特征生成伪标签的半监督模型训练方法，并在较小规模监督数据集（500张）和较大规模无监督数据集（10 000张）上进行联合训练，所得结论如下。1）采用本文所提训练方法的模型识别精度达到了不低于 98.12%的应用级水准，基于该方法的智能移动终端应用在实际测试中取得良好的检测效果，验证了本文方法的稳定性、精确性和鲁棒性。2）本文所使用的半监督训练方法具有广泛的拓展性，该方法可被迁移到绝大多数支持Fine Tune的通用目标检测模型的训练中，例如其可在其他变电站二次设备（如端子排）的巡

42、检工作中推广应用。3）本文模型对透视参数的估计可直接用于图像的内外参数标定或被识别对象的姿态估计，并可为增强现实或3D人机交互等下游任务提供技术支撑。附录见本刊网络版（http：）。参考文献：1任宝军，高志勇.一种基于边缘计算的分散式站所终端方案的设计与实现 J.综合智慧能源，2022，44（6）：59-69.REN Baojun，GAO Zhiyong.Design and implementation of a terminal configuration scheme in a decentralized distribution station based on edge comput

43、ing J .Integrated Intelligent Ener-gy，2022，44（6）：59-69.2GIRSHICK R，DONAHUE J，DARRELL T，et al.Rich feature hierarchies for accurate object detection and semantic segmen-tation C IEEE Conference on Computer Vision and Pattern Recognition.Columbus，OH，USA：IEEE，2014：580-587.3REDMON J，DIVVALA S，GIRSHICK R

44、，et al.You only look once：unified，real-time object detection C 2016 IEEE Con-ference on Computer Vision and Pattern Recognition（CVPR）.Las Vegas，NV，USA：IEEE，2016：779-788.4CAI Zhaowei，VASCONCELOS N.Cascade R-CNN：delving into high quality object detection C IEEE Conference on Com-puter Vision and Patte

45、rn Recognition.Salt Lake City，UT，USA：IEEE，2018：6154-6162.5PANG Jiangmiao，CHEN Kai，SHI Jianping，et al.Libra R-CNN：towards balanced learning for object detection C IEEE Con-ference on Computer Vision and Pattern Recognition.Long Beach，CA，USA：IEEE，2019：821-830.6朱惠玲，牛哲文，黄克灿，等.基于单阶段目标检测算法的变电设备红外图像目标识别及定位

46、 J.电力自动化设备，2021，41（8）：217-224.ZHU Huiling，NIU Zhewen，HUANG Kecan，et al.Identification and location of infrared image for substation equipment based on single-stage object detection algorithm J Electric Power Automation Equipment，2021，41（8）：217-224.7林刚，王波，彭辉，等.基于改进Faster-RCNN的输电线巡检图像多目标检测及定位 J .电力自动化

47、设备，2019，39（5）：213-218.LIN Gang，WANG Bo，PENG Hui，et al.Multi-target detection and location of transmission line inspection image based on improved Faster-RCNN J.Electric Power Automation Equipment，2019，39（5）：213-218.8付文龙，谭佳文，吴喜春，等.基于图像处理与形态特征分析的智能变电站保护压板状态识别 J.电力自动化设备，2019，39（7）：203-207.FU Wenlong，TA

48、N Jiawen，WU Xichun，et al.Protection platen status recognition based on image processing and morphological feature analysis for smart substationJ.Electric Power Automation Equipment，2019，39（7）：203-207.9卜强生，高磊，闫志伟，等.智能变电站继电保护软压板防误操作策略及实现 J .电力自动化设备，2016，36（12）：156-160，168.BU Qiangsheng，GAO Lei，YAN Zhi

49、wei，et al.Strategy and im表1 不同模型及训练方法的测试结果Table 1 Test Results of different models and training methods模型及训练方法YOLOv3Faster R-CNN（Baseine）Cascade R-CNNCascade R-CNN+FPN+ssld本文模型监督数据监督数据+边缘吸附全部数据+边缘吸附PmAP0.5%正面清晰85.9690.6792.9995.2396.6096.9499.72正面复杂80.7785.7988.1190.2491.3691.4997.94大倾角清晰82.8687.799

50、0.1292.3192.8793.4999.17大倾角复杂76.5881.9883.4985.8186.7287.0395.64均值81.5486.5688.6890.9091.8992.2498.12PmAP0.75%正面清晰79.9184.2087.3591.1293.2393.9398.02正面复杂73.8281.1283.9086.5689.6590.4595.48大倾角清晰76.8182.3686.2489.6090.5192.2196.19大倾角复杂69.6377.0279.7181.5182.7285.5993.03均值75.0481.1884.3087.2089.0390.55

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 规范透视场景监督目标及其保护压板巡检应用韩畅

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。