0分享至
用扫码二维码
分享至好友和朋友圈
中国电工技术学会活动专区
CES Conference
阅读提示:本文约 3500 字,建议收藏后阅读!
在我国电力系统中,配电站属于电力网络边缘节点,是电力系统中的重要环节。然而,人工巡检或一些传统硬件设备的数据采集手段,由于成本及效率等问题,已经无法匹配当下的安防巡检需求。针对此问题,福州大学物理与信息工程学院、闽江学院计算机与控制工程学院的研究人员陈标发、陈传东、魏榕山、罗海波,在2022年第5期《电气技术》上撰文,提出一种基于现场可编程门阵列(FPGA)的智能配电站安防巡检解决方案。 他们首先利用YOLOv4-tiny网络实现安全帽佩戴检测、工作服着装检测、越界预警识别等功能,其准确率可达93.5%;其次针对配电站的应用场景,利用FPGA在边缘设备上实现实时检测的效果,并从并行展开及流水线等方面进行加速优化。实验结果表明,该系统可在ZCU102平台上实现每秒传输帧数为68的检测速度,整体平均性能达到228十亿次运算/秒。在我国电力系统中,配电站作为电网末端与用电设备相连的关键节点,与输电、变电同样是电力系统中的重要环节。随着社会经济的高速发展,以及配电站在整个电力网络中的特殊地位,其数量也日益增加。
人工巡检或一些传统硬件设备的数据采集手段,由于成本或效率等问题,已经无法完美匹配当下数以万计的配电站安防巡检需求。并且,配电站属于高电压、高危场所,如何高效、安全地监管进入站房的工作人员及其施工区域是否合规等,更是一个重要问题。
当前的主流做法是采用安装相关传感器的方式进行监管,该方案存在成本高、无法存证等问题。因此,有必要研究与设计新的监管方法,在低成本的条件下实现证据链的保存和违规识别的高准确率。
在传统硬件设备环境感知的基础上,本文提出一种基于机器视觉的智能配电站安防巡检解决方案。此方案可通过视频监控设备,实现对配电站房内视频流的视觉分析,通过YOLO(you only look once)卷积神经网络进行目标检测,从而实现安全帽佩戴检测、工作服着装检测、越界预警识别等功能。
在实际应用中,绝大部分卷积神经网络都是部署在中央处理器(central processing unit, CPU)和图形处理器(graphics processing unit, GPU)上,然而CPU的高延时、低效率,GPU的高成本、高功耗的缺点决定了其难以在边缘设备上实现。张量处理器(tense processing unit, TPU)、网络处理器(neural- network processing unit, NPU)作为特殊的专用集成电路(application specific integrated circuit, ASIC)方案,研发成本高,研发周期长,且完成后难以更改,难以适应更新迭代较快的神经网络算法。因此,本文利用现场可编程门阵列(field programmable gate array, FPGA)的可定制性、可重构性及高并行度的独特优势,设计一套基于FPGA的快速推理模型。
1 YOLO卷积神经网络
1.1 YOLO模型
近些年来,有关目标检测算法的研究取得了一定的进展。目前比较流行的算法可以分为基于候选区域的两阶段(two stage)目标检测算法和单阶段(one stage)目标检测算法,包括YOLO、SSD(single shot multibox detector)等。相较于两阶段目标检测算法,单阶段目标检测算法虽然在精度上略有不及,但其在模型参数量及检测速度上均有一定优势。
YOLO是一种基于深度神经网络的对象识别和定位算法,是较为优秀的目标检测架构之一,其在检测实时性方面具有较大优势。YOLO将生成候选区和对象识别这两个阶段合二为一,利用整张图片作为网络的输入,直接在输出层回归边界框的位置和所属类别。
YOLOv4-tiny是在YOLOv4算法的基础上进行压缩设计的,其结构更为简单,参数量只有原来的十分之一,这使YOLOv4-tiny的检测速度获得较大提升,使之部署在移动和嵌入式设备上成为可能。因此本文采取YOLOv4-tiny网络进行目标检测。而对于部分对速度、功耗、资源不敏感,对精度有较高要求的场景,可使用YOLOv4或其他卷积神经网络。
1.2 数据集采集
由于配电站环境复杂多变,通过监控摄像头和公开数据集获取更为丰富的数据集。利用监控摄像头进行视频采集,并经过筛选及处理共获得12928张图片。此外,还从公开数据集中获得9 873张图像文件。完成图像采集后,使用开源项目LabelImg进行标定工作。
数据集各类标签比例如图1所示,通过对数据集标签文件的分析可知,本次采集的数据集中共四种检测目标,即穿着工作服的行人、未穿着工作服的行人、已佩戴安全帽的头部、未佩戴安全帽的头部。
图1 数据集各类标签比例
1.3 训练结果
利用本次采集的数据集对YOLOv4-tiny模型进行训练,训练结果各项指标见表1。其中,Precision为准确率;Recall为召回率;MAP.5为将IOU(intersection over union)设置为0.5时,每个类别的AP(average precision)的平均值。
表1 模型训练结果指标
利用训练好的模型对验证集图片进行检测,如图2所示,能够准确识别画面中所出现的工作人员是否佩戴了安全帽,以及是否穿着工作服。若正确佩戴安全帽且穿着工作服,则不出现提示信息,使用绿框框出工作人员;若错误佩戴或未佩戴安全帽,则使用黄框框出对应工作人员头部,并使用“Helmet”在头部进行标注;若未穿着工作服,则使用黄框框出对应工作人员,并使用“Dress”在头部进行标注。
图2 效果展示
2 FPGA加速器设计
2.1 量化方案
神经网络的训练一般采用浮点数进行计算,然而浮点运算在硬件平台上的实现比定点计算更加复杂,运算效率更低。为减少硬件资源消耗,提高系统推理速度,对YOLOv4-tiny模型进行8bits对称线性量化。对称线性量化具有高效、易于硬件实现的优势,其具体量化公式为
2.2 系统架构设计
系统架构如图3所示。CPU负责统筹协调任务并发送指令。PL端主要负责YOLOv4-tiny网络的加速实现。由于片上存储资源有限,采用片外数据方向寄存器(data direction register, DDR)协同存储数据。
图3 系统架构
PL端可通过配置直接存储器访问(direct memory access, DMA)实现输入输出数据的传输。指令存储于随机块存储器(block random access memory, BRAM),其中包括操作模式、配置参数、存储位置等指令。
Command Analyzer作为核心控制模块,负责解析指令,并输出相应的控制信号。池化模块、上采样模块、卷积模块等计算单元,从输入缓冲区读取输入特征图,利用数字信号处理(digital signal processing, DSP)资源进行相应计算,中间数据缓存于输出缓冲区,计算完成后进行量化、激活,最终存入输入缓冲区。
2.3 加速器优化设计
YOLO网络经历多次的卷积和池化层,其中包含大量的重复循环操作,因此需对数据排布与存储、计算过程等方面进行优化与改进。本文考虑采用并行展开与流水线技术来提高并行度,增加系统吞吐量。并行展开是一种用面积换速度的设计方法,通过在硬件上重复设计多个计算单元,可以实现一定数量计算单元的并行运算。
卷积优化架构如图4所示,卷积过程中,考虑到随着网络层数的增加,特征图尺寸越来越小,而通道数越来越大,故若直接按照特征图宽度和高度进行并行展开,当宽度和高度小于并行度时则无法充分利用重复设计的硬件单元,造成资源的浪费且无法达到加速的目的。因此选择对输入通道及输出通道进行并行展开。充分利用DSP资源,提高系统并行度,从而增大系统吞吐量。
图4 卷积优化架构
流水线技术广泛运用于硬件架构设计中,它可以缩短运行周期并有效提升系统效率。本文对循环中的任务采取流水线技术优化,将原有卷积操作进行细分,以周期为单位细分读数据、乘法、累加、写数据等操作,使每个环节在每个周期都可以有连续的输入与输出。以卷积中的累加操作为例,如图4中PE所示,通过加法器树的设计,使每个周期并行展开的乘法结果都可以开始累加操作而不互相依赖,从而实现流水线设计。
3 结果与分析
为了评估本文的优化策略,使用Xilinx公司的ZCU102开发板进行验证。性能评估见表2,DSP资源主要用于进行乘法运算,BRAM资源主要用于存储输入图片、权重、量化参数等数据。为了提升并行度、加快检测速度,各逻辑模块消耗了较多的触发器和查找表(look up table, LUT)资源。
系统时钟频率150MHz的情况下,整体平均性能达到228十亿次运算/秒(giga operations per second, GOPS),峰值性能达到307GOPS,系统实现每秒传输帧数(frames per second, FPS)为68的检测速度。
表2 性能评估
4 结论
本文针对当下配电站存在的缺陷及其需求,设计了一套基于FPGA的智能配电站安防巡检系统。
通过YOLOv4-tiny网络实现安全帽佩戴检测、工作服着装检测、越界预警识别等功能,达到了危险预警和异常告警的目的。在ZCU102 FPGA开发板上进行了加速器的实现与优化,通过并行展开及流水线操作两方面进行加速优化,最终实现68FPS的检测速度,整体平均性能达到228GOPS,峰值性能可达307GOPS。
考虑到配电网络结构庞大多变,配电站环境较为复杂,可通过增加、修改数据集,利用神经网络的自学习、自适应能力,重新训练获得网络模型,并更新硬件系统相关参数本,以适应新场景的需求。
因此,本文提出的解决方案具备较强的通用性,能够大幅降低整个电力网络在配电站环节针对安防巡检的投入成本,并有效提高整个电力网络的运行效率,最大限度保障人员、设施安全,为配电站安防巡检的智能化发展提供参考。
本文编自2022年第5期《电气技术》,论文标题为“基于现场可编程门阵列的智能配电站安防巡检系统设计与实现”,作者为陈标发、陈传东 等。
扫码参会 ACCES 2022
(点击上方文字,访问会议官网)
2022年9月16-18日 重庆市
中国电工技术学会
新媒体平台
学会官方
电工技术学报
CES电气
学会官方B站
CES TEMS
今日头条号
学会科普
新浪微博
抖音号
《电工技术学报》:010-/6981 邮箱:[email protected] 《电气技术》:010- 邮箱:[email protected] 编务:010-;订阅:010- 广告合作:010-/6838特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
/阅读下一篇/ 返回网易首页 下载网易新闻客户端