专利基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210756317.2 (22)申请日 2022.06.29 (71)申请人河北工业大学地址 300130 天津市红桥区丁字沽光荣道8 号河北工业大学东院330# (72)发明人陈海永　史世杰　谭江恒　 (74)专利代理机构天津翰林知识产权代理事务所(普通合伙) 12210 专利代理师张国荣 (51)Int.Cl. G06V 40/20(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法 (57)摘要本发明公开了一种基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法，该行人检测方法采用轻量化YOL O v5网络，将原版YOL O v5 模型的Foucs层替换为卷积层以及将主干网络中的卷积替换为通道随机混合的分组卷积来轻量化模型，并利用时空记忆机制对网络检测结果进行修正，减少误识别，利用修正的检测结果进行行人位置检测，降低了模型的误识别率且减少了模型的硬件开销并提高了处理速度。采用本发明行人检测方法在数据集测试结果为：误识别率从 7％降低至1％，处理速度从5 6FPS提升到74FPS。权利要求书2页说明书11页附图8页 CN 115116137 A 2022.09.27 CN 115116137 A 1.基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法，其特征在于，该方法包括如下步骤：第一步：构建训练数据库 1)采集监测地点不同场景的图像，图像采集的场景包括晴天、阴天、雨天和夜晚；根据行人距离摄像头的远近将采集到的图像中的人物目标划分为不同尺寸，其中面积小于32* 32像素为小尺寸目标，在32*32 像素至96*96像素之间为中尺寸目标，大于96*96像素为大尺寸目标；按以上三种人物目标尺寸1:1:1的数量比挑选出图像，并对挑选出的图像进行数据增强，最后进行图像尺寸统一化操作，获得原始数据集； 2)数据集划分：对步骤1)中得到的原始数据集采用人工的方式添加标签，用矩形框分别标记出图像中的人物目标和围墙，并且按一定数量比例随机将原始数据集中的图像划分训练集和验证集；第二步：构建轻量化YOLO v5网络模型 1)训练集的预处理：对第一步的步骤2)中得到的训练集进行数据增强； 2)搭建轻量化YOLO v5网络模型轻量化YOLO v5网络模型为YOLO v5网络模型的改进结构，具体的，为将YOLO v5网络模型的主干网络中顺接的Foucs模块、 CBL模块、 CSP1_1模块、 CBL模块、 CSP 1_3模块、 CBL模块、 CBL模块、 CSP 1_3模块、 CBL模块、 CBL模块、 CBL模块、 SPP模块、 CBL模块替换成顺接的2个CBL 模块、 SFB1模块、 2 个SFB2模块、 SFB1模块、 7个SFB 2模块、 SFB1模块、 SFB 2模块、 CBS 模块；轻量化YOLO v5网络模型的主干网络部分的输入首先输入到第一个CBL模块中，第二个SFB2模块的输出分别输入到与其顺接的SFB1模块和Neck网络部分的第一个CBL模块， CBS模块的输出输入到YOLO v5网络模型的主干网络中的CSP2 _1模块中，轻量化YOLO v5网络模型的其它部分结构与YOLO v5网络模型相同； 3)训练网络采用在ImageNet得到的预训练权重初始化主干网络，使用kaiming正态分布初始化卷积层参数，网络的其余部分采用Xavier初始化；设置随训练代数呈阶梯下降的学习率，前50 代冻结主干网络参数；将步骤1)中完成预处理的训练集输入到完成初始化的轻量化YOLO v5网络模型中，利用主干网络部分进行特征提取与融合，利用分类和回归网络，得到人物目标的位置、类别和置信度，以及围墙的位置与置信度，将其与真实标签对比得到Loss值；根据Loss值采用SGD 优化器，进行反向传播更新网络参数，直至L oss下降至预设，网络模型训练完成； 4)网络模型验证对第一步的步骤2)中得到的验证集输入到步骤3)中完成训练的网络模型中，将网络模型输出的检测标签与真实标签对比，得到误识别率，当误识别率不大于10％时，保存网络模型当前参数，该网络模型为有效模型；当误识别率大于10％时，调整网络模型的初始参数，重新训练网络直至Loss下降至预设值，且验证集的误识别率不大于10％，保存网络模型当前参数，当前网络模型即为有效模型，网络模型验证完成；第三步：利用轻量化YOLO v5网络模型与时空记忆机制模块进行行人位置检测 1)获取初步检测结果将摄像头捕获到的视频流按帧输入到第二步中完成验证的轻量化YOLO v5网络模型权　利　要　求　书 1/2 页 2 CN 115116137 A 2中，得到视频的帧序列图像的检测结果，每一幅图像的检测结果包括人物目标的位置、类别和置信度，以及围墙的位置与置信度，该检测结果为初步检测结果； 2)获取修正的检测结果将初步检测结果输入到时空记忆机制模块中，时空记忆机制原理如下：其中Pn+1表示视频序列图像的第n+1 帧图像中人物目标的置信度； Δx和Δy分别表示第 n+1帧图像与第i帧图像中最临近人物目标的x轴和y轴的变化值，取值范围均为0～+∞； Pi 表示网络模型输出的第i帧图像中的人物目标的置信度；表示向上取整；上式中， f(x)表达式如下：将时空记忆机制模块输出的预测下一帧图像中的人物目标的置信度替换掉对应帧的初步检测结果中的置信度，得到修正的检测结果； 3)行人位置检测根据步骤2)中修正的检测结果中检测出的人物目标和围墙，当人物目标的轨迹与设定的围墙警戒线发生交叉或者低于某个阈值时，可判定为翻墙行为或者违规隔墙取物行为；以视频画面的左上角为坐标原点分别向右、向下设置x轴、 y轴正方向，建立二维坐标系，围墙的位置由人工给定，围墙警戒线近似为一条直线； xi,yi表示检测到的人物目标在同一坐标系下的坐标；其原理如下： f(x,y)＝Ax+By+C＝0 表示围墙警戒线的位置，若则表明有翻墙嫌疑；若 |f(xi,yi)|＜t 则表明有隔墙取物嫌疑；其中xi,yi表示检测到第i帧图像中的人物目标的位置坐标， t 表示设定的阈值， A、 B、 C为人工给定围墙位置时计算得到的常数参数。 2.根据权利要求1所述的基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法，其特征在于，第一步的步骤1)中，图像数据增强的方式有镜像、剪裁、平移和缩放。 3.根据权利要求1所述的基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法，其特征在于，第一步的步骤2)中，训练集与验证集中的图像数量比为7： 3 。 4.根据权利要求1所述的基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法，其特征在于，第二步的步骤1)中，训练集进行数据增强方式为Mosaic数据增强。权　利　要　求　书 2/2 页 3 CN 115116137 A 3

专利 基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法

专利基于轻量化YOLO v5网络模型与时空记忆机制的行人检测方法