(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210785408.9 (22)申请日 2022.07.05 (71)申请人 深圳职业 技术学院 地址 518000 广东省深圳市南 山区西丽 街 道西丽湖镇西丽湖畔 申请人 广州国家现代农业产业科技创新中 心 (72)发明人 毛亮 郭子豪 吴惠粦 张兴龙  梁志尚  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 郭浩辉 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/82(2022.01)G06V 10/80(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于YOLOv5网络模型的目标识别方法及装 置 (57)摘要 本发明公开了一种基于YOLOv5网络模型的 目标识别方法及装置, 其中所述方法包括: 获取 待识别的目标图像并输入至YOLOv5算法网络模 型中, 以使所述YOLOv5算法网络模型基于 GhostNet为主干网络对所述目标图像执行卷积 操作和执行注 意力操作, 识别所述目标图像内所 有待识别目标的位置, 生 成所述目标图像的目标 识别结果。 本发明提供的一种基于YOL Ov5网络模 型的目标识别方法, 基于GhostNet为主干网络的 同时引入了CA注意力机制, 可以减少网络模型的 计算开销, 使目标检测模型的网络结构更为轻量 化, 且能够提高对个体较小的待测目标以及大面 积团簇重叠的多目标识别精度。 权利要求书2页 说明书10页 附图1页 CN 115223042 A 2022.10.21 CN 115223042 A 1.一种基于 YOLOv5网络模型的目标识别方法, 其特 征在于, 包括: 获取待识别的目标图像; 将所述目标图像输入至YOLOv5算法网络模型中, 以使所述YOLOv5算法网络模型基于 GhostNet为主干网络对 所述目标图像执行卷积操作和执行注 意力操作, 识别所述目标图像 内所有待识别目标的位置, 生 成所述目标图像的目标识别结果; 其中, 所述Y OLOv5算法 网络 模型中的主干网络在N个预设位置处的Ghost  botteneck层后引入CA注意力机制, N为大于 等于4的正整数。 2.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法, 其特征在于, 所述 YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执 行卷积操作, 具体包括: 对所述主干 网络中每一Ghost  botteneck层的输入目标图像执行缩略预设倍数卷积通 道的卷积 操作, 生成第一特 征图; 对所述第一特征图进行卷积操作, 生成每一所述Ghost  botteneck层对应 的目标图像 特征图。 3.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法, 其特征在于, 所述 YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执 行注意力操作, 具体为: 对引入CA注意力机制的每个所述Ghost  botteneck层执行注意力操作; 其中, 所述注意 力操作包括: 使用两个预设尺寸的池化核对Ghost  botteneck层对应的目标图像特征图每 个通道的水平坐标和垂直坐标进行编码, 生成水平方向感知特征图和垂直方向感知特征 图; 将所述水平方向感知特征图和所述垂 直方向感知特征图进 行拼接, 生成第一特征图; 根 据预设公式获取所述第一特征图在水平方向和垂 直方向的注意力权重, 生成注意力权重特 征图。 4.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法, 其特征在于, 所述 YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行注意力操作后, 还包 括: 选取所述主干网络中若干个预设位置处的Ghost  botteneck层输出四个预设尺寸的目 标图像特 征图; 将所述四个预设尺寸的目标图像特征图进行特征融合, 输出对应四个预设尺寸的融合 特征图, 对所述四个预设尺寸的融合特 征图执行剪枝操作。 5.如权利 要求4所述的一种基于YOLOv5网络模型的目标识别方法, 其特征在于, 所述对 所述四个预设尺寸的融合特 征图执行剪枝操作, 具体包括: 将第一预设尺寸的融合特征图、 第 二预设尺寸的融合特征图和第 三预设尺寸的融合特 征图分别输入至检测头进 行目标位置检测, 生成三个预设尺度下所述目标图像内的目标识 别结果; 引入深度可分离卷积对第四预设尺寸的融合特 征图进行目标位置检测。 6.如权利 要求5所述的一种基于YOLOv5网络模型的目标识别方法, 其特征在于, 所述检 测头为三分支检测头, 具体为: 第一分支用于检测目标框的类别; 第二分支用于检测目标框是否为前 景或背景;权 利 要 求 书 1/2 页 2 CN 115223042 A 2第三分支用于检测目标框的坐标信息 。 7.如权利 要求5所述的基于YOLOv5网络模型的目标识别方法, 其特征在于, 所述将第一 预设尺寸的融合特征图、 第二预设尺寸的融合特征图和第三预设尺寸的融合特征图分别输 入至检测头进行目标位置检测, 生成三个预设尺度下所述 目标图像内的目标识别结果, 具 体包括: 对每个所述预设尺寸的融合特征图进行降维, 生成统一通道数的对应预设尺寸的第 一 分支特征图; 对每个所述预设尺寸的融合特征图对应的所述第 一分支特征图进行卷积操作, 生成对 应预设尺寸的第二分支特 征图和第三分支特 征图; 将每个预设尺寸的融合特征图对应的第 一分支特征图、 第 二特征图和第 三特征图进行 合并, 生成第一预设尺寸检测特征图、 第二预设尺寸检测特征图和第三预设尺寸检测特征 图; 对所述第一预设尺寸检测特征图、 第 二预设尺寸检测特征图和第 三预设尺寸检测特征 图进行目标位置检测, 生成三个预设尺度检测特 征图内的目标识别结果。 8.一种基于YOLOv5网络模型的目标识别装置, 其特征在于, 包括: 获取模块和识别模 块, 具体为: 所述获取模块用于获取待识别的目标图像; 所述识别模块用于将所述目标图像输入至YOLOv5算法网络模型中, 以使所述YOLOv5算 法网络模 型基于GhostNet为主干网络对 所述目标图像执行卷积操作和执行注 意力操作, 识 别所述目标图像内所有待识别目标的位置, 生 成所述目标图像的目标识别结果; 其中, 所述 YOLOv5算法网络模型中的主干网络在N个预设位置处的Ghost  botteneck层后引入CA注意 力机制, N 为大于等于4的正整数。 9.一种终端设备, 其特征在于, 包括处理器、 存储器以及存储在所述存储器中且被配置 为由所述处理器执行 的计算机程序, 所述处理器执行所述计算机程序时实现如权利要求1 至7任意一项所述的基于 YOLOv5网络模型的目标识别方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的计算 机程序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权 利要求1至7中任意 一项所述的基于 YOLOv5网络模型的目标识别方法。权 利 要 求 书 2/2 页 3 CN 115223042 A 3

.PDF文档 专利 基于YOLOv5网络模型的目标识别方法及装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于YOLOv5网络模型的目标识别方法及装置 第 1 页 专利 基于YOLOv5网络模型的目标识别方法及装置 第 2 页 专利 基于YOLOv5网络模型的目标识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:29:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。