(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210864608.3 (22)申请日 2022.07.21 (71)申请人 河南科技大 学 地址 471000 河南省洛阳市涧西区西苑路 48号 (72)发明人 张伏 曹炜桦 付三玲 王顺青  崔夏华 王新月 张亚坤 杨宁  张晓东 潘孝青  (74)专利代理 机构 洛阳公信知识产权事务所 (普通合伙) 41120 专利代理师 宋晨炜 (51)Int.Cl. G06V 20/68(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01)G06V 10/80(2022.01) G06V 10/77(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种融合坐标注意力机制和改进组合卷积 的YOLOv4识别方法 (57)摘要 一种融合坐标注意力机制和组合卷积的 YOLOv4识别方法,基于YOLOv4模型进行识别, 选 用GhostNet特征提取网络代替CSPDarkNet53作 为YOLOv4骨干网络, 采用通过少量计算生成大量 特征图的结构, 使用更低成本计算量获取特征层 中冗余信息, 减少模型参数量和计算量; 引入坐 标注意力机制增强对目标细粒性特征的提取; 设 计改进组合卷积模块节省计算能力, 防止有效特 征丢失, 提高识别精度。 改进YOLOv4模型对果实 的识别准确率可达99.23%, 可满足自然环境下果 实识别精度与速度的需求, 为采摘机器人快速精 准作业提供保障。 权利要求书1页 说明书7页 附图6页 CN 115223163 A 2022.10.21 CN 115223163 A 1.一种融合坐标注意力机制和改进组合卷积的YOLOv4识别方法, 其特征在于: 包括如 下步骤: 步骤1、 选取不同环境下的果蔬图像建立数据集; 步骤2、 对目标检测算法YOLOv4进行改进, 获得包括输入端、 主干特征提取网络、 特征融 合单元和输出端的改进目标识别模型, 将从数据集中选出的训练样本输入建立的改进目标 识别网络进行训练, 具体改进包括: 主干特征提取网络采用GhostNet特 征提取网络; 特征融合单元融合了坐标注意力 机制和改进组合卷积模块, 改进组合卷积模块为在两 项传统组合卷积内引入可分离卷积和残差边; 步骤3、 用获得的改进目标识别模型对拍摄的图像进行检测, 识别出果蔬图像中的果 实。 2.如权利要求1所述的一种融合坐标注意力机制和组合卷积的YOLOv4识别方法, 其特 征在于: 步骤2中输出端中的常规卷积模块 替换为Ghost  Module。 3.如权利要求1所述的一种融合坐标注意力机制和组合卷积的YOLOv4识别方法, 其特 征在于: 两项传统组合卷积分别为第一次上采样之后的传统组合卷积与第三次传统组合卷 积。 4.如权利要求1所述的一种融合坐标注意力机制和组合卷积的YOLOv4识别方法, 其特 征在于: 改进组合卷积模块在两项传统组合卷积 内引入可分离卷积的具体方法为, 传统组 合卷积的第2次卷积 操作和第4次卷积 操作替换为可分离卷积。 5.如权利要求1所述的一种融合坐标注意力机制和组合卷积的YOLOv4识别方法, 其特 征在于: 改进组合卷积模块在两项传统组合卷积 内增加残差结构的具体方法为, 传统组合 卷积的第1、 2次卷积 操作旁增 加残差边。 6.如权利要求1所述的一种融合坐标注意力机制和组合卷积的YOLOv4识别方法, 其特 征在于: 特征融合单元融合了坐标注意力机制的具体方法为, 坐标注意力机制引入至传统 组合卷积的第2次卷积 操作和第3次卷积 操作之间。权 利 要 求 书 1/1 页 2 CN 115223163 A 2一种融合坐 标注意力机制和改进组合卷积的Y OLOv4识别方 法 技术领域 [0001]本发明涉及图像识别方法, 具体为一种融合坐标注意力机制和改进组合卷积的 YOLOv4识别方法。 背景技术 [0002]近年来, 卷积神经网络在目标识别与检测方面应用广泛, 为果蔬识别提供了新思 路。 采用原始图像作为输入, 可有效从大量样本中学习相应特征, 避免复杂的特征提取过 程, 在整个过程中只需少量的人工参与。 因此, 基于卷积神经网络的目标识别已成为果蔬识 别的新发展趋势。 [0003]YOLOv4网络使用CSPDarknet53骨干网络, 虽能降低参数量、 提升识别精度, 但其模 型计算复杂、 需消耗较大内存空间、 识别精度和速度均有待提高, 难以满足复杂环境下采摘 机器人对目标果实的快速精准作业。 [0004]国内外学者对不 同种类果蔬进行识别, 但对于分枝多长势复杂的果蔬很难应用, 例如火龙果枝 条长势错综复杂, 导致火龙果果 实存在遮挡、 粘连等问题, 均给火龙果果 实目 标识别带来很大困难。 如何快速准确识别果 实, 对实现农业机器人自动采摘、 提高作业效率 成为亟待解决的难题。 发明内容 [0005]为解决上述技术问题, 本发明提供一种融合坐标注意力机制和改进组合卷积的 YOLOv4识别方法, 能够快速、 准确的进行果蔬果实识别。 [0006]为实现上述技术目的, 所采用的技术方案是: 一种融合坐标注意力机制和改进组 合卷积的YOLOv4识别方法, 包括如下步骤: 步骤1、 选取不同环境下的果蔬图像建立数据集; 步骤2、 对目标检测算法YOLOv4进行改进, 获得包括输入端、 主干特征提取网络、 特 征融合单元和输出端的改进目标识别模型, 将从数据集中选出的训练样本输入建立的改进 目标识别网络进行训练, 具体改进包括: 主干特征提取网络采用GhostNet特 征提取网络; 特征融合单元 融合了坐标注意力机制和改进组合卷积模块, 改进组合卷积模块为 在两项传统 组合卷积内引入可分离卷积和残差边; 步骤3、 用获得的改进目标识别模型对拍摄的图像进行检测, 识别出果 蔬图像中的 果实。 [0007]进一步, 步骤2中输出端中的常规卷积模块 替换为Ghost  Module。 [0008]进一步, 两项传统组合卷积分别为第一次上采样之后的传统组合卷积与第三次传 统组合卷积。 [0009]进一步, 改进组合卷积模块在两项传统组合卷积内引入可分离卷积的具体方法 为, 传统组合卷积的第2次卷积 操作和第4次卷积 操作替换为可分离卷积。说 明 书 1/7 页 3 CN 115223163 A 3

.PDF文档 专利 一种融合坐标注意力机制和改进组合卷积的YOLOv4识别方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合坐标注意力机制和改进组合卷积的YOLOv4识别方法 第 1 页 专利 一种融合坐标注意力机制和改进组合卷积的YOLOv4识别方法 第 2 页 专利 一种融合坐标注意力机制和改进组合卷积的YOLOv4识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:28:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。