(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210822356.8
(22)申请日 2022.07.13
(71)申请人 广州科语 机器人有限公司
地址 511470 广东省广州市南沙区大岗镇
豪岗大道3 0号
(72)发明人 晁人傑 邓亮 郑卓斌 王立磊
刘若辰
(74)专利代理 机构 广东北定知识产权代理事务
所(普通合伙) 44761
专利代理师 曹江雄
(51)Int.Cl.
G06V 20/00(2022.01)
G06V 10/40(2022.01)
G06V 10/764(2022.01)
G06V 10/774(2022.01)G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于改进YOLOX模型的样 本不均衡目标检测
方法
(57)摘要
本发明涉及一种基于改进YOL OX模型的样本
不均衡目标检测方法。 通过改进YOLOX模型对扫
地机器人采集的待检测图像进行特征提取, 得到
多个第一特征。 将多个第一特征输入 特征融合层
进行跨层融合得到多个预测特征。 最后通过预测
层处理多个预测特征, 得到该待检测图像的目标
检测结果。 其中, 特征提取层包括多个带注意力
机制的CSPDarkNet, 该跨层融合处理包 括将所述
多个第一特征融合处理后得到的中间特征中的
部分或全部进行融合, 使 得浅层特征和深层特征
可进一步融合, 提高针对不同类型目标进行目标
检测的效果, 同时该改进YOLOX模型使用
Varifocal损失函数和平衡损失函数, 使得样本
不均衡情况下, 出现频次低的目标能被有效识
别。
权利要求书2页 说明书8页 附图4页
CN 115170930 A
2022.10.11
CN 115170930 A
1.基于改进YOLOX模型的样本不均衡目标检测方法, 其特征在于, 所述改进YOLOX模型
包括特征提取层、 特征融合层和预测层; 所述特征提取层包括多个带注意力机制的
CSPDarkNet, 所述改进YOLOX模型使用的损失函数为Varifocal损失函数和 平衡损失函数,
所述方法包括:
获取扫地机器人采集的待检测图像;
将所述待检测图像输入所述特征提取层进行处理, 根据所述特征提取层的输出结果,
得到多个第一特 征;
将所述多个第一特征输入所述特征融合层进行跨层融合处理, 得到多个预测特征; 其
中, 所述跨层融合处理包括将所述多个第一特征融合处理后得到的中间特征中的部 分或全
部进行融合;
通过所述预测层处理所述多个预测特征, 根据处理结果得到所述待检测图像的目标检
测结果。
2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
获取扫地机器人视角图像数据集, 所述图像数据集包括训练集和验证集;
将所述训练集输入待训练的改进YOLOX模型进行训练, 通过所述验证集对改进YOLOX模
型进行验证;
获取训练中改进YOLOX模型的Varifocal损失和平衡损失, 并基于损失函数反向梯度传
播更新模型参数直至模型收敛, 得到训练后的改进YOLOX模型。
3.根据权利要求2所述的方法, 其特 征在于, 包括:
通过以下公式获取 所述平衡损失L oss:
其中, N为样本数量, Ii为第i张图片, WC为所设计 的第C类的分类权重, Leiou为有效交并
比损失, Lcls为分类损失, Lobj为Varifocal损失。
4.根据权利要求3所述的方法, 其特 征在于, 包括:
通过以下公式获取 所述Varifocal损失Lobj:
其中, p为Varifocal损失函数预测的IoU ‑aware分类得分, q为目标得分, 正样本时q为
交并比(I oU), 负样本时q为0, g为调制因子, a为缩放因子 。
5.根据权利要求3所述的方法, 其特 征在于, 包括:
通过以下公式获取第C类的分类权 重WC:
其中, ni为第i类标签数量, nC为第C类标签数量, nclass为数据集类别数;权 利 要 求 书 1/2 页
2
CN 115170930 A
2通过以下公式获取有效交并比损失Leiou:
其中, c表示能同时包含预测框和真实框的最小闭包对角线距离, cw、 ch为两个矩形的闭
包宽度和闭包高度, r为两个中心点的欧式距离, b、 w、 h分别为预测框的中心点、 宽度和高
度, bgt、 wgt、 hgt分别表示真实框的中心点、 宽度和高度, I oU为交并比。
6.根据权利要求1所述的方法, 其特征在于, 所述基于损失函数反 向梯度传播更新模型
参数, 包括:
通过如下算法获取训练中改进YOLOX模型的权 重:
其中, Wt和Wt+1为第t次迭代和第t+1次迭代的权重, mW为反向传播算法的学习率,
为损失函数对权 重W的偏导数;
以及, 通过如下算法获取训练中的改进YOLOX模型的偏移量:
其中, bt和bt+1为第t次迭代和第t+1次迭代的偏移量, mb为反向传播算法的学习率,
为损失函数对偏移量b的偏导数。
7.根据权利要求1所述的方法, 其特 征在于, 包括:
通过指数移动平均方法更新所述模型参数, 其中, 指数移动平均方法通过如下公式实
现:
其中, WEMA,k、 bEMA,k分别表示对第k轮训练后的权重和偏移量进行指数滑动平均更新后的
参数值, a为衰减因子,
为第k‑1轮训练后的权 重和偏移量。
8.根据权利要求1所述的方法, 其特征在于, 所述CSPDarkNet包括Focus模块和与所述
Focus模块串联的多个Dark模块;
每个Dark模块后配有注意力机制模块, 所述注意力机制模块的输入深度应为前置Dark
模块的输出深度, 所述注意力机制模块的输入深度输出深度与输入深度一 致。
9.根据权利要求8所述的方法, 其特征在于, 包括: 所述注意力机制模块后的嵌入位置
配有检测头; 所述检测头的数量 根据待检测图像中的待检测目标尺寸大小确定 。
10.根据权利要求1所述的方法, 其特征在于, 所述预测层包括Head层, 用于在模型训练
阶段计算损失, 并在模型应用阶段处 理所述多个预测特 征, 得到目标检测结果。权 利 要 求 书 2/2 页
3
CN 115170930 A
3
专利 基于改进YOLOX模型的样本不均衡目标检测方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:30:10上传分享