专利基于改进YOLOX模型的样本不均衡目标检测方法 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210822356.8 (22)申请日 2022.07.13 (71)申请人广州科语机器人有限公司地址 511470 广东省广州市南沙区大岗镇豪岗大道3 0号 (72)发明人晁人傑　邓亮　郑卓斌　王立磊　刘若辰　 (74)专利代理机构广东北定知识产权代理事务所(普通合伙) 44761 专利代理师曹江雄 (51)Int.Cl. G06V 20/00(2022.01) G06V 10/40(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01)G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于改进YOLOX模型的样本不均衡目标检测方法 (57)摘要本发明涉及一种基于改进YOL OX模型的样本不均衡目标检测方法。通过改进YOLOX模型对扫地机器人采集的待检测图像进行特征提取，得到多个第一特征。将多个第一特征输入特征融合层进行跨层融合得到多个预测特征。最后通过预测层处理多个预测特征，得到该待检测图像的目标检测结果。其中，特征提取层包括多个带注意力机制的CSPDarkNet，该跨层融合处理包括将所述多个第一特征融合处理后得到的中间特征中的部分或全部进行融合，使得浅层特征和深层特征可进一步融合，提高针对不同类型目标进行目标检测的效果，同时该改进YOLOX模型使用 Varifocal损失函数和平衡损失函数，使得样本不均衡情况下，出现频次低的目标能被有效识别。权利要求书2页说明书8页附图4页 CN 115170930 A 2022.10.11 CN 115170930 A 1.基于改进YOLOX模型的样本不均衡目标检测方法，其特征在于，所述改进YOLOX模型包括特征提取层、特征融合层和预测层；所述特征提取层包括多个带注意力机制的 CSPDarkNet，所述改进YOLOX模型使用的损失函数为Varifocal损失函数和平衡损失函数，所述方法包括：获取扫地机器人采集的待检测图像；将所述待检测图像输入所述特征提取层进行处理，根据所述特征提取层的输出结果，得到多个第一特征；将所述多个第一特征输入所述特征融合层进行跨层融合处理，得到多个预测特征；其中，所述跨层融合处理包括将所述多个第一特征融合处理后得到的中间特征中的部分或全部进行融合；通过所述预测层处理所述多个预测特征，根据处理结果得到所述待检测图像的目标检测结果。 2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取扫地机器人视角图像数据集，所述图像数据集包括训练集和验证集；将所述训练集输入待训练的改进YOLOX模型进行训练，通过所述验证集对改进YOLOX模型进行验证；获取训练中改进YOLOX模型的Varifocal损失和平衡损失，并基于损失函数反向梯度传播更新模型参数直至模型收敛，得到训练后的改进YOLOX模型。 3.根据权利要求2所述的方法，其特征在于，包括：通过以下公式获取所述平衡损失L oss：其中， N为样本数量， Ii为第i张图片， WC为所设计的第C类的分类权重， Leiou为有效交并比损失， Lcls为分类损失， Lobj为Varifocal损失。 4.根据权利要求3所述的方法，其特征在于，包括：通过以下公式获取所述Varifocal损失Lobj：其中， p为Varifocal损失函数预测的IoU ‑aware分类得分， q为目标得分，正样本时q为交并比(I oU)，负样本时q为0， g为调制因子， a为缩放因子。 5.根据权利要求3所述的方法，其特征在于，包括：通过以下公式获取第C类的分类权重WC：其中， ni为第i类标签数量， nC为第C类标签数量， nclass为数据集类别数；权　利　要　求　书 1/2 页 2 CN 115170930 A 2通过以下公式获取有效交并比损失Leiou：其中， c表示能同时包含预测框和真实框的最小闭包对角线距离， cw、 ch为两个矩形的闭包宽度和闭包高度， r为两个中心点的欧式距离， b、 w、 h分别为预测框的中心点、宽度和高度， bgt、 wgt、 hgt分别表示真实框的中心点、宽度和高度， I oU为交并比。 6.根据权利要求1所述的方法，其特征在于，所述基于损失函数反向梯度传播更新模型参数，包括：通过如下算法获取训练中改进YOLOX模型的权重：其中， Wt和Wt+1为第t次迭代和第t+1次迭代的权重， mW为反向传播算法的学习率，为损失函数对权重W的偏导数；以及，通过如下算法获取训练中的改进YOLOX模型的偏移量：其中， bt和bt+1为第t次迭代和第t+1次迭代的偏移量， mb为反向传播算法的学习率，为损失函数对偏移量b的偏导数。 7.根据权利要求1所述的方法，其特征在于，包括：通过指数移动平均方法更新所述模型参数，其中，指数移动平均方法通过如下公式实现：其中， WEMA,k、 bEMA,k分别表示对第k轮训练后的权重和偏移量进行指数滑动平均更新后的参数值， a为衰减因子，为第k‑1轮训练后的权重和偏移量。 8.根据权利要求1所述的方法，其特征在于，所述CSPDarkNet包括Focus模块和与所述 Focus模块串联的多个Dark模块；每个Dark模块后配有注意力机制模块，所述注意力机制模块的输入深度应为前置Dark 模块的输出深度，所述注意力机制模块的输入深度输出深度与输入深度一致。 9.根据权利要求8所述的方法，其特征在于，包括：所述注意力机制模块后的嵌入位置配有检测头；所述检测头的数量根据待检测图像中的待检测目标尺寸大小确定。 10.根据权利要求1所述的方法，其特征在于，所述预测层包括Head层，用于在模型训练阶段计算损失，并在模型应用阶段处理所述多个预测特征，得到目标检测结果。权　利　要　求　书 2/2 页 3 CN 115170930 A 3

专利 基于改进YOLOX模型的样本不均衡目标检测方法

专利基于改进YOLOX模型的样本不均衡目标检测方法