专利模型训练及帽子检测方法、装置、电子设备及存储介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210761000.8 (22)申请日 2022.06.29 (71)申请人重庆紫光华山智安科技有限公司地址 400700 重庆市北碚区云汉大道1 17号附386号 (72)发明人翟波　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 专利代理师杜杨 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 40/16(2022.01)G06V 10/26(2022.01) G06N 3/08(2006.01) (54)发明名称模型训练及帽子检测方法、装置、电子设备及存储介质 (57)摘要本发明涉及深度学习技术领域，提供一种模型训练及帽子检测方法、装置、电子设备及存储介质，所述方法包括：获取样本图像及样本图像对应的标签；将样本图像输入预先建立的帽子检测模型，对样本图像中人脸佩戴的帽子类型进行预测，得到预测结果；帽子检测模型包括第一特征提取网络、多个依次连接的中间特征提取网络和第二特征提取网络；每一中间特征提取网络均包括个数依次增加特征提取单元，任一中间特征提取网络的特征提取单元输出的特征图的尺寸依次减小，多个中间特征提取网络的特征提取单元输出的特征图的最小尺寸依次减小；对帽子检测模型进行训练，得到训练后的帽子检测模型。本发明在提高了检测效率的同时提高了检测的准确率。权利要求书3页说明书13页附图5页 CN 115019108 A 2022.09.06 CN 115019108 A 1.一种模型训练方法，其特征在于，所述方法包括：获取样本图像及所述样本图像对应的标签，所述标签表征所述样本图像中人脸佩戴的帽子类型；将所述样本图像输入预先建立的帽子检测模型，对所述样本图像中人脸佩戴的帽子类型进行预测，得到预测结果；其中，所述帽子检测模型包括第一特征提取网络、多个依次连接的中间特征提取网络和第二特征提取网络；每一所述中间特征提取网络均包括多个并行的特征提取单元，多个中间特征提取网络包括的特征提取单元的个数依次增加，任一所述中间特征提取网络的多个特征提取单元输出的特征图的尺寸依次减小，多个所述中间特征提取网络的特征提取单元输出的特征图的最小尺寸依次减小；基于所述样本图像的预测结果、所述标签和预设的损失函数对所述帽子检测模型进行训练，得到训练后的帽子检测模型。 2.如权利要求1所述的模型训练方法，其特征在于，所述帽子检测模型还包括预测网络；所述将所述样本图像输入预先建立的帽子检测模型，对所述样本图像中人脸佩戴的帽子类型进行预测，得到预测结果的步骤包括：将所述样本图像输入所述第一特征提取网络，得到第一特征图；将所述第一特征图作为第一个所述中间特征提取网络的输入、以及将第i ‑1个所述中间特征提取网络的每个特征提取单元的输出特征图融合后作为第i个所述中间特征提取网络的输入，得到每个所述中间特征提取网络的每个特征提取单元的输出特征图；其中， i为大于2的整数；将最后一个所述中间特征提取网络的每个特征提取单元的输出特征图均输入所述第二特征提取网络，得到第二特征图；将所述第一特征图、除最后一个所述中间特征提取网络之外的每一所述中间特征提取网络的任一特征提取单元的输出特征图、以及所述第二特征图输入所述预测网络，得到所述预测结果。 3.如权利要求2所述的模型训练方法，其特征在于，所述预测网络包括融合层和分类层，所述第一特征提取网络、除最后一个所述中间特征提取网络之外的每一所述中间特征提取网络、以及所述第二特征提取网络还包括调整层；所述将所述第一特征图、除最后一个所述中间特征提取网络之外的每一所述中间特征提取网络的任一特征提取单元的输出特征图、以及所述第二特征图输入所述预测网络，得到所述预测结果的步骤包括：利用每一所述调整层对各自的输入特征图进行调整，得到每一所述调整层对应的特征向量，其中，所述第一特征提取网络的所述调整层的输入为第一特征图，所述中间特征提取网络的所述调整层的输入为各自的输出特征图，所述第二特征提取网络的所述调整层的输入为第二特征图；将每一所述特征向量均输入所述融合层，得到融合特征向量；将所述融合特征向量输入所述分类层，得到所述预测结果。 4.如权利要求3所述的模型训练方法，其特征在于，所述调整层包括权重调整层和池化权　利　要　求　书 1/3 页 2 CN 115019108 A 2层，所述利用每一所述调整层对各自的输入特征图进行调整，得到每一所述调整层对应的特征向量的步骤包括：针对任一所述调整层，利用所述权重调整层对所述输入特征图的每个特征点进行权重调整，得到调整后的特征图；将所述调整后的特征图输入所述池化层，得到所述调整层对应的特征向量。 5.如权利要求3所述的模型训练方法，其特征在于，所述将每一所述特征向量均输入所述融合层，得到融合特征向量的步骤包括：获取每一所述特征向量的权重，其中，所述权重是所有特征向量的向量均值，或者，利用输出维度为1的全连接层计算产生；按照每一所述特征向量的权重，对所有所述特征向量进行加权运算，得到所述融合特征向量。 6.如权利要求1所述的模型训练方法，其特征在于，所述方法还包括：获取原始图像和多个素材图像，所述原始图像包括佩戴帽子的人脸，所述原始图像和每一所述素材图像具有不同的背景或者不同的人脸；对所述原始图像进行分割，得到所述原始图像中的原始人脸区域和原始背景区域；从所述多个素材图像中随机选择目标素材图像；提取所述目标素材图像中的素材背景区域和/或素材人脸区域；用所述素材图像中的素材背景区域替换所述原始图像中的原始背景区域，和/或，用所述素材图像中的素材人脸区域替换所述原始图像中的原始人脸区域，得到替换图像；将所述原始图像及所述替换图像均作为所述样本图像。 7.一种帽子检测方法，其特征在于，所述方法包括：获取待检测图像；获取预设的模板特征库，所述模板特征库中包括至少一个模板特征，每一所述模板特征是将每一模板图像输入如权利要求1～6任一项所述的模型训练方法训练后的帽子检测模型得到的，每一所述模板图像包括人脸及佩戴的预设类型帽子；将所述待检测图像输入如权利要求1～6任一项所述的模型训练方法训练后的帽子检测模型，得到所述待检测图像的帽子佩戴特征；若所述模板特征库中存在与所述帽子佩戴特征一致的目标模板特征，则判定所述待检测图像中的人脸佩戴有所述目标模板特征对应的预设类型帽子。 8.一种模型训练装置，其特征在于，所述装置包括：样本获取模块，用于获取样本图像及所述样本图像对应的标签，所述标签表征所述样本图像中人脸佩戴的帽子类型；预测模块，用于将所述样本图像输入预先建立的帽子检测模型，对所述样本图像中人脸佩戴的帽子类型进行预测，得到预测结果；其中，所述帽子检测模型包括第一特征提取网络、多个依次连接的中间特征提取网络和第二特征提取网络；每一所述中间特征提取网络均包括多个并行的特征提取单元，多个中间特征提取网络包括的特征提取单元的个数依次增加，任一所述中间特征提取网络的多个特征提取单元输出的特征图的尺寸依次减小，多个所述中间特征提取网络的特征提取单元输出的特征图的最小尺寸依次减小；权　利　要　求　书 2/3 页 3 CN 115019108 A 3

专利 模型训练及帽子检测方法、装置、电子设备及存储介质

专利模型训练及帽子检测方法、装置、电子设备及存储介质