(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210761000.8
(22)申请日 2022.06.29
(71)申请人 重庆紫光华山智安科技有限公司
地址 400700 重庆市北碚区云汉大道1 17号
附386号
(72)发明人 翟波
(74)专利代理 机构 北京超凡宏宇专利代理事务
所(特殊普通 合伙) 11463
专利代理师 杜杨
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/774(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06V 40/16(2022.01)G06V 10/26(2022.01)
G06N 3/08(2006.01)
(54)发明名称
模型训练及帽子检测方法、 装置、 电子设备
及存储介质
(57)摘要
本发明涉及深度学习技术领域, 提供一种模
型训练及帽子检测方法、 装置、 电子设备及存储
介质, 所述方法包括: 获取样本图像及样本图像
对应的标签; 将样本图像输入预先建立的帽子检
测模型, 对样本图像中人脸佩戴的帽子类型进行
预测, 得到预测结果; 帽子检测模型包括第一特
征提取网络、 多个依次连接的中间特征提取网络
和第二特征提取网络; 每一中间特征提取网络均
包括个数依次增加特征提取单元, 任一中间特征
提取网络的特征提取单元输出的特征图的尺寸
依次减小, 多个中间特征提取网络的特征提取单
元输出的特征图的最小尺寸依次减小; 对帽子检
测模型进行训练, 得到训练后的帽子检测模型。
本发明在提高了检测效率的同时提高了检测的
准确率。
权利要求书3页 说明书13页 附图5页
CN 115019108 A
2022.09.06
CN 115019108 A
1.一种模型训练方法, 其特 征在于, 所述方法包括:
获取样本图像及所述样本图像对应的标签, 所述标签表征所述样本图像中人脸佩戴的
帽子类型;
将所述样本图像输入预先建立的帽子检测模型, 对所述样本图像中人脸佩戴的帽子类
型进行预测, 得到预测结果;
其中, 所述帽子检测模型包括第一特征提取网络、 多个依次连接的中间特征提取网络
和第二特征提取网络; 每一所述中间特征提取网络均包括多个并行 的特征提取单元, 多个
中间特征提取网络包括的特征提取单元的个数依次增加, 任一所述中间特征提取网络的多
个特征提取单元输出的特征图的尺寸依次减小, 多个所述中间特征提取网络的特征提取单
元输出的特 征图的最小尺寸依次减小;
基于所述样本图像的预测结果、 所述标签和预设的损失函数对所述帽子检测模型进行
训练, 得到训练后的帽子检测模型。
2.如权利要求1所述的模型训练方法, 其特征在于, 所述帽子检测模型还包括预测网
络;
所述将所述样本图像输入预先建立的帽子检测模型, 对所述样本图像中人脸佩戴的帽
子类型进行 预测, 得到预测结果的步骤 包括:
将所述样本图像输入所述第一特 征提取网络, 得到第一特 征图;
将所述第一特征图作为第一个所述中间特征提取网络的输入、 以及将第i ‑1个所述中
间特征提取网络的每个特征提取单元的输出特征图融合后作为第i个所述中间特征提取网
络的输入, 得到每个所述中间特征提取网络的每个特征提取单元的输出特征图; 其中, i为
大于2的整数;
将最后一个所述中间特征提取网络的每个特征提取单元的输出特征图均输入所述第
二特征提取网络, 得到第二特 征图;
将所述第一特征图、 除最后一个所述中间特征提取网络之外的每一所述中间特征提取
网络的任一特征提取单元 的输出特征图、 以及所述第二特征图输入所述预测网络, 得到所
述预测结果。
3.如权利要求2所述的模型训练方法, 其特征在于, 所述预测网络包括融合层和分类
层, 所述第一特征提取网络、 除最后一个所述中间特征提取网络之外的每一所述中间特征
提取网络、 以及所述第二特 征提取网络还 包括调整层;
所述将所述第 一特征图、 除最后 一个所述中间特征提取网络之外的每一所述中间特征
提取网络的任一特征提取单元 的输出特征图、 以及所述第二特征图输入所述预测网络, 得
到所述预测结果的步骤 包括:
利用每一所述调整层对各自的输入特征图进行调整, 得到每一所述调整层对应的特征
向量, 其中, 所述第一特征提取网络的所述调整层的输入为第一特征图, 所述中间特征提取
网络的所述调整层的输入为各自的输出特征图, 所述第二特征提取网络的所述调整层的输
入为第二特 征图;
将每一所述特 征向量均输入所述融合层, 得到融合特 征向量;
将所述融合特 征向量输入所述分类层, 得到所述预测结果。
4.如权利要求3所述的模型训练方法, 其特征在于, 所述调整层包括权重调 整层和池化权 利 要 求 书 1/3 页
2
CN 115019108 A
2层, 所述利用每一所述调整层对各自的输入特征图进行调整, 得到每一所述调整层对应的
特征向量的步骤 包括:
针对任一所述调整层, 利用所述权重调 整层对所述输入特征图的每个特征点进行权重
调整, 得到调整后的特 征图;
将所述调整后的特 征图输入所述池化层, 得到所述调整层对应的特 征向量。
5.如权利要求3所述的模型训练方法, 其特征在于, 所述将每一所述特征向量均输入所
述融合层, 得到融合特 征向量的步骤 包括:
获取每一所述特征向量的权重, 其中, 所述权重是所有特征向量的向量均值, 或者, 利
用输出维度为1的全连接层计算产生;
按照每一所述特征向量的权重, 对所有所述特征向量进行加权运算, 得到所述融合特
征向量。
6.如权利要求1所述的模型训练方法, 其特 征在于, 所述方法还 包括:
获取原始图像和多个素材图像, 所述原始图像包括佩戴帽子的人脸, 所述原始图像和
每一所述素 材图像具有不同的背景或者 不同的人脸;
对所述原 始图像进行分割, 得到所述原 始图像中的原 始人脸区域和原 始背景区域;
从所述多个素 材图像中随机 选择目标 素材图像;
提取所述目标 素材图像中的素 材背景区域和/或素 材人脸区域;
用所述素材图像中的素材背景区域替换所述原始图像 中的原始背景区域, 和/或, 用所
述素材图像中的素 材人脸区域 替换所述原始图像中的原 始人脸区域, 得到替换图像;
将所述原 始图像及所述 替换图像均 作为所述样本图像。
7.一种帽子检测方法, 其特 征在于, 所述方法包括:
获取待检测图像;
获取预设的模板特征库, 所述模板特征库中包括至少一个模板特征, 每一所述模板特
征是将每一模板图像输入如权利要求1~6任一项所述的模型训练方法训练后的帽子检测
模型得到的, 每一所述模板图像包括人脸及佩戴的预设类型帽子;
将所述待检测图像输入如权利要求1~6任一项所述的模型训练方法训练后的帽子检
测模型, 得到所述待检测图像的帽子佩戴特 征;
若所述模板特征库中存在与 所述帽子佩戴特征一致的目标模板特征, 则判定所述待检
测图像中的人脸佩戴有所述目标模板特 征对应的预设类型帽子 。
8.一种模型训练装置, 其特 征在于, 所述装置包括:
样本获取模块, 用于获取样本 图像及所述样本 图像对应的标签, 所述标签表征所述样
本图像中人脸佩戴的帽子类型;
预测模块, 用于将所述样本 图像输入预先建立的帽子检测模型, 对所述样本 图像中人
脸佩戴的帽子类型进行 预测, 得到预测结果;
其中, 所述帽子检测模型包括第一特征提取网络、 多个依次连接的中间特征提取网络
和第二特征提取网络; 每一所述中间特征提取网络均包括多个并行 的特征提取单元, 多个
中间特征提取网络包括的特征提取单元的个数依次增加, 任一所述中间特征提取网络的多
个特征提取单元输出的特征图的尺寸依次减小, 多个所述中间特征提取网络的特征提取单
元输出的特 征图的最小尺寸依次减小;权 利 要 求 书 2/3 页
3
CN 115019108 A
3
专利 模型训练及帽子检测方法、装置、电子设备及存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:31:19上传分享