(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210688130.3
(22)申请日 2022.06.17
(71)申请人 南京地平线集成电路有限公司
地址 210046 江苏省南京市栖霞区经济技
术开发区兴智路6号兴智科技园A栋20
层
(72)发明人 不公告发明人
(74)专利代理 机构 北京思源智汇知识产权代理
有限公司 1 1657
专利代理师 郑晓斐
(51)Int.Cl.
G06V 20/59(2022.01)
G06V 40/16(2022.01)
G06V 40/10(2022.01)
G06V 10/46(2022.01)G06T 7/60(2017.01)
G06V 10/25(2022.01)
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06V 10/774(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
图像识别的方法、 装置、 介质和设备
(57)摘要
公开了一种图像识别的方法、 装置、 存储介
质和电子设备, 其中, 方法包括: 从待识别图像中
确定出待识别对象的人脸图像、 人体区域信息和
人体骨骼的关键点信息; 利用预先训练的第一预
测模型, 基于 人脸图像, 预测待识别对象的年龄,
得到待识别对象的预测年龄; 利用预先训练的第
二预测模型, 基于人体区域信息和人体骨骼的关
键点信息 预测待识别对象所处的年龄区间, 得到
待识别对象的预测年龄区间; 基于预测年龄和预
测年龄区间, 确定待识别对象是否为儿童。 克服
了依赖单一特征信息进行识别的局限性, 降低了
人脸或身体被遮挡对图像识别带来的不利影响,
有助于提高图像识别的泛化性、 容错性以及儿童
识别的准确度。
权利要求书2页 说明书11页 附图4页
CN 114937261 A
2022.08.23
CN 114937261 A
1.一种图像识别的方法, 包括:
从待识别图像 中确定出待识别对象的人脸图像、 人体区域信 息和人体骨骼的关键点信
息;
利用预先训练的第一预测模型, 基于所述人脸图像, 预测所述待识别对象的年龄, 得到
所述待识别对象的预测年龄;
利用预先训练的第二预测模型, 基于所述人体区域信息和所述人体骨骼的关键点信
息, 预测所述待识别对象所处的年龄区间, 得到所述待识别对象的预测年龄区间;
基于所述预测年龄和所述预测年龄区间, 确定所述待识别对象是否为儿童。
2.根据权利要求1所述的方法, 其中, 所述从待识别图像中确定出待识别对象的人脸图
像、 人体区域信息和人体骨骼的关键点信息, 包括:
利用预先训练 的多任务检测网络 中的人脸分支网络对所述待识别图像进行人脸检测,
得到人脸检测框;
基于所述人脸检测框, 从所述待识别图像中提取 所述人脸图像;
利用所述多任务检测网络中的人体分支网络, 对所述待识别对象进行人体检测, 得到
人体检测框, 并将所述人体 检测框的坐标确定为所述人体区域信息;
利用所述人体分支网络, 基于所述人体检测框, 预测所述待识别对象的人体骨骼关键
点的坐标和置信度, 得到所述人体骨骼的关键点信息 。
3.根据权利要求1所述的方法, 其中, 所述利用预先训练的第一预测模型, 基于所述人
脸图像, 预测所述待识别对象的年龄, 得到所述待识别对象的预测年龄, 包括:
利用所述第一预测模型对所述人脸图像进行预测, 输出第一概率向量, 所述第一概率
向量包括第一预设数量的年龄数值的置信度;
基于所述 概率向量中大于预设概 率阈值的置信度的数量, 确定所述预测年龄 。
4.根据权利要求1所述的方法, 其中, 所述利用预先训练的第一预测模型, 基于所述人
脸图像, 预测所述待识别对象 的年龄, 得到所述待识别对象的预测年龄之前, 所述方法还包
括对所述人脸图像进行如下 预处理:
将所述人脸图像调整至预设尺寸;
对调整尺寸后的人脸图像中的像素值进行归一 化处理。
5.根据权利要求4所述的方法, 其中, 所述对调 整尺寸后的人脸图像中的像素值进行归
一化处理之后, 所述预处 理还包括:
从所述人脸图像中识别出面部关键点, 得到面部关键点的坐标信息;
基于所述 面部关键点的坐标信息, 将所述人脸图像中的人脸姿态调整至预设姿态。
6.根据权利要求2至5任一所述的方法, 其中, 所述利用预先训练 的第二预测模型, 基于
所述人体区域信息和所述人体骨骼的关键点信息预测所述待识别对象所处的年龄区间, 得
到所述待识别对象的预测年龄区间, 包括:
基于所述人体区域信息, 确定所述人体 检测框的高度和面积;
基于所述人体骨骼的关键点信息, 确定所述待识别对象的上半身高度;
将所述人体区域信息、 所述人体检测框的高度和面积、 所述上半身高度以及所述人体
骨骼的关键点信息编码成特 征向量;
将所述特征向量输入所述第二预测模型, 得到第二概率向量, 所述第二概率向量中包权 利 要 求 书 1/2 页
2
CN 114937261 A
2括第二预设数量的年龄区间的置信度;
基于所述第二 概率向量, 确定所述预测年龄区间。
7.根据权利要求6所述的方法, 其中, 所述将所述人体区域信息、 所述人体检测框的高
度和面积、 所述上半身高度以及所述人体骨骼的关键点信息编码成特 征向量, 包括:
基于所述待识别图像的分辨率, 对所述人体检测框的坐标以及所述人体骨骼的关键点
的坐标进行归一 化处理;
将处理后的人体检测框的坐标和人体骨骼的关键点的坐标、 所述人体骨骼的关键点的
置信度、 所述上半身高度以及所述人体 检测框的高度和面积编码成所述特 征向量。
8.根据权利要求1至7任一所述的方法, 其中, 所述基于所述预测年龄和所述预测年龄
区间, 确定所述待识别对象是否为儿童, 包括:
当满足第一预设条件时, 基于所述预测年龄区间确定所述待识别对象是否为儿童, 所
述第一预设条件包括以下之一: 所述人脸图像中的人脸遮挡区域大于预设区域阈值且所述
人体骨骼的关键点中可见 的关键点数量大于预设数量; 或, 所述人脸遮挡区域不大于所述
预设区域阈值且所述预测 年龄所处的年龄区间与所述预测 年龄区间的差异大于预设差异
阈值;
当不满足所述第 一预设条件时, 基于所述预测年龄所处的年龄区间确定所述待识别对
象是否为儿童。
9.一种图像识别的装置, 包括:
信息获取单元, 被配置成从待识别图像中确定出待识别对象的人脸图像、 人体区域信
息和人体骨骼的关键点信息;
第一预测单元, 被配置成利用预先训练的第一预测模型, 基于所述人脸图像, 预测所述
待识别对象的年龄, 得到所述待识别对象的预测年龄;
第二预测单元, 被配置成利用预先训练的第二预测模型, 基于所述人体区域信息和所
述人体骨骼的关键点信息预测所述待识别对象所 处的年龄区间, 得到所述待识别对象的预
测年龄区间;
结果确定单元, 被配置成基于所述预测年龄和所述预测年龄区间, 确定所述待识别对
象是否为儿童。
10.一种计算机可读存储介质, 所述存储介质存储有计算机程序, 所述计算机程序用于
执行上述权利要求1 ‑8任一所述的方法。
11.一种电子设备, 所述电子设备包括:
处理器;
用于存储所述处 理器可执行指令的存 储器;
所述处理器, 用于从所述存储器中读取所述可执行指令, 并执行所述指令以实现上述
权利要求1 ‑8任一所述的方法。权 利 要 求 书 2/2 页
3
CN 114937261 A
3
专利 图像识别的方法、装置、介质和设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:29:08上传分享