专利图像识别的方法、装置、介质和设备 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210688130.3 (22)申请日 2022.06.17 (71)申请人南京地平线集成电路有限公司地址 210046 江苏省南京市栖霞区经济技术开发区兴智路6号兴智科技园A栋20 层 (72)发明人不公告发明人　 (74)专利代理机构北京思源智汇知识产权代理有限公司 1 1657 专利代理师郑晓斐 (51)Int.Cl. G06V 20/59(2022.01) G06V 40/16(2022.01) G06V 40/10(2022.01) G06V 10/46(2022.01)G06T 7/60(2017.01) G06V 10/25(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/774(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称图像识别的方法、装置、介质和设备 (57)摘要公开了一种图像识别的方法、装置、存储介质和电子设备，其中，方法包括：从待识别图像中确定出待识别对象的人脸图像、人体区域信息和人体骨骼的关键点信息；利用预先训练的第一预测模型，基于人脸图像，预测待识别对象的年龄，得到待识别对象的预测年龄；利用预先训练的第二预测模型，基于人体区域信息和人体骨骼的关键点信息预测待识别对象所处的年龄区间，得到待识别对象的预测年龄区间；基于预测年龄和预测年龄区间，确定待识别对象是否为儿童。克服了依赖单一特征信息进行识别的局限性，降低了人脸或身体被遮挡对图像识别带来的不利影响，有助于提高图像识别的泛化性、容错性以及儿童识别的准确度。权利要求书2页说明书11页附图4页 CN 114937261 A 2022.08.23 CN 114937261 A 1.一种图像识别的方法，包括：从待识别图像中确定出待识别对象的人脸图像、人体区域信息和人体骨骼的关键点信息；利用预先训练的第一预测模型，基于所述人脸图像，预测所述待识别对象的年龄，得到所述待识别对象的预测年龄；利用预先训练的第二预测模型，基于所述人体区域信息和所述人体骨骼的关键点信息，预测所述待识别对象所处的年龄区间，得到所述待识别对象的预测年龄区间；基于所述预测年龄和所述预测年龄区间，确定所述待识别对象是否为儿童。 2.根据权利要求1所述的方法，其中，所述从待识别图像中确定出待识别对象的人脸图像、人体区域信息和人体骨骼的关键点信息，包括：利用预先训练的多任务检测网络中的人脸分支网络对所述待识别图像进行人脸检测，得到人脸检测框；基于所述人脸检测框，从所述待识别图像中提取所述人脸图像；利用所述多任务检测网络中的人体分支网络，对所述待识别对象进行人体检测，得到人体检测框，并将所述人体检测框的坐标确定为所述人体区域信息；利用所述人体分支网络，基于所述人体检测框，预测所述待识别对象的人体骨骼关键点的坐标和置信度，得到所述人体骨骼的关键点信息。 3.根据权利要求1所述的方法，其中，所述利用预先训练的第一预测模型，基于所述人脸图像，预测所述待识别对象的年龄，得到所述待识别对象的预测年龄，包括：利用所述第一预测模型对所述人脸图像进行预测，输出第一概率向量，所述第一概率向量包括第一预设数量的年龄数值的置信度；基于所述概率向量中大于预设概率阈值的置信度的数量，确定所述预测年龄。 4.根据权利要求1所述的方法，其中，所述利用预先训练的第一预测模型，基于所述人脸图像，预测所述待识别对象的年龄，得到所述待识别对象的预测年龄之前，所述方法还包括对所述人脸图像进行如下预处理：将所述人脸图像调整至预设尺寸；对调整尺寸后的人脸图像中的像素值进行归一化处理。 5.根据权利要求4所述的方法，其中，所述对调整尺寸后的人脸图像中的像素值进行归一化处理之后，所述预处理还包括：从所述人脸图像中识别出面部关键点，得到面部关键点的坐标信息；基于所述面部关键点的坐标信息，将所述人脸图像中的人脸姿态调整至预设姿态。 6.根据权利要求2至5任一所述的方法，其中，所述利用预先训练的第二预测模型，基于所述人体区域信息和所述人体骨骼的关键点信息预测所述待识别对象所处的年龄区间，得到所述待识别对象的预测年龄区间，包括：基于所述人体区域信息，确定所述人体检测框的高度和面积；基于所述人体骨骼的关键点信息，确定所述待识别对象的上半身高度；将所述人体区域信息、所述人体检测框的高度和面积、所述上半身高度以及所述人体骨骼的关键点信息编码成特征向量；将所述特征向量输入所述第二预测模型，得到第二概率向量，所述第二概率向量中包权　利　要　求　书 1/2 页 2 CN 114937261 A 2括第二预设数量的年龄区间的置信度；基于所述第二概率向量，确定所述预测年龄区间。 7.根据权利要求6所述的方法，其中，所述将所述人体区域信息、所述人体检测框的高度和面积、所述上半身高度以及所述人体骨骼的关键点信息编码成特征向量，包括：基于所述待识别图像的分辨率，对所述人体检测框的坐标以及所述人体骨骼的关键点的坐标进行归一化处理；将处理后的人体检测框的坐标和人体骨骼的关键点的坐标、所述人体骨骼的关键点的置信度、所述上半身高度以及所述人体检测框的高度和面积编码成所述特征向量。 8.根据权利要求1至7任一所述的方法，其中，所述基于所述预测年龄和所述预测年龄区间，确定所述待识别对象是否为儿童，包括：当满足第一预设条件时，基于所述预测年龄区间确定所述待识别对象是否为儿童，所述第一预设条件包括以下之一：所述人脸图像中的人脸遮挡区域大于预设区域阈值且所述人体骨骼的关键点中可见的关键点数量大于预设数量；或，所述人脸遮挡区域不大于所述预设区域阈值且所述预测年龄所处的年龄区间与所述预测年龄区间的差异大于预设差异阈值；当不满足所述第一预设条件时，基于所述预测年龄所处的年龄区间确定所述待识别对象是否为儿童。 9.一种图像识别的装置，包括：信息获取单元，被配置成从待识别图像中确定出待识别对象的人脸图像、人体区域信息和人体骨骼的关键点信息；第一预测单元，被配置成利用预先训练的第一预测模型，基于所述人脸图像，预测所述待识别对象的年龄，得到所述待识别对象的预测年龄；第二预测单元，被配置成利用预先训练的第二预测模型，基于所述人体区域信息和所述人体骨骼的关键点信息预测所述待识别对象所处的年龄区间，得到所述待识别对象的预测年龄区间；结果确定单元，被配置成基于所述预测年龄和所述预测年龄区间，确定所述待识别对象是否为儿童。 10.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1 ‑8任一所述的方法。 11.一种电子设备，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求1 ‑8任一所述的方法。权　利　要　求　书 2/2 页 3 CN 114937261 A 3

专利 图像识别的方法、装置、介质和设备

专利图像识别的方法、装置、介质和设备