专利图片识别方法、装置及电子设备 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210725302.X (22)申请日 2022.06.24 (71)申请人微梦创科网络科技（中国）有限公司地址 100193 北京市海淀区东北旺西路中关村软件园二期（西扩） N-1、 N-2地块新浪总部科研楼 2层 (72)发明人李蒙　赵金阁　李玲　韦昌佗　 (74)专利代理机构北京国昊天诚知识产权代理有限公司 1 1315 专利代理师王思超 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) (54)发明名称图片识别方法、装置及电子设备 (57)摘要本申请实施例提供了一种图片识别方法、装置及电子设备，包括：获取待识别的目标图片；将所述目标图片输入至预先训练的图片识别模型中进行分类识别处理，输出所述目标图片的分类识别结果，所述图片识别模型用于对所述目标图片中的目标对象所属类别进行第一分类识别和对所述目标图片所属风格进行第二分类识别，并对所述第一分类识别的第一子分类识别结果和所述第二分类识别的第二子分类识别结果进行融合处理，得到所述分类识别结果；根据所述分类识别结果确定所述目标图片及其目标对象共同所属的目标类别。权利要求书2页说明书11页附图5页 CN 115035347 A 2022.09.09 CN 115035347 A 1.一种图片识别方法，其特征在于，所述图片识别方法包括：获取待识别的目标图片；将所述目标图片输入至预先训练的图片识别模型中进行分类识别处理，输出所述目标图片的分类识别结果，所述图片识别模型用于对所述目标图片中的目标对象所属类别进行第一分类识别和对所述目标图片所属风格进行第二分类识别，并对所述第一分类识别的第一子分类识别结果和所述第二分类识别的第二子分类识别结果进行融合处理，得到所述分类识别结果；根据所述分类识别结果确定所述目标图片及其目标对象共同所属的目标类别。 2.根据权利要求1所述的图片识别方法，其特征在于，所述图片识别模型包括：主干特征提取层、目标对象检测层、整图特征分类层和特征融合层；在所述分类识别处理中，所述主干特征提取层用于对所述目标图片的主干图像特征进行提取，得到所述目标图片的主干图像特征；所述目标对象检测层用于对所述主干图像特征中的目标对象所属类别进行第一分类识别，得到所述目标图片中目标对象的第一子分类识别结果，所述第一子分类识别结果指示所述目标图片中目标对象所属各类别的概率；所述整图特征分类层用于根据所述主干图像特征对所述目标图片所属风格进行第二分类识别，得到所述目标图片的第二子分类识别结果，所述第二子分类识别结果指示所述目标图片所属各风格的概率；所述特征融合层用于对所述第一子分类识别结果和所述第二子分类识别结果进行融合处理，得到所述目标图片的分类识别结果，所述分类识别结果指示所述目标图片及其目标对象共同所属的目标类别。 3.根据权利要求2所述的图片识别方法，其特征在于，所述特征融合层还用于从所述第一子分类识别结果中筛选出概率大于设定阈值的所述目标图片中目标对象所属的各目标类别，按照预设的对象所属类别与图片所属风格之间的对应关系，确定所述目标图片中目标对象所属的各目标类别与所述目标图片所属的各风格之间的目标对应关系，根据所述目标对应关系将所述第一子分类识别结果和所述第二子分类识别结果进行融合处理。 4.一种图片识别模型的训练方法，其特征在于，包括：获取多个样本图片；根据所述多个样本图片生成训练样本集，其中，所述训练样本集中的每个训练样本标注有标签，所述标签包括所述训练样本中的目标对象所属类别的第一类别标签和所述训练样本所属风格的第二类别标签，所述第一类别标签和所述第二类别标签具有对应关系；将所述训练样本集输入到待训练的图片识别模型进行迭代训练，直至所述图片识别模型对应的损失函数收敛的情况下，得到训练后的图片识别模型，所述损失函数表示所述图片识别模型输出的所述样本图片及其目标对象共同所属目标类别的预测值与真实值之间的误差，所述真实值根据所述第一类别标签和所述第二类别标签确定。 5.根据权利要求4所述的图片识别模型的训练方法，其特征在于，所述根据所述多个样本图片生成训练样本集包括：对所述多个样本图片进行标记处理，通过聚类算法将经过标记处理的样本图片进行聚类，得到所述样本图片所属风格的第二类别标签和所述训练样本中目标对象所属类别的第权　利　要　求　书 1/2 页 2 CN 115035347 A 2一类别标签；建立所述第一类别标签和所述第二类别标签之间的对应关系，生成所述训练样本集。 6.根据权利要求4所述的图片识别模型的训练方法，其特征在于，所述图片识别模型每次迭代训练的具体步骤包括：对所述样本图片的主干图像特征进行提取，得到所述样本图片的主干图像特征，确定所述样本图片的目标对象所属类别的第一概率图；根据所述主干图像特征确定所述样本图片所属风格的第二概率图；对所述第一概率图和所述第二概率图进行融合处理，得到所述样本图片及其目标对象共同所属目标类别的第三概率图；根据所述第三概率图对应的目标类别、所述第一类别标签、所述第二类别标签、以及所述损失函数，调整所述图片识别模型的模型参数。 7.根据权利要求4所述的图片识别模型的训练方法，其特征在于，所述损失函数包括目标对象检测损失函数和整图特征分类损失函数；其中，所述目标对象检测损失函数表示所述训练样本中的所述目标对象所属类别的预测值与第一类别标签之间的误差，所述整图特征分类损失函数表示所述训练样本所属风格的预测值与第二类别标签之间的误差。 8.一种图片识别装置，其特征在于，所述图片识别包括：获取模块，用于获取待识别的目标图片；识别模块，用于将所述目标图片输入至预先训练的图片识别模型中进行分类识别处理，输出所述目标图片的分类识别结果，所述图片识别模型用于对所述目标图片中的目标对象所属类别进行第一分类识别和对所述目标图片所属风格进行第二分类识别，并对所述第一分类识别的第一子分类识别结果和所述第二分类识别的第二子分类识别结果进行融合处理，得到所述分类识别结果；确定模块，用于根据所述分类识别结果确定所述目标图片及其目标对象共同所属的目标类别。 9.一种电子设备，包括处理器、通信接口、存储器和通信总线；其中，所述处理器、所述通信接口以及所述存储器通过总线完成相互间的通信；所述存储器，用于存放计算机程序；所述处理器，用于执行所述存储器上所存放的程序，实现如权利要求 1‑3任意一项所述的图片识别方法或4 ‑7任意一项所述的图片识别模型的训练方法步骤。 10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求 1‑3任意一项所述的图片识别方法或4‑7任意一项所述的图片识别模型的训练方法步骤。权　利　要　求　书 2/2 页 3 CN 115035347 A 3

专利 图片识别方法、装置及电子设备

专利图片识别方法、装置及电子设备