(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210725302.X
(22)申请日 2022.06.24
(71)申请人 微梦创科网络科技 (中国) 有限公司
地址 100193 北京市海淀区东北旺西路中
关村软件园二期 (西扩) N-1、 N-2地块
新浪总部科研楼 2层
(72)发明人 李蒙 赵金阁 李玲 韦昌佗
(74)专利代理 机构 北京国昊天诚知识产权代理
有限公司 1 1315
专利代理师 王思超
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/774(2022.01)
G06V 10/80(2022.01)
(54)发明名称
图片识别方法、 装置及电子设备
(57)摘要
本申请实施例提供了一种图片识别方法、 装
置及电子设备, 包括: 获取待识别的目标图片; 将
所述目标图片输入至预先训练的图片识别模型
中进行分类识别处理, 输出所述目标图片的分类
识别结果, 所述图片识别模型用于对 所述目标图
片中的目标对象所属类别进行第一分类识别和
对所述目标图片所属风格进行第二分类识别, 并
对所述第一分类识别的第一子分类识别结果和
所述第二分类识别的第二子分类识别结果进行
融合处理, 得到所述分类识别结果; 根据所述分
类识别结果确定所述目标图片及其目标对象共
同所属的目标类别。
权利要求书2页 说明书11页 附图5页
CN 115035347 A
2022.09.09
CN 115035347 A
1.一种图片识别方法, 其特 征在于, 所述图片识别方法包括:
获取待识别的目标图片;
将所述目标图片输入至预先训练的图片识别模型中进行分类识别处理, 输出所述目标
图片的分类识别结果, 所述图片识别模型用于对所述目标图片中的目标对象所属类别进 行
第一分类识别和对所述目标图片所属风格进 行第二分类识别, 并对所述第一分类识别的第
一子分类识别结果和所述第二分类识别的第二子分类识别结果进 行融合处理, 得到所述分
类识别结果;
根据所述分类识别结果确定所述目标图片及其目标对象共同所属的目标类别。
2.根据权利要求1所述的图片识别方法, 其特征在于, 所述图片识别模型包括: 主干特
征提取层、 目标对象检测层、 整图特 征分类层和特 征融合层;
在所述分类识别处理中, 所述主干特征提取层用于对所述目标图片的主干图像特征进
行提取, 得到所述目标图片的主干图像特 征;
所述目标对象检测层用于对所述主干图像特征中的目标对象所属类别进行第一分类
识别, 得到所述目标图片 中目标对 象的第一子分类识别结果, 所述第一子分类识别结果指
示所述目标图片中目标对象所属各类别的概 率;
所述整图特征分类层用于根据所述主干图像特征对所述目标图片所属风格进行第二
分类识别, 得到所述 目标图片的第二子分类识别结果, 所述第二子分类识别结果指示所述
目标图片所属各风格的概 率;
所述特征融合层用于对所述第一子分类识别结果和所述第二子分类识别结果进行融
合处理, 得到所述 目标图片的分类识别结果, 所述分类识别结果指示所述 目标图片及其 目
标对象共同所属的目标类别。
3.根据权利要求2所述的图片识别方法, 其特征在于, 所述特征融合层还用于从所述第
一子分类识别结果中筛选出概率大于设定阈值的所述目标图片中目标对 象所属的各目标
类别, 按照预设的对 象所属类别与图片所属 风格之间的对应关系, 确定所述 目标图片 中目
标对象所属的各目标类别与所述目标图片所属的各风格之 间的目标对应关系, 根据所述目
标对应关系将所述第一子分类识别结果和所述第二子分类识别结果进行融合处 理。
4.一种图片识别模型的训练方法, 其特 征在于, 包括:
获取多个样本图片;
根据所述多个样本 图片生成训练样本集, 其中, 所述训练样本集中的每个训练样本标
注有标签, 所述标签包括所述训练样本中的目标对象所属类别的第一类别标签和所述训练
样本所属风格的第二类别标签, 所述第一类别标签和所述第二类别标签具有对应关系;
将所述训练样本集输入到待训练的图片识别模型进行迭代训练, 直至所述图片识别模
型对应的损失函数收敛的情况下, 得到训练后的图片识别模型, 所述损失函数表示所述图
片识别模型输出的所述样本图片及其目标对 象共同所属目标类别的预测 值与真实值之间
的误差, 所述真实值 根据所述第一类别标签和所述第二类别标签确定 。
5.根据权利要求4所述的图片识别模型的训练方法, 其特征在于, 所述根据所述多个样
本图片生成训练样本集包括:
对所述多个样本图片进行标记 处理, 通过聚类算法将经过标记 处理的样本图片进行聚
类, 得到所述样本图片所属风格的第二类别标签和所述训练样本中目标对象所属类别的第权 利 要 求 书 1/2 页
2
CN 115035347 A
2一类别标签;
建立所述第一类别标签和所述第二类别标签之间的对应关系, 生成所述训练样本集。
6.根据权利要求4所述的图片识别模型的训练方法, 其特征在于, 所述图片识别模型每
次迭代训练的具体步骤 包括:
对所述样本 图片的主干 图像特征进行提取, 得到所述样本 图片的主干 图像特征, 确定
所述样本图片的目标对象所属类别的第一 概率图;
根据所述主干图像特 征确定所述样本图片所属风格的第二 概率图;
对所述第一概率图和所述第 二概率图进行融合处理, 得到所述样本图片及其目标对象
共同所属目标类别的第三 概率图;
根据所述第三概率图对应的目标类别、 所述第 一类别标签、 所述第二类别标签、 以及所
述损失函数, 调整所述图片识别模型的模型参数。
7.根据权利要求4所述的图片识别模型的训练方法, 其特征在于, 所述损失函数包括目
标对象检测损失函数和整图特征分类损失函数; 其中, 所述 目标对象检测损失函数表示所
述训练样本中的所述目标对象所属类别的预测值与第一类别标签之 间的误差, 所述整图特
征分类损失函数表示所述训练样本所属风格的预测值与第二类别标签之间的误差 。
8.一种图片识别装置, 其特 征在于, 所述图片识别包括:
获取模块, 用于获取待识别的目标图片;
识别模块, 用于将所述目标图片输入至预先训练的图片识别模型中进行分类识别处
理, 输出所述 目标图片的分类识别结果, 所述图片识别模型用于对所述 目标图片 中的目标
对象所属类别进 行第一分类识别和对所述目标图片所属风格进行第二分类识别, 并对所述
第一分类识别的第一子分类识别结果和所述第二分类识别的第二子分类识别结果进行融
合处理, 得到所述分类识别结果;
确定模块, 用于根据 所述分类识别结果确定所述目标图片及其目标对象共同所属的目
标类别。
9.一种电子设备, 包括处理器、 通信接口、 存储器和通信总线; 其中, 所述处理器、 所述
通信接口以及所述存储器通过总线完成相互间的通信; 所述存储器, 用于存放计算机程序;
所述处理器, 用于执行所述存储器上所存放的程序, 实现如权利要求 1‑3任意一项 所述的图
片识别方法或4 ‑7任意一项所述的图片识别模型的训练方法步骤。
10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征
在于, 所述计算机程序被处理器执行时, 实现如权利要求 1‑3任意一项 所述的图片识别方法
或4‑7任意一项所述的图片识别模型的训练方法步骤。权 利 要 求 书 2/2 页
3
CN 115035347 A
3
专利 图片识别方法、装置及电子设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:29:10上传分享