(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210776957.X
(22)申请日 2022.06.30
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 郑弘晖 冯原 孙准 韩树民
(74)专利代理 机构 中科专利商标代理有限责任
公司 11021
专利代理师 鄢功军
(51)Int.Cl.
G06V 10/80(2022.01)
G06V 10/25(2022.01)
G06V 10/40(2022.01)
G06V 10/26(2022.01)
G06V 20/10(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
(54)发明名称
图像识别方法、 装置、 电子设备和存 储介质
(57)摘要
本公开提供了一种图像识别方法, 涉及人工
智能技术领域, 尤其涉及深度学习、 图像处理和
计算机视觉等技术领域, 可应用于智慧城市等场
景下。 具体实现方案为: 对第一图像的第N级第一
特征和第二图像的第N级第二特征进行融合处
理, 得到第N级融合特征, 其中, N为大于或等于1
的整数; 根据第N级融合特征, 得到第N+1级第一
特征和第N+1级第二特征; 根据第N+1级第一特征
和第N+1级第二特征, 得到第N+M级第一特征和第
N+M级第二特征, 其中, M为大于1的整数; 以及根
据第N+M级第一特征和第N+M级第二特征, 识别第
二图像中相对于第一图像存在变化的目标区域。
本公开还提供了一种图像识别装置、 电子设备和
存储介质。
权利要求书3页 说明书12页 附图7页
CN 115131641 A
2022.09.30
CN 115131641 A
1.一种图像识别方法, 包括:
对第一图像的第N级第一特征和第二图像的第N级第二特征进行融合处理, 得到第N级
融合特征, 其中, N 为大于或等于1的整数;
根据所述第N级融合特 征, 得到第N+1级第一特 征和第N+1级第二特 征;
根据所述第N+1级第一特征和所述第N+1级第二特征, 得到第N+M级第一特征和第N+M级
第二特征, 其中, M为大于1的整数; 以及
根据所述第N+M级第一特征和所述第N+M级第二特征, 识别所述第二图像中相对于所述
第一图像存在变化的目标区域。
2.根据权利要求1所述的方法, 其中, 所述根据所述第N级融合特征, 得到第N+1级第一
特征和第N+1级第二特 征包括:
对所述第N级融合特 征进行第N+1级第一特 征提取, 得到所述第N+1级第一特 征; 以及
对所述第N级融合特 征进行第N+1级第二特 征提取, 得到所述第N+1级第二特 征。
3.根据权利要求1或2所述的方法, 其中, 所述根据所述第N+1级第一特征和所述第N+1
级第二特 征, 得到第N+M级第一特 征和第N+M级第二特 征包括:
根据所述第N+1级第一特征和所述第N+1级第二特征中的至少一个, 得到第N+2级第一
特征至所述第N+M级第一特 征; 以及
根据所述第N+1级第一特征和所述第N+1级第二特征中的至少一个, 得到第N+2级第二
特征至所述第N+M级第二特 征。
4.根据权利 要求3所述的方法, 其中, 第N+i级第一特征是对第N+i ‑1级第一特征进行第
一特征提取得到的, 或
所述第N+i级第一特征是对第N+i ‑1级融合特征进行第一特征提取得到的, 所述第N+i ‑
1级融合特 征是对所述第N+i ‑1级第一特 征和第N+i ‑1级第二特 征进行融合处 理得到的,
i为大于1的整数, i 为小于或等于I的整数, I 为小于或等于 M的整数。
5.根据权利 要求3所述的方法, 其中, 第N+i级第二特征是对第N+i ‑1级第二特征进行第
二特征提取得到的, 或
所述第N+i级第二特征是对第N+i ‑1级融合特征进行第二特征提取得到的, 所述第N+i ‑
1级融合特 征是对第N+i ‑1级第一特 征和所述第N+i ‑1级第二特 征进行融合处 理得到的,
i为大于1的整数, i 为小于或等于I的整数, I 为小于或等于 M的整数。
6.根据权利要求1所述的方法, 其中, 所述对第一图像的第N级第一特征和第二图像的
第N级第二特 征进行融合处 理, 得到第N级融合特 征包括:
对所述第一图像进行N级第一特 征提取, 得到所述第N级第一特 征;
对所述第二图像进行N级第二特 征提取, 得到所述第N级第二特 征; 以及
对所述第N级第一特 征和所述第N级第二特 征进行融合处 理, 得到所述第N级融合特 征。
7.根据权利 要求1所述的方法, 其中, 所述根据所述第N+M级第一特征和所述第N+M级第
二特征, 识别所述第二图像中相对于所述第一图像存在变化的目标区域包括:
对所述第N+M级第一特征和所述第N+M级第二特征进行融合处理, 得到第N+M级融合特
征;
根据所述第N+M级融合特征, 识别所述第二图像中相对于所述第一图像存在变化的目
标区域。权 利 要 求 书 1/3 页
2
CN 115131641 A
28.根据权利要求1所述的方法, 其中, 所述第 一图像是在第 一时刻采集的与目标对象相
关的图像, 所述第二图像是在第二时刻采集的与所述目标对象相关的图像。
9.根据权利要求1至8任一项所述的方法, 其中, 所述根据所述第 N级融合特征, 得到第N
+1级第一特 征和第N+1级第二特 征包括:
根据所述第N级第一特征和所述第N级第二特征中至多一个以及所述第N级融合特征,
得到所述第N+1级第一特 征和所述第N+1级第二特 征。
10.一种图像识别装置, 包括:
融合模块, 用于对第一图像的第 N级第一特征和第 二图像的第N级第 二特征进行融合处
理, 得到第N级融合特 征, 其中, N 为大于或等于1的整数;
第一获得模块, 用于根据所述第N级融合特征, 得到第N+1级第一特征和第N+1级第二特
征;
第二获得模块, 用于根据所述第N+1级第一特征和所述第N+1级第二特征, 得到第N+M级
第一特征和第N+M级第二特 征, 其中, M为大于1的整数; 以及
识别模块, 用于根据所述第N+M级第一特征和所述第N+M级第二特征, 识别所述第二 图
像中相对于所述第一图像存在变化的目标区域。
11.根据权利要求10所述的装置, 其中, 所述第一获得模块包括:
第一特征提取子模块, 用于对所述第N级融合特征进行第N+1级第一特征提取, 得到所
述第N+1级第一特 征; 以及
第二特征提取子模块, 用于对所述第N级融合特征进行第N+1级第二特征提取, 得到所
述第N+1级第二特 征。
12.根据权利要求10或1 1所述的装置, 其中, 所述第二获得模块包括:
第一获得子模块, 用于根据所述第N+1级第一特征和所述第N+1级第二特征中的至少一
个, 得到第N+2级第一特 征至所述第N+M级第一特 征; 以及
第二获得子模块, 用于根据所述第N+1级第一特征和所述第N+1级第二特征中的至少一
个, 得到第N+2级第二特 征至所述第N+M级第二特 征。
13.根据权利 要求12所述的装置, 其中, 第N+i级第一特征是对第N+i ‑1级第一特征进行
第一特征提取得到的, 或
所述第N+i级第一特征是对第N+i ‑1级融合特征进行第一特征提取得到的, 所述第N+i ‑
1级融合特 征是对所述第N+i ‑1级第一特 征和第N+i ‑1级第二特 征进行融合处 理得到的,
i为大于1的整数, i 为小于或等于I的整数, I 为小于或等于 M的整数。
14.根据权利 要求12所述的装置, 其中, 第N+i级第二特征是对第N+i ‑1级第二特征进行
第二特征提取得到的, 或
所述第N+i级第二特征是对第N+i ‑1级融合特征进行第二特征提取得到的, 所述第N+i ‑
1级融合特 征是对第N+i ‑1级第一特 征和所述第N+i ‑1级第二特 征进行融合处 理得到的,
i为大于1的整数, i 为小于或等于I的整数, I 为小于或等于 M的整数。
15.根据权利要求9所述的装置, 其中, 所述融合模块包括:
第三特征提取子模块, 用于对所述第一图像进行N级第一特征提取, 得到所述第N级第
一特征;
第四特征提取子模块, 用于对所述第二图像进行N级第二特征提取, 得到所述第N级第权 利 要 求 书 2/3 页
3
CN 115131641 A
3
专利 图像识别方法、装置、电子设备和存储介质
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:29:07上传分享