(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210671644.8 (22)申请日 2022.06.15 (65)同一申请的已公布的文献号 申请公布号 CN 114758339 A (43)申请公布日 2022.07.15 (73)专利权人 深圳思谋信息科技有限公司 地址 518051 广东省深圳市南 山区高新 南 九道45号 三航科技大厦2 2楼 专利权人 苏州思谋智能科技有限公司 (72)发明人 杨帆 刘枢 陈帅 王杰 李耀  徐威 孙宇君 吕江波 沈小勇  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 赖远龙 (51)Int.Cl. G06V 30/10(2022.01)G06V 20/62(2022.01) G06K 9/62(2022.01) G06V 10/80(2022.01) G06V 10/774(2022.01) (56)对比文件 CN 114565915 A,202 2.05.31 CN 112508003 A,2021.0 3.16 CN 112508000 A,2021.0 3.16 CN 113989484 A,202 2.01.28 CN 111767909 A,2020.10.13 CN 114004858 A,202 2.02.01 CN 112085019 A,2020.12.15 CN 113379001 A,2021.09.10 CN 114511041 A,202 2.05.17 CN 113936187 A,202 2.01.14 CN 111402367 A,2020.07.10 审查员 高婕 (54)发明名称 字符识别模型的获取方法、 装置、 计算机设 备和存储介质 (57)摘要 本申请涉及一种字 符识别模 型的获取方法、 装置、 计算机设备和存储介质。 所述方法包括: 获 取待处理图片组、 字符位置标注组、 字符表以及 字符字体; 根据字符表以及字符字体, 获得多组 期望字符串, 并将多组期望字 符串转化为多张字 符串图片; 根据字符位置标注组, 将待处理图片 组中每张待处理图片分别与多张字符串图片中 的对应字符串图片进行融合, 获得多张融合后的 图片, 并基于字符位置标注组和多组期望字符 串, 获取多个融合后的字符位置标注; 基于待处 理图片组、 多张融合后的图片、 多个融合后的字 符位置标注以及预设字 符识别模 型进行训练, 获 得字符识别模型。 采用本方法能够扩大样本数 量, 提高获取的字符识别模型的字符识别准确 度。 权利要求书3页 说明书16页 附图7页 CN 114758339 B 2022.09.20 CN 114758339 B 1.一种字符识别模型的获取 方法, 其特 征在于, 所述方法包括: 获取待处理图片组、 字符位置标注组、 字符表以及字符字体, 所述待处理图片组包括至 少一张待处理图片, 每张所述待处理图片对应所述字符位置标注组中至少一个字符位置标 注; 根据所述字符表以及所述字符字体, 获得多组期望字符串, 并将所述多组期望字符串 转化为多张字符串图片; 根据所述字符位置标注组, 将所述待处理图片组中每张待处理图片分别与 所述多张字 符串图片 中的对应字符串图片进行融合, 获得多张融合后的图片, 采用的融合方法为泊松 融合算法, 并基于所述字符位置标注组和所述多组期望字符串, 获取多个融合后的字符位 置标注, 所述一张融合后的图片对应所述多个融合后的字符位置标注中至少一个融合后的 字符标注; 所述基于所述字符位置标注组和所述多组期望字符串, 获取多个融合后的字符 位置标注, 包括: 获取所述多组期望字符串中每个期望字符串的长度; 在所述字符位置标注 组中每个字符位置标注中截取 所述期望 字符串的长度, 获得多个融合后的字符位置标注; 基于所述待处理图片组、 所述多张融合后的图片、 所述多个融合后的字符位置标注以 及预设字符识别模型进 行训练, 获得字符识别模型; 所述基于所述待处理图片组、 所述多张 融合后的图片、 所述多个融合后的字符位置标注以及预设字符识别模型进行训练, 获得字 符识别模型, 包括: 获取预设训练轮数和模型调整指令; 根据所述模型调整指令的内容, 调 整所述预设字符识别模型 的模型参数或模型结构, 获得调整后的字符识别模型; 将所述待 处理图片组、 所述多张融合后的图片、 所述多个融合后的字符位置标注输入至所述调整后 字符识别模型进行训练, 经 过所述预设训练轮数的训练之后, 获得字符识别模型。 2.根据权利要求1所述的字符识别模型的获取方法, 其特征在于, 所述根据所述字符表 以及所述字符字体, 获得多组期望 字符串, 包括: 获取字符格 式和融合图片数量, 所述字符格 式包括以下至少一个: 字符长度、 字符像素 大小、 字符镜像、 字符下划线以及字符阴影; 对所述字符表中的字符进行排列组合, 得到多组顺序不同的字符串; 根据所述字符字体和所述字符格式, 分别对所述多组顺序不同的字符串中每组字符串 进行格式处 理, 得到多组格式处 理后的字符串; 从所述多组格式处理后的字符串中, 提取和所述融合图片数量匹配的多组字符串, 作 为所述多组期望 字符串。 3.根据权利要求1所述的字符识别模型的获取方法, 其特征在于, 所述模型调整指令包 括以下至少一种: 大小模型切换指令以及预设字符范围指令; 所述根据 所述模型调整指令的内容, 调 整所述预设字符识别模型的模型参数或模型结 构, 获得调整后的字符识别模型包括: 若所述模型调整指令包括所述大小模型切换指令, 则根据 所述大小模型切换指令对所 述预设字符识别模型进行模型切换, 获得调整后的字符识别模型; 若所述模型调整指令包括所述预设字符范围指令, 则根据 所述预设字符范围指令调整 所述预设字符识别模型的结构, 获得调整后的字符识别模型; 若所述模型调整指令包括所述大小模型切换指令和所述预设字符范围指令, 则根据 所 述大小模型切换指 令对所述预设字符识别模型进 行模型切换, 获得初始调整的字符识别模权 利 要 求 书 1/3 页 2 CN 114758339 B 2型; 根据所述预设字符范围指令调整所述初始调整的字符识别模型 的结构, 获得调整后的 字符识别模型。 4.根据权利要求1所述的字符识别模型的获取方法, 其特征在于, 所述基于所述待处理 图片组、 所述多张融合后的图片、 所述多个融合后的字符位置标注以及预设字符识别模型 进行训练, 获得字符识别模型, 包括: 将所述待处理图片组中的每张待处理图片、 所述多 张融合后的图片中的每张融合后的 图片分别经过图像预 处理, 获得多张预 处理过的图片, 所述图像预 处理包括以下至少一种: 图片切割处 理、 图像旋转处 理和图像二 值化处理; 将所述多张预处 理过的图片划分为训练集和 测试集; 将所述训练集和对应的字符位置标注输入至所述预设字符识别模型进行训练, 获得初 始字符识别模型; 将所述测试集输入至所述初始字符识别模型进行测试, 获得 所述字符识别模型。 5.根据权利要求4所述的字符识别模型的获取方法, 其特征在于, 所述将所述测试集输 入至所述初始字符识别模型进行测试, 获得 所述字符识别模型, 包括: 获取模型阈值, 所述模型阈值包括以下至少一种: 置信度阈值和字符大小阈值; 基于所述测试集中的每个样本, 对所述初始字符识别模型进行测试, 得到所述测试集 中的各个样本各自对应的测试 结果; 若所述测试结果不满足预设准确度, 则调整所述置信度阈值, 返回所述将所述训练集 和对应的字符位置标注输入至所述预设字符识别模型进行训练, 获得初始字符识别模型的 步骤; 若所述测试结果不满足预设清晰度, 则调整所述多 张融合后的图片对应的所述字符大 小阈值, 获得多组阈值调整后的图片, 将所述多组阈值调整后的图片赋给所述多张融合后 的图片, 返回所述将所述待处理图片组中的每张待处理图片、 所述多张融合后的图片 中的 每张融合后的图片分别经 过图像预处 理, 获得多张预处 理过的图片的步骤; 若所述测试结果满足所述预设清晰度和所述预设准确度, 则将所述初始字符识别模型 作为所述字符识别模型。 6.根据权利要求1所述的字符识别模型的获取方法, 其特征在于, 获取所述字符位置标 注组的步骤, 包括: 针对所述待处理图片组中的每张待处理图片, 判断所述待处理图片是否对应有字符位 置标注, 若有, 则将所述待处理图片对应的至少一个字符位置标注添加至所述字符位置标 注组中; 若没有, 则使用字符标注算法对所述待处理图片进 行标注处理, 得到所述待处理图 片对应的至少一个字符位置标注, 并将所述待处理图片对应的至少一个字符位置标注添加 至所述字符位置标注组中。 7.一种字符识别模型的获取装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取待处理图片组、 字符位置标注组、 字符表以及字符字体, 所述 待处理图片组包括至少一张待处理图片, 每张所述待处理图片对应所述字符位置标注组中 至少一个字符位置标注; 字符串图片 获取模块, 用于根据所述字符表以及所述字符字体, 获得多组期望字符串, 并将所述多组期望 字符串转 化为多张字符串图片;权 利 要 求 书 2/3 页 3 CN 114758339 B 3

.PDF文档 专利 字符识别模型的获取方法、装置、计算机设备和存储介质

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 字符识别模型的获取方法、装置、计算机设备和存储介质 第 1 页 专利 字符识别模型的获取方法、装置、计算机设备和存储介质 第 2 页 专利 字符识别模型的获取方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:30:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。