(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210502398.3
(22)申请日 2022.05.10
(71)申请人 马上消费金融股份有限公司
地址 401120 重庆市渝北区黄山大道中段
52号渝兴广场B2栋4至8楼
(72)发明人 吕乐宾 吴海英 权佳成 李宽
(74)专利代理 机构 北京国昊天诚知识产权代理
有限公司 1 1315
专利代理师 朱文杰
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/335(2019.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
(54)发明名称
名称处理方法及装置
(57)摘要
本申请实施例提供了名称处理方法及 装置,
在获取到目标对象的第一非标准名称后, 对第一
非标准名称进行简化处理, 得到第二非标准名
称; 以及对待简化标准名称集中的标准名称进行
简化处理, 得到简化标准名称集; 然后确定简化
标准名称集中与第二非标准名 称相匹配的目标
简化标准名称, 目标简化标准名称对应的未简化
标准名称即可作为第一非标准名 称的参考标准
名称, 以使得在用户输入不规范的名称时, 从预
设标准名 称集中自动匹配该不规范名 称对应的
参考标准名称, 这样能够提高针对不规范名称进
行标准名称匹配的效率和匹配准确度, 并且还可
以根据该参考标准名 称对不规范名 称进行纠正
或者根据该参考标准名 称确定输入不规范名 称
的用户是否为目标服 务用户。
权利要求书3页 说明书23页 附图6页
CN 114880430 A
2022.08.09
CN 114880430 A
1.一种名称处 理方法, 其特 征在于, 所述方法包括:
获取目标对象的第一非标准名称;
对所述第一非标准名称进行简化处理, 得到第二非标准名称; 以及对待简化标准名称
集中包括的标准名称进 行简化处理, 得到简化标准名称集; 其中, 若 所述第一 非标准名称中
不包括指定字段, 则所述待简化标准名称集为预设标准名称集; 若所述第一非标准名称中
包括所述指定字段, 则所述待简化标准名称集为所述预设标准名称集中满足第一约束 条件
的标准名称形成的集 合;
确定所述简化标准名称集中与所述第 二非标准名称相匹配的目标简化标准名称; 所述
目标简化标准名称对应的未简化标准名称用于作为所述第一非标准名称的参 考标准名称。
2.根据权利要求1所述的方法, 其特征在于, 所述预设标准名称集中满足第 一约束条件
的标准名称包括至少一个第一标准名称和至少一个第二标准名称;
其中, 所述第一标准名称不包 含所述指定 字段; 所述第二标准名称包 含所述指定 字段;
所述第二标准名称中所述指定字段的第一赋值与所述第一非标准名称中所述指定字
段的第二赋值相同, 且所述第一赋值与所述第二赋值的所属级别相同; 或者, 所述第一赋值
与所述第二赋值的所属级别不相同。
3.根据权利要求1所述的方法, 其特征在于, 所述确定所述简化标准名称集中与所述第
二非标准名称相匹配的目标简化标准名称, 包括:
基于预设字符串 匹配方法, 确定所述简化标准名称集中与所述第 二非标准名称相匹配
的目标简化标准名称。
4.根据权利要求3所述的方法, 其特征在于, 所述预设字符串匹配方法包括暴力 字符串
匹配方法和字符串模糊匹配方法;
所述基于预设字符串 匹配方法, 确定所述简化标准名称集中与 所述第二非标准名称相
匹配的目标简化标准名称, 包括:
基于所述暴力 字符串匹配方法, 确定所述简化标准名称集中满足第 二约束条件的简化
标准名称; 其中, 所述第二约束条件包括简化标准名称与第二非标准名称之间属于包含关
系;
基于所述字符串模糊匹配方法, 确定简化标准名称子集中满足第 三约束条件的简化标
准名称; 其中, 所述简化标准名称子集包括不满足所述第二约束 条件的简化标准名称, 所述
第三约束条件 包括简化标准名称与第二非标准名称之间的差异程度小于第一预设阈值;
将满足所述第 二约束条件的简化标准名称、 以及不满足所述第 二约束条件且满足所述
第三约束条件的简化标准名称, 确定为所述第二非标准名称相匹配的目标简化标准名称。
5.根据权利要求4所述的方法, 其特征在于, 所述字符串模糊匹配方法包括第 一字符串
匹配方法和第二字符串匹配方法; 所述第一字符串匹配方法对应的第一字符 匹配步长小于
所述第二字符串匹配方法对应的第二字符匹配步长;
所述基于所述字符串模糊匹配方法, 确定简化标准名称子集中满足第 三约束条件的简
化标准名称, 包括:
基于所述第 一字符串 匹配方法, 确定简化标准名称子集包括的第 一类简化标准名称中
满足第三约束条件的简化标准名称; 其中, 所述第一类简化标准名称与所述第二非标准名
称之间的最短字符串长度小于第二预设阈值;权 利 要 求 书 1/3 页
2
CN 114880430 A
2基于所述第 二字符串 匹配方法, 确定简化标准名称子集包括的第 二类简化标准名称中
满足第三约束条件的简化标准名称; 其中, 所述第二类简化标准名称与所述第二非标准名
称之间的最短字符串长度大于或等于所述第二预设阈值。
6.根据权利要求1所述的方法, 其特征在于, 在确定所述简化标准名称集中与 所述第二
非标准名称相匹配的目标简化标准名称之后, 还 包括:
确定每个所述目标简化标准名称与所述第二非标准名称之间的语义相似度;
基于确定的所述语义相似度, 生成所述第一非标准名称的标准名称匹配结果。
7.根据权利要求6所述的方法, 其特征在于, 所述基于确定的所述语义相似度, 生成所
述第一非标准名称的标准名称匹配结果, 包括:
基于确定的所述语义相似度, 确定每个所述目标简化标准名称对应的未简化标准名称
的排序结果;
基于每个所述未简化标准名称的排序 结果, 确定所述第 一非标准名称的标准名称匹配
结果。
8.根据权利要求6所述的方法, 其特征在于, 针对每个所述目标简化标准名称, 确定所
述目标简化标准名称与所述第二非标准名称之间的语义相似度, 包括:
利用预设语义相似度算法, 确定所述目标简化标准名称与所述第 二非标准名称之间的
初始相似度;
基于所述初始相似度、 以及所述目标简化标准名称与 所述第二非标准名称之间的字符
串匹配结果, 确定所述 目标简化标准名称与所述第二非标准名称之间的语义相似度; 所述
字符串匹配结果包括表征目标简化标准名称与第二非标准名称之间是否属于包含关系的
匹配结果, 属于包含关系的所述目标简化标准名称的语义相似度大于所述目标简化标准名
称对应的所述初始相似度。
9.根据权利要求6所述的方法, 其特征在于, 在基于确定的所述语义相似度, 生成所述
第一非标准名称的标准名称匹配结果之后, 还 包括:
若确定的所述语义相似度中的最大值大于第 三预设阈值, 则将输入所述第 一非标准名
称的目标用户确定为目标服 务人群。
10.一种名称处 理装置, 其特 征在于, 所述装置包括:
名称获取模块, 被 配置为获取目标对象的第一非标准名称;
名称简化模块, 被配置为对所述第 一非标准名称进行简化处理, 得到第 二非标准名称;
以及对待简化标准名称集中包括的标准名称进行简化处理, 得到简化标准名称集; 其中, 若
所述第一非标准名称中不包括指定字段, 则所述待简化标准名称集为预设标准名称集; 若
所述第一 非标准名称中包括所述指 定字段, 则所述待简化标准名称集为所述预设标准名称
集中满足第一约束条件的标准名称形成的集 合;
名称确定模块, 被配置为确定所述简化标准名称集中与 所述第二非标准名称相匹配的
目标简化标准名称; 所述目标简化标准名称对应的未简化标准名称用于作为所述第一非标
准名称的参 考标准名称。
11.一种名称处 理设备, 其特 征在于, 所述设备包括:
处理器; 以及
被安排成存储计算机可执行指令的存储器, 所述可执行指令被配置由所述处理器执权 利 要 求 书 2/3 页
3
CN 114880430 A
3
专利 名称处理方法及装置
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:48:25上传分享