(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210478330.6 (22)申请日 2022.05.05 (71)申请人 国家邮政局邮政业 安全中心 地址 100080 北京市海淀区挂甲屯路5号 (72)发明人 许良锋 王丰 高黎明 杨阳  任仰奇 张彬 杨韬 杨睿  闻克宇 张倾城  (74)专利代理 机构 北京友谊嘉知识产权代理事 务所(普通 合伙) 16075 专利代理师 张会会 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 40/284(2020.01) G06F 40/216(2020.01)G06F 40/237(2020.01) G06F 40/253(2020.01) G06F 40/58(2020.01) (54)发明名称 内件品名与寄递地址的关联关系的识别方 法和系统 (57)摘要 本公开实施例公开了一种内件品名与寄递 地址的关联关系的识别方法和系统。 其中, 所述 内件品名与寄递地址的关联关系的识别方法包 括: 获取英语语境的寄递面单数据; 对所述寄递 面单数据的英文内件品名和英文寄递地址进行 自然语言处理; 对自然语言处理得到的数据进行 关注词分析; 根据关注词分析结果, 寄递面单数 据以及业务规则库构建识别模型, 所述业务规则 库对不同类型的英文风险内件品的识别规则进 行预设定; 通过所述识别模型, 获得英文风险内 件品名与英文风险寄递 地址的关联关系。 权利要求书2页 说明书16页 附图5页 CN 114818730 A 2022.07.29 CN 114818730 A 1.一种内件品名与寄递 地址的关联关系的识别方法, 其特 征在于, 包括: 获取英语 语境的寄递 面单数据; 对所述寄递 面单数据的英文内件品名和英文寄递 地址进行自然语言处 理; 对自然语言处 理得到的数据进行关注词分析; 根据关注词分析结果, 所述寄递面单数据以及业务规则库构建识别模型, 所述业务规 则库对不同类型的英文风险内件品的识别规则进行 预设定; 通过所述识别模型, 获得英文风险内件品名与英文风险寄递 地址的关联关系。 2.根据权利要求1所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 所 述通过所述识别模型, 获得英文风险内件品名与英文风险寄递地址的关联关系包括: 向所 述识别模型输入一个英文风险内件品名, 所述识别模型输出相关的多个英文风险寄递地址 及各英文风险寄递地址的出现概率; 或, 向所述识别模型输入一个英文风险寄递地址, 所述 识别模型输出相关的多个英文风险内件品名及各英文风险内件品名的出现概 率。 3.根据权利要求2所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 所 述识别模型为Sk ip‑gram模型。 4.根据权利要求1所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 所 述通过所述识别模型, 获得英文风险内件品名与英文风险寄递地址的关联关系包括: 向所 述识别模型输入多个英文风险内件品名, 所述识别模型输出相关的一个英文风险寄递地 址; 或, 向所述识别模型输入多个英文风险寄递地址, 所述识别模型输出相关的一个英文风 险内件品名。 5.根据权利要求4所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 所 述识别模型为CBOW模型。 6.根据权利要求1所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 通 过NLTK方法对所述寄递 面单数据的英文内件品名和英文寄递 地址进行自然语言处 理。 7.根据权利要求1所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 还 包括: 在所述对自然语 言处理得到的数据进 行关注词分析之前, 建立特征词 库, 所述特征词 库中包括至少一类危险内件品的英文内件品名; 所述对自然语言处理得到的数据进行关注词分析包括: 从所述特征词库中选择英文内 件品名作为关注词, 或, 自定义词语进行关注词分析; 在自定义词语进行关注词分析时, 所述内件 品名与寄递地址的关联关系的识别方法还 包括: 将关注词分析结果与所述特征词 库中的英文内件品名进 行匹配, 在匹配失败后, 确认 所述关注词分析结果是否为危险内件品, 在确认为风险内件品后, 将所述关注词分析结果 更新至所述特 征词库中。 8.根据权利要求1所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 所 述对自然语 言处理得到的数据进 行关注词分析包括: 统计关注词数量, 统计关注词密度, 搜 索单个关注词, 统计关注词出现位置的上下文中的相似词, 搜索 多个关注词的共同上下文, 统计关注词 出现的频率, 统计出现次数高于第一预设值的关注词, 统计出现次数低于第二 预设值的关注词, 多维度选择关注词, 以及, 图形化展示多个关注词中的一种或多种。 9.根据权利要求1所述的内件 品名与寄递地址的关联关系的识别方法, 其特征在于, 还 包括: 在所述通过所述识别模型, 获得英文风险内件品名与英文风险寄递地址的关联关系权 利 要 求 书 1/2 页 2 CN 114818730 A 2之后, 查找与所述英文风险寄递地址或英文风险内件品名对应的寄递面单, 并为所述寄递 面单设置风险识别标识。 10.一种内件品名与寄递 地址的关联关系的识别系统, 其特 征在于, 包括: 获取模块, 用于获取英语 语境的寄递 面单数据; 处理模块, 用于对所述寄递面单数据的英文内件 品名和英文寄递地址进行自然语言处 理; 分析模块, 用于对自然语言处 理得到的数据进行关注词分析; 构建模块, 用于根据关注词分析结果, 寄递面单数据以及业务规则库构建识别模型, 所 述业务规则库对不同类型的英文风险内件品的识别规则进行 预设定; 识别模块, 用于通过所述识别模型, 获得英文风险内件品名与英文风险寄递地址的关 联关系。权 利 要 求 书 2/2 页 3 CN 114818730 A 3

.PDF文档 专利 内件品名与寄递地址的关联关系的识别方法和系统

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 内件品名与寄递地址的关联关系的识别方法和系统 第 1 页 专利 内件品名与寄递地址的关联关系的识别方法和系统 第 2 页 专利 内件品名与寄递地址的关联关系的识别方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:48:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。