(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210209046.9
(22)申请日 2022.03.03
(71)申请人 OPPO广东移动通信有限公司
地址 523860 广东省东莞 市长安镇乌沙海
滨路18号
(72)发明人 张伟 刘海锋
(74)专利代理 机构 深圳市隆天联鼎知识产权代
理有限公司 4 4232
专利代理师 刘抗美
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/242(2020.01)
G06F 40/295(2020.01)
(54)发明名称
实体消歧方法、 实体消歧装置、 存储介质与
电子设备
(57)摘要
本公开提供一种实体消歧方法、 实体消歧装
置、 存储介质与电子设备, 涉及自然语言处理技
术领域。 该实体消歧方法包括: 确定待识别语句
对应的目标意图, 并获取所述目标意图的第一词
典树和第二词典树, 所述第一词典树包含槽位信
息, 所述第二词典树包含冲突句式; 利用所述第
一词典树确定所述待识别语句中的关键词对应
的候选槽位; 通过将各所述关键词对应的候选槽
位进行组合, 得到第一候选句式; 响应于所述第
一候选句式的数量大于1, 利用所述第二词典树
对所述第一候选句式进行匹配, 以得到第二候选
句式; 根据所述第二候选句式得到所述待识别语
句对应的目标 实体。 本公开提高了实体消歧的准
确性与效率。
权利要求书3页 说明书19页 附图8页
CN 114595696 A
2022.06.07
CN 114595696 A
1.一种实体消歧方法, 其特 征在于, 包括:
确定待识别语句对应的目标意图, 并获取所述目标意图的第一词典树和第二词典树,
所述第一词典树包 含槽位信息, 所述第二词典树包 含冲突句式;
利用所述第一词典树确定所述待识别语句中的关键词对应的候选 槽位;
通过将各 所述关键词对应的候选 槽位进行组合, 得到第一 候选句式;
响应于所述第一候选句式的数量大于1, 利用所述第二词典树对所述第一候选句式进
行匹配, 以得到第二 候选句式;
根据所述第二 候选句式得到所述待识别语句对应的目标实体。
2.根据权利要求1所述的方法, 其特征在于, 所述利用所述第 一词典树确定所述待识别
语句中的关键词对应的候选 槽位, 包括:
将所述待识别语句中的子串与所述第一词典树的节点进行匹配, 当匹配成功时, 将所
述子串确定为关键词子串;
根据所述关键词子串确定所述待识别语句中的关键词, 并根据与所述关键词子串 匹配
的所述节点对应的槽位信息确定所述关键词对应的候选 槽位。
3.根据权利要求2所述的方法, 其特征在于, 所述根据所述关键词子串确定所述待识别
语句中的关键词, 还 包括:
响应于多个所述关键词子串间存在交集, 根据所述关键词子串的长度对所述关键词子
串进行筛选, 以使得筛 选后的各 所述关键词子串间不存在交集。
4.根据权利要求2所述的方法, 其特征在于, 所述第一词典树还包括第一状态转移数
组、 第一验证数组、 第一回退数组、 第一输出数组; 所述将所述待识别语句中的子串与所述
第一词典树的节点进行匹配, 当匹配成功时, 将所述子串确定为关键词子串, 包括:
根据所述第一状态转移数组确定与所述待识别语句中的当前待匹配子串对应的当前
待匹配节点;
根据所述第一验证数组验证所述当前待匹配子串与所述当前待匹配节点是否匹配成
功;
当所述当前待 匹配子串与 所述当前待 匹配节点匹配不成功时, 根据所述第 一回退数组
更新所述当前待匹配子串与所述当前待匹配节点;
当所述当前待 匹配子串与 所述当前待 匹配节点匹配成功时, 若根据所述第 一输出数组
确定所述当前待匹配节点满足输出条件, 则输出所述当前待匹配子串以作为所述关键词子
串, 并将所述当前待匹配子串的下一字符加入所述当前待匹配子串中以更新所述当前待匹
配子串; 若根据所述第一输出数组确定所述当前待匹配节点不满足输出条件, 则将所述当
前待匹配子串的下一字符加入所述当前待匹配子串中以更新所述当前待匹配子串。
5.根据权利要求1所述的方法, 其特征在于, 所述利用所述第 二词典树对所述第 一候选
句式进行匹配, 以得到第二 候选句式, 包括:
将所述第一候选句式与所述第 二词典树的节点进行匹配, 根据匹配成功的所述第 一候
选句式与所述节点对应的冲突句式 中的至少一 者确定所述第二 候选句式。
6.根据权利要求5所述的方法, 其特征在于, 所述将所述第 一候选句式与所述第 二词典
树的节点进行匹配, 根据匹配成功的所述第一候选句式与所述节点对应的冲突句式中的至
少一者确定所述第二 候选句式, 包括:权 利 要 求 书 1/3 页
2
CN 114595696 A
2将所述第一候选句式中的子句式与所述第二词典树的节点进行匹配, 当匹配成功时,
将所述子句式确定为已匹配子句式, 将与所述已匹配子句式匹配的所述节点对应的冲突句
式确定为已匹配冲突句式;
根据所述已匹配子句式与所述已匹配冲突句式 中的至少一 者确定所述第二 候选句式。
7.根据权利要求6所述的方法, 其特征在于, 所述第二词典树还包括第二状态转移数
组、 第二验证数组、 第二回退数组、 第二输出数组; 所述将所述第一候选句式中的子句式与
所述第二词典树的节点进行匹配, 当匹配成功时, 将所述子句 式确定为已匹配子句式, 包
括:
根据所述第二状态转移数组确定与所述第一候选句式中的当前待匹配子句式对应的
当前待匹配节点;
根据所述第二验证数组验证所述当前待匹配子句式与所述当前待匹配节点是否匹配
成功;
当所述当前待 匹配子句式与 所述当前待匹配节点匹配不成功时, 根据 所述第二回退数
组更新所述当前待匹配子句式与所述当前待匹配节点;
当所述当前待 匹配子句式与 所述当前待匹配节点匹配成功时, 若根据 所述第二输出数
组确定所述当前待匹配节点满足输出条件, 则输出所述当前待匹配子句式以作为所述已匹
配子句式, 并将所述当前待匹配子句式的下一字符加入所述当前待匹配子句式中以更新所
述当前待匹配子句 式; 若根据所述第二输出数组确定所述当前待匹配节点不满足输出条
件, 则将所述当前待匹配子句式的下一字符加入所述当前待匹配子句式中以更新所述当前
待匹配子句式。
8.根据权利要求6所述的方法, 其特征在于, 所述根据所述已匹配子句式与 所述已匹配
冲突句式 中的至少一 者确定所述第二 候选句式, 包括:
根据所述已匹配子句式的长度信 息或所述已匹配冲突句式的长度信 息, 从所述已匹配
子句式或所述已匹配冲突句式 中确定所述第二 候选句式。
9.根据权利要求1所述的方法, 其特征在于, 所述根据所述第 二候选句式得到所述待识
别语句对应的目标实体, 包括:
根据所述第 二候选句式对所述关键词对应的候选槽位进行筛选, 根据筛选后的候选槽
位得到所述待识别语句对应的目标实体。
10.根据权利要求9所述的方法, 其特征在于, 所述根据筛选后的候选槽位得到所述待
识别语句对应的目标实体, 包括:
响应于存在至少一个所述关键词, 其对应的筛选后的候选槽位的数量大于1, 根据 所述
筛选后的候选槽位优先级对所述筛选后的候选槽位做进一步筛选, 以得到所述待识别语句
对应的目标实体。
11.一种实体消歧装置, 其特 征在于, 包括:
词典树获取模块, 被配置为确定待识别语句对应的目标意图, 并获取所述目标意图的
第一词典树和第二词典树, 所述第一词典树包 含槽位信息, 所述第二词典树包 含冲突句式;
候选槽位确定模块, 被配置为利用所述第 一词典树确定所述待识别语句中的关键词对
应的候选 槽位;
第一候选句式确定模块, 被配置为通过将各所述关键词对应的候选槽位进行组合, 得权 利 要 求 书 2/3 页
3
CN 114595696 A
3
专利 实体消歧方法、实体消歧装置、存储介质与电子设备
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:50:16上传分享