(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210445329.3 (22)申请日 2022.04.26 (71)申请人 康键信息技 术 (深圳) 有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书 有限公司) (72)发明人 薛忠源  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 焦禹 (51)Int.Cl. G06F 16/33(2019.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G16H 40/20(2018.01) (54)发明名称 语义理解召回模型的应用方法、 装置、 设备 及存储介质 (57)摘要 本申请公开一种语义理解召回模型的应用 方法、 装置、 设备及存储介质, 包括: 从目标语义 理解召回模型对应的语义样本库中抽取与输入 信息具备第一关系的M个语料信息; 对M个语料信 息和输入信息执行预训练, 将M个语料信息和输 入信息转化为X个字向量; 将X个字向量中的每个 字向量输入至第一表示层, 执行语义识别, 获取X 个第一语义信息; 将每个字向量输入至第二表示 层, 执行语义识别, 获取X个第二语义信息; 根据X 个第一语义信息和X个第二语义信息, 利用预设 算法确定M个语料信息与输入信息之间的M个匹 配阈值。 如此, 从而提高确定语料信息与输入信 息之间相关性的精准度, 进一步提高后续用户搜 索内容的准确性。 权利要求书2页 说明书13页 附图2页 CN 114741475 A 2022.07.12 CN 114741475 A 1.一种语义理解召回模型的应用方法, 其特 征在于, 包括: 从目标语义理解召回模型对应的语义样本库中抽取与输入信 息具备第 一关系的M个语 料信息, M为 正整数; 对所述M个语料信 息和所述输入信 息执行预训练, 将所述M个语料信 息和所述输入信 息 转化为X个字向量, X为比M大1的正整数; 将所述X个字向量中的每个字向量输入至第一表示层, 执行语义识别, 获取X个第一语 义信息, 所述X个第一语义信息中的每个第一语义信息为所述每个字 向量中子字 向量在预 定范围内的语义信息, 所述每 个字向量包括至少一个子 字向量; 将所述每个字向量输入至第二表示层, 执行语义识别, 获取X个第二语义信息, 所述X个 第二语义信息中的每 个第二语义信息为所述每 个字向量中子 字向量之间的语义关系信息; 根据所述X个第一语义信息和所述X个第二语义信息, 利用预设算法确定所述M个语料 信息与所述输入信息之间的M个匹配阈值。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法包括: 建立样本库; 所述样本库中包括N个样本, 所述样本库包括: 正样本库, 负样本库; 所述正样本库中的 样本信息为与所述输入信息相关度大于或者等于第一阈值的样本信息, 所述负样本库中的 样本信息为与所述输入信息相关度小于第一阈值的样本信息N 为整数。 3.根据权利要求1所述的方法, 其特征在于, 所述抽取与输入信息具备第一关系的M个 语料信息之前, 所述方法还 包括: 利用所述样本库中的样本信息对所述语义理解召回模型进行训练; 获取所述目标语义理解召回模型。 4.根据权利要求2所述的方法, 其特征在于, 在所述样本库为所述正样本库的情况下, 所述建立样本库包括: 将正样本信息存 入正样本库; 其中, 所述正样本信息包括以下至少一项: 包括症状信息和医生信息的第一匹配关系 信息, 具有长尾标志的第二匹配关系信息, 包括医生 擅长和医生信息的第三匹配关系信息; 所述第一匹配关系信息满足第二阈值, 所述长尾关系为第一匹配关系的细化信息 。 5.根据权利要求4所述的方法, 其特征在于, 在所述正样本信 息为所述具有长尾标志的 第二匹配关系信息的情况 下, 所述建立样本库之前, 所述方法包括: 筛选所述包括症状信息和医生信息的匹配关系信息, 获取所述第二匹配关系信息, 所 述第二匹配关系信息包括至少一组匹配关系信息; 为所述第二匹配关系信息中的每 个匹配关系信息添加强化信息 。 6.根据权利要求2所述的方法, 其特征在于, 在所述样本库为所述负样本库的情况下, 所述建立样本库包括: 将所述负 样本信息存 入负样本库; 其中, 所述负 样本信息包括以下至少一项: 第一负 样本信息, 第二负 样本信息; 所述第一负样本信 息包括症状信 息和医生信 息的第四匹配关系信 息, 所述第四匹配关 系信息为不满足所述第二阈值, 满足第三阈值的匹配关系信息; 所述第二负样本信息包括 症状信息和医生信息的第五匹配关系信息, 所述第五匹配关系信息为不满足所述第三阈值权 利 要 求 书 1/2 页 2 CN 114741475 A 2的匹配关系信息 。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述X个字向量中的每个字向量输 入至第一表示层, 执 行语义识别, 获取 X个第一语义信息, 包括: 将所述X个字向量中的每个字向量输入至用于指示所述X个字向量对应的整体语义含 义的第一表示层, 执 行语义识别, 并获取 X个第一语义信息; 所述将所述每个字向量输入至第二表示层, 执行语义识别, 获取X个第二语义信息, 包 括: 将所述X个字向量中的每个字向量输入至用于指示所述每个字向量之间语义关系和所 述每个字向量语义含义的第二表示层, 执 行语义识别, 并获取 X个第二语义信息 。 8.一种语义理解召回模型的应用装置, 其特 征在于, 包括: 执行模块, 用于从 目标语义理解召回模型对应的语义样本库中抽取与输入信 息具备第 一关系的M个 语料信息, M为 正整数; 所述执行模块, 还用于对所述M个语料信息和所述输入信息执行预训练, 将所述M个语 料信息和所述输入信息转 化为X个字向量, X为比M大1的正整数; 获取模块, 用于将所述执行模块转化的所述X个字向量中的每个字向量输入至第一表 示层, 执行语义识别, 获取X个第一语义信息, 所述X个第一语义信息中的每个第一语义信息 为所述每个字向量中子字向量在预定范围内的语义信息, 所述每个字向量包括至少一个子 字向量; 所述获取模块, 还用于将所述执行模块转化的所述每个字向量输入至第二表示层, 执 行语义识别, 获取X个第二语义信息, 所述X个第二语义信息中的每个第二语义信息为所述 每个字向量中子 字向量之间的语义关系信息; 确定模块, 用于根据 所以获取模块获取的所述X个第 一语义信 息和所述X个第 二语义信 息, 利用预设算法确定所述M个 语料信息与所述输入信息之间的M个匹配阈值。 9.一种设备, 其特征在于, 包括存储器和处理器, 所述存储器中存储有计算机可读指 令, 所述计算机可读指令被所述处理器执行时, 使得所述处理器执行如权利要求1至7中任 一项权利要求所述语义理解召回模型的应用方法的步骤。 10.一种存储有计算机可读指令的存储介质, 其特征在于, 所述计算机可读指令被一个 或多个处理器执行时, 使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述 语义理解召回模型的应用方法的步骤。权 利 要 求 书 2/2 页 3 CN 114741475 A 3

.PDF文档 专利 语义理解召回模型的应用方法、装置、设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语义理解召回模型的应用方法、装置、设备及存储介质 第 1 页 专利 语义理解召回模型的应用方法、装置、设备及存储介质 第 2 页 专利 语义理解召回模型的应用方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:52:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。