(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210332294.2 (22)申请日 2022.03.31 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 冷佳  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 任亚娟 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06F 16/332(2019.01) (54)发明名称 相似方法及装置、 电子设备及可读存 储介质 (57)摘要 本发明公开了一种相似 方法及装置、 电子设 备及可读 存储介质。 其中, 该方法包括: 将查询输 入、 查询输入对应的领域属性以及与查询输入关 联的问题文本, 输入至预先训练完成的文本匹配 模型; 通过文本匹配模型的特征提取层, 确定查 询输入、 领域属性以及问题文本对应的文本向量 表示; 通过文本匹配模型的特征处理层, 确定文 本向量表示对应的领域向量表示 以及共享向量 表示; 通过文本匹配模型的特征分类层, 根据领 域向量表示 以及共享向量表示确定查询输入与 问题文本的相似度。 本发明解决了由于相关技术 中的单一模 型只能针对单个领域, 无法针对多个 不同领域的输入 文本进行准确识别的技 术问题。 权利要求书2页 说明书9页 附图2页 CN 114757198 A 2022.07.15 CN 114757198 A 1.一种文本匹配方法, 其特 征在于, 包括: 将查询输入、 所述查询输入对应的领域属性以及与所述查询输入关联的问题文本, 输 入至预先训练完成的文本匹配模型; 通过所述文本匹配模型的特征提取层, 确定所述查询输入、 所述领域属性以及所述问 题文本对应的文本向量表示; 通过所述文本匹配模型的特征处理层, 确定所述文本向量表示对应的领域向量表示以 及共享向量表示; 通过所述文本匹配模型的特征分类层, 根据 所述领域向量表示以及所述共享向量表示 确定所述 查询输入与所述问题文本的相似度。 2.根据权利要求1所述的方法, 其特征在于, 所述特征处理层包括多个领域单元以及共 享单元, 其中, 通过所述文本匹配模型的特征 处理层, 确定所述文本向量表示对应的领域向 量表示以及共享向量表示, 包括: 通过所述多个领域单元, 根据 所述文本向量表示获取所述多个领域模块对应的多个领 域子向量表示; 根据所述多个领域子向量表示确定所述领域向量表示; 通过所述共享单 元, 根据所述文本向量表示确定所述共享向量表示。 3.根据权利要求2所述的方法, 其特征在于, 所述特征处理层还包括门控处理单元, 其 中, 根据所述多个领域子向量表示确定所述领域向量表示, 包括: 通过所述门控处理单元, 根据 所述文本向量表示与所述多个领域单元对应的多个领域 之间的关联关系, 确定所述多个领域单 元对应的分数值; 根据分数值以及所述多个领域子向量表示确定所述领域向量表示。 4.根据权利要求1所述的方法, 其特征在于, 通过所述文本匹配模型的特征分类层, 根 据所述领域向量表示以及所述共享向量表示确定所述查询输入与所述问题文本的相似度, 包括: 对所述领域向量表示以及所述共享向量表示进行拼接, 得到第一向量表示; 对所述第一向量表示进行分类, 以确定所述相似度。 5.根据权利要求3所述的方法, 其特征在于, 在所述将查询输入、 所述查询输入对应的 领域属性以及与所述查询输入关联的问题文本, 输入至预先训练完成的文本匹配模型之 前, 还包括: 通过所述门控处 理单元, 确定预设训练样本的预测领域分数; 根据所述预设训练样本的样本领域分数以及所述预测领域分数确定交叉熵损失函数; 根据所述交叉熵损失函数训练所述文本匹配模型。 6.一种文本匹配装置, 其特 征在于, 包括: 输入模块, 用于将查询输入、 所述查询输入对应的领域属性以及与所述查询输入关联 的问题文本, 输入至预 先训练完成的文本匹配模型; 第一确定模块, 用于通过所述文本匹配模型的特征提取层, 确定所述查询输入、 所述领 域属性以及所述问题文本对应的文本向量表示; 第二确定模块, 用于通过所述文本匹配模型的特征处理层, 确定所述文本向量表示对 应的领域向量表示以及共享向量表示;权 利 要 求 书 1/2 页 2 CN 114757198 A 2第三确定模块, 用于通过所述文本匹配模型的特征分类层, 根据所述领域向量表示以 及所述共享向量表示确定所述 查询输入与所述问题文本的相似度。 7.根据权利要求6所述的装置, 其特征在于, 所述特征处理层包括多个领域单元以及共 享单元, 其中, 所述第二确定模块包括: 第一获取子模块, 用于通过所述多个领域单元, 根据所述文本向量表示获取所述多个 领域模块对应的多个领域子向量表示; 第一确定 子模块, 用于根据所述多个领域子向量表示确定所述领域向量表示; 第二确定子模块, 用于通过所述共享单元, 根据所述文本向量表示确定所述共享向量 表示。 8.根据权利要求7所述的装置, 其特征在于, 所述特征处理层还包括门控处理单元, 其 中, 所述第一确定 子模块包括: 第一确定单元, 用于通过所述门控处理单元, 根据所述文本向量表示与所述多个领域 单元对应的多个领域之间的关联关系, 确定所述多个领域单 元对应的分数值; 第二确定单元, 用于根据分数值以及所述多个领域子向量表示确定所述领域向量表 示。 9.根据权利要求6所述的装置, 其特 征在于, 所述第三确定模块包括: 处理子模块, 用于对所述领域向量表示以及所述共享向量表示进行拼接, 得到第一向 量表示; 分类子模块, 用于对所述第一向量表示进行分类, 以确定所述相似度。 10.根据权利要求8所述的装置, 其特 征在于, 还 包括: 第四确定模块, 用于在所述将查询输入、 所述查询输入对应的领域属性以及与所述查 询输入关联的问题文本, 输入至预先训练完成的文本匹配模型之前, 通过所述门控处理单 元, 确定预设训练样本的预测领域分数; 第五确定模块, 用于根据所述预设训练样本的样本领域分数以及所述预测领域分数确 定交叉熵损失函数; 训练模块, 用于根据所述交叉熵损失函数训练所述文本匹配模型。 11.一种电子设备, 其特征在于, 包括处理器, 存储器及存储在所述存储器上并可在所 述处理器上运行 的程序或指令, 所述程序或指令被所述处理器执行时实现如权利要求1 ‑5 所述的文本匹配方法的步骤。 12.一种可读存储介质, 其特征在于, 所述可读存储介质上存储程序或指令, 所述程序 或指令被处 理器执行时实现如权利要求1 ‑5所述的文本匹配方法的步骤。权 利 要 求 书 2/2 页 3 CN 114757198 A 3

.PDF文档 专利 相似方法及装置、电子设备及可读存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 相似方法及装置、电子设备及可读存储介质 第 1 页 专利 相似方法及装置、电子设备及可读存储介质 第 2 页 专利 相似方法及装置、电子设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。