国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210332294.2 (22)申请日 2022.03.31 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 冷佳 (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 任亚娟 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06F 16/332(2019.01) (54)发明名称 相似方法及装置、 电子设备及可读存 储介质 (57)摘要 本发明公开了一种相似 方法及装置、 电子设 备及可读 存储介质。 其中, 该方法包括: 将查询输 入、 查询输入对应的领域属性以及与查询输入关 联的问题文本, 输入至预先训练完成的文本匹配 模型; 通过文本匹配模型的特征提取层, 确定查 询输入、 领域属性以及问题文本对应的文本向量 表示; 通过文本匹配模型的特征处理层, 确定文 本向量表示对应的领域向量表示 以及共享向量 表示; 通过文本匹配模型的特征分类层, 根据领 域向量表示 以及共享向量表示确定查询输入与 问题文本的相似度。 本发明解决了由于相关技术 中的单一模 型只能针对单个领域, 无法针对多个 不同领域的输入 文本进行准确识别的技 术问题。 权利要求书2页 说明书9页 附图2页 CN 114757198 A 2022.07.15 CN 114757198 A 1.一种文本匹配方法, 其特 征在于, 包括: 将查询输入、 所述查询输入对应的领域属性以及与所述查询输入关联的问题文本, 输 入至预先训练完成的文本匹配模型; 通过所述文本匹配模型的特征提取层, 确定所述查询输入、 所述领域属性以及所述问 题文本对应的文本向量表示; 通过所述文本匹配模型的特征处理层, 确定所述文本向量表示对应的领域向量表示以 及共享向量表示; 通过所述文本匹配模型的特征分类层, 根据 所述领域向量表示以及所述共享向量表示 确定所述 查询输入与所述问题文本的相似度。 2.根据权利要求1所述的方法, 其特征在于, 所述特征处理层包括多个领域单元以及共 享单元, 其中, 通过所述文本匹配模型的特征 处理层, 确定所述文本向量表示对应的领域向 量表示以及共享向量表示, 包括: 通过所述多个领域单元, 根据 所述文本向量表示获取所述多个领域模块对应的多个领 域子向量表示; 根据所述多个领域子向量表示确定所述领域向量表示; 通过所述共享单 元, 根据所述文本向量表示确定所述共享向量表示。 3.根据权利要求2所述的方法, 其特征在于, 所述特征处理层还包括门控处理单元, 其 中, 根据所述多个领域子向量表示确定所述领域向量表示, 包括: 通过所述门控处理单元, 根据 所述文本向量表示与所述多个领域单元对应的多个领域 之间的关联关系, 确定所述多个领域单 元对应的分数值; 根据分数值以及所述多个领域子向量表示确定所述领域向量表示。 4.根据权利要求1所述的方法, 其特征在于, 通过所述文本匹配模型的特征分类层, 根 据所述领域向量表示以及所述共享向量表示确定所述查询输入与所述问题文本的相似度, 包括: 对所述领域向量表示以及所述共享向量表示进行拼接, 得到第一向量表示; 对所述第一向量表示进行分类, 以确定所述相似度。 5.根据权利要求3所述的方法, 其特征在于, 在所述将查询输入、 所述查询输入对应的 领域属性以及与所述查询输入关联的问题文本, 输入至预先训练完成的文本匹配模型之 前, 还包括: 通过所述门控处 理单元, 确定预设训练样本的预测领域分数; 根据所述预设训练样本的样本领域分数以及所述预测领域分数确定交叉熵损失函数; 根据所述交叉熵损失函数训练所述文本匹配模型。 6.一种文本匹配装置, 其特 征在于, 包括: 输入模块, 用于将查询输入、 所述查询输入对应的领域属性以及与所述查询输入关联 的问题文本, 输入至预 先训练完成的文本匹配模型; 第一确定模块, 用于通过所述文本匹配模型的特征提取层, 确定所述查询输入、 所述领 域属性以及所述问题文本对应的文本向量表示; 第二确定模块, 用于通过所述文本匹配模型的特征处理层, 确定所述文本向量表示对 应的领域向量表示以及共享向量表示;权 利 要 求 书 1/2 页 2 CN 114757198 A 2第三确定模块, 用于通过所述文本匹配模型的特征分类层, 根据所述领域向量表示以 及所述共享向量表示确定所述 查询输入与所述问题文本的相似度。 7.根据权利要求6所述的装置, 其特征在于, 所述特征处理层包括多个领域单元以及共 享单元, 其中, 所述第二确定模块包括: 第一获取子模块, 用于通过所述多个领域单元, 根据所述文本向量表示获取所述多个 领域模块对应的多个领域子向量表示; 第一确定 子模块, 用于根据所述多个领域子向量表示确定所述领域向量表示; 第二确定子模块, 用于通过所述共享单元, 根据所述文本向量表示确定所述共享向量 表示。 8.根据权利要求7所述的装置, 其特征在于, 所述特征处理层还包括门控处理单元, 其 中, 所述第一确定 子模块包括: 第一确定单元, 用于通过所述门控处理单元, 根据所述文本向量表示与所述多个领域 单元对应的多个领域之间的关联关系, 确定所述多个领域单 元对应的分数值; 第二确定单元, 用于根据分数值以及所述多个领域子向量表示确定所述领域向量表 示。 9.根据权利要求6所述的装置, 其特 征在于, 所述第三确定模块包括: 处理子模块, 用于对所述领域向量表示以及所述共享向量表示进行拼接, 得到第一向 量表示; 分类子模块, 用于对所述第一向量表示进行分类, 以确定所述相似度。 10.根据权利要求8所述的装置, 其特 征在于, 还 包括: 第四确定模块, 用于在所述将查询输入、 所述查询输入对应的领域属性以及与所述查 询输入关联的问题文本, 输入至预先训练完成的文本匹配模型之前, 通过所述门控处理单 元, 确定预设训练样本的预测领域分数; 第五确定模块, 用于根据所述预设训练样本的样本领域分数以及所述预测领域分数确 定交叉熵损失函数; 训练模块, 用于根据所述交叉熵损失函数训练所述文本匹配模型。 11.一种电子设备, 其特征在于, 包括处理器, 存储器及存储在所述存储器上并可在所 述处理器上运行 的程序或指令, 所述程序或指令被所述处理器执行时实现如权利要求1 ‑5 所述的文本匹配方法的步骤。 12.一种可读存储介质, 其特征在于, 所述可读存储介质上存储程序或指令, 所述程序 或指令被处 理器执行时实现如权利要求1 ‑5所述的文本匹配方法的步骤。权 利 要 求 书 2/2 页 3 CN 114757198 A 3
专利 相似方法及装置、电子设备及可读存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:51:53
上传分享
举报
下载
原文档
(531.0 KB)
分享
友情链接
GB T 27930.2 -XXXX 电动汽车非车载传导式充电机与车辆之间的数字通信协议 第2部分 Chaojix系统.pdf
ISO IEC 27005-2022 信息安全、 网络安全和隐私保护-信息安全风险管理指南.pdf
T-ZZB 2980—2022 平板显示用视窗功能面板.pdf
T-SZSWA 007—2022 困境儿童关爱社会工作服务指南.pdf
易观分析 AIGC产业研究报告2023——音频生成篇.pdf
GB-T 35284-2017 信息安全技术 网站身份和系统安全要求与评估方法.pdf
NB-T 10802—2021 水电工程预应力锚固设计规范.pdf
DB53-T 1137-2023 公路建设项目电子文件与电子档案管理系统建设指南 云南省.pdf
T-CIECCPA 010—2020 节能诊断数据结构化处理规范.pdf
GB-T 230.1-2018 金属材料 洛氏硬度试验 第1部分 试验方法.pdf
GB-T 14560-2022 履带起重机.pdf
GB-T 34422-2017 汽车用制动盘.pdf
GB-T 13560-2017 烧结钕铁硼永磁材料.pdf
T-SXAGS 0012—2020 山西好粮油 小麦粉.pdf
GB-T 5048-2017 防潮包装.pdf
穿越数据的迷宫扫描版.pdf
GB-T 23020-2013工业企业信息化和工业化融合评估规范.pdf
GM-T 0010-2012 SM2密码算法加密签名消息语法规范.pdf
YD-T 3838-2021 通信制造业绿色工厂评价细则.pdf
T-CADERM 3008—2019 严重过敏反应诊断和早期治疗规范.pdf
1
/
3
14
评价文档
赞助2.5元 点击下载(531.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。