国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221021869 9.3 (22)申请日 2022.03.03 (71)申请人 贝壳找房网 (北京) 信息技 术有限公 司 地址 101520 北京市密云区经济开发区兴 盛南路8号开发区办公楼501室-1834 (经济开发区集中办公区) (72)发明人 魏林林 马宝昌 (74)专利代理 机构 北京市尚公律师事务所 11746 专利代理师 贺小明 回旋 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/211(2020.01)G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种语义匹配方法及其装置 (57)摘要 本发明提供一种语义匹配方法及其装置, 所 述方法包括以下步骤: 将输入语句分别输入到交 叉编码器和双编码器中; 计算交叉编码器各层的 多头注意力权重; 计算双编码器所含两个子编码 器中各层的表 示向量; 对两个子编码器中对应各 层的表示向量分别进行交互计算, 得到两个子编 码器各层的交互注意力权重; 以及最小化交叉编 码器各层多头注意力权重与双编码器对应各层 交互注意力权重的误差, 以得到与所述输入语句 匹配的语义。 本发明所提供的语义匹配方法及其 装置可以实现双编码器框架中查询语句和候选 文本之间深层次的语义交 互。 权利要求书2页 说明书11页 附图7页 CN 114579704 A 2022.06.03 CN 114579704 A 1.一种语义匹配方法, 其特 征在于, 包括以下步骤: 将输入语句分别输入到交叉编码器和双编码器中; 计算所述交叉编码器各层的多头注意力权 重; 计算所述双编码器所含两个子编码器中各层的表示向量; 对所述两个子编码器中对应各层的表示向量分别进行交互计算, 得到所述两个子编码 器各层的交 互注意力权 重; 以及 最小化所述交叉编码器各层多头注意力权重与所述双编码器对应各层交互注意力权 重的误差, 以得到与所述输入语句匹配的语义。 2.根据权利要求1所述的语义匹配方法, 其特征在于, 所述交叉编码器各层的多头注意 力权重为各层多头注意力中各个头注意力权 重的加和平均值。 3.根据权利要求1所述的语义匹配方法, 其特征在于, 所述双编码器所含两个子编码器 各层的交 互注意力权 重通过下式进行交 互计算: 其中, 表示所述双编码器所含两个子编码器第i层的交互注意力权重, 表示所述 双编码器中第一子编码器中第i层的表示向量, 表示所述双编码器中第二子编码器中第i 层的表示向量。 4.根据权利要求3所述的语义匹配方法, 其特征在于, 所述交叉编码器各层多头注意力 权重与所述双编码器对应各层交互注意力权重的误差为均方误差, 该均方误差通过下式进 行计算: 其中, Lattn表示所述交叉编码器第i层的多头注意力权重与所述双编码器第i层的交互 注意力权重的均方误差, n表示所述交叉编码器或所述双编码器的层数, 表示所述双编 码器所含两个子编码器第i层的交互注意力权重, 表示所述交叉编码器第i层的多头注 意力权重。 5.根据权利要求1所述的语义匹配方法, 其特征在于, 所述交叉编码器和双编码器均为 12层。 6.一种用于进行语义匹配的装置, 其特 征在于, 包括: 输入模块, 其被 配置为输入语句; 交叉编码器模块, 其包含交叉编码器, 所述交叉编码器模块被配置为, 计算输入的语句 在所述交叉编码器各层的多头注意力权 重; 双编码器模块, 其包含双编码器和交互单元, 所述双编码器含有两个子编码器, 所述双 编码器被配置为, 计算输入的语句在所述两个子编码器中各层的表示向量, 所述交互单元 对所述两个子编码器中对应各层的表示向量分别进行 交互计算, 得到所述两个子编 码器各 层的交互注意力权 重; 以及权 利 要 求 书 1/2 页 2 CN 114579704 A 2最小化模块, 其被配置为, 最小化所述交叉编码器各层多头注意力权重与所述双编码 器对应各层交 互注意力权 重的误差, 以得到与所述输入语句匹配的语义。 7.根据权利要求6所述的用于进行语义匹配的装置, 其特征在于, 所述交互单元通过下 式对所述双编码器所含两个子编码器各层的交 互注意力权 重进行交 互计算: 其中, 表示所述双编码器所含两个子编码器第i层的交互注意力权重, 表示所述 双编码器中第一子编码器中第i层的表示向量, 表示所述双编码器模块中第二子编码器 中第i层的表示向量。 8.根据权利要求7所述的用于进行语义匹配的装置, 其特征在于, 所述交叉编码器各层 多头注意力权重与所述双编 码器对应各层交互注意力权重的误差为均方误差, 该均方误差 通过下式进行计算: 其中, Lattn表示所述交叉编码器第i层的多头注意力权重与所述双编码器第i层的交互 注意力权重的均方误差, n表示所述交叉编码器或所述双编码器的层数, 表示所述双编 码器所含两个子编码器第i层的交互注意力权重, 表示所述交叉编码器第i层的多头注 意力权重。 9.一种计算机设备, 包括: 处理器; 存储装置; 以及 存储在所述存 储装置上并可在所述处 理器上运行的计算机程序, 其特 征在于, 当所述处 理器执行所述计算机程序时, 实现如权利要求1 ‑5中任一项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时, 实现如权利要求1 ‑5中任一项所述方法的步骤。 11.一种计算机程序产品, 包括计算机指令, 其特征在于, 该计算机指令被处理器执行 时实现权利要求1 ‑5中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114579704 A 3
专利 一种语义匹配方法及其装置
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:47:30
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 40985-2021 数字版权保护 版权资源标识与描述.pdf
GB-T 43624-2023 湿地术语.pdf
GB-T 42807-2023 港口基础地理信息交换服务技术要求.pdf
T-SHPPA 025—2024 切向流过滤膜及膜包-装置生产质量管理指南.pdf
DB3418-T 022-2022 检验检测机构远程检测服务规范 宣城市.pdf
GB-T 33009.2-2016 工业自动化和控制系统网络安全 集散控制系统 DCS 第2部分:管理要求.pdf
GB-T 41997.3-2022 机械电气安全 基于视觉的电敏保护设备 第3部分:采用立体视觉保护器件特殊要求.pdf
GB-T 33770.2-2019信息技术服务外包第2部分数据保护要求.pdf
GB-T 9776-2022 建筑石膏.pdf
DB36-T 1099-2018 电子政务云平台安全规范 江西省.pdf
安全架构实践的公理 2020.pdf
GB-T 20491-2017 用于水泥和混凝土中的钢渣粉.pdf
T-CACM 1065—2018 中药DNA分子鉴定试剂盒 定性 评价技术要求.pdf
DB51-T 2799-2021 四川省高速公路景观及绿化设计指南 四川省.pdf
GB-T 30452-2013 光催化纳米材料光解指数测试方法.pdf
国测 智能网联汽车安全渗透白皮书 2020.pdf
T-CEC 675—2022 电化学储能电站安全规程.pdf
GB-T 29849-2013 光伏电池用硅材料表面金属杂质含量的电感耦合等离子体质谱测量方法.pdf
信通院 车联网白皮书 2023年.pdf
GB-T 38408-2019 皮革 材质鉴别 显微镜法.pdf
1
/
3
21
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。