(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210384575.2 (22)申请日 2022.04.13 (71)申请人 天津大学 地址 300072 天津市南 开区卫津路9 2号 申请人 起硕 (天津) 智能科技有限公司 (72)发明人 申奥运 张鹏 吴斌 张烁 张伟  严文龙  (74)专利代理 机构 天津市北洋 有限责任专利代 理事务所 12 201 专利代理师 韩帅 (51)Int.Cl. G06F 40/211(2020.01) G06F 40/253(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于增强方式融合语法信息的深度学习文 本匹配方法 (57)摘要 本发明公开了基于增强方式融合语法信息 的深度学习文本匹配方法, 所述文本匹配方法建 立在编码层、 匹配融合层和池化预测层; 所述编 码层用于在句对编码表示时, 对句子做依存句法 分析, 构造依存句法树, 利用 深度神经网络提取 出句子的依存句法信息和语义信息,将两者相加 融合; 所述匹配融合层用于在相似度计算时, 计 算句对之间编码特征的欧式距离, 将内积交互矩 阵与欧式距离矩阵两者对应位置相减, 利用欧式 距离增强内积交互过程; 所述池化预测层用于加 权的池化方式与最大池化方式相拼接组合的池 化模块进行信息的池化特征提取, 本发明在SNLI 和Quora数据集上 都验证了对句对精确匹配的能 力。 权利要求书2页 说明书8页 附图1页 CN 115034202 A 2022.09.09 CN 115034202 A 1.基于增强方式融合语法信息的深度学习文本匹配方法, 所述文本匹配方法建立在编 码层、 匹配融合层和池化预测层; 其特 征在于: 所述编码层用于在句对编码表示 时, 对句子做依存句法分析, 构造依存句法树, 利用深 度神经网络提取 出句子的依存句法信息和语义信息,将两者相加融合; 所述匹配融合层用于在相似度计算时, 计算句对之间编码特征的欧式距离, 将内积交 互矩阵与欧式距离矩阵两者对应位置相减, 利用欧式距离增强内积交 互过程; 所述池化预测层用于加权的池化方式与最大池化方式相拼接组合的池化模块进行信 息的池化特 征提取。 2.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法, 其特 征在于: 所述编码层将对句对的编码表示进行语法信息的增强过程: 对预训练词向量嵌入; 应用BiLSTM抽取句子的上 下文语义表示信息, 如下式所示: 对句对进行依存句 法树构建, 应用TreeLSTM提取出句子的依存句 法信息, 将句子的依 存句法信息与语义信息进行融合, 如下式所示: 其中: 和 分别是pi(qj)左子树和右子树的隐藏层单元的输出, 之后句子的表示将会被转换 和为 3.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法, 其特 征在于: 所述匹配融合层对文本之间的相似度计算时做语法信息的增强过程: 对编码信息计算向量内积式交 互矩阵和欧式距离交 互矩阵; 将两者对应位置相减获得增强后的交 互矩阵, 再做句对之间的相互表示; 将向表示信息与原 始编码信息进行融合; 将融合后的特 征使用Bi lSTM进行聚合。 4.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法, 其特 征在于: 所述池化预测层对语法信息增强过程: 通过下式对语义特 征权重归一化处理获得池化特 征; 权 利 要 求 书 1/2 页 2 CN 115034202 A 2通过下式对池化特征信息进行拼接获得最大池化特 征; 对所有的池化特 征进行拼接获得最终的池化特 征V; 权 利 要 求 书 2/2 页 3 CN 115034202 A 3

.PDF文档 专利 基于增强方式融合语法信息的深度学习文本匹配方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于增强方式融合语法信息的深度学习文本匹配方法 第 1 页 专利 基于增强方式融合语法信息的深度学习文本匹配方法 第 2 页 专利 基于增强方式融合语法信息的深度学习文本匹配方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:49:08上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。