专利一种多粒度知识增强的语义匹配方法 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210390694.9 (22)申请日 2022.04.14 (71)申请人西安邮电大学地址 710121 陕西省西安市长安区西长安街618号 (72)发明人曹小鹏　王凯丽　杨笑　 (51)Int.Cl. G06N 3/04(2006.01) G06F 40/30(2020.01) G06F 40/242(2020.01) G06F 40/216(2020.01) G06F 40/151(2020.01) G06F 40/126(2020.01) G06F 17/10(2006.01) (54)发明名称一种多粒度知识增强的语义匹配方法 (57)摘要本发明提出一种多粒度知识增强的语义匹配方法，解决文本匹配一词多义、分词不当的问题，本发明的技术方案主要包括以下步骤： (1)构建嵌入模型(2)捕获匹配特征(3)计算文本相似度。该方法主要应用于文本语义匹配任务中。权利要求书1页说明书5页附图1页 CN 114723013 A 2022.07.08 CN 114723013 A 1.一种多粒度知识增强的语义匹配方法，其特征在于： (1)构建嵌入模型：从字符粒度和词粒度对文本进行嵌入，使用Lattice LSTM融合字符和单词级别的信息，引入HowNet外部知识库，获取输入句子中所有隐含的单词信息，解决一词多义的问题。 (2)捕获匹配特征：从字符粒度和词粒度对两个句子进行编码，利用注意力机制捕获文本在字符和词两个粒度的隐藏信息。最终根据池化提取文本特征，并输入预测层判断两个句子是否相似。权　利　要　求　书 1/1 页 2 CN 114723013 A 2一种多粒度知识增强的语义匹配方法技术领域 [0001]本发明属于计算机自然语言处理领域，具体涉及一种采用多粒度知识增强模式进行语义匹配的方法。背景技术 [0002]文本语义匹配作为自然语言处理领域的一项基本问题和研究热点，广泛适用于现实生活中的各个方面。比如做对话问答任务时，对上下文之间的语义进行匹配，或者比较问题与候选答案之间的语义是否匹配，从而选出正确答案；做阅读理解任务时，可以将文本与问题进行匹配选出答案，因此文本匹配技术在自然语言处理中占据着比较重要的角色。 [0003]传统的短文本匹配主要从词汇层面对句子做匹配，一般从词、句式等方面进行考虑，词和词之间是独立的，缺少词语的上下文语境，这极大地忽略了词本身的语义信息。汉语中大量的词语是多义词，这为语义理解带来了很大的困难。现有的交互模型仅使用单一的词向量进行交互，不能有效地利用句子之间的上下文信息，导致文本隐含的语义特征不能被完全挖掘。 [0004]2013年， Huang等人提出了一种深度语义结构化模型，这是深度学习应用于文本匹配的最早作品之一。通过使用MLP将单词或句子映射到特征向量，使用两个深度前馈神经网络将查询文档投影到潜在空间等长的低维向量中，并通过余弦相似度来衡量相关性。该模型既可以减少切词依赖，又可以提高模型的范化能力。 [0005]2015年，华为诺亚方舟实验室，采用CNN模型解决语义匹配问题，提出了两种网络架构，分别为ARC ‑I和ARC‑II，其中ARC ‑II在第一层卷积后把两个文本进行融合。 Wang和 Jiang提出了匹配文本序列的比较聚合模型，执行单词级别的匹配，使用卷积神经网络进行聚合。随后， Wang等人提出BiMP M模型，从多个角度进行文本匹配，在释义识别和自然语言推理任务上均有良好的效果。 [0006]2016年， Pang等人提出MatchPyramid模型，该模型聚焦于单词之间的关系，对句子中的词进行点乘、余弦相似度等计算来获取匹配矩阵，随后对矩阵进行二维卷积来提取特征。 MatchPyramid在文本匹配上具有良好的效果，但缺乏词与词形成词组后的匹配信息。长短时记忆神经网络LSTM提取长序列文本的特征信息，获得文本的全局信息，解决了CNN不能提取全局特征的缺陷。 Chen等人提出了ESIM模型，该模型是LSTM的加强版，考虑了局部推断和全局推断，用句子间的注意力机制，实现局部的推断，进一步实现全局的推断。 [0007]2018年， Google提出了BERT模型， BERT模型利用MLM和NSP进行预训练，并且采用深层的双向Transformer组件，最终生成融合上下文信息的深层双向语言表征。 BERT在NLP领域的任务中取得了良好的效果，但模型庞大，网络参数多，进行预训练或微调时速度较慢。发明内容 [0008]本发明提出一种多粒度知识增强的语义匹配方法，本发明的技术方案主要包括以下步骤： 1.构建嵌入模型：从字符粒度和词粒度对文本进行嵌入，使用Lattice LSTM融合字说　明　书 1/5 页 3 CN 114723013 A 3

专利 一种多粒度知识增强的语义匹配方法

专利一种多粒度知识增强的语义匹配方法