(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210361778.X (22)申请日 2022.04.07 (71)申请人 中国人民解 放军国防科技大 学 地址 410073 湖南省长 沙市开福区德雅路 109号 (72)发明人 罗雪山 欧丽珍 陈洪辉 蔡飞  王思远 胡涛 陈佩佩 李新梦  陈翀昊  (74)专利代理 机构 长沙国科天河知识产权代理 有限公司 432 25 专利代理师 唐品利 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/242(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 缩略语消歧方法、 装置、 计算机设备和存储 介质 (57)摘要 本申请涉及一种缩略语消歧方法、 装置、 计 算机设备和存储介质。 所述方法包括: 从待消歧 文本信息中获取缩略语、 包含缩略语的原始句 子, 并根据缩略语在词典中确定缩略语的多个候 选释义; 根据候选释义与原始句子, 得到释义组 合; 根据将原始句子中的缩略语替换为候选释义 形成的新句子与原始句子, 得到句子组合; 将释 义组合和句子组合分别输入到训练好的孪生神 经网络模型中, 得到单词维度的打分和句子维度 的打分; 根据单词维度的打分和句子维度的打 分, 得到模型的预测结果。 本方法能够评估任意 长度的缩略语候选释义个数, 具有较好的鲁棒 性, 并可提高缩略语消歧的准确性。 权利要求书2页 说明书10页 附图4页 CN 114925698 A 2022.08.19 CN 114925698 A 1.一种缩略语消歧方法, 其特 征在于, 所述方法包括: 从待消歧文本信息中获取缩略语、 包含缩略语的原始句子, 并根据所述缩略语在词典 中确定缩略语的多个候选释义; 根据所述候选释义与所述原始句子, 得到释义组合; 根据将所述原始句子中的缩略语 替换为所述 候选释义形成的新句子与原 始句子, 得到句子组合; 将所述释义组合和所述句子组合分别输入到训练好的孪生神经网络模型中, 分别对释 义组合和句子组合中句子对的编码进行打 分, 得到单词维度的打 分和句子维度的打 分; 根据所述单词维度的打 分和所述句子维度的打 分, 得到模型的预测结果。 2.根据权利要求1所述的方法, 其特征在于, 将所述释义组合和所述句子组合分别输入 到训练好的孪生神经网络模型中, 分别对释义组合和句 子组合中句 子对的编码进行打分, 得到单词维度的打 分和句子维度的打 分, 包括: 将所述释义组合中的每一个句子对输入到训练好的孪生神经网络模型中, 利用向量相 似度评估方法对各句子对的编码进行打 分, 得到单词维度的打 分; 将所述句子组合中的每一个句子对输入到训练好的孪生神经网络模型中, 利用向量相 似度评估方法对各句子对的编码进行打 分, 得到句子维度的打 分。 3.根据权利要求1所述的方法, 其特征在于, 将所述释义组合和所述句子组合分别输入 到训练好的孪生神经网络模型中, 分别对释义组合和句 子组合中句 子对的编码进行打分, 得到单词维度的打 分和句子维度的打 分, 包括: 将所述释义组合中的每一个句子对输入到训练好的孪生神经网络模型中, 通过将句子 对进行编 码, 并对编 码结果经过池化层进 行处理, 得到两个相同维度的句子向量; 将两个相 同维度的句子向量通过softmax分类器, 得到释义组合预测标签, 并将释义组合预测标签为 1的概率值作为对应候选释义的打 分, 得到单词维度的打 分; 将所述句子组合中的每一个句子对输入到训练好的孪生神经网络模型中, 得到句子维 度的打分。 4.根据权利要求1所述的方法, 其特征在于, 所述单词维度的打分为维度等于候选释义 数量的行向量; 所述句子维度的打 分为维度等于候选释义数量的行向量; 根据所述单词维度的打 分和所述句子维度的打 分, 得到模型的预测结果, 包括: 将所述单词维度的打分和所述句子维度的打分进行加权求和, 得到最后的得分向量, 并对所述最后的得分向量中的元素进 行排序, 并将排序后的最大值对应的候选释义作为模 型的预测结果。 5.根据权利要求1所述的方法, 其特征在于, 将所述释义组合和所述句子组合分别输入 到训练好的孪生神经网络模型中, 分别对释义组合和句 子组合中句 子对的编码进行打分, 得到单词维度的打分和句子维度的打分, 步骤中所述训练好的孪生神经网络模型为训练好 的BERT孪生神经网络模型。 6.一种缩略语消歧方法, 其特 征在于, 所述方法包括: 从待消歧文本信息中获取缩略语、 包含缩略语的原始句子, 并根据所述缩略语在词典 中确定缩略语的多个候选释义; 将所述原 始句子中的缩略语替换为所述 候选释义形成的新句子; 根据所述 新句子与所述原 始句子构成的句子对, 得到新的句子集;权 利 要 求 书 1/2 页 2 CN 114925698 A 2将所述新的句子集输入到训练好的孪生神经网络模型中, 对所述新的句子集中句子对 的编码进行打 分, 得到新的句子集中所有句子对的打 分; 根据所有句子对的打分进行排序, 并将打分最高的句子对对应的候选释义作为模型预 测结果。 7.根据权利要求6所述的方法, 其特征在于, 将所述新的句子集输入到训练好的孪生神 经网络模型中, 对所述新的句 子集中句 子对的编码进行打分, 得到新的句 子集中所有句 子 对的打分, 步骤中所述训练好的孪生神经网络模型为训练好的BERT孪生神经网络 。 8.一种缩略语消歧装置, 其特 征在于, 所述装置包括: 确定候选释义模块, 用于从待消歧文本信 息中获取缩略语、 包含缩略语的原始句子, 并 根据所述缩略语在词典中确定缩略语的多个候选释义; 输入数据处理模块, 用于根据 所述候选释义与所述原始句子, 得到释义组合; 根据将所 述原始句子中的缩略语替换为所述 候选释义形成的新句子与原 始句子, 得到句子组合; 句子对的相似度评估模块, 用于将所述释义组合和所述句子组合分别 输入到训练好的 孪生神经网络模型中, 分别对释义组合和句 子组合中句 子对的编码进行打分, 得到单词维 度的打分和句子维度的打 分; 缩略语消歧模块, 用于根据所述单词维度的打分和所述句子维度的打分, 得到模型的 预测结果。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至 5中任一项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至 5中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114925698 A 3

.PDF文档 专利 缩略语消歧方法、装置、计算机设备和存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 缩略语消歧方法、装置、计算机设备和存储介质 第 1 页 专利 缩略语消歧方法、装置、计算机设备和存储介质 第 2 页 专利 缩略语消歧方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:52:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。