(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210281854.6 (22)申请日 2022.03.22 (65)同一申请的已公布的文献号 申请公布号 CN 114417887 A (43)申请公布日 2022.04.29 (73)专利权人 南京云问网络技 术有限公司 地址 210000 江苏省南京市 鼓楼区建宁路 65号2楼203室 (72)发明人 杜振东  (74)专利代理 机构 南京瑞华腾知识产权代理事 务所(普通 合伙) 32368 专利代理师 胡海 (51)Int.Cl. G06F 40/30(2020.01) G06K 9/62(2022.01)审查员 谢萍 (54)发明名称 一种融合语义解析的自然语言推断方法和 装置 (57)摘要 本发明提出了一种融合语义解析的自然语 言推断方法和装置, 该方法包括如下步骤: 获取 前提T及其对应假 设Q; 分别对所述前提T和假 设Q 进行语义解析, 获得多个特征; 对所述多个特征 进行统一化和特征融合, 获得融合特征input_i; 将所述融合特征input_i输入JudgeNLIModel模 型中, 输出对应假设的答案。 本发明结合自然语 言理解, 抽取前提和假设中的特定特征, 从而帮 助推断前提和假设之间的关系, 提高了自然语言 推断的正确率, 也为之后的自然语 言推断方法提 供了改进的参 考方向。 权利要求书2页 说明书7页 附图5页 CN 114417887 B 2022.06.24 CN 114417887 B 1.一种融合语义 解析的自然语言推断方法, 其特 征在于, 包括如下步骤: 获取前提T及其对应假设Q; 分别对所述前提T和假设Q进行语义 解析, 获得多个特 征; 对所述多个特 征进行统一 化和特征融合, 获得融合特 征input_i; 将所述融合特 征input_i输入JudgeN LIModel模型中, 输出对应假设的答案; 其中, 对所述多个特征进行特征融合, 获得融合特征input_i, 具体为: 设前提T进行语 义解析获得多个特征t1、 t2 …tn, 假设Q进行语义解析获得多个特征q1、 q2 …qn, 进行序列化 表示后, 融合特征input_i为[CLS] T [SEP] [nlu_t] t1 [SEP] [nlu_t] t2 [SEP] … [nlu_t] tn [SEP] Q [SEP] [nlu _q] q1 [SEP] [nlu_q] q2 [SEP] …[nlu_q] qn [SEP], 其中, 每个特征均包括起始值num_begin、 起始值闭合情况num_begin_interval、 结束值 num_end、 结束值闭合情况num_end_i nterval、 单位特 征unit, 缺少的内容, 用N one代替。 2.根据权利要求1所述的融合语义解析的自然语言推断方法, 其特征在于, 分别对所述 前提T和假设Q进行语义解析,具体为: 利用正则表达式规则分别对前提T和假设Q中的字符 和单位进行识别, 获得多个特 征。 3.根据权利要求1所述的融合语义解析的自然语言推断方法, 其特征在于, 所述统一化 为将前提T和假设Q中的单位进行统一。 4.根据权利要求1所述的融合语义解析的自然语言推断方法, 其特征在于, 所述 JudgeNLIModel模型的构建包括如下步骤: 解析文档, 采集获得多对前提T和假设Q, 生成数据集D; 按照预设比例, 将所述数据集D划分为训练集、 测试集和验证集; 分别提取所述训练集、 测试集和验证集中前提T和假设Q的特征, 获得训练集特征、 测试 集特征和验证集特 征; 将所述训练集特 征进行统一 化和特征融合后, 输入初始模型中进行训练; 设置初始模型的epoch轮次 , 每间隔epoch轮次输出一次模型 , 并保存为 JudgeNLIModels模型; 将所述验证集特征输入 JudgeNLIModels模型 中, 采用f1指 标对所有 JudgeNLIModels模 型进行评价, 选择其中效果 最好的模型, 即为JudgeN LIModel模型; 利用所述测试集特征对JudgeNLIModel模型进行测试, 获得所述JudgeNLIModel模型的 效果。 5.根据权利要求4所述的融合语义解析的自然语言推断方法, 其特征在于, 所述f1指标 的计算公式如下: 其中, P为 准确率, R为召回率。权 利 要 求 书 1/2 页 2 CN 114417887 B 26.根据权利要求4所述的融合语义解析的自然语言推断方法, 其特征在于, 所述初始模 型为BERT模 型, 其包括输入层、 嵌入层、 双向层和输出层, 所述 嵌入层为由词嵌入、 段嵌入和 位置嵌入求和获得; 在所述位置嵌入中, 所述前提T和假设Q中特 征的位置编码与其数值的位置保持一 致。 7.一种融合语义 解析的自然语言推断装置, 其特 征在于, 包括: 获取模块, 用于获取 前提T及其对应假设Q; 解析模块, 用于分别对所述前提T和假设Q进行语义 解析, 获得多个特 征; 融合模块, 用于对所述多个特 征进行统一 化和特征融合, 获得融合特 征input_i; 输入输出模块, 用于将所述融合特征input_i输入JudgeNLIModel模型中, 输出对应假 设的答案; 其中, 对所述多个特征进行特征融合, 获得融合特征input_i, 具体为: 设前提T进行语 义解析获得多个特征t1、 t2 …tn, 假设Q进行语义解析获得多个特征q1、 q2 …qn, 进行序列化 表示后, 融合特征input_i为[CLS] T [SEP] [nlu_t] t1 [SEP] [nlu_t] t2 [SEP] … [nlu_t] tn [SEP] Q [SEP] [nlu _q] q1 [SEP] [nlu_q] q2 [SEP] …[nlu_q] qn [SEP], 其中, 每个特征均包括起始值num_begin、 起始值闭合情况num_begin_interval、 结束值 num_end、 结束值闭合情况num_end_i nterval、 单位特 征unit, 缺少的内容, 用N one代替。 8.根据权利要求7所述的融合语义解析的自然语言推断装置, 其特征在于, 还包括模型 构建模块, 所述模型构建模块包括: 数据集生成单元, 用于解析文档, 采集获得多对前提T和假设Q, 生成数据集D; 数据集划分单 元, 用于按照预设比例, 将所述数据集D划分为训练集、 测试集和验证集; 特征提取单元, 用于分别提取所述训练集、 测试集和验证集中前提T和假设Q的特征, 获 得训练集特 征、 测试集特 征和验证集特 征; 模型训练单元, 用于将所述训练集特征进行统一化和特征融合后, 输入初始模型中进 行训练; 模型输出单元, 用于设置初始模型的epoch轮次, 每 间隔epoch轮次输出一次模型, 并保 存为JudgeN LIModels模型; 模型选择单元, 用于将所述验证集特征输入JudgeNLIModels模型中, 采用f1指标对所 有JudgeN LIModels模型进行评价, 选择其中效果 最好的模型, 即为JudgeN LIModel模型; 模型测试单元, 用 于利用所述测试集特征对JudgeNLIModel模型进行测试, 获得所述 JudgeNLIModel模型的效果。权 利 要 求 书 2/2 页 3 CN 114417887 B 3

.PDF文档 专利 一种融合语义解析的自然语言推断方法和装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合语义解析的自然语言推断方法和装置 第 1 页 专利 一种融合语义解析的自然语言推断方法和装置 第 2 页 专利 一种融合语义解析的自然语言推断方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:47:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。