专利一种融合语义解析的自然语言推断方法和装置 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210281854.6 (22)申请日 2022.03.22 (65)同一申请的已公布的文献号申请公布号 CN 114417887 A (43)申请公布日 2022.04.29 (73)专利权人南京云问网络技术有限公司地址 210000 江苏省南京市鼓楼区建宁路 65号2楼203室 (72)发明人杜振东　 (74)专利代理机构南京瑞华腾知识产权代理事务所(普通合伙) 32368 专利代理师胡海 (51)Int.Cl. G06F 40/30(2020.01) G06K 9/62(2022.01)审查员谢萍 (54)发明名称一种融合语义解析的自然语言推断方法和装置 (57)摘要本发明提出了一种融合语义解析的自然语言推断方法和装置，该方法包括如下步骤：获取前提T及其对应假设Q；分别对所述前提T和假设Q 进行语义解析，获得多个特征；对所述多个特征进行统一化和特征融合，获得融合特征input_i；将所述融合特征input_i输入JudgeNLIModel模型中，输出对应假设的答案。本发明结合自然语言理解，抽取前提和假设中的特定特征，从而帮助推断前提和假设之间的关系，提高了自然语言推断的正确率，也为之后的自然语言推断方法提供了改进的参考方向。权利要求书2页说明书7页附图5页 CN 114417887 B 2022.06.24 CN 114417887 B 1.一种融合语义解析的自然语言推断方法，其特征在于，包括如下步骤：获取前提T及其对应假设Q；分别对所述前提T和假设Q进行语义解析，获得多个特征；对所述多个特征进行统一化和特征融合，获得融合特征input_i；将所述融合特征input_i输入JudgeN LIModel模型中，输出对应假设的答案；其中，对所述多个特征进行特征融合，获得融合特征input_i，具体为：设前提T进行语义解析获得多个特征t1、 t2 …tn，假设Q进行语义解析获得多个特征q1、 q2 …qn，进行序列化表示后，融合特征input_i为[CLS] T [SEP] [nlu_t] t1 [SEP] [nlu_t] t2 [SEP] … [nlu_t] tn [SEP] Q [SEP] [nlu _q] q1 [SEP] [nlu_q] q2 [SEP] …[nlu_q] qn [SEP]，其中，每个特征均包括起始值num_begin、起始值闭合情况num_begin_interval、结束值 num_end、结束值闭合情况num_end_i nterval、单位特征unit，缺少的内容，用N one代替。 2.根据权利要求1所述的融合语义解析的自然语言推断方法，其特征在于，分别对所述前提T和假设Q进行语义解析,具体为：利用正则表达式规则分别对前提T和假设Q中的字符和单位进行识别，获得多个特征。 3.根据权利要求1所述的融合语义解析的自然语言推断方法，其特征在于，所述统一化为将前提T和假设Q中的单位进行统一。 4.根据权利要求1所述的融合语义解析的自然语言推断方法，其特征在于，所述 JudgeNLIModel模型的构建包括如下步骤：解析文档，采集获得多对前提T和假设Q，生成数据集D；按照预设比例，将所述数据集D划分为训练集、测试集和验证集；分别提取所述训练集、测试集和验证集中前提T和假设Q的特征，获得训练集特征、测试集特征和验证集特征；将所述训练集特征进行统一化和特征融合后，输入初始模型中进行训练；设置初始模型的epoch轮次，每间隔epoch轮次输出一次模型，并保存为 JudgeNLIModels模型；将所述验证集特征输入 JudgeNLIModels模型中，采用f1指标对所有 JudgeNLIModels模型进行评价，选择其中效果最好的模型，即为JudgeN LIModel模型；利用所述测试集特征对JudgeNLIModel模型进行测试，获得所述JudgeNLIModel模型的效果。 5.根据权利要求4所述的融合语义解析的自然语言推断方法，其特征在于，所述f1指标的计算公式如下：其中， P为准确率， R为召回率。权　利　要　求　书 1/2 页 2 CN 114417887 B 26.根据权利要求4所述的融合语义解析的自然语言推断方法，其特征在于，所述初始模型为BERT模型，其包括输入层、嵌入层、双向层和输出层，所述嵌入层为由词嵌入、段嵌入和位置嵌入求和获得；在所述位置嵌入中，所述前提T和假设Q中特征的位置编码与其数值的位置保持一致。 7.一种融合语义解析的自然语言推断装置，其特征在于，包括：获取模块，用于获取前提T及其对应假设Q；解析模块，用于分别对所述前提T和假设Q进行语义解析，获得多个特征；融合模块，用于对所述多个特征进行统一化和特征融合，获得融合特征input_i；输入输出模块，用于将所述融合特征input_i输入JudgeNLIModel模型中，输出对应假设的答案；其中，对所述多个特征进行特征融合，获得融合特征input_i，具体为：设前提T进行语义解析获得多个特征t1、 t2 …tn，假设Q进行语义解析获得多个特征q1、 q2 …qn，进行序列化表示后，融合特征input_i为[CLS] T [SEP] [nlu_t] t1 [SEP] [nlu_t] t2 [SEP] … [nlu_t] tn [SEP] Q [SEP] [nlu _q] q1 [SEP] [nlu_q] q2 [SEP] …[nlu_q] qn [SEP]，其中，每个特征均包括起始值num_begin、起始值闭合情况num_begin_interval、结束值 num_end、结束值闭合情况num_end_i nterval、单位特征unit，缺少的内容，用N one代替。 8.根据权利要求7所述的融合语义解析的自然语言推断装置，其特征在于，还包括模型构建模块，所述模型构建模块包括：数据集生成单元，用于解析文档，采集获得多对前提T和假设Q，生成数据集D；数据集划分单元，用于按照预设比例，将所述数据集D划分为训练集、测试集和验证集；特征提取单元，用于分别提取所述训练集、测试集和验证集中前提T和假设Q的特征，获得训练集特征、测试集特征和验证集特征；模型训练单元，用于将所述训练集特征进行统一化和特征融合后，输入初始模型中进行训练；模型输出单元，用于设置初始模型的epoch轮次，每间隔epoch轮次输出一次模型，并保存为JudgeN LIModels模型；模型选择单元，用于将所述验证集特征输入JudgeNLIModels模型中，采用f1指标对所有JudgeN LIModels模型进行评价，选择其中效果最好的模型，即为JudgeN LIModel模型；模型测试单元，用于利用所述测试集特征对JudgeNLIModel模型进行测试，获得所述 JudgeNLIModel模型的效果。权　利　要　求　书 2/2 页 3 CN 114417887 B 3

专利 一种融合语义解析的自然语言推断方法和装置

专利一种融合语义解析的自然语言推断方法和装置