(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210281854.6
(22)申请日 2022.03.22
(65)同一申请的已公布的文献号
申请公布号 CN 114417887 A
(43)申请公布日 2022.04.29
(73)专利权人 南京云问网络技 术有限公司
地址 210000 江苏省南京市 鼓楼区建宁路
65号2楼203室
(72)发明人 杜振东
(74)专利代理 机构 南京瑞华腾知识产权代理事
务所(普通 合伙) 32368
专利代理师 胡海
(51)Int.Cl.
G06F 40/30(2020.01)
G06K 9/62(2022.01)审查员 谢萍
(54)发明名称
一种融合语义解析的自然语言推断方法和
装置
(57)摘要
本发明提出了一种融合语义解析的自然语
言推断方法和装置, 该方法包括如下步骤: 获取
前提T及其对应假 设Q; 分别对所述前提T和假 设Q
进行语义解析, 获得多个特征; 对所述多个特征
进行统一化和特征融合, 获得融合特征input_i;
将所述融合特征input_i输入JudgeNLIModel模
型中, 输出对应假设的答案。 本发明结合自然语
言理解, 抽取前提和假设中的特定特征, 从而帮
助推断前提和假设之间的关系, 提高了自然语言
推断的正确率, 也为之后的自然语 言推断方法提
供了改进的参 考方向。
权利要求书2页 说明书7页 附图5页
CN 114417887 B
2022.06.24
CN 114417887 B
1.一种融合语义 解析的自然语言推断方法, 其特 征在于, 包括如下步骤:
获取前提T及其对应假设Q;
分别对所述前提T和假设Q进行语义 解析, 获得多个特 征;
对所述多个特 征进行统一 化和特征融合, 获得融合特 征input_i;
将所述融合特 征input_i输入JudgeN LIModel模型中, 输出对应假设的答案;
其中, 对所述多个特征进行特征融合, 获得融合特征input_i, 具体为: 设前提T进行语
义解析获得多个特征t1、 t2 …tn, 假设Q进行语义解析获得多个特征q1、 q2 …qn, 进行序列化
表示后, 融合特征input_i为[CLS] T [SEP] [nlu_t] t1 [SEP] [nlu_t] t2 [SEP] …
[nlu_t] tn [SEP] Q [SEP] [nlu _q] q1 [SEP] [nlu_q] q2 [SEP] …[nlu_q] qn [SEP],
其中, 每个特征均包括起始值num_begin、 起始值闭合情况num_begin_interval、 结束值
num_end、 结束值闭合情况num_end_i nterval、 单位特 征unit, 缺少的内容, 用N one代替。
2.根据权利要求1所述的融合语义解析的自然语言推断方法, 其特征在于, 分别对所述
前提T和假设Q进行语义解析,具体为: 利用正则表达式规则分别对前提T和假设Q中的字符
和单位进行识别, 获得多个特 征。
3.根据权利要求1所述的融合语义解析的自然语言推断方法, 其特征在于, 所述统一化
为将前提T和假设Q中的单位进行统一。
4.根据权利要求1所述的融合语义解析的自然语言推断方法, 其特征在于, 所述
JudgeNLIModel模型的构建包括如下步骤:
解析文档, 采集获得多对前提T和假设Q, 生成数据集D;
按照预设比例, 将所述数据集D划分为训练集、 测试集和验证集;
分别提取所述训练集、 测试集和验证集中前提T和假设Q的特征, 获得训练集特征、 测试
集特征和验证集特 征;
将所述训练集特 征进行统一 化和特征融合后, 输入初始模型中进行训练;
设置初始模型的epoch轮次 , 每间隔epoch轮次输出一次模型 , 并保存为
JudgeNLIModels模型;
将所述验证集特征输入 JudgeNLIModels模型 中, 采用f1指 标对所有 JudgeNLIModels模
型进行评价, 选择其中效果 最好的模型, 即为JudgeN LIModel模型;
利用所述测试集特征对JudgeNLIModel模型进行测试, 获得所述JudgeNLIModel模型的
效果。
5.根据权利要求4所述的融合语义解析的自然语言推断方法, 其特征在于, 所述f1指标
的计算公式如下:
其中, P为 准确率, R为召回率。权 利 要 求 书 1/2 页
2
CN 114417887 B
26.根据权利要求4所述的融合语义解析的自然语言推断方法, 其特征在于, 所述初始模
型为BERT模 型, 其包括输入层、 嵌入层、 双向层和输出层, 所述 嵌入层为由词嵌入、 段嵌入和
位置嵌入求和获得;
在所述位置嵌入中, 所述前提T和假设Q中特 征的位置编码与其数值的位置保持一 致。
7.一种融合语义 解析的自然语言推断装置, 其特 征在于, 包括:
获取模块, 用于获取 前提T及其对应假设Q;
解析模块, 用于分别对所述前提T和假设Q进行语义 解析, 获得多个特 征;
融合模块, 用于对所述多个特 征进行统一 化和特征融合, 获得融合特 征input_i;
输入输出模块, 用于将所述融合特征input_i输入JudgeNLIModel模型中, 输出对应假
设的答案;
其中, 对所述多个特征进行特征融合, 获得融合特征input_i, 具体为: 设前提T进行语
义解析获得多个特征t1、 t2 …tn, 假设Q进行语义解析获得多个特征q1、 q2 …qn, 进行序列化
表示后, 融合特征input_i为[CLS] T [SEP] [nlu_t] t1 [SEP] [nlu_t] t2 [SEP] …
[nlu_t] tn [SEP] Q [SEP] [nlu _q] q1 [SEP] [nlu_q] q2 [SEP] …[nlu_q] qn [SEP],
其中, 每个特征均包括起始值num_begin、 起始值闭合情况num_begin_interval、 结束值
num_end、 结束值闭合情况num_end_i nterval、 单位特 征unit, 缺少的内容, 用N one代替。
8.根据权利要求7所述的融合语义解析的自然语言推断装置, 其特征在于, 还包括模型
构建模块, 所述模型构建模块包括:
数据集生成单元, 用于解析文档, 采集获得多对前提T和假设Q, 生成数据集D;
数据集划分单 元, 用于按照预设比例, 将所述数据集D划分为训练集、 测试集和验证集;
特征提取单元, 用于分别提取所述训练集、 测试集和验证集中前提T和假设Q的特征, 获
得训练集特 征、 测试集特 征和验证集特 征;
模型训练单元, 用于将所述训练集特征进行统一化和特征融合后, 输入初始模型中进
行训练;
模型输出单元, 用于设置初始模型的epoch轮次, 每 间隔epoch轮次输出一次模型, 并保
存为JudgeN LIModels模型;
模型选择单元, 用于将所述验证集特征输入JudgeNLIModels模型中, 采用f1指标对所
有JudgeN LIModels模型进行评价, 选择其中效果 最好的模型, 即为JudgeN LIModel模型;
模型测试单元, 用 于利用所述测试集特征对JudgeNLIModel模型进行测试, 获得所述
JudgeNLIModel模型的效果。权 利 要 求 书 2/2 页
3
CN 114417887 B
3
专利 一种融合语义解析的自然语言推断方法和装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:47:25上传分享