(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210267524.1
(22)申请日 2022.03.18
(71)申请人 中南大学
地址 410083 湖南省长 沙市岳麓区麓山 南
路932号
(72)发明人 龙军 刘磊 李浩然 向一平
(74)专利代理 机构 长沙市融智专利事务所(普
通合伙) 43114
专利代理师 胡喜舟
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/211(2020.01)
G06F 40/253(2020.01)
G06F 16/35(2019.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于实体语义融合的关系抽取方法
(57)摘要
本发明公开了一种基于实体语义融合的关
系抽取方法, 包括: 获取待抽取关系的目标语句;
构建目标语句的预置向量; 构建目标语句的句法
依存树, 并建立句法依存树的邻接矩阵; 其中, 句
法依存树以实体节点作为全局节 点, 并增设全局
节点到其他节点的连接以及所有节点到自身的
连接; 将预置向量及邻接矩阵输入GCN神经网络
进行语义提取, 得到第一特征向量; 将第一特征
向量输入PCNN 分段卷积神经网络进行特征提取,
得到第二特征向量; 将第二特征向量输入
Softmax分类器进行关系类别预测, 实现实体关
系抽取。 解决了现有技术中实体关系抽取效果不
佳的问题。
权利要求书2页 说明书6页 附图2页
CN 114444515 A
2022.05.06
CN 114444515 A
1.一种基于实体 语义融合的关系抽取 方法, 其特 征在于, 包括:
获取待抽取关系的目标语句;
构建目标语句的预置向量, 该预置向量包含目标语句中每个单词、 单词的词性及实体
标签;
构建目标语句的句法依存树, 并建立句法依存树的邻接矩阵; 其中, 句法依存树以实体
节点作为全局节点, 并增设全局节点到其 他节点的连接以及所有节点到自身的连接;
将预置向量及邻接矩阵输入GCN神经网络进行语义 提取, 得到第一特 征向量;
将第一特 征向量输入PCN N分段卷积神经网络进行 特征提取, 得到第二特 征向量;
将第二特 征向量输入Softmax分类 器进行关系类别预测, 实现实体关系抽取。
2.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述构建目
标语句的预置向量具体包括:
采用词嵌入 模型将目标语句中的单词映射到维度为dw的向量空间;
采用句法分析工具对目标语句 构造词性标注及实体标签, 并将词性及实体标签分别映
射到维度为ds的向量空间;
将目标语句的每个单词、 词性及实体标签进行拼接, 得到目标语句的预置向量S={X1,
X2,X3,......,Xm}, 其中
m为目标语句长度,
表示第i个单词,
表示第i个单词的词性,
表示第i个单词的实体标签。
3.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述构建目
标语句的句法依存树, 并建立句法依存树的邻接矩阵, 具体包括:
针对目标语句, 使用句法分析工具构建以实体节点作为全局节点的语法依存树;
构建全局节点到其 他节点的 的连接, 建立第一邻接矩阵;
增设每个节点到自身的连接, 建立单位矩阵;
将第一邻接矩阵与单位矩阵相加, 得到最终的邻接矩阵。
4.根据权利要求2所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述GCN神
经网络的公式表示如下:
其中,
表示第l层第i个节点的隐藏层表示; ρ表示ReLU激活函数;
表示邻接矩阵,
表示i节点和j节点的连接关系, 其值为i节点到j节点的距离; di表示节点i的出度; b(l)表
示偏移量; αi表示权重系数;
GCN神经网络的最后一层的每 个节点的隐藏层表示构成第一特 征向量。
5.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述将第 一
特征向量输入PCN N分段卷积神经网络进行 特征提取, 得到第二特 征向量, 具体包括:
采用多个滤波器及权 重矩阵对第一特 征向量进行 卷积运算;
将每个卷积运算后得到的特征向量分割为三段, 分割时以实体头和实体尾为边界分
割; 将每一段进行最大池化处 理, 得到池化向量;权 利 要 求 书 1/2 页
2
CN 114444515 A
2拼接所有池化向量, 采用非线性方程tanh作为隐藏层激活函数,分片计算最大池化输
出, 得到第二特 征向量。
6.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述将第 二
特征向量输入Softmax分类 器进行关系类别预测, 实现实体关系抽取, 具体包括:
将第二特 征向量输入到Softmax分类 器, Softmax分类 器公式表示如下:
f(z|g)=softmax(Wsg+bs)
其中, z表示需要计算的关系类别, g表示第二特征向量, Ws和bs分别为权重参数和偏置
参数;
计算出每个关系类别的所占概率, 从高到低 排序获取最高概率的关系类别作为关系抽
取的结果, 实现实体关系抽取。
7.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 进行关系抽
取之前, 还包括: 构建训练样 本集, 并基于训练样 本集对GCN神经网络、 PCNN分段卷积神经网
络及Softmax分类 器进行训练。
8.根据权利要求7所述的基于实体语义融合的关系抽取方法, 其特征在于, 训练过程
中, Softmax分类 器的损失函数采用交叉熵函数。权 利 要 求 书 2/2 页
3
CN 114444515 A
3
专利 一种基于实体语义融合的关系抽取方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:45:17上传分享