(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210267524.1 (22)申请日 2022.03.18 (71)申请人 中南大学 地址 410083 湖南省长 沙市岳麓区麓山 南 路932号 (72)发明人 龙军 刘磊 李浩然 向一平  (74)专利代理 机构 长沙市融智专利事务所(普 通合伙) 43114 专利代理师 胡喜舟 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/211(2020.01) G06F 40/253(2020.01) G06F 16/35(2019.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于实体语义融合的关系抽取方法 (57)摘要 本发明公开了一种基于实体语义融合的关 系抽取方法, 包括: 获取待抽取关系的目标语句; 构建目标语句的预置向量; 构建目标语句的句法 依存树, 并建立句法依存树的邻接矩阵; 其中, 句 法依存树以实体节点作为全局节 点, 并增设全局 节点到其他节点的连接以及所有节点到自身的 连接; 将预置向量及邻接矩阵输入GCN神经网络 进行语义提取, 得到第一特征向量; 将第一特征 向量输入PCNN 分段卷积神经网络进行特征提取, 得到第二特征向量; 将第二特征向量输入 Softmax分类器进行关系类别预测, 实现实体关 系抽取。 解决了现有技术中实体关系抽取效果不 佳的问题。 权利要求书2页 说明书6页 附图2页 CN 114444515 A 2022.05.06 CN 114444515 A 1.一种基于实体 语义融合的关系抽取 方法, 其特 征在于, 包括: 获取待抽取关系的目标语句; 构建目标语句的预置向量, 该预置向量包含目标语句中每个单词、 单词的词性及实体 标签; 构建目标语句的句法依存树, 并建立句法依存树的邻接矩阵; 其中, 句法依存树以实体 节点作为全局节点, 并增设全局节点到其 他节点的连接以及所有节点到自身的连接; 将预置向量及邻接矩阵输入GCN神经网络进行语义 提取, 得到第一特 征向量; 将第一特 征向量输入PCN N分段卷积神经网络进行 特征提取, 得到第二特 征向量; 将第二特 征向量输入Softmax分类 器进行关系类别预测, 实现实体关系抽取。 2.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述构建目 标语句的预置向量具体包括: 采用词嵌入 模型将目标语句中的单词映射到维度为dw的向量空间; 采用句法分析工具对目标语句 构造词性标注及实体标签, 并将词性及实体标签分别映 射到维度为ds的向量空间; 将目标语句的每个单词、 词性及实体标签进行拼接, 得到目标语句的预置向量S={X1, X2,X3,......,Xm}, 其中 m为目标语句长度, 表示第i个单词, 表示第i个单词的词性, 表示第i个单词的实体标签。 3.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述构建目 标语句的句法依存树, 并建立句法依存树的邻接矩阵, 具体包括: 针对目标语句, 使用句法分析工具构建以实体节点作为全局节点的语法依存树; 构建全局节点到其 他节点的 的连接, 建立第一邻接矩阵; 增设每个节点到自身的连接, 建立单位矩阵; 将第一邻接矩阵与单位矩阵相加, 得到最终的邻接矩阵。 4.根据权利要求2所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述GCN神 经网络的公式表示如下: 其中, 表示第l层第i个节点的隐藏层表示; ρ表示ReLU激活函数; 表示邻接矩阵, 表示i节点和j节点的连接关系, 其值为i节点到j节点的距离; di表示节点i的出度; b(l)表 示偏移量; αi表示权重系数; GCN神经网络的最后一层的每 个节点的隐藏层表示构成第一特 征向量。 5.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述将第 一 特征向量输入PCN N分段卷积神经网络进行 特征提取, 得到第二特 征向量, 具体包括: 采用多个滤波器及权 重矩阵对第一特 征向量进行 卷积运算; 将每个卷积运算后得到的特征向量分割为三段, 分割时以实体头和实体尾为边界分 割; 将每一段进行最大池化处 理, 得到池化向量;权 利 要 求 书 1/2 页 2 CN 114444515 A 2拼接所有池化向量, 采用非线性方程tanh作为隐藏层激活函数,分片计算最大池化输 出, 得到第二特 征向量。 6.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 所述将第 二 特征向量输入Softmax分类 器进行关系类别预测, 实现实体关系抽取, 具体包括: 将第二特 征向量输入到Softmax分类 器, Softmax分类 器公式表示如下: f(z|g)=softmax(Wsg+bs) 其中, z表示需要计算的关系类别, g表示第二特征向量, Ws和bs分别为权重参数和偏置 参数; 计算出每个关系类别的所占概率, 从高到低 排序获取最高概率的关系类别作为关系抽 取的结果, 实现实体关系抽取。 7.根据权利要求1所述的基于实体语义融合的关系抽取方法, 其特征在于, 进行关系抽 取之前, 还包括: 构建训练样 本集, 并基于训练样 本集对GCN神经网络、 PCNN分段卷积神经网 络及Softmax分类 器进行训练。 8.根据权利要求7所述的基于实体语义融合的关系抽取方法, 其特征在于, 训练过程 中, Softmax分类 器的损失函数采用交叉熵函数。权 利 要 求 书 2/2 页 3 CN 114444515 A 3

.PDF文档 专利 一种基于实体语义融合的关系抽取方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于实体语义融合的关系抽取方法 第 1 页 专利 一种基于实体语义融合的关系抽取方法 第 2 页 专利 一种基于实体语义融合的关系抽取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:45:17上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。