国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210384509.5 (22)申请日 2022.04.13 (71)申请人 华南师范大学 地址 528225 广东省佛山市南海区狮山 南 海软件科技园华 南师范大学软件学院 (72)发明人 项冠华 刘帅 (74)专利代理 机构 广州骏思知识产权代理有限 公司 44425 专利代理师 张金龙 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种实体关系抽取方法、 装置、 电子设备及 存储介质 (57)摘要 本发明涉及一种实体关系抽取方法、 装置、 电子设备及存储介质。 本发明所述的实体关系抽 取方法包括: 获取待抽取实体关系的句子; 对待 抽取实体关系的句子进行编码, 得到句子表示; 对句子表 示进行依赖解析处理, 得到待抽取实体 关系的句子的结构信息; 对句子的结构信息使用 注意力机制和池化操作, 提取句子的局部特征和 全局特征, 得到基于关系的语义信息; 拼接结构 信息和语义信息, 得到待抽取实体 关系的句子对 应的句子表征; 对句子表征进行解码, 得到待抽 取实体关系的句子的实体关系三元组。 本发明所 述的一种实体关系抽取方法, 通过Bi ‑LSTM和GCN 两次对单词的依赖抽取, 和基于关系的注意力机 制训练, 提升 了模型的鲁棒 性。 权利要求书3页 说明书10页 附图3页 CN 115048926 A 2022.09.13 CN 115048926 A 1.一种实体关系抽取 方法, 其特 征在于, 包括以下步骤: 获取待抽取实体关系的句子; 对所述待抽取实体关系的句子进行编码, 得到句子表示, 其中, 所述句子表示包含句子 中每个词的向量表示; 对所述句子表示进行依赖解析处 理, 得到所述待抽取实体关系的句子的结构信息; 对所述句子的结构信 息使用注意力 机制和池化操作, 提取所述句子的局部特征和全局 特征, 得到基于关系的语义信息; 拼接所述结构信息和所述语义信息, 得到所述待抽取实体关系的句子对应的句子表 征; 对所述句子表征进行解码, 得到所述待抽取实体关系的句子的实体关系三元组。 2.根据权利要求1所述的一种实体关系抽取方法, 其特征在于, 对所述待抽取实体关系 的句子进行编码, 得到句子表示, 包括: 对于给定长度为n的句子s={W1, W2, ..., Wn}, 用xi表示句子中的每一个的单词表征Wi, 其 中 xi由 单 词Wi的 词嵌 入 位 置 嵌 入 和字 符 嵌 入 拼 接 而 成 , 即 将所述待抽取实体关系的句子输入Bi ‑LSTM网络, 使用以下公式, 提取句子中每个单词 Wi对应的隐藏向量hi, 得到句子表示得到所述待抽取实体关系的句子的句子表示: 其中, hi为句子中相应位置第i个单词对应的隐藏向量。 3.根据权利要求2所述的一种实体关系抽取方法, 其特征在于, 对所述句子表示进行依 赖解析处 理, 得到所述待抽取实体关系的句子的结构信息, 包括: 将所述句子表示 生成对应的依赖树, 使用以下公式, 得到所述依赖树的节点表征 其中, Aij为邻接矩阵, 如果有边从节点i到节点j, 则Aij=1和Aji=1, 否则Aij=0和Aji= 0; W(l)为权矩阵, bl为偏置向量, ρ 为激活函数, 为更新后的最终节点表征; 构建一个基于注意力机制的邻接矩阵 输出计算为值的加权和, 其 中权重由具有相应 键的查询函数计算, 加入多头注意力机制邻接矩阵的计算如下: 其中, Q和K都等于上一节中l_1层的集合表示 表示第t个头的邻接矩阵, WiQ, 和V是注意力机制中输入所需要相乘的矩阵; 使用以下公式, 更新依赖树中每一层的节点表征 权 利 要 求 书 1/3 页 2 CN 115048926 A 2其中, 为更新后的节点表征, ρ 为激活函数, 是更新完成的邻接矩阵, W(l)和 是 与注意力引导邻接矩阵 相关的权重矩阵和偏差项, 为连接后的节点表征, xj为节点 的初始输入, 即节点更新完成的 表示节点j的l层表征; 使用以下公式, 得到所述待抽取实体关系的句子对应的结构信息 hcomb: 其中, hout=[h(1);…; h(l)], 是将1个分离的密连层的输出连接起来的输出; Wcomb为权重 矩阵, bcomb为线性变换的偏置向量, hi为句子中相应位置第i个单词对应的隐藏向量。 4.根据权利要求3所述的一种实体关系抽取方法, 其特征在于, 对所述句子的结构信 息 使用注意力机制和池化操作, 提取所述句 子的局部特征和全局特征, 得到基于关系的语义 信息, 包括: 将所述句子的结构信息输入平均池中进行平均池化处理, 使用以下公式, 得到句子的 全局表征Sg: Sg=avg(hk) 其中, hk={hcomb1; ...; hcombi}; 将所述句子的全局表 征Sg、 所述句子的结构信息hcomb和关系嵌入矩阵R一起输入到基于 关系的注意力机制中, 使用以下公式, 得到基于关系的句子语义表征Sk和关系矩阵Rk; Sk, Rk=attention(hk, Sg, R) 其中, Sk为句子的语 义表征, Rk为句子的关系矩阵, attention()为注意力机制计 算, R是 第k种关系的可训练的初始 矩阵; 拼接所述句子的全局表征Sg和语义表征Sk, 得到基于关系的语义信息Uk。 5.根据权利要求4所述的一种实体关系抽取方法, 其特征在于, 对所述句子表征进行解 码, 得到所述待抽取实体关系的句子的实体关系三元组, 包括: 将所述句子表征输入Bi ‑LSTM模型, 使用以下公式, 得到单词序列经过Bi ‑LSTM模型映 射后的句子表征; 其中, 为句子表征; 使用以下公式, 计算关系rk下第n个单词的预测标记的概 率P: 其中, wo为权重, bo为偏秩; 当P大于特定阈值时, 抽取P值 最大的两个实体组, 组成当前关系rk的实体关系三元组。 6.一种实体关系抽取装置, 其特 征在于, 包括:权 利 要 求 书 2/3 页 3 CN 115048926 A 3
专利 一种实体关系抽取方法、装置、电子设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:46:10
上传分享
举报
下载
原文档
(903.3 KB)
分享
友情链接
GB-T 23262-2009 非金属密封填料试验方法.pdf
GB-T 26698-2022 考试用铅笔和涂卡专用笔.pdf
NY-T 2922-2016 梨种质资源描述规范.pdf
GB-T 5905.1-2023 起重机 检验与试验规范 第1部分:通则.pdf
DB42-T 1946-2022 工业锅炉燃油燃气燃烧器节能等级评价方法 湖北省.pdf
GB-T 18916.56-2021 取水定额 第56部分:毛皮.pdf
GB-T 37933-2019 信息安全技术 工业控制系统专用防火墙技术要求.pdf
GB-T 38645-2020 信息安全技术 网络安全事件应急演练指南.pdf
T-CFA 03110315—2020 铸件热处理单元数字化技术要求.pdf
GA-T 1720-2020 移动警务 数字证书格式要求.pdf
DB34-T 3176-2018 公路水运工程预应力孔道数控压浆施工技术规程 安徽省.pdf
GB-T 36896.4-2018 轻型有缆遥控水下机器人 第4部分:摄像、照明与云台.pdf
GB-T 35965.1-2018 应急信息交互协议 第1部分:预警信息.pdf
YD-T 4177.3-2022 移动互联网应用程序(APP)收集使用个人信息最小必要评估规范 第3部分:图片信息.pdf
NY-T 1281-2007 花卉植物真菌病害检测规程.pdf
DB64-T 405-2017 火灾自动报警系统质量检验评定规程 宁夏回族自治区.pdf
GB-T 35394-2017 无损检测 X射线数字成像检测 系统特性.pdf
安全培训教育管理制度.pdf
GB-T 36632-2018 信息安全技术 公民网络电子身份标识格式规范.pdf
GB-T 31288-2014 铁尾矿砂.pdf
1
/
3
17
评价文档
赞助2.5元 点击下载(903.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。