(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210287573.1 (22)申请日 2022.03.23 (65)同一申请的已公布的文献号 申请公布号 CN 114385793 A (43)申请公布日 2022.04.22 (73)专利权人 粤港澳大湾区数字经济 研究院 (福田) 地址 518045 广东省深圳市福田区福保街 道市花路长富金茂大厦1号楼39楼 3901单元 (72)发明人 杨海钦 叶俊鹏 柳昊良  (74)专利代理 机构 深圳市君胜知识产权代理事 务所(普通 合伙) 44268 专利代理师 温宏梅(51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/126(2020.01) G06F 40/30(2020.01) G06N 20/00(2019.01) (56)对比文件 CN 111475617 A,2020.07.31 CN 110781302 A,2020.02.1 1 US 2022067030 A1,202 2.03.03 魏优等.基于深层语境词表示与自注意力的 生物医学事 件抽取. 《计算机 工程与科 学》 .2020, (第09期), 审查员 邓丽婉 (54)发明名称 一种事件抽取方法及相关装置 (57)摘要 本申请公开了一种事件抽取方法及相关装 置, 方法包括获取待抽取语句对应的事件类型; 对待抽取语句中的每个词语进行词编码和位置 编码, 得到待抽取语句对应的词嵌入向量和位置 嵌入向量; 将词嵌入向量、 位置嵌入向量及事件 类型对应的事件类型嵌入向量相加以得到目标 嵌入向量, 并基于目标 嵌入向量抽取各事件类型 各自对应的事件参数。 本申请通过将语句的词嵌 入向量、 位置嵌入向量及事件类型对应的事件类 型嵌入向量相加来得到目标嵌入向量, 再基于目 标嵌入向量确定各事件类型的事件论元, 将事件 类型作为指示信息与语句信息融合, 提高目标 嵌 入向量所携带的语义信息, 从而可以提高事件参 数的抽取精确度。 权利要求书3页 说明书12页 附图5页 CN 114385793 B 2022.07.08 CN 114385793 B 1.一种事 件抽取方法, 其特 征在于, 所述的方法包括: 获取待抽取语句对应的事件类型, 其中, 所述待抽取语句对应的事件类型包括多个事 件类型; 对所述待抽取语句中的每个词语进行词编码和位置编码, 得到所述待抽取语句对应的 词嵌入向量和 位置嵌入向量, 其中, 所述待抽取语句中的各词语对应的词嵌入向量的向量 维度和位置嵌入向量的向量维度均等于事 件类型嵌入向量的向量维度; 将所述词嵌入向量、 所述位置嵌入向量以及所述事件类型对应的事件类型嵌入向量相 加以得到目标嵌入向量, 并基于所述目标嵌入向量抽取事件类型对应的事件参数, 包括: 分 别将所述词嵌入向量的各词向量、 所述位置嵌入向量中与各词向量对应的位置向量以及目 标事件类型嵌入向量进 行逐点相加, 以得到目标嵌入向量, 其中, 所述目标事件类型嵌入向 量是根据所述事件类型嵌入向量 获得的; 基于注 意力机制将所述目标嵌入向量进 行信息融 合, 以得到第二语境化表达; 基于所述第二语境化表达, 确定所述目标嵌入向量对应的事件 论元, 并基于确定的事 件论元获取 各事件类型各自对应的事 件参数。 2.根据权利要求1所述事件抽取方法, 其特征在于, 所述获取待抽取语句对应的事件类 型具体包括: 对所述待抽取语句中的每个词语进行词编码和位置编码, 得到所述待抽取语句对应的 词嵌入向量和位置嵌入向量; 将所述词嵌入向量与所述 位置嵌入向量相加以得到 输入向量; 将所述输入向量输入预先训练 的事件分类模型中的事件类型编码器, 通过所述事件类 型编码器输出 所述待抽取语句的第一语境 化表达; 将所述语境化表示输入所述事件分类模型中的事件类型分类器, 通过所述事件类型分 类器确定所述待抽取语句对应的事 件类型。 3.根据权利要求1所述事件抽取方法, 其特征在于, 多个所述事件类型中的各事件类型 对应的事 件类型嵌入向量的向量维度均相等。 4.根据权利要求1所述事件抽取方法, 其特征在于, 所述将所述词嵌入向量、 所述位置 嵌入向量以及所述事件类型对应的事件类型嵌入向量相加以得到目标嵌入向量, 并基于所 述目标嵌入向量抽取事 件类型对应的事 件参数具体包括: 对于每个事件类型, 分别将所述词嵌入向量的各词向量、 所述位置嵌入向量中与各词 向量对应的位置向量以及所述事件类型的事件类型嵌入向量进行逐点相加, 以得到目标嵌 入向量; 基于注意力机制将所述目标嵌入向量进行信息融合, 以得到第二语境 化表达; 基于所述第二语境化表达, 确定所述目标嵌入向量对应的事件论元, 并基于确定的事 件论元获取事 件类型对应的事 件参数。 5.根据权利要求1所述事件抽取方法, 其特征在于, 所述将所述词嵌入向量、 所述位置 嵌入向量以及所述事件类型对应的事件类型嵌入向量相加以得到目标嵌入向量, 并基于所 述目标嵌入向量抽取事 件类型对应的事 件参数具体包括: 将多个事件类型中的各事件类型对应的事件类型嵌入向量加权, 以得到目标事件类型 嵌入向量; 分别将所述词嵌入向量的各词向量、 所述位置嵌入向量中与 各词向量对应的位置向量权 利 要 求 书 1/3 页 2 CN 114385793 B 2以及所述目标事 件类型嵌入向量进行 逐点相加, 以得到目标嵌入向量; 基于注意力机制将所述目标嵌入向量进行信息融合, 以得到第二语境 化表达; 基于所述第二语境化表达, 确定所述目标嵌入向量对应的事件论元, 并基于确定的事 件论元获取 各事件类型各自对应的事 件参数。 6.根据权利要求5所述事件抽取方法, 其特征在于, 所述将多个事件类型中的各事件类 型各自对应的事 件类型嵌入向量加权, 以得到目标事 件类型嵌入向量具体包括: 获取各事件类型各自对应的事件概率, 其中, 所述事件概率为获取待抽取语句对应的 事件类型时确定的; 将各事件类型各自对应的事件概率作为各事件类型对应的事件类型嵌入向量的加权 系数, 并基于各事件类型嵌入向量的加权系 数将各事件类型嵌入向量加权, 以得到目标事 件类型嵌入向量。 7.根据权利要求5所述事件抽取方法, 其特征在于, 所述将多个事件类型中的各事件类 型各自对应的事 件类型嵌入向量加权, 以得到目标事 件类型嵌入向量具体包括: 读取各事件类型对应的预设加权系数; 基于读取的各预设加权系数将各事件类型嵌入向量加权, 以得到目标事件类型嵌入向 量。 8.根据权利要求5所述事件抽取方法, 其特征在于, 所述基于确定的事件论元获取各事 件类型各自对应的事 件参数具体包括: 获取若干事件论元中的各事件论元的词语属性, 并基于各事件论元各自对应的词语属 性形成若干候选事件参数, 其中, 若干候选事件参数中的各事件参数均包括至少一个事件 论元; 将若干候选事 件参数进行事 件归类, 以得到各事 件类型各自对应的事 件参数。 9.根据权利要求5所述事件抽取方法, 其特征在于, 所述基于确定的事件论元获取各事 件类型各自对应的事 件参数具体包括: 获取若干事件论元中的各事件论元的词语属性, 并基于各事件论元各自对饮的词语属 性形成若干候选事件参数, 其中, 若干候选事件参数中的各事件参数均包括至少一个事件 论元; 对于每个事件类型, 确定所述事件类型的事件嵌入向量与若干候选事件参数中的各候 选事件参数的参数嵌入向量的向量距离; 基于获取到的各向量距离确定所述事件类型对应的候选事件参数, 以得到各事件类型 各自对应的事 件参数。 10.根据权利要求4或5所述事件抽取方法, 其特征在于, 所述基于注意力 机制将所述目 标嵌入向量进行信息融合, 以得到第二语境 化表达具体为: 将所述目标嵌入向量输入预先训练 的事件抽取模型中的事件论元编码器, 通过所述事 件论元编码器对所述目标嵌入向量进行信息融合, 以得到第二语境 化表达。 11.根据权利要求4或5所述事件抽取方法, 其特征在于, 所述基于所述第二语境化表 达, 确定所述目标嵌入向量对应的事 件论元具体包括: 将所述第二语境化表达输入预先训练 的事件抽取模型中的事件论元分类器, 通过所述 事件论元分类 器确定所述目标嵌入向量对应的事 件论元。权 利 要 求 书 2/3 页 3 CN 114385793 B 3

.PDF文档 专利 一种事件抽取方法及相关装置

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种事件抽取方法及相关装置 第 1 页 专利 一种事件抽取方法及相关装置 第 2 页 专利 一种事件抽取方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:44:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。