(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210496739.0 (22)申请日 2022.05.09 (71)申请人 华南师范大学 地址 510631 广东省广州市中山大道西5 5 号华南师范大学计算机学院 (72)发明人 毛承洁 顾文静 张莹祺 张晓晗  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 黎扬鹏 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/242(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06K 9/62(2022.01) (54)发明名称 基于多图协作语义网络的实体识别方法、 系 统和存储介质 (57)摘要 本发明公开了一种基于多图协作语义网络 的实体识别方法、 系统和存储介质, 可广泛应用 于实体识别技术领域。 本发明方法通过提取包含 若干个中文句子的原始数据内的词典特征数据 和词性特征数据组成特征数据, 并根据原始数据 和特征数据构建多图矩阵, 同时将原始数据和特 征数据进行合并后得到合并数据, 然后将合并数 据和多图矩阵融合后进行协作训练, 得到特征融 合结果, 再对 所述特征融合结果进行解码后得到 所述原始数据的中文命名实体识别结果, 通过考 虑词典特征数据和词性特征数据来识别中文句 子中的中文实体, 从而能够 有效提高实体识别结 果的准确度。 权利要求书2页 说明书8页 附图2页 CN 114896978 A 2022.08.12 CN 114896978 A 1.一种基于多图协作语义网络的实体识别方法, 其特 征在于, 包括以下步骤: 获取原始数据, 所述原 始数据包括若干个中文句子; 提取所述原始数据的特 征数据, 所述特 征数据包括词典特 征数据和词性特 征数据; 根据所述原 始数据和所述特 征数据构建多图矩阵; 将所述原 始数据和所述特 征数据进行合并, 得到合并数据; 将所述合并数据和所述多图矩阵融合后进行协作训练, 得到特 征融合结果; 对所述特 征融合结果进行解码, 得到所述原 始数据的中文命名实体识别结果。 2.根据权利要求1所述的一种基于多图协作语义网络的实体识别方法, 其特征在于, 所 述提取所述原始数据的特 征数据, 包括: 采用词典工具对所述原 始数据进行词特 征数据匹配, 得到词典特 征数据; 采用词性 解析工具对所述原 始数据进行词性 解析, 得到词性特 征数据。 3.根据权利要求1所述的一种基于多图协作语义网络的实体识别方法, 其特征在于, 在 所述提取所述原始数据的特 征数据后, 所述方法还 包括以下步骤: 将所述词典特 征数据输入嵌入层, 得到词典特 征向量; 将所述词性特 征数据输入嵌入层, 得到词性特 征向量; 将所述原 始数据输入嵌入层, 得到上 下文信息向量。 4.根据权利要求3所述的一种基于多图协作语义网络的实体识别方法, 其特征在于, 所 述根据所述原 始数据和所述特 征数据构建多图矩阵, 包括: 融合所述词典特 征向量和所述上 下文信息向量, 生成边界图; 融合所述词性特 征向量和所述上 下文信息向量, 分别生成关系图和包 含图。 5.根据权利要求4所述的一种基于多图协作语义网络的实体识别方法, 其特征在于, 所 述关系图包括单个次之间的依存关系和词语之间的依存关系。 6.根据权利要求4所述的一种基于多图协作语义网络的实体识别方法, 其特征在于, 所 述将所述 合并数据和所述多图矩阵融合后进行协作训练, 包括: 将第一合并数据与 所述边界图的融合结果输入第 一图注意网络进行图卷积处理, 所述 第一合并数据包括所述词典特 征向量和所述上 下文信息向量的合并数据; 将第二合并数据和所述关系图的融合结果输入到第 二图注意网络进行图卷积处理, 所 述第二合并数据包括词性特 征向量和所述上 下文信息向量的合并数据; 将所述第二合并数据和所述包含图的融合结果输入到第三图注意网络进行图卷积处 理。 7.根据权利要求6所述的一种基于多图协作语义网络的实体识别方法, 其特征在于, 所 述将所述 合并数据和所述多图矩阵融合后进行协作训练, 还 包括: 将所述边界图、 所述关系图、 所述包含图与所述原始数据的上下文信息输入融合层进 行参数学习; 通过多图融合进行协作训练。 8.一种基于多图协作语义网络的实体识别系统, 其特 征在于, 包括: 获取模块, 用于获取原 始数据, 所述原 始数据包括若干个中文句子; 提取模块, 用于提取所述原始数据的特征数据, 所述特征数据包括词典特征数据和词 性特征数据;权 利 要 求 书 1/2 页 2 CN 114896978 A 2构建模块, 用于根据所述原 始数据和所述特 征数据构建多图矩阵; 合并模块, 用于将所述原 始数据和所述特 征数据进行合并, 得到合并数据; 协作训练模块, 用于将所述合并数据和所述多图矩阵融合后进行协作训练, 得到特征 融合结果; 解码模块, 用于对所述特征融合结果进行解码, 得到所述原始数据的中文命名实体识 别结果。 9.一种基于多图协作语义网络的实体识别系统, 其特 征在于, 包括: 至少一个存 储器, 用于存 储程序; 至少一个处理器, 用于加载所述程序以执行如权利要求1 ‑7任一项所述的基于多图协 作语义网络的实体识别方法。 10.一种存储介质, 其特征在于, 其中存储有计算机可执行的程序, 所述计算机可执行 的程序被处理器执行时用于实现如权利要求 1‑7任一项所述的基于多图协作语义网络的实 体识别方法。权 利 要 求 书 2/2 页 3 CN 114896978 A 3

.PDF文档 专利 基于多图协作语义网络的实体识别方法、系统和存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多图协作语义网络的实体识别方法、系统和存储介质 第 1 页 专利 基于多图协作语义网络的实体识别方法、系统和存储介质 第 2 页 专利 基于多图协作语义网络的实体识别方法、系统和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:49:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。