国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210386674.4 (22)申请日 2022.04.13 (71)申请人 国家电网有限公司大 数据中心 地址 100031 北京市西城区宣武门内大街8 号 (72)发明人 纪鑫 王宏刚 杨成月 武同心 杨智伟 江孔辰 何禹德 米娜 褚娟 李建芳 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 岳晓萍 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/242(2020.01) G06F 40/30(2020.01)G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 50/06(2012.01) (54)发明名称 一种实体识别方法、 装置、 设备及存 储介质 (57)摘要 本发明公开了一种实体识别方法、 装置、 设 备及存储介质, 利用获取的词典对待测句子进行 匹配获得字符序列的潜在词, 并根据潜在词与待 测句子的字符形成待测句子的格结构; 将待测句 子的格结构输入平面晶格Flat ‑lattice模型进 行编码, 获得待测句子中包含的字词向量, 字词 向量包括: 字符向量和潜在词向量; 根据待测句 子中的字词向量构建字词图, 将 字词图输入至少 两个不同结构的图网络模型, 融合各图网络模型 输出的图节 点向量得到多个语义表征向量; 将多 个语义表征向量进行分类, 获得待测句子的实体 识别结果, 能够通过图神经网络构建不同粒度语 义特征图表示, 通过融入不同粒度的语义, 充分 提高实体表征信息的丰富度, 进而提高实体识别 效果。 权利要求书2页 说明书11页 附图4页 CN 114611521 A 2022.06.10 CN 114611521 A 1.一种实体识别方法, 其特 征在于, 包括: 利用获取的词典对待测句子进行匹配获得字符序列的潜在词, 并根据 所述潜在词与 所 述待测句子的字符形成待测句子的格结构; 将所述待测句子的格结构输入平面晶格Fl at‑lattice模型进行编码, 获得所述待测句 子中包含的字词向量, 所述字词向量包括: 字符向量和潜在词向量; 根据所述待测句子 中的所述字词向量构建字词图, 将所述字词图输入至少两个不同结 构的图网络模型, 融合各 所述图网络模型输出的图节点向量得到多个 语义表征向量; 将所述多个 语义表征向量进行分类, 获得 所述待测句子的实体识别结果。 2.根据权利 要求1所述的方法, 其特征在于, 所述平面晶格Flat ‑lattice模型通过训练 样本集迭代训练预训练的Flat ‑lattice模型 得到; 其中, 通过训练样本集迭代训练预训练的Flat ‑lattice模型包括: 获取预训练的Fl at‑lattice模型、 训练集中各实体样本的格结构和所述格结构对应的 预设字词向量; 将各所述实体样本的格结构输入预训练的Fl at‑lattice模型中, 得到实体样本句子中 包含的初始字词向量; 基于所述初始字词向量和所述预设字词向量, 采用正向传播和反 向传播修改所述预训 练的Flat ‑lattice模型中各层神经元的参数值以及连接权重, 直到所述预训练的Flat ‑ lattice模型实现收敛时, 获得训练好的Flat ‑lattice模型。 3.根据权利要求1所述的方法, 其特征在于, 所述字词图包括: 包含图邻接矩阵、 转移图 邻接矩阵、 格图邻接矩阵。 4.根据权利要求1所述的方法, 其特征在于, 将所述字词图输入至少两个不同结构的图 网络模型, 融合各 所述图网络模型输出的图节点向量得到多个 语义表征向量包括: 获取至少两个不同的图网络模型; 将所述字词图中的节点信 息分别输入各所述图网络模型, 得到各所述图网络模型输出 的图节点向量; 所述图节点信息用于表示字符向量与潜在词向量之间的关系; 将各所述图节点向量分别匹配不同的权重后进行加和运算获得融合后的语义表征向 量。 5.根据权利要求4所述的方法, 其特征在于, 将所述字词图中的节点信 息分别输入各所 述图网络模型之前, 还 包括: 在所述字词图中设置全局节点, 所述全局节点与所述字词图中的各节点相连。 6.根据权利要求1所述的方法, 其特征在于, 所述图网络模型包括: 包含图注意力模型、 转移图注意力模型和格图注意力模型; 相应的, 所述包含图注意力模型输出的图节点向量为包含图节点向量, 所述转移图注 意力模型输出的图节 点向量为转移图节点向量, 所述格图注意力模型输出的图节点向量为 格图节点向量。 7.根据权利要求1所述的方法, 其特征在于, 将所述多个语义表征向量进行分类, 获得 所述待测句子的实体识别结果包括: 采用条件随机场算法获取多个 语义表征向量对应的多个预测标签序列; 根据所述多个预测标签序列, 采用维特比解码算法获得最优标签序列作为所述待测句权 利 要 求 书 1/2 页 2 CN 114611521 A 2子的实体识别结果。 8.一种实体识别装置, 其特 征在于, 包括: 格结构获取模块, 用于利用获取的词典对待测句子进行匹配获得字符序列的潜在词, 并根据所述潜在词与所述待测句子的字符形成待测句子的格结构; 编码模块, 用于将所述待测句子 的格结构输入平面晶格Flat ‑lattice模型进行编码, 获得所述待测句子中包 含的字词向量, 所述字词向量包括: 字符向量和潜在词向量; 图结构模块, 用于根据所述待测句子中的所述字词向量构建字词图, 将所述字词图输 入至少两个不同结构的图网络模型, 融合各所述图网络模型输出的图节点向量得到多个语 义表征向量; 实体识别模块, 用于将所述多个语义表征向量进行分类, 获得所述待测句子的实体识 别结果。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 实体识别方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的实体识别方法。权 利 要 求 书 2/2 页 3 CN 114611521 A 3
专利 一种实体识别方法、装置、设备及存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:46:11
上传分享
举报
下载
原文档
(743.2 KB)
分享
友情链接
GB-T 2881-2014 工业硅.pdf
T-ACEF 108—2023 公民绿色低碳行为温室气体减排量化指南 行:不停车缴费.pdf
GB-T 13389-2014 掺硼掺磷掺砷硅单晶电阻率与掺杂剂浓度换算规程.pdf
GB-T 25744-2010 钢件渗碳淬火回火金相检验.pdf
GB-T 17903.1-2024 信息技术 安全技术 抗抵赖 第1部分:概述.pdf
GB-T 8567-2006 计算机软件文档编制规范.pdf
信通院 中国宽带发展白皮书-2019年.pdf
DB31-T 1449-2023 燃料电池电动汽车运行安全和维护技术要求 上海市.pdf
GB-T 20009-2019 信息安全技术 数据库管理系统安全评估准则.pdf
T-CQTX 0001—2023 蒸汽锅炉水容积测试技术规范.pdf
ISO IEC 27701-2019 中文版.pdf
GB-T 38667-2020 信息技术 大数据 数据分类指南.pdf
GB51415—2020 有色金属冶炼废气治理技术标准.pdf
DB44-T 2368-2022 社会组织能力建设指南 广东省.pdf
DB 52-T 1123-2016 贵州省 政府数据 数据分类分级指南.pdf
GB-T 20261-2020 信息安全技术 系统安全工程 能力成熟度模型.pdf
T-CESA 1254—2023 智慧博物馆建设总体要求.pdf
GB-T 34078.2-2021 基于云计算的电子政务公共平台总体规范 第2部分:顶层设计导则.pdf
云计算开源产业联盟 云计算安全责任共担白皮书 2020年 .pdf
GB-T 38674-2020 信息安全技术 应用软件安全编程指南.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(743.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。