国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210325701.7 (22)申请日 2022.03.29 (71)申请人 北京感易智能科技有限公司 地址 102425 北京市房山区阎村镇阎富路1 号20号楼3层3 05 (72)发明人 刘雨亮 胡殿明 (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 张睿 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 数据处理方法、 装置、 电子设备、 介质及程序 产品 (57)摘要 本发明提供一种数据处理方法、 装置、 电子 设备、 介质及程序产品, 属于通信技术领域, 包 括: 对多源异构数据进行事件检测和主体识别, 得到所述多源异构数据对应的事件信息和主体 信息; 基于所述主体信息和预设标准化主体库, 确定所述主体信息对应的关系信息, 并对所述事 件信息进行属性抽取, 得到所述事件信息对应的 属性信息, 其中, 所述预设标准化主体库中包括 多个主体信息, 每个所述主体信息均关联有一组 或多组关系信息; 基于所述事件信息、 所述主体 信息、 所述属性信息和所述关系信息, 得到所述 多源异构数据的事 件四元组信息 。 权利要求书2页 说明书10页 附图3页 CN 114742055 A 2022.07.12 CN 114742055 A 1.一种数据处 理方法, 其特 征在于, 包括: 对多源异构数据进行事件检测和主体识别, 得到所述多源异构数据对应的事件信 息和 主体信息; 基于所述主体信息和预设标准化主体库, 确定所述主体信息对应的关系信息, 并对所 述事件信息进 行属性抽取, 得到所述事件信息对应的属性信息, 其中, 所述预设标准化主体 库中包括多个主体信息, 每 个所述主体信息均关联有一组或多组关系信息; 基于所述事件信 息、 所述主体信息、 所述属性信息和所述关系信 息, 得到所述多源异构 数据的事 件四元组信息 。 2.根据权利要求1所述的数据处理方法, 其特征在于, 所述对多源异构数据进行事件检 测和主体识别, 得到所述多源异构数据对应的事 件信息和主体信息, 具体包括: 在所述多源异构数据为非结构化数据的情况下, 将所述多源异构数据进行文本化处 理, 得到所述多源异构数据对应的文本信息; 对所述文本信息输入预设文本主体分类模型, 得到所述文本信息对应的文本主体类 型; 将所述文本信 息输入所述文本主体类型对应的命名实体识别模型, 输出所述文本信 息 对应的第一主体信息; 在所述第一主体信息为多个的情况下, 基于各个所述第一主体信息的文本密度信息, 确定所述主体信息, 或, 在所述第一主体信息为一个的情况下, 将所述第一主体信息作为所 述主体信息; 对所述文本信息进行事 件检测, 得到所述多源异构数据对应的事 件信息。 3.根据权利要求2所述的数据处理方法, 其特征在于, 所述对所述文本信 息进行事件检 测, 得到所述多源异构数据对应的事 件信息, 包括: 将所述文本信 息分别输入预设文本事件分类模型和预设文本语义模型, 输出所述文本 信息对应的第一事 件分类信息和第一语义事 件信息; 对所述文本信息对应的句子集合进行事件识别处理, 得到句子事件集, 对所述文本信 息对应的段落 集合进行事 件识别处 理, 得到段落事 件集; 合并所述句子事件集合所述段落事件集中的同类型事件, 得到合并后的目标事件集 合; 基于所述目标事件集合中各个事件的出现的频率, 在所述目标事件集合中确定所述多 源异构数据对应的事 件信息。 4.根据权利要求1所述的数据处理方法, 其特征在于, 所述基于所述主体信 息和预设标 准化主体库, 确定所述主体信息对应的关系信息, 包括: 基于所述主体信息在所述预设标准 化主体库中匹配对应的标准主体信息; 获取所述标准主体信息对应的关系信息, 得到所述主体信息对应的关系信息 。 5.根据权利要求1 ‑4任一所述的数据处理方法, 其特征在于, 在得到所述多源异构数据 的事件四元组信息之后, 还 包括: 获取所述事件信息对应的事 件历史数据; 对所述事件历史数据进行事件持续 时间和事件热度分析, 得到事件持续 时间信息和事 件热度信息;权 利 要 求 书 1/2 页 2 CN 114742055 A 2基于所述事件持续时间信息、 事件热度信息和所述事件信息的历史发生次数, 得到所 述事件信息对应的事 件评价信息 。 6.根据权利要求1 ‑4任一所述的数据处理方法, 其特征在于, 在得到所述多源异构数据 的事件四元组信息之后, 还 包括: 将各个所述事件四元组信息中的第一事件信息和第二事件信息输入事件发生概率预 测模型, 得到所述第一事 件信息发生后, 所述第二事 件信息发生的预测概 率; 其中, 所述第一事 件信息和所述第二事 件信息具 备时间关联性。 7.一种数据处 理装置, 其特 征在于, 包括: 分析模块, 用于对多源异构数据进行事件检测和主体识别, 得到所述多源异构数据对 应的事件信息和主体信息; 确定模块, 用于基于所述主体信息和预设标准化主体库, 确定所述主体信息对应的关 系信息, 并对所述事件信息进行属 性抽取, 得到所述事件信息对应的属性信息, 其中, 所述 预设标准化主体库中包括多个主体信息, 每个所述主体信息均关联有一组或多组关系信 息; 处理模块, 用于基于所述事件信息、 主体信息、 属性信息和所述关系信息, 得到所述多 源异构数据的事 件四元组信息 。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述数据处 理方法。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处 理器执行时实现如权利要求1至 6任一项所述数据处 理方法。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述数据处 理方法。权 利 要 求 书 2/2 页 3 CN 114742055 A 3
专利 数据处理方法、装置、电子设备、介质及程序产品
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:50:47
上传分享
举报
下载
原文档
(647.7 KB)
分享
友情链接
GB-T 16427-2018 粉尘层电阻率测定方法.pdf
T-CASME 436—2023 9BB~20BB太阳能电池片自动串焊机.pdf
GM-T 0022-2014 IPSec VPN技术规范.pdf
T-ACEF 108—2023 公民绿色低碳行为温室气体减排量化指南 行:不停车缴费.pdf
T-ZNX 020—2021 驱鸟剂对直播稻田鸟害驱避药效试验准则.pdf
GB-T 9139-2018 土方机械 液压挖掘机 技术条件.pdf
GM-T 0090-2020 标识密码应用标识格式规范.pdf
T-CAAMTB 134—2023 质量分级及“领跑者”评价要求 电动汽车用驱动电机系统.pdf
GB-T 6516-2010 电解镍.pdf
DB34-T 3893-2021 工业企业节能诊断技术规范 安徽省.pdf
GB-T 42777-2023 基于文本数据的金融风险防控 知识图谱构建技术框架指南.pdf
GM-T 0120-2022 基于云计算的电子签名服务技术实施指南.pdf
GB-T 17116.3-2018 管道支吊架 第3部分:中间连接件和建筑结构连接件.pdf
YD-T 3835.1-2021 量子密钥分发(QKD)系统测试方法 第1部分:基于诱骗态BB84协议的QKD系统.pdf
DB45-T 1764-2018 香蕉催熟技术规程 广西壮族自治区.pdf
GB-T 34953.4-2020 信息技术 安全技术 匿名实体鉴别 第4部分:基于弱秘密的机制.pdf
TB-T 1720-2017 铁道客车及动车组给水装置.pdf
CY-T 121-2015 学术出版规范 注释.pdf
T-GHDQ 89.2—2022 车载网络安全测试规范 第2部分:车载以太网安全测试规范.pdf
信通院 《区块链赋能新型智慧城市白皮书-2019年》.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(647.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。