国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210883202.X (22)申请日 2022.07.26 (71)申请人 江苏保旺达软件技 术有限公司 地址 210061 江苏省南京市江北新区星火 路9号软件大厦B座9 楼 (72)发明人 钟丹东 鲍鑫伟 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 严慧 (51)Int.Cl. G06K 9/62(2022.01) G06Q 10/04(2012.01) G06F 16/9535(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 数据分析方法、 装置、 电子设备及存 储介质 (57)摘要 本发明公开了一种数据分析方法、 装置、 电 子设备及存储介质, 其中, 该方法包括: 接入目标 数据源, 并读取目标数据源中的待处理数据; 根 据至少一个预设聚类维度对待处理数据进行聚 类处理, 得到和至少一个预设聚类维度相对应的 目标聚类结果; 针对目标聚类结果, 调用与当前 目标聚类结果相对应的目标网络模型对当前目 标聚类结果所对应的聚类数据进行处理, 以得到 当前目标聚类结果的目标特征信息; 根据预先设 置的预测维度对各目标聚类结果所对应的目标 特征信息进行处理, 确定目标预测结果。 实现了 对于海量数据的聚类, 并根据聚类结果得到对应 的预测结果, 使得用户根据预测结果可以快速完 成数据的审计, 提高了数据审计的效率和准确 性。 权利要求书2页 说明书10页 附图2页 CN 115249043 A 2022.10.28 CN 115249043 A 1.一种数据分析 方法, 其特 征在于, 包括: 接入目标数据源, 并读取所述目标数据源中的待处理数据, 其中, 所述目标数据源对应 不同类型的数据存 储系统; 根据至少一个预设聚类维度对待处理数据进行聚类处理, 得到和所述至少一个预设聚 类维度相对应的目标聚类结果, 其中, 所述目标聚类结果中包 含和聚类维度对应的数据; 针对所述目标聚类结果, 调用与当前目标聚类结果相对应的目标网络模型对所述当前 目标聚类结果所对应的聚类数据进行处理, 以得到所述当前目标聚类结果的目标特征信 息; 根据预先设置的预测维度对各目标聚类结果所对应的目标特征信 息进行处理, 确定目 标预测结果。 2.根据权利要求1所述的方法, 其特征在于, 所述接入目标数据源, 并读取所述目标数 据源中的待处 理数据, 包括: 获取在数据源配置界面确定的数据源, 并将其作为所述目标 数据源; 读取所述目标 数据源内的所有数据类型, 将 读取到的数据作为所述待处 理数据; 其中, 所述数据类型包括结构化数据、 半结构化数据和非结构化数据。 3.根据权利要求1所述的方法, 其特征在于, 所述根据至少一个预设聚类维度对待处理 数据进行聚类处 理, 得到和所述至少一个预设聚类维度相对应的目标聚类结果, 包括: 采用K均值聚类算法根据所述至少一个预设聚类维度对所述待处理数据进行聚类, 得 到与所述至少一个预设聚类维度对应的聚类结果; 采用凝聚式层次聚类分析算法对所述至少一个聚类结果进行处理得到所述目标聚类 结果, 以使所述目标聚类结果的数量和所述至少一个预设聚类维度的数量相对应。 4.根据权利要求1所述的方法, 其特 征在于, 在接入目标 数据源之前, 还 包括: 获取在聚类维度配置界面确定的至少一个预设聚类维度, 并构建和所述至少一个预设 聚类维度对应的网络模型。 5.根据权利要求1所述的方法, 其特征在于, 所述针对所述目标聚类结果, 调用与当前 目标聚类结果相对应的目标网络模型对所述当前目标聚类结果所对应的聚类数据进行处 理, 以得到所述当前目标聚类结果的目标 特征信息, 包括: 根据所述目标聚类结果的标识信 息匹配对应的网络模型, 将所述标识信 息相同的网络 模型作为所述目标网络模型; 其中, 所述标识信息和所述预设聚类维度相对应; 基于所述目标网络模型对所述目标聚类结果进行 特征提取, 得到所述目标 特征信息。 6.根据权利要求1所述的方法, 其特征在于, 在根据 预先设置的预测维度对各目标聚类 结果所对应的目标 特征信息进行处 理, 确定目标 预测结果, 包括: 将所述目标预测结果分配到对应的目标用户, 以使所述目标用户根据 所述目标预测结 果进行数据审计。 7.根据权利要求4所述的方法, 所述构建和所述至少一个预设聚类维度对应的网络模 型, 包括: 获取至少一个第一训练样本; 其中, 所述第一训练样本中包括和所述预设维度相对应 的第一原 始数据、 理论特 征信息; 针对各训练样本, 将当前训练样本中的第一原始数据输入至待训练网络模型中, 得到权 利 要 求 书 1/2 页 2 CN 115249043 A 2与所述当前训练样本相对应的实际特 征信息; 基于所述实 际特征信息和所述理论特征信息, 确定损 失值, 以基于所述损 失值对所述 待训练网络模型中的模型参数进行修 正; 将所述待训练网络模型中的损失函数收敛作为训练目标, 得到所述网络模型。 8.一种数据分析装置, 其特 征在于, 包括: 数据接入模块, 用于接入目标数据源, 并读取所述目标数据源中的待处理数据, 其中, 所述目标 数据源对应不同类型的数据存 储系统; 聚类模块, 用于根据至少一个预设聚类维度对待处理数据进行聚类处理, 得到和所述 至少一个预设聚类维度相对应的目标聚类结果, 其中, 所述 目标聚类结果中包含和聚类维 度对应的数据; 特征提取模块, 用于针对所述目标聚类结果, 调用与当前目标聚类结果相对应的目标 网络模型对所述当前目标聚类结果所对应的聚类数据进行 处理, 以得到所述当前目标聚类 结果的目标 特征信息; 预测模块, 用于根据 预先设置的预测维度对各目标聚类结果所对应的目标特征信 息进 行处理, 确定目标 预测结果。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 一个或多个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 数据分析 方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的数据分析 方法。权 利 要 求 书 2/2 页 3 CN 115249043 A 3
专利 数据分析方法、装置、电子设备及存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:36:28
上传分享
举报
下载
原文档
(500.6 KB)
分享
友情链接
GB-T 37526-2019 太阳能资源评估方法.pdf
GB-T 15918-2010 海洋学综合术语.pdf
GB-T 16433-2009 残疾人田径运动员医学和功能分级.pdf
GM-T 0125.1-2022 JSON Web 密码应用语法规范 第1部分:算法标识.pdf
GB 4943.1-2022 音视频、信息技术和通信技术设备 第1部门 安全要求.pdf
MH-T 1020-2018 锂电池航空运输规范.pdf
信通院 数据安全风险分析及应对策略研究-2022年.pdf
民航 JJF(民航)0100-2008 C21001型冷却系统测试仪.pdf
T-CWA 211—2022 水性非固化橡胶沥青防水涂料.pdf
T-GDYLSH 001—2021 养老机构认知症老年人生活照顾指南.pdf
GM-T 0006-2012 密码应用标识规范.pdf
GB-T 42002-2022 跨境电子商务交易类产品信息多语种描述 智能手机.pdf
商用密码管理条例.pdf
GB-T 22739-2008 地理标志产品 建莲.pdf
WS-T 792-2021 日本血吸虫抗体检测标准 酶联免疫吸附试验法.pdf
GB-T 34680.1-2017 智慧城市评价模型及基础评价指标体系 第1部分:总体框架及分项评价指标制定的要求.pdf
GM-T 0023-2014 IPSec VPN网关产品规范.pdf
GB-T 42078-2022 化工园区开发建设导则.pdf
GB-T 18884.1-2015 家用厨房设备 第1部份:术语.pdf
ISO 17987-2-2016.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(500.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。