(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202110904327.1 (22)申请日 2021.08.0 6 (65)同一申请的已公布的文献号 申请公布号 CN 113515896 A (43)申请公布日 2021.10.19 (73)专利权人 红云红河烟草 (集团) 有限责任公 司 地址 650231 云南省昆明市五华区红锦路 367号 (72)发明人 李达 许仁杰 袁湘云 刘智宇  马洁 葛文  (74)专利代理 机构 北京维澳专利代理有限公司 11252 专利代理师 常小溪 (51)Int.Cl. G06F 30/27(2020.01) G06Q 50/04(2012.01) G06Q 10/04(2012.01) (56)对比文件 CN 112580682 A,2021.0 3.30 CN 111080009 A,2020.04.28 CN 110225100 A,2019.09.10 CN 109960146 A,2019.07.02CN 112817954 A,2021.0 5.18 CN 106022521 A,2016.10.12 CN 111461328 A,2020.07.28 CN 1098152 23 A,2019.0 5.28 CN 10916 5664 A,2019.01.08 US 2019286990 A1,2019.09.19 CN 112612819 A,2021.04.0 6 CN 107193876 A,2017.09.2 2 CN 10727342 9 A,2017.10.20 CN 110457867 A,2019.1 1.15 CN 101888087 A,2010.1 1.17 CN 111046027 A,2020.04.21 US 20132620 59 A1,2013.10.0 3 CN 102496 077 A,2012.0 6.13 CN 10710 3394 A,2017.08.2 9 US 2017372 224 A1,2017.12.28 CN 112906882 A,2021.0 6.04 US 2019384790 A1,2019.12.19 US 2018375743 A1,2018.12.27 CN 113177448 A,2021.07.27 孔钦.大数据下数据预处 理方法研究. 《计算 机技术与发展》 .2018,第28卷(第5期), (续) 审查员 何适 (54)发明名称 用于卷烟实时数采的数据缺失值 填充方法 (57)摘要 本发明公开了一种用于卷烟实时数采的数 据缺失值填充方法, 本发明的设计构思在于, 通 过大数据统计分析, 以机器学习的方式, 对实时 数采数据的缺失值进行自动填充, 结合自学习模 型, 将数采数据对应的预测值填入至缺失位置, 并检测填充的缺失值是否在预测值的置信区间 范围内。 在此过程中, 动态根据实际数据情况进 行更新和迭代。 本发明解决了卷烟工业现场干扰 噪声信号影 响的问题, 实现了实时数采 数据缺失 值的自动填充, 在确保控制精度的同时, 并能保证信息系统分析 结果的正确性、 准确性。 [转续页] 权利要求书1页 说明书3页 附图1页 CN 113515896 B 2022.08.09 CN 113515896 B (56)对比文件 陈娟.缺失值 填补效果: 机 器学习与统计学 习的比较. 《统计与决策》 .2020,(第17期), 潘立强.传感器网络中一种基 于时-空相关性的缺失值估计方法. 《计算机学报》 .2010,第3 3 卷(第1期), 熊中敏.缺失数据处 理方法研究综述. 《计算 机工程与应用》 .2021,(第14期),2/2 页 2[接上页] CN 113515896 B1.一种用于卷烟实时数采的数据缺失值 填充方法, 其特 征在于, 包括: 在进行实时数据采集过程中, 当检测到数据缺失时, 根据已采集的数据以及预先构建 的预测模型, 预测出缺失的待填入数据; 根据预设的置信区间, 校验所述待填入数据是否有效; 若有效, 则将待填入数据补进实时数采数据的缺失位置; 其中, 所述预测模型的构建方式包括: 按照数据采样频率、 数据结构、 数据字段划分为若干个分组, 并根据品牌、 批次、 工序 段 对所述分组进行分类及汇总; 检索并获取历史生产数据; 根据已确定的若干分组对所述历史生产数据进行整理, 并向对应分组中导入所述历史 生产数据得到样本集, 所述历史生产数据包 含原始的数采数据; 将所述样本集中的数据与真实生产情况进行关联, 得到数据分布特 征及映射特 征; 根据所述样本集中的数据、 所述数据分布特征以及所述映射特征训练所述预测模型, 使所述预测模型输出 预测期望值。 2.根据权利要求1所述的用于卷烟实时数采的数据缺失值填充方法, 其特征在于, 所述 预测模型被配置为: 具有基于现场实际数据以及算法仿 真数据所形成的虚实映射自学习机 制。 3.根据权利要求1所述的用于卷烟实时数采的数据缺失值填充方法, 其特征在于, 所述 方法还包括: 在数采过程中, 根据实际数据情况动态更新并迭代所述预测模型的参数。 4.根据权利要求3所述的用于卷烟实时数采的数据缺失值填充方法, 其特征在于, 所述 根据实际数据情况动态更新并迭代所述预测模型 的参数包括: 根据卷烟原料等级、 环境温 湿度数据, 并结合当前生产对应的牌号、 批次号以及涉及的设备参数, 持续训练并优化所述 预测模型的参数。 5.根据权利要求1所述的用于卷烟实时数采的数据缺失值填充方法, 其特征在于, 在所 述预测模型 的训练阶段, 将预先设定的置信区间作为输入, 使所述预测模型输出符合置信 区间的预测期望值。权 利 要 求 书 1/1 页 2 CN 113515896 B 3

.PDF文档 专利 用于卷烟实时数采的数据缺失值填充方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于卷烟实时数采的数据缺失值填充方法 第 1 页 专利 用于卷烟实时数采的数据缺失值填充方法 第 2 页 专利 用于卷烟实时数采的数据缺失值填充方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:57:44上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。