(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111068515.1 (22)申请日 2021.09.13 (71)申请人 江苏海洋大学 地址 222000 江苏省连云港市海州区苍梧 路59号 (72)发明人 孙佳龙 颜永豪 赵思聪 吉方正  朱国豪 王晓 田慧娟 于浩  夏天钰 王秋雅 骆剑波 袁淑婷  蔡靖慧  (74)专利代理 机构 连云港权策知识产权代理事 务所(特殊普通 合伙) 3239 9 代理人 何文豪 (51)Int.Cl. G06K 9/62(2022.01) G06F 30/27(2020.01)G06F 16/29(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 10/04(2012.01) G06Q 50/26(2012.01) G06F 111/10(2020.01) (54)发明名称 一种基于relieff特征选择和BP_Adaboost 算法的经济 状况不佳家 庭预测分类模型 (57)摘要 本发明公开了一种基于relieff特征选 择和 BP_Adaboo st算法的经济状 况不佳家庭预测分类 模型, 包括如下步骤: 对 数据集进行预处理、 对数 据集进行划分、 将训练集的数据代入到相应的算 法中建立数学模 型、 把测试集中的数据通过建立 好的数据模 型进行分类预测、 将数据模型预测的 结果与真实标签相比较, 根据模 型评估方法及原 则对各个模 型进行评估; 本发明为工作者提供一 个可视化的展示平台, 让工作者清晰的了解到各 个村镇的经济状况不佳家庭的教育水平、 务工情 况、 劳动力水平、 健康状况、 家庭住房情况等信 息, 通过及时走访调查来遏制情况的恶化, 系统 结合GIS展示出到地图上, 并与图表信息联动, 可 以清晰的了解到整体局势, 避免大规模经济状况 不佳反复的情况发生。 权利要求书2页 说明书8页 附图4页 CN 114429167 A 2022.05.03 CN 114429167 A 1.一种基于relieff特征选择和BP_Adaboost算法的经济状况不佳家庭预测分类模型, 其特征在于, 包括如下步骤: S1: 对数据集进行 预处理: (1)特征选取: 选取家庭人口、 教育情况、 健康状况、 劳动力、 工作情况、 年均收入、 人均 住房以及人均耕地的特 征属性作为机器学习数据集的特 征向量使用; (2)过滤异常: 针对上述数据集中存在的一些离群点, 找出并踢除在采集过程中出现的 缺失、 异常问题的数据; (3)特征编码: 对统计数据特征为文本的数据进行标签编码, 将其转换为机器学习训练 使用的特 征向量; S2: 对数据集进行划分: 将S1数据集中连续的两个数据按照各占百分之五十分别放入 训练集和 测试集; S3: 将训练集的数据代入到相应的算法中建立数 学模型: (1)数据选择和网络初始化: 数据集中选出m组数据来作为分类器的训练数据, 对测试 数据集的分布权值进行初始化, 将权值设置为Dt(i)=1/m, 根据数据集 的输入及输出维度 定下网络的结构, 完成以上步骤后, 对BP神经网络 权值和阈值进行初始化; (2)弱分类器预测: 在模型建立的过程中需要通过BP神经网络训练出数个弱分类器, 假 设第t个弱分类 器的预测序列为g(t), 其 误差为et, 计算公式如式(1.1)所示: e=∑iD(i) i=1, 2, ..., m(g(t)≠y)     (1.1) (3)计算预测序列权 重: 权重αt可以通过 预测结果的误差et通过式(1.2)求得: (4)测试数据权重调整: 由第(3)步中求得的权重来对训练样本集的权重进行更新, 更 新的公式如式(1.3)所示: (5)强分类函数: 当分类器经过一定轮数的训练之后会得到若干组分类器, 设T轮T组的 分类函数为f(gt, at), 将所有的弱分类函数进行组合后可得到强分类函数h(x), 公式如式 (1.4)所示: (6)更新样本权重: 设R为ReliefF算法从经济状况不佳家庭数据训练集中随机选择出 的样本, ReliefF算法会从与 R类型相同的样本之中再找出其最近邻的样本H, 再从与R是不 同类型的样本中找出其最近邻的样本M, 更新每个样本的权重, 设diff(A, R1, R2)为在样本 R2特征A上的差, 计算方式如式(1.5)所示: 那么更新权 重W(A)的计算公式为式(1.6)所示:权 利 要 求 书 1/2 页 2 CN 114429167 A 2其中, 在式(1.1)中, g(t)表示预测分类结果, y表示期望分类结果, 在式(1.3)中Bt表示 归一化因子, 其作用是保证权重比例不变的前提下, 分布权值的和 为1, 式(1.6)中Mj(C)表 示类C中的第j个最邻近样本; S4: 把测试集中的数据通过建立 好的数据模型进行分类预测: S5: 将数据模型预测的结果与真实标签相比较, 根据模型评估方法及原则对各个模型 进行评估。 2.根据权利要求1所述的基于relieff特征选择和BP_Adaboost算法的经济状况不佳家 庭预测分类模型, 其特征在于: 基于relieff特征选择和BP_Adaboost算法的经济状况不佳 家庭预测分类模型设计脱离经济状况不佳状态的监测系统。 3.根据权利要求2所述的基于relieff特征选择和BP_Adaboost算法的经济状况不佳家 庭预测分类模型, 其特征在于: 所述脱离经济状况不佳状态的监测系统采用三层架构, 包括 表现层(UI)、 应用层(BL L)、 数据访问层。 4.根据权利要求3所述的基于relieff特征选择和BP_Adaboost算法的经济状况不佳家 庭预测分类模型, 其特征在于: 所述脱离经济状况不佳状态的监测系统功能模块包括数据 管理、 脱离经济状况不佳状态的策略、 分析 预测。权 利 要 求 书 2/2 页 3 CN 114429167 A 3

.PDF文档 专利 一种基于relieff特征选择和BP_Adaboost算法的经济状况不佳家庭预测分类模型

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于relieff特征选择和BP_Adaboost算法的经济状况不佳家庭预测分类模型 第 1 页 专利 一种基于relieff特征选择和BP_Adaboost算法的经济状况不佳家庭预测分类模型 第 2 页 专利 一种基于relieff特征选择和BP_Adaboost算法的经济状况不佳家庭预测分类模型 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:53:30上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。