国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210929907.0 (22)申请日 2022.08.04 (71)申请人 上海钐昆网络科技有限公司 地址 201201 上海市浦东 新区上丰路6 33号 6幢一层810 01室 (72)发明人 武晋琦 (74)专利代理 机构 北京东方亿 思知识产权代理 有限责任公司 1 1258 专利代理师 彭琼 (51)Int.Cl. G06F 16/9535(2019.01) G06K 9/62(2022.01) (54)发明名称 一种分类方法、 装置、 设备及存 储介质 (57)摘要 本发明公开了一种分类方法、 装置、 设备及 存储介质, 该方法包括: 获取待分类用户的特征 标签对应的用户特征数据; 将所述用户特征数据 分别输入到多个 分类模型中的每个 分类模型中, 得到每个所述分类模型计算的概率; 计算多个所 述概率的平均值; 根据所述平均值确定所述待分 类用户的所属类别; 其中, 每个所述分类模型是 基于训练样本中部分特征标签对应的用户特征 数据进行训练得到的。 本发明实施例提供的分类 方法能够提高将用户分类的准确性。 权利要求书2页 说明书10页 附图3页 CN 114996590 A 2022.09.02 CN 114996590 A 1.一种分类方法, 其特 征在于, 所述方法包括: 获取待分类用户的特 征标签对应的用户特 征数据; 将所述用户特征数据分别输入到多个分类模型中的每个分类模型中, 得到每个所述分 类模型计算的概 率; 计算多个所述 概率的平均值; 根据所述平均值确定所述待分类用户的所属类别; 其中, 每个所述分类模型是基于训练样本中部分特征标签对应的用户特征数据进行训 练得到的; 训练每 个所述分类模型时采用的所述部分特 征标签不完全相同; 每个所述分类模型的训练过程包括: 获取M个第一样本和N个第二样本, 所述第一样本 包括已分类用户的类别标签和所述特征标签对应的用户特征数据, 所述第二样本包括未分 类用户的所述特 征标签对应的用户特 征数据; 将所述M个第一样本的用户特征数据和所述N个第二样本的用户特征数据拼接, 得到P 个训练样本集; 针对多个待训练分类模型中的每 个待训练分类模型, 分别执 行以下步骤: 根据所述待训练分类模型对应的训练样本集, 采用部分特征标签训练所述待训练分类 模型, 得到所述分类模型; 其中, M为大于 0的正整数, N 为大于M的正整数, P为大于 0的正整数。 2.根据权利要求1所述的方法, 其特征在于, 所述待训练分类模型包括待训练决策树分 类模型; 所述分类模型包括决策树分类模型。 3.根据权利要求1或2所述的方法, 其特征在于, 在所述获取M个第一样本和N个第二样 本之前, 所述方法还 包括: 获取多个第 一初始样本和多个第 二初始样本, 所述第 一初始样本包括所述已分类用户 的所述类别标签和用户特征数据, 所述第二初始样本包括所述未分类用户的用户特征数 据; 将多个所述第 一初始样本和多个所述第 二初始样本 中的用户特征数据归类, 得到多个 所述特征标签; 将所述第一初始样本中所述已分类用户的所述类别标签和所述特征标签对应的用户 特征数据作为所述第一样本; 将所述第二初始样本中所述未分类用户的所述特征标签对应的用户特征数据作为所 述第二样本; 其中, 每个特征标签对应一种用户特 征数据。 4.根据权利要求1所述的方法, 其特征在于, 所述根据平均值确定所述待分类用户的所 属类别, 具体包括: 将所述平均值与预设阈值进行比较; 当所述平均值大于所述预设阈值时, 确定所述待分类用户属于目标用户。 5.一种分类装置, 其特 征在于, 所述装置包括: 第一获取模块, 用于获取待分类用户的特 征标签对应的用户特 征数据; 第一计算模块, 用于将所述用户特征数据分别输入到多个分类模型中的每个分类模型权 利 要 求 书 1/2 页 2 CN 114996590 A 2中, 得到每 个所述分类模型计算的概 率; 第二计算模块, 用于计算多个所述 概率的平均值; 确定模块, 用于根据所述平均值确定所述待分类用户的所属类别; 其中, 每个所述分类模型是基于训练样本中部分特征标签对应的用户特征数据进行训 练得到的; 训练每 个所述分类模型时采用的所述部分特 征标签不完全相同; 每个所述分类模型的训练过程包括: 第二获取模块, 用于获取M个第一样本和N个第二 样本, 所述第一样本包括已分类用户的类别标签和所述特征标签对应的用户特征数据, 所 述第二样本包括未分类用户的所述特 征标签对应的用户特 征数据; 拼接模块, 用于将所述M个第 一样本的用户特征数据和所述N个第二样本的用户特征数 据拼接, 得到P个训练样本集; 训练模块, 用于针对多个待训练分类模型中的每个待训练分类模型, 分别执行以下步 骤: 根据所述待训练分类模型对应的训练样本集训练所述待训练分类模型, 得到所述分类 模型; 其中, M为大于 0的正整数, N 为大于M的正整数, P为大于 0的正整数。 6.根据权利要求5所述的装置, 其特征在于, 所述待训练分类模型包括待训练决策树分 类模型; 所述分类模型包括决策树分类模型。 7.一种电子设备, 其特征在于, 所述设备包括: 处理器以及存储有计算机程序指令的存 储器; 所述处理器执行所述计算机程序指令时实现如权利要求1 ‑4任意一项所述的分类方 法。 8.一种计算机存储介质, 其特征在于, 所述计算机存储介质上存储有计算机程序指令, 所述计算机程序指令被处 理器执行时实现如权利要求1 ‑4任意一项所述的分类方法。权 利 要 求 书 2/2 页 3 CN 114996590 A 3
专利 一种分类方法、装置、设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:32:31
上传分享
举报
下载
原文档
(456.2 KB)
分享
友情链接
GB-T 411-2017 棉印染布.pdf
DB13-T 5617-2022 精细化工反应安全风险评估导则 河北省.pdf
信通院 数据治理研究报告-2020年——培育数据要素市场路线图.pdf
NIST 改善关键基础设施的网络安全框架 数据法盟翻译 2020.pdf
GB-T 41800-2022 信息技术 传感器网络 爆炸危险化学品贮存安全监测系统技术要求.pdf
GB-T 17396-2022 液压支柱用热轧无缝钢管.pdf
T-CEC 719—2022 电力科技成果评价规范.pdf
DB3201-T 1125-2022 党政机关单位大型固定资产设施设备运维服务管理规范 南京市.pdf
GB-T 33857-2017 节能评估技术导则 热电联产项目.pdf
T-ZZB 0602—2018 环保节能舒适型冷风扇.pdf
GB-T 36959-2018 信息安全技术 网络安全等级保护测评机构能力要求和评估规范.pdf
专利 一种知识图谱更新方法、装置、设备及存储介质.PDF
个人信息保护与数据合规法律汇编V3.0-垦丁王捷律师团队-KINDING-202212.pdf
T-CXZCX 001—2023 餐饮外卖一次性密封规范.pdf
GB-T 32815-2016 硅基MEMS制造技术 体硅压阻加工工艺规范.pdf
GB-T 30297-2013 氯碱工业用全氟离子交换膜 应用规范.pdf
GB-T 39044-2020 政务服务平台接入规范.pdf
阿里云 专有云敏捷版云原生PaaS场景 阿里云企业级容器平台AECP 产品文档 2021.pdf
GB-T 33319-2016 塑料 聚乙烯 PE 透气膜专用料.pdf
百度安全 大模型安全解决方案白皮书 2023.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(456.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。