(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210929907.0 (22)申请日 2022.08.04 (71)申请人 上海钐昆网络科技有限公司 地址 201201 上海市浦东 新区上丰路6 33号 6幢一层810 01室 (72)发明人 武晋琦  (74)专利代理 机构 北京东方亿 思知识产权代理 有限责任公司 1 1258 专利代理师 彭琼 (51)Int.Cl. G06F 16/9535(2019.01) G06K 9/62(2022.01) (54)发明名称 一种分类方法、 装置、 设备及存 储介质 (57)摘要 本发明公开了一种分类方法、 装置、 设备及 存储介质, 该方法包括: 获取待分类用户的特征 标签对应的用户特征数据; 将所述用户特征数据 分别输入到多个 分类模型中的每个 分类模型中, 得到每个所述分类模型计算的概率; 计算多个所 述概率的平均值; 根据所述平均值确定所述待分 类用户的所属类别; 其中, 每个所述分类模型是 基于训练样本中部分特征标签对应的用户特征 数据进行训练得到的。 本发明实施例提供的分类 方法能够提高将用户分类的准确性。 权利要求书2页 说明书10页 附图3页 CN 114996590 A 2022.09.02 CN 114996590 A 1.一种分类方法, 其特 征在于, 所述方法包括: 获取待分类用户的特 征标签对应的用户特 征数据; 将所述用户特征数据分别输入到多个分类模型中的每个分类模型中, 得到每个所述分 类模型计算的概 率; 计算多个所述 概率的平均值; 根据所述平均值确定所述待分类用户的所属类别; 其中, 每个所述分类模型是基于训练样本中部分特征标签对应的用户特征数据进行训 练得到的; 训练每 个所述分类模型时采用的所述部分特 征标签不完全相同; 每个所述分类模型的训练过程包括: 获取M个第一样本和N个第二样本, 所述第一样本 包括已分类用户的类别标签和所述特征标签对应的用户特征数据, 所述第二样本包括未分 类用户的所述特 征标签对应的用户特 征数据; 将所述M个第一样本的用户特征数据和所述N个第二样本的用户特征数据拼接, 得到P 个训练样本集; 针对多个待训练分类模型中的每 个待训练分类模型, 分别执 行以下步骤: 根据所述待训练分类模型对应的训练样本集, 采用部分特征标签训练所述待训练分类 模型, 得到所述分类模型; 其中, M为大于 0的正整数, N 为大于M的正整数, P为大于 0的正整数。 2.根据权利要求1所述的方法, 其特征在于, 所述待训练分类模型包括待训练决策树分 类模型; 所述分类模型包括决策树分类模型。 3.根据权利要求1或2所述的方法, 其特征在于, 在所述获取M个第一样本和N个第二样 本之前, 所述方法还 包括: 获取多个第 一初始样本和多个第 二初始样本, 所述第 一初始样本包括所述已分类用户 的所述类别标签和用户特征数据, 所述第二初始样本包括所述未分类用户的用户特征数 据; 将多个所述第 一初始样本和多个所述第 二初始样本 中的用户特征数据归类, 得到多个 所述特征标签; 将所述第一初始样本中所述已分类用户的所述类别标签和所述特征标签对应的用户 特征数据作为所述第一样本; 将所述第二初始样本中所述未分类用户的所述特征标签对应的用户特征数据作为所 述第二样本; 其中, 每个特征标签对应一种用户特 征数据。 4.根据权利要求1所述的方法, 其特征在于, 所述根据平均值确定所述待分类用户的所 属类别, 具体包括: 将所述平均值与预设阈值进行比较; 当所述平均值大于所述预设阈值时, 确定所述待分类用户属于目标用户。 5.一种分类装置, 其特 征在于, 所述装置包括: 第一获取模块, 用于获取待分类用户的特 征标签对应的用户特 征数据; 第一计算模块, 用于将所述用户特征数据分别输入到多个分类模型中的每个分类模型权 利 要 求 书 1/2 页 2 CN 114996590 A 2中, 得到每 个所述分类模型计算的概 率; 第二计算模块, 用于计算多个所述 概率的平均值; 确定模块, 用于根据所述平均值确定所述待分类用户的所属类别; 其中, 每个所述分类模型是基于训练样本中部分特征标签对应的用户特征数据进行训 练得到的; 训练每 个所述分类模型时采用的所述部分特 征标签不完全相同; 每个所述分类模型的训练过程包括: 第二获取模块, 用于获取M个第一样本和N个第二 样本, 所述第一样本包括已分类用户的类别标签和所述特征标签对应的用户特征数据, 所 述第二样本包括未分类用户的所述特 征标签对应的用户特 征数据; 拼接模块, 用于将所述M个第 一样本的用户特征数据和所述N个第二样本的用户特征数 据拼接, 得到P个训练样本集; 训练模块, 用于针对多个待训练分类模型中的每个待训练分类模型, 分别执行以下步 骤: 根据所述待训练分类模型对应的训练样本集训练所述待训练分类模型, 得到所述分类 模型; 其中, M为大于 0的正整数, N 为大于M的正整数, P为大于 0的正整数。 6.根据权利要求5所述的装置, 其特征在于, 所述待训练分类模型包括待训练决策树分 类模型; 所述分类模型包括决策树分类模型。 7.一种电子设备, 其特征在于, 所述设备包括: 处理器以及存储有计算机程序指令的存 储器; 所述处理器执行所述计算机程序指令时实现如权利要求1 ‑4任意一项所述的分类方 法。 8.一种计算机存储介质, 其特征在于, 所述计算机存储介质上存储有计算机程序指令, 所述计算机程序指令被处 理器执行时实现如权利要求1 ‑4任意一项所述的分类方法。权 利 要 求 书 2/2 页 3 CN 114996590 A 3

.PDF文档 专利 一种分类方法、装置、设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种分类方法、装置、设备及存储介质 第 1 页 专利 一种分类方法、装置、设备及存储介质 第 2 页 专利 一种分类方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:32:31上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。