(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210885900.3 (22)申请日 2022.07.26 (71)申请人 北京永信至诚科技股份有限公司 地址 100094 北京市海淀区丰豪东路9号院 6号楼 申请人 北京永信火眼科技有限公司 (72)发明人 蔡晶晶 张雪峰 陈俊 康传鹏  于秋梅  (74)专利代理 机构 北京知呱 呱知识产权代理有 限公司 1 1577 专利代理师 郑兴旺 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9537(2019.01) G06F 16/955(2019.01) (54)发明名称 基于多维权重模型的重点线索推荐方法及 系统 (57)摘要 基于多维权重模型的重点线索推荐方法及 系统, 通过利用URL规则库标识 的网络异常活动 数据, 提取影响人员重要程度的特征, 形成特征 池; 以预设单位时间基准将预设时间段拆分得到 多元时间序列; 将预设时间段的特征数据按照所 述多元时间序列截断分组, 得到多元时间序列数 据; 预设不同拆分维度的时间序列的敏感系数, 通过多元时间序列数据计算不同拆分维度的时 间序列的敏感系数; 预设不同特征数据的权重 值, 通过不同特征数据的权重设定和不同拆分维 度的时间序列的敏感系数进行推荐算法设计, 采 用推荐算法将综合指数在预设范围内的人员作 为高危人员。 本发明通过对异常数据的分析可以 推荐高危人员, 有益于相关部门的业 务处理。 权利要求书3页 说明书17页 附图3页 CN 115146174 A 2022.10.04 CN 115146174 A 1.基于多维权 重模型的重点线索推荐方法, 其特 征在于, 包括: 利用URL规则库标识的网络异常活动数据, 提取影响人员重要程度的特征, 形成特征 池; 以预设单位时间基准将预设时间段拆分得到多元时间序列; 将预设时间段的特 征数据按照所述多元时间序列截断分组, 得到多元时间序列数据; 预设不同拆分维度的时间序列的敏感系数, 通过多元时间序列 数据计算不同拆分维度 的时间序列的敏感系数; 预设不同特征数据的权重值, 通过不同特征数据的权重设定和不同拆分维度的时间序 列的敏感系数进 行推荐算法设计, 采用推荐算法将综合指数在预设范围内的人员作为高危 人员。 2.根据权利要求1所述的基于多维权重模型的重点线索推荐方法, 其特征在于, 特征池 的特征数据包括: 访问时间、 地理位置、 数据来源、 网站类型、 网站性质、 网站类别、 网址类 型、 行为操作和接入类型。 3.根据权利要求2所述的基于多维权重模型的重点线索推荐方法, 其特征在于, 所述预 设时间段为所述预设单位时间基准的倍数; 所述预设时间段的时长小于一天的时长, 且一 天的时长为预设时间段时长的倍数; 根据预设单位时间基准, 将预设时间段拆分作为一组多元时间序列; 将一天的特征数 据依次按照预设时间段进行分组, 得到多个分组的多元时间序列数据。 4.根据权利要求3所述的基于多维权重模型的重点线索推荐方法, 其特征在于, 所述预 设单位时间基准 为3分钟, 所述预设时间段为3 0分钟; 不同拆分维度包括3分钟、 6分钟、 9 分钟、 12分钟、 15分钟、 18分钟、 21分钟、 24分钟、 27分 钟、 30分钟; 不同拆分维度的敏感系数依次为: k1、 k2、 k3、 k 4、 k5、 k6、 k7、 k8、 k9、 k10 。 5.根据权利要求4所述的基于多维权重模型的重点线索推荐方法, 其特征在于, 计算每 个多元时间序列的敏感系数步骤 包括: 计算第一组不同拆分维度的时间序列的敏感系数: 进行第一组第一个3分钟内时间序 列数据计算; 进行第一组第二个3分钟内时间序列数据计算; 直至完成第一组第十个3分钟 内多元时间序列数据计算; 计算第二组不同拆分维度的时间序列的敏感系数, 进行第二组第一个3分钟内时间序 列数据计算; 进行第二组第二个3分钟内时间序列数据计算; 直至完成第二组第十个3分钟 内多元时间序列数据计算; 依次计算, 直至 完成预设天数内特 征数据的不同拆分维度的时间序列对应敏感系数。 6.根据权利要求5所述的基于多维权重模型的重点线索推荐方法, 其特征在于, 利用1 天内48组多元时间序列数据, 以3分钟、 6分钟、 9分钟、 12分钟、 15分钟、 18分钟、 21分钟、 24分 钟、 27分钟、 30分钟10个时间序列为拆分维度, 分别比较每个相同时间序列内的敏感系数出 现的次数, 若敏感系 数出现次数占80%以上, 则将对应出现次数高的敏感系数作为对应的 时间序列敏感系数。 7.根据权利要求6所述的基于多维权重模型的重点线索推荐方法, 其特征在于, 推荐算 法设计步骤 包括:权 利 要 求 书 1/3 页 2 CN 115146174 A 2场景系数: 单独受不同拆分维度时间序列影响的场景, 场景系数=敏感系数; 单独受位置影响的场景, 场景系数=预设的位置系数; 受时间和位置双重影响的场景, 场景系数=敏感系数+位置系数。 8.根据权利要求7所述的基于多维权重模型的重点线索推荐方法, 其特征在于, 不同特 征数据的权 重值为: 网站权重: 基于网站性质、 网站类别、 网站类型计算得到; 事件权重: 基于网站权 重、 行为操作、 网址类型、 数据来源计算得到; 人员权重: 受访 问时间、 地理位置、 接入类型特征影响, 分别计算不同场景对应的事件 权重指数, 汇总得到个人的综合指数; 根据个人的综合指数进行高危人员的推荐。 9.基于多维权 重模型的重点线索推荐系统, 其特 征在于, 包括: 特征池创建模块, 用于利用URL规则库标识的网络异常活动数据, 提取影响人员重要程 度的特征, 形成特 征池; 多元时间序列获取模块, 用于以预设单位 时间基准将预设时间段拆分得到多元时间序 列; 数据配置模块, 用于将预设时间段的特征数据按照所述多元时间序列截断分组, 得到 多元时间序列数据; 敏感系数处理模块, 用于预设不同拆分维度的时间序列的敏感系数, 通过多元时间序 列数据计算 不同拆分维度的时间序列的敏感系数; 高危人员 推荐模块, 用于预设不同特征数据的权重值, 通过不同特征数据的权重设定 和不同拆分维度的时间序列的敏感系数进 行推荐算法设计, 采用推荐算法将综合指数在预 设范围内的人员作为高危人员。 10.根据权利要求9所述的基于多维权重模型的重点线索推荐系统, 其特征在于, 所述 特征池创建模块中: 特征池的特征数据包括: 访问时间、 地理位置、 数据来源、 网站类型、 网站性质、 网站类 别、 网址类型、 行为操作和接入类型; 所述多元时间序列获取模块中: 所述预设时间段为所述预设单位 时间基准的倍数; 所述预设时间段的时长小于一天的 时长, 且一天的时长为预设时间段时长的倍数; 根据预设单位时间基准, 将预设时间段拆分作为一组多元时间序列; 将一天的特征数 据依次按照预设时间段进行分组, 得到多个分组的多元时间序列数据; 所述敏感系数处 理模块中: 不同拆分维度包括3分钟、 6分钟、 9 分钟、 12分钟、 15分钟、 18分钟、 21分钟、 24分钟、 27分 钟、 30分钟; 不同拆分维度的敏感系数依次为: k1、 k2、 k3、 k 4、 k5、 k6、 k7、 k8、 k9、 k10; 通过所述敏感系数处理模块, 计算第一组不同拆分维度的时间序列的敏感系数: 进行 第一组第一个3分钟内时间序列数据计算; 进行第一组第二个3分钟内时间序列数据计算; 直至完成第一组第十个3分钟内多元时间序列数据计算; 计算第二组同拆分维度的时间序 列的敏感系 数, 进行第二组第一个3分钟内时间序列数据计算; 进行第二组第二个3分钟内权 利 要 求 书 2/3 页 3 CN 115146174 A 3

.PDF文档 专利 基于多维权重模型的重点线索推荐方法及系统

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多维权重模型的重点线索推荐方法及系统 第 1 页 专利 基于多维权重模型的重点线索推荐方法及系统 第 2 页 专利 基于多维权重模型的重点线索推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:35:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。