(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211172330.X
(22)申请日 2022.09.26
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦二层
(72)发明人 李任鹏
(74)专利代理 机构 北京清亦华知识产权代理事
务所(普通 合伙) 11201
专利代理师 张润
(51)Int.Cl.
H04L 9/40(2022.01)
H04L 43/04(2022.01)
H04L 43/0876(2022.01)
(54)发明名称
流量检测方法、 装置、 电子设备和存 储介质
(57)摘要
本公开提供了一种流量检测方法、 装置、 电
子设备和存储介质, 涉及互联网、 大数据等计算
机技术领域。 具体实现方案为: 获取待检测的业
务流量数据、 对应的检测维度以及统计指标; 确
定检测维度的多个维度值并确定统计指标的多
个指标值; 基于多个维度值以及多个指标值, 对
业务流量数据进行聚合, 得到各维度值在多个指
标值下的流量分布数据; 确定各维度值在多个指
标值下的流量分布数据之间的相关度, 并基于相
关度确定业务流量数据中的目标业务流量数据。
由此, 实现了从待检测的业务流量数据中检测出
存在异常的目标业务流量数据, 且通用性强, 复
杂度低, 检测效率高。
权利要求书4页 说明书20页 附图5页
CN 115499231 A
2022.12.20
CN 115499231 A
1.一种流 量检测方法, 其中, 所述方法包括:
获取待检测的业 务流量数据、 对应的检测维度以及统计指标;
确定所述检测维度的多个维度值并确定所述统计指标的多个指标值;
基于所述多个维度值以及所述多个指标值, 对所述业务流量数据进行聚合, 得到各所
述维度值在所述多个指标值下的流 量分布数据;
确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度, 并基于所述相
关度确定所述 业务流量数据中的目标业 务流量数据。
2.根据权利要求1所述的方法, 其中, 所述检测维度包括 时间维度, 所述多个维度值, 包
括所述业务流量数据所属的多个时间段;
所述基于所述多个维度值以及所述多个指标值, 对所述业务流量数据进行聚合, 得到
各所述维度值在所述多个指标值下的流 量分布数据, 包括:
基于所述多个时间段以及所述多个指标值, 对所述业务流量数据进行聚合, 得到各所
述时间段在所述多个指标值下的流 量分布数据。
3.根据权利要求2所述的方法, 其中, 所述确定各所述维度值在所述多个指标值下的流
量分布数据之 间的相关度, 并基于所述相关度确定所述业务流量数据中的目标业务流量数
据, 包括:
确定所述多个时间段中的任意两个时间段在所述多个指标值下的流量分布数据之间
的相关度;
从各所述 时间段在所述多个指标值下的流量分布数据中, 确定与其它流量分布数据之
间的相关度低于第一预设阈值的目标流 量分布数据;
基于所述目标流 量分布数据, 确定所述 业务流量数据中的目标业 务流量数据。
4.根据权利要求1所述的方法, 其中, 所述检测维度包括用户维度, 所述多个维度值, 包
括所述业务流量数据所包括的多个用户标识中满足预设条件的多个候选用户标识;
所述基于所述多个维度值以及所述多个指标值, 对所述业务流量数据进行聚合, 得到
各所述维度值在所述多个指标值下的流 量分布数据, 包括:
基于多个所述候选用户标识以及所述多个指标值, 对所述业务流量数据进行聚合, 得
到各所述候选用户标识在所述多个指标值下的流 量分布数据。
5.根据权利要求4所述的方法, 其中, 所述确定各所述维度值在所述多个指标值下的流
量分布数据之 间的相关度, 并基于所述相关度确定所述业务流量数据中的目标业务流量数
据, 包括:
确定所述多个候选用户标识中的任意两个候选用户标识在所述多个指标值下的流量
分布数据之间的相关度;
基于所述任意两个候选用户标识在所述多个指标值下的流量分布数据之间的相关度,
从所述多个候选用户标识中确定用户标识集合, 其中, 所述用户标识集合中任意用户标识
与除所述任意用户标识之外的其它用户标识在所述多个指标值下的流量分布数据之间的
相关度高于第二预设阈值;
基于所述用户标识集 合, 确定所述 业务流量数据中的目标业 务流量数据。
6.根据权利要求4所述的方法, 其中, 所述多个维度值还包括指定用户标识; 所述方法
还包括:权 利 要 求 书 1/4 页
2
CN 115499231 A
2基于所述指定用户标识以及所述多个指标值, 对所述业务流量数据进行聚合, 得到所
述指定用户标识在所述多个指标值下的流 量分布数据;
所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度, 并基于所
述相关度确定所述 业务流量数据中的目标业 务流量数据, 包括:
确定所述指定用户标识与所述多个候选用户标识在所述多个指标值下的流量分布数
据之间的相关度;
从所述多个候选用户标识中确定目标用户标识, 所述目标用户标识与 所述指定用户标
识在所述多个指标值下的流 量分布数据之间的相关度高于第三预设阈值;
基于所述目标用户标识, 确定所述 业务流量数据中的目标业 务流量数据。
7.根据权利要求1 ‑6中任一项所述的方法, 其中, 所述确定所述统计指标的多个指标
值, 包括:
基于所述统计指标的多个预设指标值, 对所述业务流量数据进行聚合, 得到在多个所
述预设指标值下的流 量分布数据;
基于各所述预设指标值下的流量分布数据以及所述业务流量数据, 确定各所述预设指
标值对应的流 量覆盖率;
将对应的流量覆盖率高于第四预设阈值的多个预设指标值, 确定为所述统计指标的多
个指标值。
8.根据权利要求1 ‑6中任一项所述的方法, 其中, 所述统计指标的数量 为多个;
所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度, 并基于所
述相关度确定所述 业务流量数据中的目标业 务流量数据, 包括:
对于多个所述统计指标中的同一统计指标, 确定各所述维度值在所述同一统计指标的
多个指标值下的流 量分布数据之间的相关度;
基于各所述维度值在各所述同一统计指标的多个指标值下的流量分布数据之间的相
关度, 确定所述 业务流量数据中的目标业 务流量数据。
9.一种流 量检测装置, 其中, 所述装置包括:
获取模块, 用于获取待检测的业 务流量数据、 对应的检测维度以及统计指标;
第一确定模块, 用于确定所述检测维度的多个维度值并确定所述统计指标的多个指标
值;
聚合模块, 用于基于所述多个维度值以及所述多个指标值, 对所述业务流量数据进行
聚合, 得到各 所述维度值在所述多个指标值下的流 量分布数据;
第二确定模块, 用于确定各所述维度值在所述多个指标值下的流量分布数据之间的相
关度, 并基于所述相关度确定所述 业务流量数据中的目标业 务流量数据。
10.根据权利要求9所述的装置, 其中, 所述检测维度包括时间维度, 所述多个维度值,
包括所述 业务流量数据所属的多个时间段;
所述聚合模块, 包括:
第一聚合单元, 用于基于所述多个时间段以及所述多个指标值, 对所述业务流量数据
进行聚合, 得到各 所述时间段在所述多个指标值下的流 量分布数据。
11.根据权利要求10所述的装置, 其中, 所述第二确定模块, 包括:
第一确定单元, 用于确定所述多个时间段中的任意两个时间段在所述多个指标值下的权 利 要 求 书 2/4 页
3
CN 115499231 A
3
专利 流量检测方法、装置、电子设备和存储介质
文档预览
中文文档
30 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:43:30上传分享