(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210926000.9 (22)申请日 2022.08.03 (71)申请人 上海欣兆阳信息科技有限公司 地址 200030 上海市徐汇区乐 山路33号3幢 609室 (72)发明人 郭家清 元张毅  (74)专利代理 机构 上海申浩 律师事务所 31280 专利代理师 孟咪 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9537(2019.01) (54)发明名称 一种基于大数据的ID打通方法、 装置、 设备 和存储介质 (57)摘要 本发明提供了一种基于大数据 的ID打通方 法、 装置、 设备和存储介质。 基于大数据的ID打通 方法包括: 步骤S1: 获取不同ID的行为数据, 行为 数据包括多种关联关系信息, 以不同ID之间的同 种关联关系作为一条边, 分别计算每两个ID之间 的每一条边的可信 度; 步骤S2: 选定可信 度阈值, 过滤掉可信度低于阈值的边; 步骤S3: 计算每两 个ID之间的关联度分数; 步骤S4: 对每一个ID的 候选关联ID 按照关联度分数的大小进行排序; 步 骤S5: 选取关联度分数最大值对应的候选关联ID 作为该ID的打通ID。 本申请基于 大数据和图计算 技术, 将不同系统的ID进行关联, 从而识别ID属 于同一设备或自然人用户。 权利要求书2页 说明书6页 附图1页 CN 115470399 A 2022.12.13 CN 115470399 A 1.一种基于大 数据的ID打通方法, 其特 征在于, 包括: 步骤S1: 获取不同ID的行为数据, 行为数据包括多种关联关系信息, 以不同ID之间的相 同关联关系作为一条边, 分别计算每两个ID之间的每一条边的可信度, 可信度跟该条边所 关联的不同类型ID数量的积成反比; 步骤S2: 选 定可信度阈值, 过 滤掉可信度低于阈值的边; 步骤S3: 计算每两个ID之间的关联度分数: 其中, i和j分别代表 两个不同的ID, Pk(i,j)代表i和j之间的每一条边的可信度, K代表i 和j之间的边的数量, Score(i,j)代 表i和j之间的关联度分数; 步骤S4: 对每一个ID的候选关联ID按照关联度分数的大小 进行排序; 步骤S5: 选取关联度分数最大值对应的候选关联ID作为该ID的打通 ID: AssocID(i)=argmaxjScore(i, j), 其中, i和j分别代表两个不同的ID, 且j为关联度分数最大对应的候选关联ID, 即j为i 的打通ID。 2.如权利要求1所述的基于大数据的ID打通方法, 其特征在于, 所述关联关系包括设备 信息和时空信息 。 3.如权利要求2所述的基于大数据的ID打通方法, 其特征在于, 所述设备信息包括硬件 信息和软件信息, 所述硬件信息包括品牌、 机型、 屏幕尺寸和传感器型号, 所述软件信息包 括浏览器ua和操作系统版本, 所述时空信息包括时间、 地理位置信息和ip地址 。 4.一种基于大 数据的ID打通装置, 其特 征在于, 包括: 可信度计算单元, 用于获取不同ID的行为数据, 行为数据包括多种关联关系信息, 以不 同ID之间的相同关联关系作为一条边, 分别计算每两个ID之间的每一条边的可信度, 可信 度跟该条边所关联的不同类型ID数量的积成反比; 过滤单元, 用于选定可信度阈值, 过 滤掉可信度低于阈值的边; 关联度计算单 元, 用于计算每两个ID之间的关联度分数: 其中, i和j分别代表 两个不同的ID, Pk(i,j)代表i和j之间的每一条边的可信度, K代表i 和j之间的边的数量, Score(i,j)代 表i和j之间的关联度分数; 排序单元, 用于对每一个ID的候选关联ID按照关联度分数的大小 进行排序; 关联单元, 用于选取关联度分数最大值对应的候选关联ID作为该ID的打通 ID: AssocID(i)=argmaxjScore(i, j), 其中, i和j分别代表两个不同的ID, 且j为关联度分数最大对应的候选关联ID, 即j为i 的打通ID。 5.一种电子设备, 其特征在于, 包括: 存储器、 处理器以及存储于所述存储器上并可在 所述处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现如权利要求 1‑ 3中任一项所述的基于大 数据的ID打通方法。 6.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征 在于, 所述计算机程序被处理器执行时实现如权利要求1 ‑3中任一项所述的基于大数据的权 利 要 求 书 1/2 页 2 CN 115470399 A 2ID打通方法。权 利 要 求 书 2/2 页 3 CN 115470399 A 3

.PDF文档 专利 一种基于大数据的ID打通方法、装置、设备和存储介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于大数据的ID打通方法、装置、设备和存储介质 第 1 页 专利 一种基于大数据的ID打通方法、装置、设备和存储介质 第 2 页 专利 一种基于大数据的ID打通方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:33:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。