(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210923309.2 (22)申请日 2022.08.02 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 舒畅 陈又新  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06F 40/289(2020.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 30/00(2012.01) G06F 16/9535(2019.01) (54)发明名称 垃圾账户的检测方法、 装置、 电子设备及存 储介质 (57)摘要 本发明涉及人工智能技术, 揭露了一种垃圾 账户的检测方法, 包括: 生成目标账户中用户信 息的邻接列表, 利用所述邻接列表 生成所述用户 信息的用户矩阵; 对所述用户矩阵进行聚合和更 新, 得到更新向量; 对所述更新向量进行分类, 得 到所述更新向量的用户分类结果; 对目标账户中 文本进行向量化转换, 得到文本向量; 将所述文 本向量进行分类, 得到文本分类结果; 计算分类 结果的加权平均值, 比较所述加权平均值和阈值 的大小, 确定 所述目标账户为垃圾账户。 此外, 本 发明还涉及区块链技术, 数据列表可存储于区块 链的节点。 本发 明还提出一种垃圾账户的检测装 置、 电子设备 以及存储介质。 本发明可 以提高垃 圾账户的检测的准确率。 权利要求书2页 说明书10页 附图3页 CN 115238041 A 2022.10.25 CN 115238041 A 1.一种垃圾账户的检测方法, 其特 征在于, 所述方法包括: 生成目标账户中用户信 息的邻接列表, 利用所述邻 接列表生成所述用户信 息的用户矩 阵; 对所述用户矩阵进行节点聚合, 得到目标用户矩阵; 按照预设的更新 函数对所述目标用户矩阵中的向量进行 更新, 得到更新向量; 利用预设的用户分类模型对所述更新向量进行分类, 得到所述更新向量的用户分类结 果; 对目标账户中文本进行向量 化转换, 得到文本向量; 将所述文本向量输入至预设的文本分类模型, 得到所述文本向量的文本分类结果; 计算所述用户分类结果和所述文本分类结果的加权平均值, 比较所述加权平均值和阈 值的大小, 当所述加权平均值大于阈值时, 确定所述目标 账户为垃圾账户。 2.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述生成 目标账户中用户信 息的邻接列表, 包括: 对所述目标 账户中用户信息按照预设的索引进行二分类, 得到顶点信息和边信息; 对预设的顶点表进行初始化, 将所述顶点信息写入初始化后的顶点表内, 得到目标顶 点表; 将所述边信息按照连接关系依次写入预设的边表中, 得到目标边表; 根据所述目标顶点表和所述目标边表生成邻接列表。 3.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述利用所述邻 接列表生成 所述用户信息的用户矩阵, 包括: 根据所述邻 接列表中的顶点信 息生成顶点数组, 根据所述邻 接列表中的边信 息生成边 数组; 根据所述顶点数组确定总顶点数, 根据所述 边数组确定总边数; 利用所述总顶点数和所述总边数构建邻接矩阵, 对所述邻接矩阵进行初始化; 根据所述邻接列表对初始化后的邻接矩阵进行填充, 得到所述用户信息的用户矩阵。 4.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述对所述用户矩阵进行节 点聚合, 得到目标用户矩阵, 包括: 按照预设的节点分区方式对所述用户矩阵进行分区, 得到局部矩阵; 对所有局部矩阵进行平均池化, 得到所述局部矩阵的特 征值; 对所述特 征值进行拼接, 得到目标用户矩阵。 5.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述按照预设的更新函数对 所述目标用户矩阵中的向量进行 更新, 得到更新向量, 包括: 利用如下 所述更新 函数对所述目标用户矩阵中的向量进行 更新: 其中, 是第k+1层节点u的特征向量, 表示第k层节点v的特征向量, N(u)表示 节点u的邻居节点集合, UPDATE(k)表示在第k层节点进行更新, AGGREGATE(k)表示对第k层节 点进行加 和, 表示节点v可以取到N(u)中的任意 值。权 利 要 求 书 1/2 页 2 CN 115238041 A 26.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述对目标账户中文本进行 向量化转换, 得到文本向量, 包括: 对目标账户中文本进行分词处 理, 得到文本分词; 获取所述文本分词的词向量, 对所述词向量进行聚类处理, 得到每个特征词的聚类类 别; 基于权重算法计算每 个特征词在所述文本中的权 重; 根据所述聚类 类别和所述权 重生成文本向量。 7.如权利要求1至6中任一项所述的垃圾账户的检测方法, 其特征在于, 所述对目标账 户中文本进行向量 化转换, 得到文本向量, 包括: 对目标账户中文本进行分词处 理, 得到文本分词; 对所述文本分词进行 标记, 得到标记分词; 按照预设的句子 长度对所述标记分词进行 标记填充, 得到标准分词; 对所述标记分词进行注意力屏蔽, 得到注意力分词; 对所述注意力分词中的元 素进行映射, 得到所有注意力分词的唯一 ID; 将所述注意力分词和所述唯一ID输入至预训练的语言表征模型, 得到每个文本分词的 文本向量。 8.一种垃圾账户的检测装置, 其特 征在于, 所述装置包括: 用户矩阵模块, 用于生成目标账户中用户信息的邻接列表, 利用所述邻接列表生成所 述用户信息的用户矩阵; 节点聚合模块, 用于对所述用户矩阵进行节点聚合, 得到目标用户矩阵; 向量更新模块, 用于按照预设的更新函数对所述目标用户矩阵中的向量进行更新, 得 到更新向量; 用户分类模块, 用于利用预设的用户分类模型对所述更新向量进行分类, 得到所述更 新向量的用户分类结果; 向量化模块, 用于对目标 账户中文本进行向量 化转换, 得到文本向量; 文本分类模块, 用于将所述文本向量输入至预设的文本分类模型, 得到所述文本向量 的文本分类结果; 加权平均模块, 用于计算所述用户分类结果和所述文本分类结果的加权平均值, 比较 所述加权平均值和阈值的大小, 当所述加权平均值大于阈值时, 确定所述 目标账户为垃圾 账户。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任意一项 所 述的垃圾账户的检测方法。 10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现如权利要求1至7中任意 一项所述的垃圾账户的检测方法。权 利 要 求 书 2/2 页 3 CN 115238041 A 3

.PDF文档 专利 垃圾账户的检测方法、装置、电子设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 垃圾账户的检测方法、装置、电子设备及存储介质 第 1 页 专利 垃圾账户的检测方法、装置、电子设备及存储介质 第 2 页 专利 垃圾账户的检测方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:35:22上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。