(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210923309.2
(22)申请日 2022.08.02
(71)申请人 平安科技 (深圳) 有限公司
地址 518000 广东省深圳市福田区福田街
道福安社区益田路5033号平 安金融中
心23楼
(72)发明人 舒畅 陈又新
(74)专利代理 机构 深圳市沃德知识产权代理事
务所(普通 合伙) 44347
专利代理师 高杰 于志光
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/35(2019.01)
G06F 40/216(2020.01)
G06F 40/289(2020.01)G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 30/00(2012.01)
G06F 16/9535(2019.01)
(54)发明名称
垃圾账户的检测方法、 装置、 电子设备及存
储介质
(57)摘要
本发明涉及人工智能技术, 揭露了一种垃圾
账户的检测方法, 包括: 生成目标账户中用户信
息的邻接列表, 利用所述邻接列表 生成所述用户
信息的用户矩阵; 对所述用户矩阵进行聚合和更
新, 得到更新向量; 对所述更新向量进行分类, 得
到所述更新向量的用户分类结果; 对目标账户中
文本进行向量化转换, 得到文本向量; 将所述文
本向量进行分类, 得到文本分类结果; 计算分类
结果的加权平均值, 比较所述加权平均值和阈值
的大小, 确定 所述目标账户为垃圾账户。 此外, 本
发明还涉及区块链技术, 数据列表可存储于区块
链的节点。 本发 明还提出一种垃圾账户的检测装
置、 电子设备 以及存储介质。 本发明可 以提高垃
圾账户的检测的准确率。
权利要求书2页 说明书10页 附图3页
CN 115238041 A
2022.10.25
CN 115238041 A
1.一种垃圾账户的检测方法, 其特 征在于, 所述方法包括:
生成目标账户中用户信 息的邻接列表, 利用所述邻 接列表生成所述用户信 息的用户矩
阵;
对所述用户矩阵进行节点聚合, 得到目标用户矩阵;
按照预设的更新 函数对所述目标用户矩阵中的向量进行 更新, 得到更新向量;
利用预设的用户分类模型对所述更新向量进行分类, 得到所述更新向量的用户分类结
果;
对目标账户中文本进行向量 化转换, 得到文本向量;
将所述文本向量输入至预设的文本分类模型, 得到所述文本向量的文本分类结果;
计算所述用户分类结果和所述文本分类结果的加权平均值, 比较所述加权平均值和阈
值的大小, 当所述加权平均值大于阈值时, 确定所述目标 账户为垃圾账户。
2.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述生成 目标账户中用户信
息的邻接列表, 包括:
对所述目标 账户中用户信息按照预设的索引进行二分类, 得到顶点信息和边信息;
对预设的顶点表进行初始化, 将所述顶点信息写入初始化后的顶点表内, 得到目标顶
点表;
将所述边信息按照连接关系依次写入预设的边表中, 得到目标边表;
根据所述目标顶点表和所述目标边表生成邻接列表。
3.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述利用所述邻 接列表生成
所述用户信息的用户矩阵, 包括:
根据所述邻 接列表中的顶点信 息生成顶点数组, 根据所述邻 接列表中的边信 息生成边
数组;
根据所述顶点数组确定总顶点数, 根据所述 边数组确定总边数;
利用所述总顶点数和所述总边数构建邻接矩阵, 对所述邻接矩阵进行初始化;
根据所述邻接列表对初始化后的邻接矩阵进行填充, 得到所述用户信息的用户矩阵。
4.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述对所述用户矩阵进行节
点聚合, 得到目标用户矩阵, 包括:
按照预设的节点分区方式对所述用户矩阵进行分区, 得到局部矩阵;
对所有局部矩阵进行平均池化, 得到所述局部矩阵的特 征值;
对所述特 征值进行拼接, 得到目标用户矩阵。
5.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述按照预设的更新函数对
所述目标用户矩阵中的向量进行 更新, 得到更新向量, 包括:
利用如下 所述更新 函数对所述目标用户矩阵中的向量进行 更新:
其中,
是第k+1层节点u的特征向量,
表示第k层节点v的特征向量, N(u)表示
节点u的邻居节点集合, UPDATE(k)表示在第k层节点进行更新, AGGREGATE(k)表示对第k层节
点进行加 和,
表示节点v可以取到N(u)中的任意 值。权 利 要 求 书 1/2 页
2
CN 115238041 A
26.如权利要求1所述的垃圾账户的检测方法, 其特征在于, 所述对目标账户中文本进行
向量化转换, 得到文本向量, 包括:
对目标账户中文本进行分词处 理, 得到文本分词;
获取所述文本分词的词向量, 对所述词向量进行聚类处理, 得到每个特征词的聚类类
别;
基于权重算法计算每 个特征词在所述文本中的权 重;
根据所述聚类 类别和所述权 重生成文本向量。
7.如权利要求1至6中任一项所述的垃圾账户的检测方法, 其特征在于, 所述对目标账
户中文本进行向量 化转换, 得到文本向量, 包括:
对目标账户中文本进行分词处 理, 得到文本分词;
对所述文本分词进行 标记, 得到标记分词;
按照预设的句子 长度对所述标记分词进行 标记填充, 得到标准分词;
对所述标记分词进行注意力屏蔽, 得到注意力分词;
对所述注意力分词中的元 素进行映射, 得到所有注意力分词的唯一 ID;
将所述注意力分词和所述唯一ID输入至预训练的语言表征模型, 得到每个文本分词的
文本向量。
8.一种垃圾账户的检测装置, 其特 征在于, 所述装置包括:
用户矩阵模块, 用于生成目标账户中用户信息的邻接列表, 利用所述邻接列表生成所
述用户信息的用户矩阵;
节点聚合模块, 用于对所述用户矩阵进行节点聚合, 得到目标用户矩阵;
向量更新模块, 用于按照预设的更新函数对所述目标用户矩阵中的向量进行更新, 得
到更新向量;
用户分类模块, 用于利用预设的用户分类模型对所述更新向量进行分类, 得到所述更
新向量的用户分类结果;
向量化模块, 用于对目标 账户中文本进行向量 化转换, 得到文本向量;
文本分类模块, 用于将所述文本向量输入至预设的文本分类模型, 得到所述文本向量
的文本分类结果;
加权平均模块, 用于计算所述用户分类结果和所述文本分类结果的加权平均值, 比较
所述加权平均值和阈值的大小, 当所述加权平均值大于阈值时, 确定所述 目标账户为垃圾
账户。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
至少一个处 理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所
述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任意一项 所
述的垃圾账户的检测方法。
10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处
理器执行时实现如权利要求1至7中任意 一项所述的垃圾账户的检测方法。权 利 要 求 书 2/2 页
3
CN 115238041 A
3
专利 垃圾账户的检测方法、装置、电子设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:35:22上传分享