专利垃圾账户的检测方法、装置、电子设备及存储介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210923309.2 (22)申请日 2022.08.02 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人舒畅　陈又新　 (74)专利代理机构深圳市沃德知识产权代理事务所(普通合伙) 44347 专利代理师高杰　于志光 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06F 40/289(2020.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 30/00(2012.01) G06F 16/9535(2019.01) (54)发明名称垃圾账户的检测方法、装置、电子设备及存储介质 (57)摘要本发明涉及人工智能技术，揭露了一种垃圾账户的检测方法，包括：生成目标账户中用户信息的邻接列表，利用所述邻接列表生成所述用户信息的用户矩阵；对所述用户矩阵进行聚合和更新，得到更新向量；对所述更新向量进行分类，得到所述更新向量的用户分类结果；对目标账户中文本进行向量化转换，得到文本向量；将所述文本向量进行分类，得到文本分类结果；计算分类结果的加权平均值，比较所述加权平均值和阈值的大小，确定所述目标账户为垃圾账户。此外，本发明还涉及区块链技术，数据列表可存储于区块链的节点。本发明还提出一种垃圾账户的检测装置、电子设备以及存储介质。本发明可以提高垃圾账户的检测的准确率。权利要求书2页说明书10页附图3页 CN 115238041 A 2022.10.25 CN 115238041 A 1.一种垃圾账户的检测方法，其特征在于，所述方法包括：生成目标账户中用户信息的邻接列表，利用所述邻接列表生成所述用户信息的用户矩阵；对所述用户矩阵进行节点聚合，得到目标用户矩阵；按照预设的更新函数对所述目标用户矩阵中的向量进行更新，得到更新向量；利用预设的用户分类模型对所述更新向量进行分类，得到所述更新向量的用户分类结果；对目标账户中文本进行向量化转换，得到文本向量；将所述文本向量输入至预设的文本分类模型，得到所述文本向量的文本分类结果；计算所述用户分类结果和所述文本分类结果的加权平均值，比较所述加权平均值和阈值的大小，当所述加权平均值大于阈值时，确定所述目标账户为垃圾账户。 2.如权利要求1所述的垃圾账户的检测方法，其特征在于，所述生成目标账户中用户信息的邻接列表，包括：对所述目标账户中用户信息按照预设的索引进行二分类，得到顶点信息和边信息；对预设的顶点表进行初始化，将所述顶点信息写入初始化后的顶点表内，得到目标顶点表；将所述边信息按照连接关系依次写入预设的边表中，得到目标边表；根据所述目标顶点表和所述目标边表生成邻接列表。 3.如权利要求1所述的垃圾账户的检测方法，其特征在于，所述利用所述邻接列表生成所述用户信息的用户矩阵，包括：根据所述邻接列表中的顶点信息生成顶点数组，根据所述邻接列表中的边信息生成边数组；根据所述顶点数组确定总顶点数，根据所述边数组确定总边数；利用所述总顶点数和所述总边数构建邻接矩阵，对所述邻接矩阵进行初始化；根据所述邻接列表对初始化后的邻接矩阵进行填充，得到所述用户信息的用户矩阵。 4.如权利要求1所述的垃圾账户的检测方法，其特征在于，所述对所述用户矩阵进行节点聚合，得到目标用户矩阵，包括：按照预设的节点分区方式对所述用户矩阵进行分区，得到局部矩阵；对所有局部矩阵进行平均池化，得到所述局部矩阵的特征值；对所述特征值进行拼接，得到目标用户矩阵。 5.如权利要求1所述的垃圾账户的检测方法，其特征在于，所述按照预设的更新函数对所述目标用户矩阵中的向量进行更新，得到更新向量，包括：利用如下所述更新函数对所述目标用户矩阵中的向量进行更新：其中, 是第k+1层节点u的特征向量，表示第k层节点v的特征向量， N(u)表示节点u的邻居节点集合， UPDATE(k)表示在第k层节点进行更新， AGGREGATE(k)表示对第k层节点进行加和，表示节点v可以取到N(u)中的任意值。权　利　要　求　书 1/2 页 2 CN 115238041 A 26.如权利要求1所述的垃圾账户的检测方法，其特征在于，所述对目标账户中文本进行向量化转换，得到文本向量，包括：对目标账户中文本进行分词处理，得到文本分词；获取所述文本分词的词向量，对所述词向量进行聚类处理，得到每个特征词的聚类类别；基于权重算法计算每个特征词在所述文本中的权重；根据所述聚类类别和所述权重生成文本向量。 7.如权利要求1至6中任一项所述的垃圾账户的检测方法，其特征在于，所述对目标账户中文本进行向量化转换，得到文本向量，包括：对目标账户中文本进行分词处理，得到文本分词；对所述文本分词进行标记，得到标记分词；按照预设的句子长度对所述标记分词进行标记填充，得到标准分词；对所述标记分词进行注意力屏蔽，得到注意力分词；对所述注意力分词中的元素进行映射，得到所有注意力分词的唯一 ID；将所述注意力分词和所述唯一ID输入至预训练的语言表征模型，得到每个文本分词的文本向量。 8.一种垃圾账户的检测装置，其特征在于，所述装置包括：用户矩阵模块，用于生成目标账户中用户信息的邻接列表，利用所述邻接列表生成所述用户信息的用户矩阵；节点聚合模块，用于对所述用户矩阵进行节点聚合，得到目标用户矩阵；向量更新模块，用于按照预设的更新函数对所述目标用户矩阵中的向量进行更新，得到更新向量；用户分类模块，用于利用预设的用户分类模型对所述更新向量进行分类，得到所述更新向量的用户分类结果；向量化模块，用于对目标账户中文本进行向量化转换，得到文本向量；文本分类模块，用于将所述文本向量输入至预设的文本分类模型，得到所述文本向量的文本分类结果；加权平均模块，用于计算所述用户分类结果和所述文本分类结果的加权平均值，比较所述加权平均值和阈值的大小，当所述加权平均值大于阈值时，确定所述目标账户为垃圾账户。 9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求 1至7中任意一项所述的垃圾账户的检测方法。 10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的垃圾账户的检测方法。权　利　要　求　书 2/2 页 3 CN 115238041 A 3

专利 垃圾账户的检测方法、装置、电子设备及存储介质

专利垃圾账户的检测方法、装置、电子设备及存储介质