(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210996416.8 (22)申请日 2022.08.18 (71)申请人 北京百度网讯科技有限公司 地址 100089 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 朱喜玲 王凯 刘明珠 孙伟龙  封树超  (74)专利代理 机构 北京乐知新创知识产权代理 事务所(普通 合伙) 11734 专利代理师 马春艳 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/9535(2019.01) G06K 9/62(2022.01) (54)发明名称 一种特征提取的方法、 装置、 设备以及存储 介质 (57)摘要 本公开提供了一种特征提取的方法、 装置、 设备以及存储介质, 涉及计算机数据处理技术领 域, 尤其涉及人工智能技术领域。 具体实现方案 为: 根据用户行为数据, 获取每一用户的行为序 列, 行为序列包括按时序排列的至少一个行为; 根据行为序列, 提取行为之间的关系信息和/或 模式信息, 得到每一用户的行为习惯特征。 如此 提取到的行为习惯特征可更为准确地表征用户 的行为习惯, 有助于提高数据的表达能力, 进而 提升后续模型处 理的精度和准确度。 权利要求书3页 说明书10页 附图4页 CN 115391421 A 2022.11.25 CN 115391421 A 1.一种特 征提取的方法, 包括: 根据用户行为数据, 获取每一用户的行为序列, 所述行为序列包括按时序排列的至少 一个行为; 根据所述行为序列, 提取行为之间的关系信 息和/或模式信 息, 得到每一用户的行为习 惯特征。 2.根据权利要求1所述的方法, 其中, 所述用户行为数据包括会话信息, 相应地, 所述 根据用户行为数据, 获取每一用户的行为序列, 包括: 根据用户行为数据, 获取每一用户在每一会话中的行为序列。 3.根据权利要求1所述的方法, 其中, 根据 所述行为序列, 提取行为之间的关系信 息, 得 到每一用户的行为习惯特 征, 包括: 对所述行为序列进行关联规则挖掘, 得到所述至少一个行为之间的关联规则; 将所述关联规则确定为每一用户的行为习惯特 征。 4.根据权利要求1所述的方法, 其中, 对所述行为序列进行关联规则挖掘, 得到所述至 少一个行为之间的关联规则, 包括: 将所述行为序列中的每个行为及行为之间的组合作为项, 根据设定的第一最小支持 度, 从所述行为序列中, 发现频繁项集; 根据所述频繁项集和设定的最小置信度, 确定所述至少一个行为之间的强关联规则。 5.根据权利要求1所述的方法, 其中, 所述根据所述行为序列, 提取行为之间的模式信 息, 得到每一用户的行为习惯特 征, 包括: 对所述行为序列进行序列模式的挖掘, 得到所述行为序列的序列模式; 将所述序列模式确定为每一用户的行为习惯特 征。 6.根据权利要求5所述的方法, 其中, 所述对所述行为序列进行序列模式的挖掘, 得到 所述行为序列的序列模式, 包括: 根据设定的第 二最小支持度, 从所述行为序列中确定支持度大于或等于所述第 二最小 支持度的频繁 子序列; 将所述频繁 子序列确定所述行为序列的序列模式。 7.根据权利要求1所述的方法, 其中, 提取行为之间的关系信息和模式信息, 得到每一 用户的行为习惯特 征, 包括: 根据所述行为序列, 进行关联规则的挖掘, 得到所述至少一个行为之间的关联规则; 根据所述行为序列, 进行序列模式的挖掘, 得到所述行为序列的序列模式; 对所述关联规则和所述序列模式进行融合, 得到每一用户的行为习惯特 征。 8.根据权利要求1所述的方法, 还 包括: 将所述行为习惯特征输入应用模型, 得到输出结果, 所述应用模型的模型特征包括所 述行为习惯特 征。 9.根据权利要求1所述的方法, 其中, 所述将所述行为习惯特征输入应用模型, 得到输 出结果, 包括: 将所述行为习惯特征输入因果关系推断模型, 得到所述行为习惯特征与指定结果之间 的因果关系。 10.一种特 征提取的装置, 包括:权 利 要 求 书 1/3 页 2 CN 115391421 A 2行为序列获取模块, 用于根据用户行为数据, 获取每一用户的行为序列, 所述行为序列 包括按时序排列的至少一个行为; 行为习惯特征确定模块, 用于根据所述行为序列, 提取行为之间的关系信息和/或模式 信息, 得到每一用户的行为习惯特 征。 11.根据权利要求10所述的装置, 其中, 用户行为数据包括会话信 息, 相应地, 所述行为 序列获取模块具体用于根据用户行为数据, 获取每一用户在每一会话中的行为序列。 12.根据权利要求10所述的装置, 其中, 所述行为习惯特 征确定模块, 包括: 关联规则挖掘子模块, 用于对所述行为序列进行关联规则挖掘, 得到所述至少一个行 为之间的关联规则; 行为习惯特 征确定子模块, 用于将所述关联规则确定为每一用户的行为习惯特 征。 13.根据权利要求12所述的装置, 其中, 所述关联规则挖掘子模块包括: 频繁项集发现单元, 用于将所述行为序列中的每个行为及行为之间的组合作为项, 根 据设定的第一 最小支持度, 从所述行为序列中, 发现频繁项集; 强关联规则发现单元, 用于根据所述频繁项集和设定的最小置信度, 确定所述至少一 个行为之间的强关联规则。 14.根据权利要求10所述的装置, 其中, 所述行为习惯特 征确定模块, 包括: 序列模式挖掘子模块, 用于对所述行为序列进行序列模式的挖掘, 得到所述行为序列 的序列模式; 行为习惯特 征确定子模块, 用于将所述序列模式确定为每一用户的行为习惯特 征。 15.根据权利要求14所述的装置, 其中, 所述序列模式挖掘子模块, 包括: 频繁子序列发现单元, 用于根据设定的第二最小支持度, 从所述行为序列中确定支持 度大于或等于所述第二 最小支持度的频繁 子序列; 序列模式确定单 元, 用于将所述频繁 子序列确定所述行为序列的序列模式。 16.根据权利要求10所述的装置, 其中, 所述行为习惯特 征确定模块, 包括: 关联规则挖掘子模块, 用于根据所述行为序列, 进行关联规则的挖掘, 得到所述至少一 个行为之间的关联规则; 序列模式挖掘子模块, 用于根据所述行为序列, 进行序列模式的挖掘, 得到所述行为序 列的序列模式; 行为习惯特征融合子模块, 用于对所述关联规则和所述序列模式进行融合, 得到每一 用户的行为习惯特 征。 17.根据权利要求10所述的装置, 还 包括: 行为习惯特征应用模块, 用于将所述行为习惯特征输入应用模型, 得到输出结果, 所述 应用模型的模型 特征包括所述行为习惯特 征。 18.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1-9中任一项所述的方法。 19.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于权 利 要 求 书 2/3 页 3 CN 115391421 A 3

.PDF文档 专利 一种特征提取的方法、装置、设备以及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种特征提取的方法、装置、设备以及存储介质 第 1 页 专利 一种特征提取的方法、装置、设备以及存储介质 第 2 页 专利 一种特征提取的方法、装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:34:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。