(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210924786.0
(22)申请日 2022.08.03
(65)同一申请的已公布的文献号
申请公布号 CN 114969558 A
(43)申请公布日 2022.08.30
(73)专利权人 安徽商信政通信息技 术股份有限
公司
地址 230000 安徽省合肥市高新区望江西
路800号创新产业园一期A4幢5 01
(72)发明人 许建兵 费维进 李军 戴磊
(74)专利代理 机构 北京知联天下知识产权代理
事务所(普通 合伙) 11594
专利代理师 张迎新
(51)Int.Cl.
G06F 16/9535(2019.01)(56)对比文件
CN 111563176 A,2020.08.21
审查员 朱琦
(54)发明名称
一种基于用户行为习惯分析的用户画像生
成方法和系统
(57)摘要
本发明公开了一种基于用户行为习惯分析
的用户画像生成方法和系统, 包括: 对用户的历
史浏览行为记录进行数据挖掘, 生成有效浏览时
长; 根据有效浏览时长, 确定并存储有效浏览行
为记录; 根据存储的有效浏览行为记录分析用户
浏览习惯, 根据用户浏览习惯更新用户的文档兴
趣度评分函数和有效浏览行为记录的兴趣度; 根
据更新后的文档兴趣度评分函数和有效浏览行
为记录的兴趣度, 生成用户行为画像。 能够适配
不同用户阅读习惯、 依据不同时段进行行为画像
的自动生成。
权利要求书5页 说明书11页 附图3页
CN 114969558 B
2022.11.08
CN 114969558 B
1.一种基于用户行为习惯分析的用户画像生成方法, 其特 征在于, 包括以下步骤:
对用户的历史浏览行为记录进行 数据挖掘, 生成有效浏览时长;
根据有效浏览时长, 确定并存 储有效浏览行为记录;
根据存储的有效浏览行为记录分析用户浏 览习惯, 并更新获得有 效浏览行为记录的兴
趣度;
基于用户习惯阅读时间点, 根据更新后的有效浏览行为记录的兴趣度, 获得用户有效
浏览行为记录中不同主题下, 对应主题的所有文档的兴趣度得分总和; 根据所述兴趣度得
分总和, 生成用户行为画像;
其中, 所述 根据有效浏览时长, 确定并存 储有效浏览行为记录, 包括以下步骤:
有效浏览行为记录的存储内容包括浏览文档的ID、 浏览文档的主题、 有效浏览时长及
文档兴趣度评分函数;
存储有效浏览行为记录时, 按照预定时间间隔视为一个时区, 将有效浏览行为记录按
不同时区进行保存, 并更新有效浏览行为记录;
根据更新后的有效浏览行为记录, 更新获取用户的集中使用时间区段, 以便更新后续
的用户浏览行为习惯分析及用户行为画像的生成;
所述根据存储的有 效浏览行为记录分析用户浏览习惯, 并更新获得有效浏览行为记录
的兴趣度, 包括以下步骤:
基于有效浏览行为记录, 选取15%的分位数和85%的分位数作为更新 参数;
根据所述更新 参数, 获得兴趣度评分函数;
根据所述兴趣度评分函数, 更新并存 储有效浏览行为记录的兴趣度。
2.根据权利要求1所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征在
于, 对用户的历史浏览行为记录进行 数据挖掘, 生成有效浏览时长, 包括,
提取用户每次浏览不同文档所对应的历史浏览行为记录, 按照 时间进行排序, 并进行
有效记录挖掘和统计浏览时长, 生成有效浏览时长 。
3.根据权利要求2所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征在
于, 所述生成有效浏览时长包括,
遍历计算相邻 两个历史浏览行为记录之间的时间间隔, 将所有的时间间隔相加作为浏
览时长;
根据历史浏览行为记录的时间长度, 对所述浏览时长进行判定是否为无效的浏览时
长, 去除无效的浏览时长对应的历史浏览行为记录, 剩 下的历史浏览行为记录为所对应的
浏览时长为有效浏览时长 。
4.根据权利要求3所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征在
于, 所述根据历史浏览行为记录的时间长度进行判定是否为无效的浏览时长, 去除无效的
浏览时长对应的历史浏览行为记录, 包括,
若文档整体的打开至关闭时间不超过第 一预定时间, 则将整个文档的历史浏 览行为记
录作废去除;
若文档的两个相邻操作的时间间隔超过第 二预定时间, 则所述两个相邻操作 所在的时
间段的历史浏览行为记录不 参与最终的有效浏览时长统计。
5.根据权利要求1所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征在权 利 要 求 书 1/5 页
2
CN 114969558 B
2于, 根据更新后的有效浏览行为记录, 更新获取用户的集中使用时间区段, 包括,
计算出用户各个时区及其相邻时区中的有效浏览行为记录在所有时区中有效浏览行
为记录的总数量占比, 并记录为各个时区的统计值, 并对各个时区的统计值进行排序;
将排序结果中相邻的时区进行合并, 获得合并统计值;
在合并统计值中, 对超过所有有效浏览行为记录总数量20%的合并统计值所对应的时
区进行记录, 并作为用户习惯阅读时间点进行保存。
6.根据权利要求5所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征在
于,
若所述合并统计值包含的时区长度跨度大于5个时区, 则选择其中有效浏览行为记录
统计值最多的连续5个时区作为 合并统计值; 其中,
若所述连续5个时区的区间内阅读时间占比不小于30%, 则认为所述连续5个时区所在
的时间段为用户习惯阅读时间点。
7.根据权利要求1所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征在
于,
所述获得兴趣度评分函数为:
其中,f(x)表示兴趣度评分函数, x为分位数, Q1表示15%的分位数, Q2表示85%的分位
数;
获得所述有效浏览行为记录的兴趣度为:
其中, Score表示有效浏览行为记录的兴趣度。
8.根据权利要求1或7所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征
在于, 所述 生成用户行为画像, 包括,
基于用户习惯阅读时间点, 根据用户有效浏览行为记录的兴趣度, 获得用户有效浏览
行为记录中不同主题下, 对应主题的所有 文档的兴趣度得分总和;
并根据所述兴趣度得分总和, 获得对应主题的所有文档的兴趣得分总和在所有主题文
档下的概 率, 生成符合当前时间点的用户行为画像。
9.根据权利要求8所述的一种基于用户行为习惯分析的用户画像生成方法, 其特征在
于, 判断所述用户习惯阅读时间点包括,
确定用户信 息推送的时间点, 判断所述 时间点所在的时间段是否为用户习惯阅读时间
点; 其中,
确定用户信息推送 的时间点, 并统计该时间点所在时区及相邻4个时区内是否存在超
过预定数量的历史浏览记录, 即判定该时间点所在的时间段是否为用户习惯 阅读时间点,
其中,
若该时间点所在的时间段的历史浏 览记录中, 有效浏览行为记录的统计值超过所有有权 利 要 求 书 2/5 页
3
CN 114969558 B
3
专利 一种基于用户行为习惯分析的用户画像生成方法和系统
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:33:21上传分享