(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210958119.4 (22)申请日 2022.08.11 (71)申请人 广东工业大 学 地址 510006 广东省广州市番禺区广州大 学城外环西路10 0号 (72)发明人 郑海利 陈平华  (74)专利代理 机构 北京东方盛凡知识产权代理 事务所(普通 合伙) 11562 专利代理师 张国麒 (51)Int.Cl. G06F 16/9535(2019.01) G06N 3/04(2006.01) G06F 16/335(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) (54)发明名称 一种融合多特 征的新闻推荐方法及系统 (57)摘要 本发明提供了一种融合多特征的新闻推荐 方法及系统, 分别获取候选新闻特征信息和历史 点击新闻特征信息; 基于所述候选新闻特征信 息, 获得候选新闻表征向量; 基于所述历史点击 新闻特征信息, 获得历史点击新闻表征向量; 基 于所述历史点击新闻表征向量和用户行为特征 向量, 获得用户兴趣向量; 基于所述候选新闻表 征向量和所述用户兴趣向量, 获得用户对候选新 闻的点击率, 完成对用户喜爱新闻的推荐。 本发 明充分利用新闻中的特征信息, 形成更准确和全 面的新闻表征, 有效结合发生行为的上下文特征 信息以及用户真实的行为特征信息, 挖掘用户对 新闻的喜好 程度, 建立更准确的兴趣 模型。 权利要求书2页 说明书8页 附图2页 CN 115048586 A 2022.09.13 CN 115048586 A 1.一种融合多特 征的新闻推荐方法, 其特 征在于, 分别获取候选新闻特 征信息和历史点击新闻特 征信息; 基于所述 候选新闻特 征信息, 获得候选新闻表征向量; 基于所述历史点击新闻特 征信息, 获得历史点击新闻表征向量; 基于所述历史点击新闻表征向量和用户行为特 征向量, 获得用户兴趣向量; 基于所述候选新闻表征向量和所述用户兴趣向量, 获得用户对候选新闻的点击率, 完 成对用户喜爱新闻的推荐。 2.根据权利要求1所述的一种融合多特 征的新闻推荐方法, 其特 征在于, 所述候选新闻特征信 息和所述历史点击新闻特征信 息均包括标题特征、 类别特征和正 文特征。 3.根据权利要求2所述的一种融合多特征的新闻推荐方法, 其特征在于, 获得所述候选 新闻表征向量和所述历史点击新闻表征向量的方法均包括: 将所述标题特征、 所述类别特征和所述正文特征分别转换为标题向量、 类别向量和正 文向量; 基于注意力 机制, 对所述标题向量、 所述类别向量和所述正文向量进行融合, 获得新闻 表征向量。 4.根据权利要求3所述的一种融合多特征的新闻推荐方法, 其特征在于, 将所述标题特 征转换为所述标题向量的方法包括: 基于自然语言处 理实体识别技 术, 获得新闻实体关键词; 基于训练好的词嵌入向量, 将所述新闻实体关键词的单词序列转换为低维词向量序 列; 基于卷积神经网络, 对所述低维词向量序列进行卷积运算, 获得所述低维词向量序列 的局部上 下文特征; 对所述低维词向量序列的局部上下文特征进行最大值池化, 获得整体的标题向量表 示; 对所述新闻实体关键词进行注意力系数求和, 获得关注实体向量; 基于所述整体的标题向量表示和所述关注实体向量, 获得 所述标题向量。 5.根据权利要求3所述的一种融合多特征的新闻推荐方法, 其特征在于, 将所述类别特 征转换为所述类别向量的方法包括: 基于查表的方式, 将所述类别特 征转换为低维向量; 基于所述低维向量, 获得 所述类别向量。 6.根据权利要求3所述的一种融合多特征的新闻推荐方法, 其特征在于, 将所述正文特 征转换为所述 正文向量的方法包括: 基于训练语料和主题模型, 从所述 正文向量中提取潜在的主题分布; 基于所述主题分布, 获得词分布; 基于所述词分布, 获得 所述正文向量。 7.根据权利要求1所述的一种融合多特征的新闻推荐方法, 其特征在于, 基于所述历史 点击新闻表征向量和所述用户行为特 征向量, 获得用户兴趣向量的方法包括: 基于自注意力机制, 获得 所述历史点击新闻表征向量之间的相关性;权 利 要 求 书 1/2 页 2 CN 115048586 A 2基于指数衰减函数, 获得时间向量; 基于阅读时间上限阈值, 获得用户对历史点击新闻的停留时间向量; 基于所述时间向量和所述用户对历史点击新闻的停留时间向量, 利用元素积的方式, 获得所述用户行为特 征向量; 基于所述历史点击新闻表征向量之间的相关性和所述用户行为特征向量, 利用GRU网 络, 获得用户的短期兴趣; 基于用户的嵌入向量, 获得用户的长期兴趣; 基于全连接层, 拼接所述用户的短期兴趣和所述用户的长期兴趣, 获得用户兴趣向量。 8.一种融合多特征的新闻推荐系统, 其特征在于, 包括获取模块、 候选新闻表征模块、 历史点击新闻表征模块、 用户兴趣挖掘模块和新闻推荐模块; 所述获取模块用于分别获取候选新闻特 征信息和历史点击新闻特 征信息; 所述候选新闻表征模块用于基于所述 候选新闻特 征信息, 获得候选新闻表征向量; 所述历史点击新闻表征模块用于基于所述历史点击新闻特征信 息, 获得历史点击新闻 表征向量; 所述用户兴趣挖掘模块用于基于所述历史点击新闻表征向量和用户行为特征向量, 获 得用户兴趣向量; 所述新闻推荐模块用于基于所述候选新闻表征向量和所述用户兴趣向量, 获得用户对 候选新闻的点击率, 完成对用户喜爱新闻的推荐。权 利 要 求 书 2/2 页 3 CN 115048586 A 3

.PDF文档 专利 一种融合多特征的新闻推荐方法及系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合多特征的新闻推荐方法及系统 第 1 页 专利 一种融合多特征的新闻推荐方法及系统 第 2 页 专利 一种融合多特征的新闻推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:34:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。