国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210958119.4 (22)申请日 2022.08.11 (71)申请人 广东工业大 学 地址 510006 广东省广州市番禺区广州大 学城外环西路10 0号 (72)发明人 郑海利 陈平华 (74)专利代理 机构 北京东方盛凡知识产权代理 事务所(普通 合伙) 11562 专利代理师 张国麒 (51)Int.Cl. G06F 16/9535(2019.01) G06N 3/04(2006.01) G06F 16/335(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) (54)发明名称 一种融合多特 征的新闻推荐方法及系统 (57)摘要 本发明提供了一种融合多特征的新闻推荐 方法及系统, 分别获取候选新闻特征信息和历史 点击新闻特征信息; 基于所述候选新闻特征信 息, 获得候选新闻表征向量; 基于所述历史点击 新闻特征信息, 获得历史点击新闻表征向量; 基 于所述历史点击新闻表征向量和用户行为特征 向量, 获得用户兴趣向量; 基于所述候选新闻表 征向量和所述用户兴趣向量, 获得用户对候选新 闻的点击率, 完成对用户喜爱新闻的推荐。 本发 明充分利用新闻中的特征信息, 形成更准确和全 面的新闻表征, 有效结合发生行为的上下文特征 信息以及用户真实的行为特征信息, 挖掘用户对 新闻的喜好 程度, 建立更准确的兴趣 模型。 权利要求书2页 说明书8页 附图2页 CN 115048586 A 2022.09.13 CN 115048586 A 1.一种融合多特 征的新闻推荐方法, 其特 征在于, 分别获取候选新闻特 征信息和历史点击新闻特 征信息; 基于所述 候选新闻特 征信息, 获得候选新闻表征向量; 基于所述历史点击新闻特 征信息, 获得历史点击新闻表征向量; 基于所述历史点击新闻表征向量和用户行为特 征向量, 获得用户兴趣向量; 基于所述候选新闻表征向量和所述用户兴趣向量, 获得用户对候选新闻的点击率, 完 成对用户喜爱新闻的推荐。 2.根据权利要求1所述的一种融合多特 征的新闻推荐方法, 其特 征在于, 所述候选新闻特征信 息和所述历史点击新闻特征信 息均包括标题特征、 类别特征和正 文特征。 3.根据权利要求2所述的一种融合多特征的新闻推荐方法, 其特征在于, 获得所述候选 新闻表征向量和所述历史点击新闻表征向量的方法均包括: 将所述标题特征、 所述类别特征和所述正文特征分别转换为标题向量、 类别向量和正 文向量; 基于注意力 机制, 对所述标题向量、 所述类别向量和所述正文向量进行融合, 获得新闻 表征向量。 4.根据权利要求3所述的一种融合多特征的新闻推荐方法, 其特征在于, 将所述标题特 征转换为所述标题向量的方法包括: 基于自然语言处 理实体识别技 术, 获得新闻实体关键词; 基于训练好的词嵌入向量, 将所述新闻实体关键词的单词序列转换为低维词向量序 列; 基于卷积神经网络, 对所述低维词向量序列进行卷积运算, 获得所述低维词向量序列 的局部上 下文特征; 对所述低维词向量序列的局部上下文特征进行最大值池化, 获得整体的标题向量表 示; 对所述新闻实体关键词进行注意力系数求和, 获得关注实体向量; 基于所述整体的标题向量表示和所述关注实体向量, 获得 所述标题向量。 5.根据权利要求3所述的一种融合多特征的新闻推荐方法, 其特征在于, 将所述类别特 征转换为所述类别向量的方法包括: 基于查表的方式, 将所述类别特 征转换为低维向量; 基于所述低维向量, 获得 所述类别向量。 6.根据权利要求3所述的一种融合多特征的新闻推荐方法, 其特征在于, 将所述正文特 征转换为所述 正文向量的方法包括: 基于训练语料和主题模型, 从所述 正文向量中提取潜在的主题分布; 基于所述主题分布, 获得词分布; 基于所述词分布, 获得 所述正文向量。 7.根据权利要求1所述的一种融合多特征的新闻推荐方法, 其特征在于, 基于所述历史 点击新闻表征向量和所述用户行为特 征向量, 获得用户兴趣向量的方法包括: 基于自注意力机制, 获得 所述历史点击新闻表征向量之间的相关性;权 利 要 求 书 1/2 页 2 CN 115048586 A 2基于指数衰减函数, 获得时间向量; 基于阅读时间上限阈值, 获得用户对历史点击新闻的停留时间向量; 基于所述时间向量和所述用户对历史点击新闻的停留时间向量, 利用元素积的方式, 获得所述用户行为特 征向量; 基于所述历史点击新闻表征向量之间的相关性和所述用户行为特征向量, 利用GRU网 络, 获得用户的短期兴趣; 基于用户的嵌入向量, 获得用户的长期兴趣; 基于全连接层, 拼接所述用户的短期兴趣和所述用户的长期兴趣, 获得用户兴趣向量。 8.一种融合多特征的新闻推荐系统, 其特征在于, 包括获取模块、 候选新闻表征模块、 历史点击新闻表征模块、 用户兴趣挖掘模块和新闻推荐模块; 所述获取模块用于分别获取候选新闻特 征信息和历史点击新闻特 征信息; 所述候选新闻表征模块用于基于所述 候选新闻特 征信息, 获得候选新闻表征向量; 所述历史点击新闻表征模块用于基于所述历史点击新闻特征信 息, 获得历史点击新闻 表征向量; 所述用户兴趣挖掘模块用于基于所述历史点击新闻表征向量和用户行为特征向量, 获 得用户兴趣向量; 所述新闻推荐模块用于基于所述候选新闻表征向量和所述用户兴趣向量, 获得用户对 候选新闻的点击率, 完成对用户喜爱新闻的推荐。权 利 要 求 书 2/2 页 3 CN 115048586 A 3
专利 一种融合多特征的新闻推荐方法及系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:34:23
上传分享
举报
下载
原文档
(518.0 KB)
分享
友情链接
YD-T 3835.1-2021 量子密钥分发(QKD)系统测试方法 第1部分:基于诱骗态BB84协议的QKD系统.pdf
奇安信 实战攻防之蓝队视角下的防御体系构建.pdf
GB-T 36250-2018 基于模型的航空装备研制 企业数字化能力等级评价.pdf
GB-T 6968-2019 膜式燃气表.pdf
GB-T 32064-2015 建筑用材料导热系数和热扩散系数瞬态平面热源测试法.pdf
GB-T 18451.1-2022 风力发电机组 设计要求.pdf
GB-T 34079.1-2021 基于云计算的电子政务公共平台服务规范 第1部分:服务分类与编码.pdf
GB-T 42014-2022 信息安全技术 网上购物服务数据安全要求.pdf
GB-T 3410.2-2008 大坝监测仪器 测缝计 第2部分:振弦式测缝计.pdf
T-ZZB 0372—2018 全息防伪产品.pdf
GB-T 14617.2-2012 陆地移动业务和固定业务传播特性 第2部分:100 MHz~1 000 MHz固定业务传播特性.pdf
ISO IEC 38505-1 中文版.pdf
GB-Z 32906-2016 信息安全技术 中小电子商务企业信息安全建设指南.pdf
YD-T 零信任安全技术参考框架 2021报批稿.pdf
GB-T 3286.11-2022 石灰石及白云石化学分析方法 第11部分:氧化钙、氧化镁、二氧化硅、氧化铝及氧化铁含量的测定 波长色散X射线荧光光谱法(熔铸玻璃片法).pdf
GB-T 31167-2014 信息安全技术 云计算服务安全指南.pdf
中国信通院郭雪 交互式应用程序安全测试工具能力要求 标准解读 2021.pdf
GB-T 32856-2016 高压电能表通用技术要求.pdf
DB62-T 2779-2021 松落针病综合防治技术规程 甘肃省.pdf
GB-T 20257.4-2017 国家基本比例尺地图图式 第4部分:1250 000 1500 000 11 000 000地形图图式.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(518.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。